Python 시작 - 자연어 처리를 하기 위한 환경 설치

2019. 6. 24. 19:47Python/머신러닝,딥러닝,데이터분석,파이썬

https://wikidocs.net/22488 

 

위키독스

온라인 책을 제작 공유하는 플랫폼 서비스

wikidocs.net

를 참고하여 공부한 것을 글로 남깁니다.

 

1. 아나콘다(Anaconda)란?

아나콘다(Anaconda)는 수학과 과학 분야에서 사용되는 여러 패키지들을 묶어 놓은 파이썬 배포판으로서 SciPy, Numpy, Matplotlib, Pandas 등을 비롯한 많은 패키지들을 포함하고 있다. Anaconda는 특히 최근에 데이타 사이언스와 머신 러닝 분야에서 파이썬을 사용하기 위해 기본적으로 설치하는 배보판이 되었다. 
Anaconda를 설치하기 위해서는 https://www.anaconda.com/ 웹사이트에서 자신의 OS에 맞는 프로그램을 다운받아 설치하면 된다. 통상 Python 3.x 버전을 선택한다.

2. Anaconda 구성요소

Anaconda는 아래 그림과 같이 크게 4 부분으로 나뉘는데, 이 중 Data Science 라이브러리와 Anaconda Navigator를 주목할 만하다. Data Science 라이브러리는 (a) Jupyter와 같은 IDE 개발도구, (b) Numpy, SciPy 같은 과학 분석용 라이브러리, (c) Matplotlib 같은 데이타 시각화 (Data Visualization) 라이브러리, (d) TensorFlow 같은 머신 러닝(Machine Learning) 라이브러리 등을 포함하고 있다.

 

여러개의 패키지를 포함하고 있어서 패키지를 간편하게 사용할 수 있다.

 

https://www.anaconda.com/distribution/#download-section

 

Anaconda Python/R Distribution - Anaconda

The open-source Anaconda Distribution is the easiest way to perform Python/R data science and machine learning on Linux, Windows, and Mac OS X. With over 11 million users worldwide, it is the industry standard for developing,…

www.anaconda.com

 

아나콘다를 설치하여 실행 후

가상환경을 만들어 주었습니다.

 

conda info --envs 를 통해 체크 후 

만들어진 가상 환경에 접근하고, 

pip install nltk

nltk를 받아줍니다 

 

 nltk 설치

nltk는 자연어 처리를 위해 파이썬 패키지입니다. 기본적으로 파이썬은 pip install [패키지 이름]을 통해서 패키지를 설치합니다. 만약 위에서 권장하는 파이썬 패키지 배포판인 아나콘다를 설치하였거나, 파이썬을 별도로 설치하였다면 UNIX의 terminal이나 윈도우 명령 프롬프트에서 pip install nltk를 실행하면, nltk는 쉽게 설치가 됩니다.pip install nltk

nltk의 기능을 제대로 사용하기 위해서는 nltk data라는 nltk의 여러 실습을 위한 각각의 데이터를 추가적으로 설치해야 합니다. 이를 위해서는 파이썬 코드 내에서 import nltk 이후에 nltk.download()라는 코드를 수행하면 설치됩니다.

import nltk nltk.download()

 

 KoNLpy 설치

코엔엘파이(KoNLpy)는 한국어 형태소 분석기로, 한글 자연어 처리를 위해 만들어진 패키지입니다. 한글에 대한 예제 실습을 위해 코엔엘파이를 설치합니다. UNIX의 terminal이나 윈도우 명령 프롬프트에서 pip install konlpy를 명령하여 설치하시기 바랍니다.

 

 JPype 설치
이제 JAVA와 Python을 연결해주는 역할을 하는 JPype를 설치해야 합니다.

설치 주소 : https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype

 

 

를 진행

 

 

적용을 3.5 로했기때문에 3.5를 다운로드 받은후 install 

 

이후 pip install konlpy 를 하면 오류가 발생하지 않는 모습을 볼 수 있습니다.

 

  TensorFlow 설치

텐서플로우는 구글이 2015년에 공개한 기계 학습 오픈소스 라이브러리입니다. 기계 학습과 딥 러닝을 직관적이고 손쉽게 할 수 있도록 설계되었습니다. 딥 러닝을 위해 텐서플로우를 설치해야 합니다.

앞서 아나콘다(Anaconda)를 설치하였거나, 파이썬을 별도로 설치하였다면 명령 프롬프트 창에서 해당 명령어를 통해서 설치할 수 있습니다.

pip install tensorflow

 

 

케라스(Keras)

케라스(Keras)는 딥 러닝 프레임워크인 텐서플로우에 대한 추상화 된 API를 제공합니다. 케라스는 백엔드로 텐서플로우를 사용하며, 좀 더 쉽게 딥 러닝을 사용할 수 있게 해줍니다. 쉽게 말해, 텐서플로우의 코드를 훨씬 간단하게 작성할 수 있습니다.

pip install keras

NumPy 설치

넘파이(numpy)는 빠른 계산을 위해 지원되는 파이썬 라이브러리입니다.pip install numpy conda install numpy

넘파이 메뉴얼

 

SciKit-learn 설치

conda install scikit-learn

 

사이킷런은 파이썬 머신러닝 라이브러리입니다. 사이킷런을 통해 나이브 베이즈 분류, 서포트 벡터 머신 등 다양한 머신 러닝 모듈을 불러올 수 있습니다. 또한, 사이킷런에는 머신러닝을 연습하기 위한 아이리스 테디터, 당뇨병 데이터 등 자체 데이터 또한 제공하고 있습니다.

사이킷런은 넘파이(numpy)와 사이파이(scipy)라는 모듈이 먼저 설치되어야 하지만, 아나콘다를 통해서 한꺼번에 설치하는 것도 가능합니다. 아나콘다로 설치 시에는 다음과 같은 명령어로 설치합니다.

 

 주피터 노트북(Jupyter Notebook)

jupyter notebook 명령으로 실행 후 확인

반응형

'Python > 머신러닝,딥러닝,데이터분석,파이썬' 카테고리의 다른 글

Python 토큰화  (0) 2019.06.24