MeCab을 Python 3.5에서 사용

MeCab 설치



일본어 텍스트 마이닝을 실시할 때의 동행, 형태소 해석 소프트웨어 MeCab를 인스톨합니다.
ht tp // 타쿠 910. 기주 b. 이오 / 메카 b / # 도 w 응 아 d

의외로 도하마리하는 경우가 많은 MeCab의 설치 방법입니다.
CentOS7.3, Python3.5 환경에서 MeCab을 설치하는 것을 목표로합니다.
절차를 수립하는데 하루가 걸렸습니다(웃음)

사전 설정: 필요한 패키지 설치



OS에 로그인하면 먼저 루트 사용자가됩니다.
sudo su -
cd ~

다음은 루트 사용자로 작업을 계속합니다.

MeCab 작동에 필요한 패키지를 설치합니다.
yum -y install git gcc-c++

MeCab 패키지를 Git Clone에서 다운로드



MeCab을 Git에서 떨어뜨립니다.
htps : // 기주 b. 코 m / 타쿠 910 / 메카 b

또, 이번 작업은/opt/에서 실시합니다만, 디렉토리는 환경과 취향으로 선택해 주세요.
cd /opt/
git clone https://github.com/taku910/mecab.git


MeCab 설치



/opt/에 다운로드한 MeCab을 OS에 설치합니다.
cd mecab/mecab
./configure  --enable-utf8-only
make
make check
make install


/usr/local/lib/libmecab.so.2.0.0에 대한 링크 설정



자동으로 모듈에 연결되지 않으므로 다음을 수행합니다.
echo "/usr/local/lib" >> /etc/ld.so.conf
ldconfig


IPA 사전 설치



h tps://d ゔぇ. 오, ぇ. 이 m/우 c? 에 x포 rt=도w응아 d&아 d=0B4y35후 V1wh7MWVlSDBCSXZMTXM
↑에서 다운로드합니다.
그러나 wget 할 수 없기 때문에 브라우저에서 다운로드하여 CentOS의/opt/디렉토리에 넣습니다.
cd /opt/
tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
make check
make install


이제 OS에서 MeCab을 사용할 준비가 되었습니다.

MeCab을 Python에 바인딩



MeCab을 OS에 설치하면 파이썬에서 사용할 수 없습니다.
아래에서 Python에 MeCab을 설치합니다.
sed -i 's/ return string.split (cmd1(str))/return cmd1(str).split()/g' /opt/mecab/mecab/python/setup.py

python /opt/mecab/mecab/python/setup.py build
python /opt/mecab/mecab/python/setup.py install

pip install mecab-python3

이제 Python3.5부터 MeCab을 사용할 준비가되었습니다.

파이썬에서 MeCab을 사용할 수 있는지 확인



빨리 시도해 봅시다.
python
import MeCab
m = MeCab.Tagger ("-Ochasen")
print (m.parse ("私はメカブと申します。カラスではありません。昨日、帰宅途中に財布を落として探して回りました。Oh No!"))

이런 느낌입니다.

좋은 웹페이지 즐겨찾기