Windows10(64bit)로 Mecab의 환경 구축에 고전했다

3168 단어 mecabWindows10

실행 환경



Windows 10 64비트
Python 3.6 (64-bit 버전의 Anaconda 가상 환경에서)

Mecab 환경 설정



형태소 분석 도구 Mecab
Windows의 경우 exe를 지정하고 문자 코드를 지정하여 설치합니다. (그 때, 문자 코드를 UTF-8을 선택한다)
대상 다운로드는 다음과 같습니다.


하지만 32비트 버전만 있습니다. 따라서 MeCab 본체를 64비트로 다시 컴파일하고 관련 파일을 64비트 버전으로 업데이트해야 합니다.

Mecab 설치



ht tp // 타쿠 910. 기주 b. 이오 / 메카 b / # 도 w 응 아 d

바탕 화면에 바로 가기도 나오므로 클릭하면 명령 프롬트 돌아가? 나옵니다. 이미 사전도 설치되어 있으므로 직접 문자를 입력합니다.

편지입니다. 이 깨짐을 개선하기 위해서는 MeCab의 64bit화를 할 필요가 있습니다.

Visual Studio 2017 설치



MeCab 본체를 64-bit로 다시 컴파일하고 관련 파일을 64-bit 버전으로 업데이트하는 데 필요한 것입니다.
참조한 사이트에서는 2015 버전을 설치하도록 권장되었지만,


그 때문에 2017년판으로 실장합니다.
파일을 다시 쓰지 않으면 안되기 때문에 파일을 압축 해제 · · ·


글자 깨져있다. 어떻게 하면 좋을지 엄청나게 살다. 10회 정도 설치와 재설치를 반복해, 반나절비용해 버렸습니다・・・

Janome을 사용합시다!


$ pip install janome


htps : // py 피. py 응. 오 rg/py 피/자노메

1분도 하지 않고 설치가 완료.
$ pip install janome
설치가 완료되었으므로 형태소 해석을 한다.

token.py
from janome.tokenizer import Tokenizer
t = Tokenizer()
for token in t.tokenize('冬休み嬉しすぎる!'):
        print(token)

실행 결과



참고 URL

좋은 웹페이지 즐겨찾기