NEologd 사전을 Windows 용 MeCab에 도입하여 Python에서 사용하는 방법

1. MeCab for Python 3(Windows) 설치



먼저 Windows에서 pip에서 mecab-python을 넣을 수 있습니다.을 참조하면서 MeCab for Python 3 (Windows)을 설치하십시오.



내가 설치 한 Python은 3.6.5 (64-bit)이므로 컴파일 된 MeCab 64bit도 필요하며 위 링크에서 다운로드 할 수 있습니다. 64-bit Python을 사용하는 경우 반드시 잊지 마십시오.

설치된 MeCab은 (기본값) C:\Program Files\MeCab\에 있습니다. 사전은 C:\Program Files\MeCab\dic\에 있습니다.

2. NEologd 사전 설치



2.1. Windows Subsystem for Linux 설치





NEologd 사전을 빌드하려면 WSL(Windows Subsystem for Linux)이 필요합니다. Microsoft 웹 사이트 에 나오는 단계에 따라 WSL을 설치하십시오.

2.2. Ubuntu Linux 설치





Microsoft Store에서 Ubuntu를 설치합니다.

2.3. NEologd for Linux 설치



Ubuntu Linux를 시작하고 ubuntu 18.04에 mecab 설치을 참조하여 mecab-ipadic-neologd를 다운로드하여 빌드하십시오.

2.4. NEologd를 Windows로



설치된 NEologd 사전은 /usr/lib/mecab/dic/mecab-ipadic-neologd/에 있습니다. 이 디렉토리의 모든 파일을 C:\Program Files\MeCab\dic\ipadic-neologd\로 복사하십시오.

마지막으로 C:\Program Files\MeCab\etc\mecabrc를 열고,
dicdir =  $(rcpath)\..\dic\ipadic


dicdir =  $(rcpath)\..\dic\ipadic-neologd

로 다시 작성하십시오. 이것으로 끝입니다.

3. 테스트



NEologd의 결과는 다음과 같습니다.



기본 ipadic 결과는 다음과 같습니다.



아주 좋아졌어요! 기쁘다!

4. 임시 사전 변경



참고 : Mecab의 시스템 사전 · 사용자 사전의 사용 방법에 대해
MeCab.Tagger() 를 호출할 때는 사전의 디렉토리를 파라미터로서 넣으면, 일시적인 사전 변경을 할 수 있습니다. 예:
MeCab.Tagger("-d ..\dic\ipadic-neologd")

또는
MeCab.Tagger("-d ..\dic\ipadic")



즉, C:\Program Files\MeCab\etc\mecabrc 를 편집하지 않아도 됩니다.

좋은 웹페이지 즐겨찾기