Anaconda에 janome과 gensim을 사용한 자연 언어 처리 환경 구축
Mecab이 아니고 Janome을 사용하고 있는 것은 환경 구축이 간단하기 때문입니다. 본격적으로 사용한다면 Mecab이 더 좋습니다.
그렇습니다.
실행 환경
환경 구축
Anaconda Navigator를 시작하여 가상 환경을 만듭니다.
터미널 시작
pip install janome
pip install gensim
pip install scikit-learn
사용해 보았습니다.
Janome에서 형태소 분석
Jupyter notebook에서 실행 중입니다.
from janome.tokenizer import Tokenizer
# 簡単な使用方法
t = Tokenizer()
for token in t.tokenize(u'すもももももももものうち'):
print(token)
scikit-learn에서 tf-idf나 gensim에서 word2vec도 하고 있습니다만, 시간이 있으면 추기합니다.
Reference
이 문제에 관하여(Anaconda에 janome과 gensim을 사용한 자연 언어 처리 환경 구축), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/FukuharaYohei/items/5880c72953fc24ac10fb
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
pip install janome
pip install gensim
pip install scikit-learn
Janome에서 형태소 분석
Jupyter notebook에서 실행 중입니다.
from janome.tokenizer import Tokenizer
# 簡単な使用方法
t = Tokenizer()
for token in t.tokenize(u'すもももももももものうち'):
print(token)
scikit-learn에서 tf-idf나 gensim에서 word2vec도 하고 있습니다만, 시간이 있으면 추기합니다.
Reference
이 문제에 관하여(Anaconda에 janome과 gensim을 사용한 자연 언어 처리 환경 구축), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/FukuharaYohei/items/5880c72953fc24ac10fb텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)