wordcloud를 Windows에서 Anaconda/Jupyter에서 사용 (Tips)

Windows의 Anaconda (Jupyter) 환경에서 wordcloud를 사용합니다.



간단하고 간단하게 절차 만. 거의 자신의 메모 용.
※ 이런 때는 gist 를 사용하는지 고민합니다만, 누군가가 봐 주는, 누군가의 도움이 될 가능성이 높은 것 같기 때문에 Qiita를 사용한다! !

다음 단계로 이동



일단 확인해 둔다



Jupyter등의 환경에서 아래와 같은 1행만 걸어 실행시켜 본다.
from wordcloud import WordCloud

설치되어 있지 않으면 오류가 발생합니다.
ModuleNotFoundError: No module named 'wordcloud'

그래서 설치되어 있지 않은 것을 확인할 수 있었으므로 다음으로 진행한다.

Anaconda prompt를 시작하고 다음 명령으로 wordcloud 설치


> conda install -c conda-forge wordcloud
    :
※ 何回かなにかきかれるけど y で切り抜ける

일단 확인해 보자


from wordcloud import WordCloud

text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum."
wordcloud = WordCloud(background_color="white", width=800,height=800).generate(text)
wordcloud.to_file("./test.png")

현재 디렉토리에 png가 있으면 성공.



덤:Windows에서 일본어 폰트



font_path로 글꼴을 지정합니다. .otf 그렇다면 잘 작동합니다.
wordcloud = WordCloud(background_color="white", font_path=r"C:\WINDOWS\Fonts\SourceHanCodeJP-Bold.otf", width=800,height=800).generate(text)

사이고에게



누군가가 도움이되면 부담없이 좋겠습니다. m__m

Appendix.



위의 예는 영어 문장이므로 공백으로 나누어져 있습니다만, 일본어를 알고 싶으면 janome 가 편리합니다.
janome의 일본어 글꼴을 사용하는 WordCloud 샘플입니다.
## 分かち書き
## pip install janome
from janome.tokenizer import Tokenizer
tokenizer = Tokenizer()

text = ''
line = '吾輩は猫である。名前はまだ無い。どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。'
tokens = tokenizer.tokenize(line)
for token in tokens:
    parts = token.part_of_speech.split(',')
    if (parts[0] == '名詞'):
        text = text + ' ' + token.surface

print(text)


## 引き続きWordCloud
from wordcloud import WordCloud

wordcloud = WordCloud(background_color="white", font_path=r"C:\WINDOWS\Fonts\SourceHanCodeJP-Bold.otf", collocations = False, width=800,height=800).generate(text)
wordcloud.to_file("./test.png")

좋은 웹페이지 즐겨찾기