워드 클라우드로 소설을 보는 단어.
마스크를 지정하면 트렌디한 이미지를 만들 수 있고, 형태소 해석 후 시각화 도구로도 편리하다
문장은 나생문이다.
나생문의 txt 파일 자체는 청공 문고에서 왔다
from janome.tokenizer import Tokenizer
import zipfile
import os.path, urllib.request as request
from wordcloud import WordCloud
import matplotlib.pyplot as plt
%matplotlib inline
file = withopen('rashomon.txt', 'r') as f:
bindata = f.read()
textdata = bindata.decode('shift_jis')
t=Tokenizer()
tokens=t.tokenize(textdata)
분석하다글꼴을 지정하지 않으면 코드를 어지럽힐 수 있기 때문에 flath로 다운로드한 NotoSan을 path로 지정합니다.
words = ""
for token in tokens:
if token.part_of_speech.split(',')[0] in ['名詞', '動詞', '副詞']:
words = words + " " + token.base_form
fpath="NotoSansCJKjp-hinted/NotoSansCJKjp-Black.otf"
wordcloud = WordCloud(background_color="white",width=800,height=500,font_path=fpath).generate(words)
plt.figure(figsize=(30,24))
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
동사가 있어 크게 만들었지만 등장인물의 노파와 하인은 여전히 컸다.
Reference
이 문제에 관하여(워드 클라우드로 소설을 보는 단어.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/tetsu-sh/items/cc510654ce4977f009da텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)