Word Cloud가 만들고 싶다면.
하고 싶은 일
포인트
janome
MeCab
그렇다면 python
에서 볼 수 있도록 설정이 필요합니다 환경
Library setup
Anaconda를 넣고 있다면, 이런 곳에서 괜찮습니까?
pip install janome
pip install wordcloud
환경설정
import pandas as pd
from janome.tokenizer import Tokenizer
import matplotlib.pyplot as plt
from wordcloud import WordCloud
데이터 로드에서 아래 준비
pip install janome
pip install wordcloud
import pandas as pd
from janome.tokenizer import Tokenizer
import matplotlib.pyplot as plt
from wordcloud import WordCloud
데이터 로드에서 아래 준비
sample.csv
)를 준비합니다. csv라고 말하면서 쉼표는 사용하지 않지만 sample.csv
ライオンはパンダかもしれない
いや、そんなことはない
:
## データ読み込み
df = pd.read_csv('sample.csv', header=None)
## タイトルを付与
df.colums = ['sentences']
## 関数群の定義
def get_nouns(sentence, noun_list):
for token in t.tokenize(sentence):
split_token = token.part_of_speech.split(',')
## 一般名詞を抽出
if split_token[0] == '名詞' and split_token[1] == '一般':
noun_list.append(token.surface)
def depict_word_cloud(noun_list):
## 名詞リストの要素を空白区切りにする(word_cloudの仕様)
noun_space = ' '.join(map(str, noun_list))
## word cloudの設定(フォントの設定)
wc = WordCloud(background_color="white", font_path=r"C:/WINDOWS/Fonts/msgothic.ttc", width=300,height=300)
wc.generate(noun_space)
## 出力画像の大きさの指定
plt.figure(figsize=(5,5))
## 目盛りの削除
plt.tick_params(labelbottom=False,
labelleft=False,
labelright=False,
labeltop=False,
length=0)
## word cloudの表示
plt.imshow(wc)
plt.show()
준비가 된 곳에서 실행
## 形態素解析の準備
t = Tokenizer()
noun_list = []
for sentence in list(df['sentences']):
get_nouns(sentence, noun_list)
depict_word_cloud(noun_list)
결과
이런 것이 나오면 성공 :
Reference
이 문제에 관하여(Word Cloud가 만들고 싶다면.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/kyoro1/items/59216cc09b56d5b5f760
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
## 形態素解析の準備
t = Tokenizer()
noun_list = []
for sentence in list(df['sentences']):
get_nouns(sentence, noun_list)
depict_word_cloud(noun_list)
이런 것이 나오면 성공 :
Reference
이 문제에 관하여(Word Cloud가 만들고 싶다면.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kyoro1/items/59216cc09b56d5b5f760텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)