[스파르타코딩] 파이썬 데이터분석 3주차
3주차...고비가 왔다
그 간 부실했던 기초가 여실히 드러나며
이젠 따라가기에도 벅찬 지경에 이르렀다.
이를 어찌해야 할꼬
#1 강의 주차에 따른 수강완료 데이터 분석
전체 강의 주차 중에 몇주차 이후에 사람들이 안듣기 시작했는지
확인할 수 있는 데이터를 분석했다.
데이터를 읽어서 가공을 해준다.
그리고 막대그래프를 그려준다.
#2 워드클라우드 만들기
2.1 먼저 필요한 것을 인스톨 해준다.
conda install -c conda-forge wordcloud
2.2 넘파이를 넣어서 준비를 한다.
import numpy as np
from PIL import Image
from wordcloud import WordCloud
import matplotlib.pyplot as plt
2.3 필요한 텍스트를 읽어들인다.
text = open('./data/Sequence_01.txt')
text = text.read()
text = text.replace('\n'," ")
text
text2 = open('./data/Sequence_02.txt')
text2 = text2.read()
text2 = text2.replace('\n'," ")
text2
2.4 텍스트 데이터를 다듬는다.
result = ""
for number in range(1,15):
index = '{:02}'.format(number)
filename = "Sequence_" + index + ".txt"
text = open('./data/' + filename, 'r', encoding = 'utf-8-sig')
result += text.read().replace("\n"," ")
import re
pattern = '[^\w\s]'
text = re.sub(pattern=pattern, repl='', string = result)
text
2.5 폰트 패스를 넣고 실행한다.
font_path = './System/Library/Fonts/Supplemental/AppleGothic.ttf'
wc = WordCloud(font_path = font_path, background_color="white")
wc.generate(text)
plt.figure(figsize=(50,50))
plt.axis("off")
plt.imshow(wc)
plt.show()
2.6 워드클라우드의 기본 배경 이미지를 넣고 실행시켜준다
# Generate a word cloud image
mask = np.array(Image.open('./data/sparta.png'))
wc = WordCloud(font_path=font_path, background_color="white", mask=mask)
wc.generate(text)
f = plt.figure(figsize=(50,50))
f.add_subplot(1,2, 1)
plt.imshow(mask, cmap=plt.cm.gray)
plt.title('Original Stencil', size=40)
plt.axis("off")
f.add_subplot(1,2, 2)
plt.imshow(wc, interpolation='bilinear')
plt.title('Sparta Cloud', size=40)
plt.axis("off")
plt.show()
Author And Source
이 문제에 관하여([스파르타코딩] 파이썬 데이터분석 3주차), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@eedd/스파르타코딩-파이썬-데이터분석-3주차저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)