[파이썬 데이터분석 첫걸음] 3주차 회고

WIL

복수의 데이터 join하기

복합데이터를 하나의 데이터로: reset_index()
위 데이터의 열 제목 변경하기: lecture_count = lecture_count.rename(columns = {'user_id' : 'count'})
데이터 합치기: full_lecture = lecture_count.join(lectures, on = 'lecture_id')
-lectures 데이터의 lecture_id 열을 기준으로 합치기
-MySQL과 유사점!!

Wordcloud

동영상대로 입력했을때 UnicodeDecodeError: 'cp949' codec can't decode byte 0xeb in position 6: illegal multibyte sequence 발생. 검색해본 결과 open('파일경로.txt', 'rt', encoding='UTF8')와 같이 열면 해결된다 한다

text = open('./data/Sequence_01.txt', 'rt', encoding = 'UTF8')
text = text.read()
text

'rt'의 't'는 text mode라는 뜻. text mode가 기본설정이기 때문에 'r'(read) 와 'rt'간의 차이는 없음
보다 깔끔한 출력을 위해 특수기호 제거하기

import matplotlib.font_manager as fm
for f in fm.fontManager.ttflist:
    if 'Gothic' in f.name:
        print(f.fname)

ttf 리스트 출력되었을 때 나온 경로 복붙해서 fontpath에 C:\Windows\Fonts\NanumGothic.ttf 입력했을때 에러. _(주피터 노트북 상에서는 원화 기호로 입력됨)을 /로 바꿔 넣었더니 해결됨

# Generate a word cloud image
mask = np.array(Image.open('./data/sparta.png')) # 행렬을 만들어서 마스킹
wc = WordCloud(font_path=font_path, background_color="white", mask=mask)
wc.generate(text)

f = plt.figure(figsize=(50,50))
f.add_subplot(1,2, 1) # 그래프를 두 개 그릴 때 사용하는 방법
plt.imshow(mask, cmap=plt.cm.gray)
plt.title('Original Stencil', size=40)
plt.axis("off")
f.add_subplot(1,2, 2)
plt.imshow(wc, interpolation='bilinear')
plt.title('Sparta Cloud', size=40)
plt.axis("off")
plt.show()

생성된 이미지 드라이브에 저장하기

f = plt.figure(figsize = (50, 50)) # 변수 지정
plt.imshow(wc, interpolation = 'bilinear')
plt.title('나만의 워드클라우드', size = 40)
plt.axis('off')
plt.show()
f.savefig('./data/myWordCloud.png')

xticks 눈금 설정하기 (0부터 23까지)

기반이 되는 데이터의 x축: plt.xticks(hourdata.index)
numpy 활용하기: plt.xticks(np.arange(24))

Author And Source

이 문제에 관하여([파이썬 데이터분석 첫걸음] 3주차 회고), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@megagengar/파이썬-데이터분석-첫걸음-3주차-회고

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다