11. Pandas 내장 그래프 도구 활용
판다스는 Matplotlib 라이브러리의 기능을 일부 내장하고 있음
plot() 메소드를 적용하고 kind 옵션으로 그래프의 종류 선택 가능
1) 선그래프
import pandas as pd
df = pd.read_excel('/남북한발전전력량.xlsx')
df_ns = df.iloc[[0,5],3:]
df_ns.index = ['South', 'North']
# 행 인덱스 변경
df_ns.columns = df_ns.columns.map(int)
# 문자열로 저장되어 있는 연도 값을 정수형으로 변경
print(df_ns.head())
print('\n')
df_ns.plot()
tdf_ns = df_ns.T
# 행, 열 전치하여 다시 그리기
tdf_ns.plot()
2) 막대 그래프
tdf_ns.plot(kind = 'bar')
3) 히스토그램
히스토그램의 x축 : 발전량을 일정한 간격을 갖는 여러 구간으로 나눈 것
히스토그램의 y축 : 연갈 발전량이 x축에서 나눈 발전량 구간에 속하는 연도의 수를 빈도로 나타낸 것
tdf_ns.plot(kind = 'hist')
4) 산점도
import pandas as pd
df = pd.read_csv('./auto-mpg.csv', header = None)
df.columns = ['mpg', 'cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'model year', 'origin', 'name']
df.plot(x = 'weight', y = 'mpg', kind = 'scatter')
# weight와 mpg 사이의 상관관계를 볼 수 있음
# 무게가 클수록 연비는 낮아지는 경향 (음의 상관관계)
5) 박스 플롯
각 변수들의 데이터가 퍼져 있는 정도를 확인할 때 쓰임
df[['mpg', 'cylinders']].plot(kind = 'box')
# mpg와 cylinders 데이터가 어떤 범위에 퍼져있는지 확인 가능
# o는 이상치
Author And Source
이 문제에 관하여(11. Pandas 내장 그래프 도구 활용), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@ddaddo_data/11.-판다스-내장-그래프-도구-활용저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)