파이썬으로 데이터 분석하기(13)

주류데이터에서 대륙별 beer_servings 의 평균, 최소, 최대, 합계 바 차트 그리기

(1) beer servings 의 통계 데이터 얻기
agg()함수는 그룹에 대한 여러가지 연산 결과를 동시에 얻을 수 있는 함수입니다. 대륙별 beer 소비의 통계적 정보를 구하기 위해서는 agg에 구하고자하는 통계 파라미터를 입력하는 것으로 탐색이 가능합니다.

drink_df.groupby('continent').beer_servings.agg(['mean', 'min', 'max', 'sum'])

(2) 인덱스, 레이블, 데이터 값 리스트 만들기

beer_servings_table = drink_df.groupby('continent').beer_servings.agg(['mean', 'min', 'max', 'sum'])
beer_servings_table.index.to_list() #레이블 리스트(대륙이름)
beer_servings_table['mean'].to_list() #평균값 리스트
beer_servings_table['min'].to_list() #최솟값 리스트
beer_servings_table['max'].to_list() #최댓값 리스트
beer_servings_table['sum'].to_list() #합계값 리스트
import numpy as np
index = np.arange(len(beer_servings_table.index.to_list())) #대륙이름 리스트 카운트해서 인덱스 구하기

(3) 각 대륙의 평균/최대/최소/합계 맥주 소비량을 바 차트로 그려보기

continents = beer_servings_table.index.to_list()
values = beer_servings_table['mean'].to_list()

plt.bar(index, values, width=0.2, color='g')
plt.xticks(index, continents)
plt.show()

continents = beer_servings_table.index.to_list()
values = beer_servings_table['max'].to_list()

plt.bar(index, values, width=0.2, color='r')
plt.xticks(index, continents)
plt.show()

continents = beer_servings_table.index.to_list()
values = beer_servings_table['min'].to_list()

plt.bar(index, values, width=0.2, color='b')
plt.xticks(index, continents)
plt.show()

continents = beer_servings_table.index.to_list()
values = beer_servings_table['sum'].to_list()

# y축 레이블과 바차트 제목 추가
plt.ylabel('beer_servings')
plt.title('beer_servings by continents')

plt.bar(index, values, width=0.2, color='y')
plt.xticks(index, continents)
plt.show()

좋은 웹페이지 즐겨찾기