파이썬으로 데이터 분석하기 (4)

유동인구데이터 & 상권데이터 분석 및 bar그래프 그리기
다른 2개의 파일에서 각각 추출한 데이터를 다듬고, 중복된 데이터를 기준으로 join을 사용해서 합친 다음, 새로운 데이터를 추가하고, 새 데이터를 활용해서 바그래프 그리기

1. 데이터 확인(구별 치킨집 수 & 구별 유동인구수)

chicken_count_gu #구, 상권업종소분류명count(치킨집 수)

sum_of_population_by_gu #군구, 유동인구수

2. index 리셋하고 새로운 테이블 만들기

new_chicken_count_gu = pd.DataFrame(chicken_count_gu).reset_index()
new_chicken_count_gu.tail(5)

new_sum_of_population_by_gu = pd.DataFrame(sum_of_population_by_gu.reset_index())
new_sum_of_population_by_gu.tail(5)

3. 중복데이터를 사용하여 두 테이블 연결시키기(join)

gu_chicken = new_chicken_count_gu.join(new_sum_of_population_by_gu.set_index('군구'), on = '구')
gu_chicken.tail(5)

4. 새 테이블에 원하는 데이터 추가시키기 (치킨집 당 유동인구수)

gu_chicken['유동인구수/치킨집수'] = gu_chicken['유동인구수']/gu_chicken['상권업종소분류명'] #새로운 데이터를 추가시킬 열 이름 = 들어갈 내용
gu_chicken = gu_chicken.sort_values(by='유동인구수/치킨집수') #정렬
gu_chicken.head(5)S

5. 구별 치킨집 당 유동인구수 비율을 바 그래프로 나타내기

plt.figure(figsize=(10,5))
plt.bar(gu_chicken['구'], gu_chicken['유동인구수/치킨집수'])
plt.xlabel('구')
plt.ylabel('유동인구수/치킨집수')
plt.xticks(rotation = 90)
plt.title('치킨집당 유동인구수')
plt.show()

join 연습해보기!!! #sparta

좋은 웹페이지 즐겨찾기