[Python] World Bank의 dataset에서 세계 각국의 인구 데이터를 dataframe에서 입수

때때로 세계 각국의 인구 데이터를 사용하고 싶을 때가 있었지만, Wikipedia에서 엑셀로 복사하여 읽어야했습니다.

그러나 최근 World bank보다 인구를 포함한 데이터 세트가 제공되고 있는 것을 알고, 데이터 프레임으로서 간단하게 캡처할 수 있었으므로, 자신의 망비록으로서 기록에 남깁니다.

덧붙여 나는 Windows10에서 JupyterNotebook에서 Python을 이용하고 있습니다.

먼저 pip로 설치합니다.

pip install world_bank_data --upgrade

그런 다음 이 코드를 실행합니다.

import pandas as pd
import world_bank_data as wb
pd.set_option('display.max_rows', 20)

# Same data set, indexed with the country code
population = wb.get_series('SP.POP.TOTL', id_or_value='id', simplify_index=True, mrv=1)
countries = wb.get_countries()

# Aggregate region, country and population
df = countries[['region', 'name']].rename(columns={'name': 'country'}).loc[countries.region != 'Aggregates']
df['population'] = population
df['population'] =df['population'].fillna(0).astype(int) #浮動小数点n表示になるのでintに変換
df['population_Oku'] = population/100000000
df.sort_values('population', ascending = False).head(5)

그러면 이런 방식으로 세계 인구 Top5를 볼 수 있습니다.

아시아 인구 톱 10도 내 보았습니다.

df[df['region'].str.contains("East Asia")].sort_values('population', ascending = False).head(10)

이쪽의 영어 사이트를 참고로 하고 있습니다.
페이지 하단의 plotty로 만든 차트는 꽤 좋다고 생각했습니다.

Reference

이 문제에 관하여([Python] World Bank의 dataset에서 세계 각국의 인구 데이터를 dataframe에서 입수), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/Kent-747/items/79b964de96d18e211a07

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다