[Python] World Bank의 dataset에서 세계 각국의 인구 데이터를 dataframe에서 입수

때때로 세계 각국의 인구 데이터를 사용하고 싶을 때가 있었지만, Wikipedia에서 엑셀로 복사하여 읽어야했습니다.

그러나 최근 World bank보다 인구를 포함한 데이터 세트가 제공되고 있는 것을 알고, 데이터 프레임으로서 간단하게 캡처할 수 있었으므로, 자신의 망비록으로서 기록에 남깁니다.

덧붙여 나는 Windows10에서 JupyterNotebook에서 Python을 이용하고 있습니다.

먼저 pip로 설치합니다.
pip install world_bank_data --upgrade

그런 다음 이 코드를 실행합니다.
import pandas as pd
import world_bank_data as wb
pd.set_option('display.max_rows', 20)

# Same data set, indexed with the country code
population = wb.get_series('SP.POP.TOTL', id_or_value='id', simplify_index=True, mrv=1)
countries = wb.get_countries()

# Aggregate region, country and population
df = countries[['region', 'name']].rename(columns={'name': 'country'}).loc[countries.region != 'Aggregates']
df['population'] = population
df['population'] =df['population'].fillna(0).astype(int) #浮動小数点n表示になるのでintに変換
df['population_Oku'] = population/100000000
df.sort_values('population', ascending = False).head(5)

그러면 이런 방식으로 세계 인구 Top5를 볼 수 있습니다.


아시아 인구 톱 10도 내 보았습니다.
df[df['region'].str.contains("East Asia")].sort_values('population', ascending = False).head(10)



이쪽의 영어 사이트를 참고로 하고 있습니다.
페이지 하단의 plotty로 만든 차트는 꽤 좋다고 생각했습니다.

좋은 웹페이지 즐겨찾기