[Python] World Bank의 dataset에서 세계 각국의 인구 데이터를 dataframe에서 입수
그러나 최근 World bank보다 인구를 포함한 데이터 세트가 제공되고 있는 것을 알고, 데이터 프레임으로서 간단하게 캡처할 수 있었으므로, 자신의 망비록으로서 기록에 남깁니다.
덧붙여 나는 Windows10에서 JupyterNotebook에서 Python을 이용하고 있습니다.
먼저 pip로 설치합니다.
pip install world_bank_data --upgrade
그런 다음 이 코드를 실행합니다.
import pandas as pd
import world_bank_data as wb
pd.set_option('display.max_rows', 20)
# Same data set, indexed with the country code
population = wb.get_series('SP.POP.TOTL', id_or_value='id', simplify_index=True, mrv=1)
countries = wb.get_countries()
# Aggregate region, country and population
df = countries[['region', 'name']].rename(columns={'name': 'country'}).loc[countries.region != 'Aggregates']
df['population'] = population
df['population'] =df['population'].fillna(0).astype(int) #浮動小数点n表示になるのでintに変換
df['population_Oku'] = population/100000000
df.sort_values('population', ascending = False).head(5)
그러면 이런 방식으로 세계 인구 Top5를 볼 수 있습니다.
아시아 인구 톱 10도 내 보았습니다.
df[df['region'].str.contains("East Asia")].sort_values('population', ascending = False).head(10)
이쪽의 영어 사이트를 참고로 하고 있습니다.
페이지 하단의 plotty로 만든 차트는 꽤 좋다고 생각했습니다.
Reference
이 문제에 관하여([Python] World Bank의 dataset에서 세계 각국의 인구 데이터를 dataframe에서 입수), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/Kent-747/items/79b964de96d18e211a07텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)