【Pandas】 최신 CSV 파일을 로드하는 방법 .no.33



안녕하세요, 마유미입니다.

Pandas에 대한 기사를 시리즈로 작성하고 있습니다.

이번은 제33회째가 됩니다.

지금까지의 기사에서는, 자신의 PC에 다운로드 끝난 csv를 읽어들여 Pandas로 그 데이터에 계산을 실시하거나, 순서를 재정렬하는 방법을 써 왔습니다.



그래서 이번 기사에서는 최신 CSV 파일을 읽는 방법에 대해 써 갑니다.

그럼 바로 시작하겠습니다.

이번 기사에서 사용하는 데이터



이번에는 많은 데이터를 제공하는 사이트를 소개합니다.

NYC Open Data에 대한 액세스는 여기에서

데이터가 카테고리별로 나뉘어져 있으므로 관심있는 분야를 선택하고 조사하고 싶은 데이터를 사용하세요.

csv 데이터 URL 사용



사용하려는 데이터가 결정되면,

"Export"➡ "CSV"➡ "링크 복사"로 이동



복사한 링크는 아래와 같이 됩니다만, 「?accessType...」이하는 필요 없기 때문에



아래 스쿠쇼와 같이 불필요한 부분을 삭제한 URL만 복사합니다.



.read_csv()로 로드



지금까지 기사에서 소개했듯이 Pandas의 .read_csv() 메소드를 사용하여 csv를 읽습니다.

이번에는 이미 다운로드된 CSV가 아니라

항상 업로드하는 웹의 CSV를로드하기 때문에

방금 복사한 csv의 URL을 url=이라는 변수에 대입하여 .read_csv()의 인수로 전달합니다.



최신 데이터를 로드할 수 있습니다.

요약



이번 기사는 이것으로 끝납니다.

다음 기사에서는 이번과 같은 데이터를 사용하여 특정 열을 Python 목록으로 만들거나 사전으로 만드는 방법을 알려 드리겠습니다.

좋은 웹페이지 즐겨찾기