공공데이터포털의 xml 데이터를 csv 파일로 변환하는 방법

데이터 분석 수업을 학교에서 듣고있는데 데이터 분석 기말과제를 위해 공공 데이터 포털의 xml 데이터를 csv 파일로 변환해보려고 한다.

내 주제는 두 가지인데

  1. 코로나안심병원이 각 지역에 충분히 있을까?
  2. 코로나 백신 접종률이 높은 지역에서는 확진자가 적게 나올까?


우선 필요한 데이터를 구한다. 나는 국민 안심병원현황, 공공데이터활용지원센터_보건복지부 코로나19 시·도발생 현황, 질병관리청_코로나19 예방접종 현황 을 필요한 데이터로 선정했다.

이 중에서 공공데이터활용지원센터_보건복지부 코로나19 시·도발생 현황, 질병관리청_코로나19 예방접종 현황이 xml 데이터로 존재하는데 공공데이터활용지원센터_보건복지부 코로나19 시·도발생 현황 데이터는 따로 신청을 해야 볼 수 있는 데이터라 질병관리청_코로나19 예방접종 현황 데이터를 예시로 들어 설명하겠다.

데이터를 찾고 URL을 클릭해 열어보면

<dataTime>2021.12.02 24:00:00</dataTime>

이런식으로 나오는데 가장 윗줄인 This XML file does not appear to have any style information associated with it. The document tree is shown below.를 지우고 메모장에 저장한다.

메모장에 저장힌 후 xml 파일을 csv 파일로 바꿔주는 사이트에 그 파일을 올린다.

사이트: https://data.page/xml/csv

그러면 excel 파일이나 csv 파일 형식으로 다운 받을 수 있다!


