【지리 정보 강좌 #1】R에서의 지오코딩 입문

소개



쿠보 연개 연구회의 서브 세미나의 자료입니다! 한정 공개입니다. (2020.08. 공개했습니다
. ) R에서 웹 스크래핑 시작 의 속편이 됩니다. 마지막 자료에서 마지막으로 출력한 gas_naha.csv를 사용하여 분석을 진행합니다!

오늘의 목표



어쩌면 이 두 가지입니다.
  • 「위치 정보 데이터는 도움이 될 것」이라고 느낀다.
  • 지오코딩에서 중요한 조작을 R로 실행할 수 있게 된다!

  • 우선, 지오코딩 해보자.



    위도 경도로 변환



    처음이므로 기합을 넣어 가고 싶은 곳입니다 만, 이쪽은 전용 사이트에 파일을 업로드하는 것만으로 완성됩니다 웃음. 이번에는 도다이의 지오코딩 사이트을 사용해 보겠습니다. 절차는 아래와 같습니다.
  • 주소를 포함한 컬럼 번호를 입력
  • 이번은 2행째군요. csv 파일을 열어 확인해 보십시오.

  • 입력 파일과 출력 파일의 한자 코드
  • gas_naha.csv를 출력했을 때, CP932라는 의미 모호 인코딩을 지정했으므로, 이번은 여기를 시프트 JIS라고 지정하고 있습니다.
  • 보통의 csv 파일이라면, 아무것도 지정하지 않아도 괜찮다고 생각합니다. 문자가 깨지면 인코딩을 변경해보십시오.

  • 변환할 파일 이름
  • 그 이름대로입니다.



  • 전송을 누르면 파일이 반환된다고 생각합니다. 반환된 파일을 gas_naha_new.csv라는 이름으로 둡니다.

    데이터를 아름답게 만들기



    지오코딩된 데이터를 R 스튜디오로 가져옵니다. 이 때, fileEncoding 를 지정하는 것에 주의해 주세요. Windows의 사람은, fileEncoding = utf8 라고 하면(자), 문자 부상이 없어질지도 모릅니다.
    gas_naha <- read.csv("gas_naha_new.csv", fileEncoding = "shift-jis")
    

    친숙한 tidyverse를 사용하여 데이터를 깨끗하게 해 봅시다. select 에서 필요한 변수만 지정하고 rename 에서 변수의 이름을 알기 쉽게 합니다.
    library(tidyverse)
    gas_naha <- gas_naha %>% 
      select(store, address,company, fX, fY) %>% # 必要な変数だけ取得
      rename(longitude = fX, latitude = fY) # 変数の名前を変更
    

    덤 ① 지도상에 플롯 해 본다



    빠르지만 첫 번째 덤입니다. 전에도 했지만 지도에 주유소를 플로팅해 보겠습니다. leaflet 이라는 라이브러리를 사용합니다.
    아래 코드를 실행해보십시오. map과 함께 세계지도가 나오는지 확인하십시오.
    ## leafletというライブラリを使用します。 
    library(leaflet)
    
    ## 地図をRstudio上に用意します。
    map <- leaflet(gas_naha) %>% 
      addTiles()
    

    이 세계지도상에 오키나와현 나하시의 주유소를 플로팅해 봅니다. addCircles 대신 addMarkers 하지만 좋을지도 모릅니다. 집합체 공포증은 주의하십시오.
    map %>% 
      addCircles(lng = ~ longitude, lat = ~latitude)
    

    역시 국도를 따라 많네요~.

    결론



    다음 번에 계속… 이번에 만든 데이터에 메쉬 통계 데이터를 조합해 분석해 보겠습니다.

    지리 정보 강좌 목록


  • R에서 웹 스크래핑 시작
  • 【지리 정보 강좌 #1】R에서의 지오코딩 입문
  • 【지리 정보 강좌 #2】R에서의 메쉬 통계 데이터 입문
  • 【지리 정보 강좌 #3】R에서의 거리 계산 입문
  • 좋은 웹페이지 즐겨찾기