오픈 소스 데이터 시각화 도구의 re : dash로 손쉽게 분석 공유 그 3 ~ Google Spreadsheets 편

  • 오픈 소스 데이터 시각화 툴의 re:dash로 손쉽게 분석 공유 그 1 ~ 설치편
  • 오픈 소스 데이터 시각화 툴의 re:dash로 손쉽게 분석 공유 그 2 ~ 그래프편
  • 오픈 소스 데이터 시각화 도구의 re : dash로 손쉽게 분석 공유 그 3 ~ Google Spreadsheets 편
  • 오픈 소스 데이터 시각화 툴의 re:dash로 손쉽게 분석 공유 그 4 ~ pivot table편

  • 이전까지는 MySQL에 연결했지만 이번에는 Google Spreadsheets와 연결해 보겠습니다.

    re:dash로 Google Spreadsheets를 처리할 수 있는 메커니즘



    여기 에 문서가 있지만 re : dash는 python 모듈의 gspread와 oauth2client를 사용하여 Google Spreadsheets에서 데이터를 가져 왔습니다.

    절차 개요


  • Google Developer Console에서 프로젝트 만들기
  • 서비스 계정 키 발행
  • API 사용
  • Google Spreadsheets 데이터 소스 만들기
  • 데이터 세트를 준비하고 Google Spreadsheets에 제공
  • 시각화

  • Google Developer Console에서 프로젝트 만들기



    re:dash에서 Google Spreadsheets로 연결하려면 서비스 계정 키를 Google Developer Console에서 게시해야 합니다.

    먼저 프로젝트를 만듭니다. 이번에는 redash-sample이라는 이름으로 만들었습니다.



    서비스 계정 키 발급



    그런 다음 API 메뉴에서 서비스 계정 키를 게시합니다.
    이 절차를 수행하면 결국 json 형식의 파일이 다운로드됩니다. 이것은 나중에 사용하기 때문에 적절한 곳에 저장해 둡니다.







    API 사용



    그런 다음 Overview에서 Drive API를 찾아 enalbed로 설정합니다.



    Google Spreadsheets 데이터 소스 만들기



    다음과 같이 만듭니다.



    데이터 세트를 준비하고 Google Spreadsheets에 제공



    2010년 기준 소비자 물가 지수 의 페이지의 중분류 지수(1970년 1월~최신월)를 csv로 다운로드해 와 이것을 Google Spreadsheet에 줍니다.

    그런 다음 다음과 같이 데이터를 성형합니다. A1은 YYYYMM 쪽이 적절할까라고 생각했기 때문에 바뀌었습니다.



    그리고 이것을 Service account key의 json에있는 이메일에 공유합니다.



    시각화



    Google Spreadsheet URL이 다음과 같은 경우를 가정합니다.



    이 때 New Query에서 작성하는 값은 다음과 같습니다.
    'URL에 있는 key'와 '스프레드시트 번호(0부터 시작)'를 '|'로 구분할 수 있습니다.



    적당하게 시각화하면 다음과 같이 됩니다.
    어쩌면 집세는 내려가고 있네요.



    요약



    re:dash에서 Google Spreadsheets의 데이터를 가져와 시각화까지 왔습니다.
    Google Analytics를 Google Spreadsheets로 캡처 re:dash로 시각화하는 것도 가능할 것 같네요.
    어려움은 스프레드 시트의 로딩이 느린 것입니다. 이번에 사용한 것이라면 수입에 20초 이상 걸렸습니다.

    좋은 웹페이지 즐겨찾기