DataDirect에서 Google BigQuery에서 ODBC 연결로 데이터 가져오기
JupyterNotebook에서 데이터를 검색하고 Google BigQuery 자습서와 마찬가지로 데이터 처리를 수행했습니다.
※이하의 튜토리얼에서는 ODBC 접속이 아니고, 직접 BigQuery로부터 데이터를 취득하는 방법이 쓰여져 있습니다.
htps : // c ぉ d. 오, ぇ. 코 m/비g 쿠에 ry/도 cs/ゔぃすあぃぜージュ py r? hl = 그럼
환경
OS: Windows10
ODBC 드라이버: DataDirect 8.0 Google BigQuery
파이썬 버전: 3.8
DataDirect 8.0 Google BigQuery 설치
아래 URL에서 평가판을 다운로드할 수 있습니다.
htps //w w. p 로그 렛 s. 코 m / 콘 c와 rs / 굿
다운로드 할 수 있으면 인스톨을 실시해 갑니다.
기본적으로 "Next"로 다음으로 진행합시다.
다음 화면의 확인란은 Windows ODBC Administrator에 사용자 DSN을 추가할지 묻습니다.
나중에 설정하므로 체크를 넣어두면 좋을지도 모릅니다.
그리고 "Done"에서 설치가 완료 될 때까지 기다리십시오.
Windows ODBC Administrator 설정
설정하기 전에 Google Cloud Platfoam 서비스 계정을 만들고 계정 키의 JSON 파일이 필요합니다.
모르는 경우는 다음을 참고해 보세요.
htps //w w.まげっぁ에 ぉぉ ds. 코 m / b ぉ cks / 구이 데 / c 어서 - gcp せ r
설정 항목
입력할 내용
데이터 소스 이름
모든 이름
프로젝트
프로젝트 ID
Authentication Method
서비스 계정
서비스 계정 주소
Private key File
JSON 파일 경로
이상을 설정한 후 "Test Connect"로 연결을 확인합니다.
JupyterNotebook에서 데이터 시각화
이 기사에서는 이전 장에서 설정한 프로젝트의 리소스에 샘플 데이터 세트의 natality 테이블을 복사하여 사용합니다.
Google BigQuery 자습서의 연간 출생 수의 합계를 시각화해 봅니다.
pyodbc 설치
pip install pyodbc
import pyodbc
import pandas as pd
cnxn = pyodbc.connect('DSN=Google BigQuery',autocommit=True) #DSN=設定したDSN名
tableResult = pd.read_sql('SELECT source_year AS year,COUNT(is_male) AS birth_count \
FROM samples.natality GROUP BY year ORDER BY year DESC LIMIT 15', cnxn)
df = pd.DataFrame(tableResult)
df
%matplotlib inline
df1.plot(kind='bar', x='year', y='birth_count') #年別の出生数の合計の棒グラフ
요약
튜토리얼을 실행한 코드는 아래에서 공유하고 있으므로 참고하시기 바랍니다.
Colaboratory에서는 실행할 수 없으므로 로컬로 다운로드하여 JupyterNotebook에서 실행해보세요!
튜토리얼 실행 예
공식적으로는 Simba사의 ODBC 드라이버를 제공하고 있습니다만, Progress사가 제공하는 DataDirect에서도 같은 것이 가능합니다.
DataDirect를 사용하는 이점은 국내 기업인 Assist가 DataDirect를 다루고 있으며 지원을 받을 수 있다는 점입니다. Simba사는 일본에 전개하고 있지 않는 것도 있어 불안이 있는 사람, 평가판을 사용해 마음에 들었다고 하는 사람은 DataDirect를 검토해 봐도 좋을지도 모르겠네요!
어시스트사 홈페이지
Reference
이 문제에 관하여(DataDirect에서 Google BigQuery에서 ODBC 연결로 데이터 가져오기), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/rotteno/items/73c412d6943942a8ccfb텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)