GoogleCloudStorage에서 TreasureData로 데이터 가져오기
3478 단어 GoogleCloudStorageTreasureData
개요
회사에서 TreasureData를 데이터 레이크로 사용하고 있으므로 GoogleCloudStorage (이후 GCS)에서 데이터 가져 오기를 시도합니다.
전회( BQ에서 가져오기 )의 계속이 됩니다.
문서 을 참고로 준비된 데이터 커넥터를 이용합니다.
준비
TreasureData의 커넥터 설정을 준비하기 위해 필요한 것은 다음과 같습니다.
(이쪽도 전회와 같습니다.)
TreasureData의 커넥터 설정을 준비하기 위해 필요한 것은 다음과 같습니다.
(이쪽도 전회와 같습니다.)
GCS로 가져올 대상 파일 준비
테스트용으로 출력한 CSV 파일을 둡니다.
서비스 계정 키 만들기
지난번 와 같으므로 생략합니다.
TreasureData에서 커넥터 설정
카탈로그에서 GCS를 선택합니다.
우선은 JSON keyfile의 입력이 요구되네요.
입력하고 Continue를 누르면 자격 증명이 만들어집니다.
그런 다음 "New Source"에서 커넥터를 만듭니다.
버킷과 접두사를 넣고 다음
로드한 경우 미리보기에서 확인할 수 있습니다.
이후는, 다른 커넥터와 같은 항목이군요.
우선은 임포트처의 정보 설정입니다.
이번에도 테스트용으로 신규로 만듭니다.
계속해서 스케줄 설정입니다만, 이번은 설정 없이 갑니다.
마지막으로 커넥터의 이름을 붙여 실행!
실행 로그를 보고 완료를 기다립니다.
파일 사이즈가 나름대로 있기 때문에 다소 시간(450MB로 4분 정도) 걸렸습니다만, 문제 없게 받아들이고 있는 것 같습니다.
정리
항례의 정리를 해 둡니다.
TreasureData 측
지난번 와 같으므로 생략합니다.
TreasureData에서 커넥터 설정
카탈로그에서 GCS를 선택합니다.
우선은 JSON keyfile의 입력이 요구되네요.
입력하고 Continue를 누르면 자격 증명이 만들어집니다.
그런 다음 "New Source"에서 커넥터를 만듭니다.
버킷과 접두사를 넣고 다음
로드한 경우 미리보기에서 확인할 수 있습니다.
이후는, 다른 커넥터와 같은 항목이군요.
우선은 임포트처의 정보 설정입니다.
이번에도 테스트용으로 신규로 만듭니다.
계속해서 스케줄 설정입니다만, 이번은 설정 없이 갑니다.
마지막으로 커넥터의 이름을 붙여 실행!
실행 로그를 보고 완료를 기다립니다.
파일 사이즈가 나름대로 있기 때문에 다소 시간(450MB로 4분 정도) 걸렸습니다만, 문제 없게 받아들이고 있는 것 같습니다.
정리
항례의 정리를 해 둡니다.
TreasureData 측
항례의 정리를 해 둡니다.
TreasureData 측
GCS측
Reference
이 문제에 관하여(GoogleCloudStorage에서 TreasureData로 데이터 가져오기), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/FukTig/items/675212eafa0ce44de656텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)