GCP의 DataFlow를 손쉽게 접해본 기록
2269 단어 CloudStoragegcp자바PubSub
Intro
Google Cloud Dataflow를 접하는 것이 있었기 때문에, 비망도 겸해 어떤 느낌이었는지 기록을 남긴다.
Google Cloud Dataflow란?
간단하게 말하면, 스트리밍 데이터나 조작·관리를 가져와 주는 GCP 서비스 입니다.
이번에는 PubSub에서 받은 데이터를 DataFlow를 통해 CloudStrage에 배치하려고 합니다.
로그나 트래킹 데이터와 같은 물건이 불특정 다수 post되어, 그것을 보관하거나 나중의 분석에 이용하는 경우를 상정하고 있습니다.
1.Pub/Sub에 주제 만들기
Pub/Sub는 또 스트레이트인 이름입니다만, 이쪽도 GCP의 서비스입니다. 소위 메시징이라고 할까 큐라고 할까.
이번 데이터의 시작점, 어떤 의미 트리거가 됩니다.
우선 보통 GUI 콘솔에서 이름을 붙이기만 하면 됩니다.
2. CloudStorage에 버킷 준비
이번 종점이 되는 장소를 준비해 둡니다.
새 버킷을 만들거나 기존의 모든 폴더를 준비하십시오.
임시 파일을 배치하는 폴더도 함께 준비해 둡시다(후술).
3.DataFlow를 템플릿에서 생성
여기까지 준비할 수 있으면, 나머지는 화면으로부터 포치포치 해 가는 것만으로 되어 버립니다.
DataFlow에는 이용 빈도가 높은 유스 케이스에 맞추어 템플릿이 준비되어 있으므로,
적당히 선택해, 필요한 설정을 하는 것만으로 어느 정도 움직이는 것이 생겨 버립니다.
템플리트에서 작업 작성 링크에서 작성 화면으로 이동하면 작업 이름, 리전을 선택하십시오.
그리고 템플릿을 선택.
이번에는 "Pub/Sub to Text Files on Cloud Strage"(그대로!)를 선택합니다.
그 외 필수 파라미터를 설정하는데 있어서의 포인트로서는,
간단하게 말하면, 스트리밍 데이터나 조작·관리를 가져와 주는 GCP 서비스 입니다.
이번에는 PubSub에서 받은 데이터를 DataFlow를 통해 CloudStrage에 배치하려고 합니다.
로그나 트래킹 데이터와 같은 물건이 불특정 다수 post되어, 그것을 보관하거나 나중의 분석에 이용하는 경우를 상정하고 있습니다.
1.Pub/Sub에 주제 만들기
Pub/Sub는 또 스트레이트인 이름입니다만, 이쪽도 GCP의 서비스입니다. 소위 메시징이라고 할까 큐라고 할까.
이번 데이터의 시작점, 어떤 의미 트리거가 됩니다.
우선 보통 GUI 콘솔에서 이름을 붙이기만 하면 됩니다.
2. CloudStorage에 버킷 준비
이번 종점이 되는 장소를 준비해 둡니다.
새 버킷을 만들거나 기존의 모든 폴더를 준비하십시오.
임시 파일을 배치하는 폴더도 함께 준비해 둡시다(후술).
3.DataFlow를 템플릿에서 생성
여기까지 준비할 수 있으면, 나머지는 화면으로부터 포치포치 해 가는 것만으로 되어 버립니다.
DataFlow에는 이용 빈도가 높은 유스 케이스에 맞추어 템플릿이 준비되어 있으므로,
적당히 선택해, 필요한 설정을 하는 것만으로 어느 정도 움직이는 것이 생겨 버립니다.
템플리트에서 작업 작성 링크에서 작성 화면으로 이동하면 작업 이름, 리전을 선택하십시오.
그리고 템플릿을 선택.
이번에는 "Pub/Sub to Text Files on Cloud Strage"(그대로!)를 선택합니다.
그 외 필수 파라미터를 설정하는데 있어서의 포인트로서는,
이번 종점이 되는 장소를 준비해 둡니다.
새 버킷을 만들거나 기존의 모든 폴더를 준비하십시오.
임시 파일을 배치하는 폴더도 함께 준비해 둡시다(후술).
3.DataFlow를 템플릿에서 생성
여기까지 준비할 수 있으면, 나머지는 화면으로부터 포치포치 해 가는 것만으로 되어 버립니다.
DataFlow에는 이용 빈도가 높은 유스 케이스에 맞추어 템플릿이 준비되어 있으므로,
적당히 선택해, 필요한 설정을 하는 것만으로 어느 정도 움직이는 것이 생겨 버립니다.
템플리트에서 작업 작성 링크에서 작성 화면으로 이동하면 작업 이름, 리전을 선택하십시오.
그리고 템플릿을 선택.
이번에는 "Pub/Sub to Text Files on Cloud Strage"(그대로!)를 선택합니다.
그 외 필수 파라미터를 설정하는데 있어서의 포인트로서는,
4.Topic에 Publish 해 보자
이상까지 일종의 설정은 완료.
작업을 실행하고 PubSub에서 메시지를 게시한 후 잠시 후 CloudStorage에 파일이 있습니다.
내용에는 퍼블리시한 메시지가!
덧붙여서, 디폴트는 5분간에 쌓인 메시지가, 각각 개행된 후에 1파일로서 CloudStorage에 토해지는 모양.
비고·감상
Reference
이 문제에 관하여(GCP의 DataFlow를 손쉽게 접해본 기록), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/hwatry/items/d44e27988031fc66c11d텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)