Bluemix : 단순 ETL 서비스 DataConnect, GUI에서 워크 플로우를 작성하도록 ETL 작업을하는 기능이 beta되어 있었기 때문에 시도했습니다.

이런 식으로, 플로우를 GUI로 시각적으로 알기 쉽게 그리는 것 같은 기능 「Design Data Flow」가 beta 릴리스된 것 같기 때문에 시험해 보았습니다.


그건 그렇고



Dataconnect 사용법에 대한 간략한 소개는 아래 기사를 참조하십시오.
ぃ tp // 이 m / 아제 텐 / ms / 아 0b604c67d993387 f5

절차



자꾸 말하면
・필요한 데이터 소스(A, B, C로 한다)를 모두 일단 정의
· 각 데이터 소스에 대해 수행하려는 처리 (조인, 성형)를 각각 정의
 A에게는 ~~를 한다
 B에는~~을 한다
 C에는~~한다
 라는 것을 정의합니다.
· 마지막으로 각 데이터 소스에 대해 처리 후 저장 방법을 정의합니다.
 A는 결국 A_copy라는 테이블에 저장한다
B는 B.csv라는 파일로 출력한다
등등.

그래서 여기에서 자세한 절차를 캡처하고 정리하고 싶습니다.

왼쪽 창에서 Design Data Flow를 클릭합니다.



캔버스 같은 것이 열리므로 오른쪽 상단의 "+"를 클릭


소스 정의



눈에 띄는 화면입니다. .
원본 재료로 만들 테이블을 선택하고 ADD를 클릭합니다.


성형



소스로 정의한 아이콘을 클릭하면 아래 캡처와 같이 테두리가 보라색으로 표시됩니다.
그 상태라면 오른쪽 창에 "어떤 성형합니까?"라는 화면이 표시되므로,
데이터의 정렬이나 중복 제거 등, 좋아하는 처리를 여러가지 정의합니다.


각 데이터 소스에 대한 처리 후 저장 방법 정의



여기까지의 순서로, 성형이나 join 이나를 정의했으므로, 마지막은 그것을 어느 테이블에 (or 어느 파일에) 써내는지의 타겟을 정의합니다.
오른쪽 상단의 타겟 버튼 (고르고 바주카의 타겟 같은 아이콘)을 클릭하면 ...


눈에 띄는이 화면에 우울합니다. 그리고는 종래와 같이, 정의를 결정해 주면 OK입니다. SAVE로 저장합니다.


결국 이런 형태



모든 정의를 마친 캔버스는 이런 느낌이 듭니다.
시각적으로, 어느 테이블에 대해 어떤 일을 시킬 것인지를 한 번에 알 수 있게 되어 있습니다.

그리고 마지막으로 비상문 마크 같은 아이콘을 클릭하면 job이 달립니다.


작업을 실행한 결과는 지금까지처럼 확인할 수 있습니다.



쵸코쵸코 링크가 되어 있는 문자도 있으므로, 거기를 클릭하면 각각 상세를 확인할 수 있습니다.
예를 들어 view data 등을 클릭하면, 다시 DB에 다시 접속하지 않아도, 이 브라우저로부터 타겟처 DB의 테이블을 열람해, 예상하고 있는 결과가 제대로 들어가 있는지를 확인할 수 있습니다.

좋은 웹페이지 즐겨찾기