Bluemix : 간단한 ETL 서비스 DataConnect에서 작업 스케줄러 실행을 시도했습니다.

서비스 이름이 바뀐 것 같기 때문에 제목만 이름 바꾸고 있습니다.
구: DataWorks
신규: DataConnect

Dataworks, 여러가지 클릭하면 여러가지 옵션이 나오므로, 편리할 것 같다고 생각하면서 조금씩 시험하고 있습니다.

이번에는 ETL 작업(데이터 복사 작업)을 즉시가 아니라 스케줄러 실행해 보았습니다.

전제



즉시 실행했을 때의 기록은 이쪽.
Dataworks의 기본적인 사용법도 여기에 실고 있기 때문에 적절히 참조. .
ぃ tp // 이 m / 아제 텐 / ms / 아 0b604c67d993387 f5

어떻게 스케줄러를 실행합니까?



아래에서는 "RUN"을 즉시 선택하지만,
이번은 그 왼쪽 옆의 「SCHEDULE」을 클릭! !


무엇을 할 수 있습니까? 그 1



시간을 지정하고 그 시간이되면 자동으로 작업 실행
솔직한 패턴으로는 이쪽. 순수하게 시간을 설정하면 OK.


무엇을 할 수 있습니까? 그 2



1분마다 등 정기간격으로 작업을 연장 실행할 수 있음
위 캡처 아래쪽으로,
Schedule this activity to repeat 라고 써 있습니다 ··(찾기 힘들다..)
이것을 클릭하면 아래와 같은 화면이 나타납니다.


· 몇 분마다 실행하시겠습니까?
· 언제까지 계속 하시겠습니까?
등을 지정해 줄 수 있습니다.

이것을 활용하여 무엇을 실현할 수 있는지 생각해 보았다 (개인의 감상)



· 간단한 배치 데이터 이동
→월 1회, 낡은 데이터를 이동한다.
→OLTP계의 DB에 모은 데이터(예를 들면 PostgreSQL에 모인 데이터)를, 데이터 분석자가 사용하는 데이타베이스(예를 들면 dashDB)에 매일 카피해 준다
→ 일일로 백업적으로 데이터를 전송하고 싶습니다.

등등.

· 데이터베이스의 복제적으로
→ 두 개의 데이터베이스가 있고 공통으로 사용하고 싶은 테이블은 복제하고 싶다.
등등.

최단이라면 1분마다 작업 실행할 수 있는 것 같기 때문에, 1분의 딜레이는 있습니다만, 느슨한 복제로서는 요건에 따라서는 사용할 수 있을지도?

좋은 웹페이지 즐겨찾기