Glue 사용 방법의 오류: (Workflows에서 작업 프로세스를 시각화)
업데이트
Glue Workflows 소개
Glue 작업 및 클론 작성 워크플로우
Glue의 Trigger 기능도 클론에 대응하여 상태 및 프로세스를 시각적으로 표시
Glue의 리소스 제작 프로세스만 활용하려는 경우에 유용합니다.
오류를 잘 처리하고 싶을 때, 건너뛰고 싶을 때, 다른 AWS 자원과 연합된 프로세스를 만들고 싶을 때는 StopFunction이 가장 좋다.
Workflows 만들기
컨텐트
다음 글에서 쓴 복제자 또는 작업으로 작업흐름 만들기
https://qiita.com/pioho07/items/a24d188d67fe97034b34
자유형 -> 작업(PySpark) -> 작업(Pythenshell)
S3 csv 파일을 Parquet으로 간단히 복사하여 파일 이름 바꾸기
Glue 작업 및 클론 작성 워크플로우
Glue의 Trigger 기능도 클론에 대응하여 상태 및 프로세스를 시각적으로 표시
Glue의 리소스 제작 프로세스만 활용하려는 경우에 유용합니다.
오류를 잘 처리하고 싶을 때, 건너뛰고 싶을 때, 다른 AWS 자원과 연합된 프로세스를 만들고 싶을 때는 StopFunction이 가장 좋다.
Workflows 만들기
컨텐트
다음 글에서 쓴 복제자 또는 작업으로 작업흐름 만들기
https://qiita.com/pioho07/items/a24d188d67fe97034b34
자유형 -> 작업(PySpark) -> 작업(Pythenshell)
S3 csv 파일을 Parquet으로 간단히 복사하여 파일 이름 바꾸기
자원 이름
클론 이름
se2_in0
작업 이름
se2_job15
se2_job16
Workflow 제작
Glue 화면 왼쪽 메뉴에서 "Workflows", "Add workflow"를 클릭
![](https://s1.md5.ltd/image/72d28992689aeed750ba50585066142c.png)
다음 내용을 입력하고 [Add workflow]를 클릭합니다.
Workflow name: se2_workflow1
![](https://s1.md5.ltd/image/ff3a0a74dd45cbb0e3898b2d378f1b01.png)
만들어진workflow의 "se2 workflow1"을 선택하고 화면 아래의 "Graph"탭을 클릭하고 "Add trigger"를 클릭합니다
※ 이곳에서 만든 트레일러는 글루의 트레일러입니다.
![](https://s1.md5.ltd/image/b7a991d88b17ed4e62c7bccaf7277937.png)
"Addnew"탭을 클릭하고 Name에 "se2 wf trigger1"을 추가하고 "On demand"에서 Trigger type을 선택하고 "Add"를 클릭합니다.
※ "Clone existing"탭에서 기존 Trigger로부터 복사 가능
![](https://s1.md5.ltd/image/09b0a6cbeaa36138ae13a2abb491b404.png)
이런 걸 만들 수 있어요.
![](https://s1.md5.ltd/image/00231111f1a2c129bc9a83f133593dae.png)
어쨌든 전체 화면에 표시하고 "Add node"를 클릭한 곳
![](https://s1.md5.ltd/image/d3c8240280f5783d909ef19685ee325e.png)
팝업 화면이 나오므로 "Crawlers"탭을 클릭하고 해당 복제자 "se2 in0"중에서 선택하고 "Add"를 클릭합니다
※ "Jobs"탭을 클릭하면 의뢰를 선택할 수 있습니다.
![](https://s1.md5.ltd/image/a74a708d18b1c71e543192564bf087be.png)
왼쪽 동그란 시작, 벌레 같은 아이콘
![](https://s1.md5.ltd/image/984502f3d4deb638403caaccaaca8f6e.png)
복제자 아이콘을 클릭하면 다음과 같은 상황이 발생합니다. "Add trigger"를 클릭하십시오.
![](https://s1.md5.ltd/image/c61a8a1f2f669ada5e78e9e512ce3f7f.png)
팝업 화면에서name에 "se2 wf trigger2"를 입력하고 "Add"를 클릭합니다
![](https://s1.md5.ltd/image/0c5d36702b935705eb2a2efee5b2c7c3.png)
나는 이 순간이 이상하다고 생각한다. 신경 쓰지 말고 오른쪽에 있는 "Add node"를 눌러라.
![](https://s1.md5.ltd/image/7e295ff6511d4c05e953108efc903172.png)
"Jobs"옵션을 클릭하고 작업 "se2 job15"를 선택하고 "Add"를 누르십시오
![](https://s1.md5.ltd/image/a9dccf9ddfde1c8305b26d37be298c97.png)
두 번째 미션을 할 수 있습니다.
![](https://s1.md5.ltd/image/4510fc6ac55ac0d053c3e6513eb9dd5a.png)
그리고 같은 요령으로 세 번째 미션을 추가합니다.
![](https://s1.md5.ltd/image/fb5acda7059dc6c130aa950c3618b6dd.png)
염주를 연결하려는 임무나 기어오르기를 Trigger로 연결하는 흐름이다.
Workflow 실행
객체의 워크플로우를 선택하고 [Action]->[Run]을 클릭합니다.
![](https://s1.md5.ltd/image/0cf4516147a031b866a478266dbcc33b.png)
대상의workflow를 선택하고 화면 아래의 "History"옵션을 클릭하고 "RunID"를 선택하고 "View run detail"을 클릭합니다
![](https://s1.md5.ltd/image/3d169408a21d7086fd20ad3c27c1409c.png)
Workflow의 상태를 확인할 수 있습니다.
녹색 완료 표시, 클론 완료 표시, 파란색 표시, 다음 작업 수행 중임을 확인
주의점
![](https://s1.md5.ltd/image/8a5c0ea9565a5f7b3cf94f7859386fdb.png)
여기도 꼭.
Glue Workflows 공식 문서
Performing Complex ETL Activities Using Workflows in AWS Glue
https://docs.aws.amazon.com/ja_jp/glue/latest/dg/orchestrate-using-workflows.html
Glue 사용 방법의 오류: (Pythn Shell 사용)
https://qiita.com/pioho07/items/a24d188d67fe97034b34
Glue 사용법 요약
https://qiita.com/pioho07/items/32f76a16cbf49f9f712f
Reference
이 문제에 관하여(Glue 사용 방법의 오류: (Workflows에서 작업 프로세스를 시각화)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/pioho07/items/0cd0ae27b61f5914f78d텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)