Spark에 break point를 붙여서 Debug하는 방법
2807 단어 스파크
소개
Spark를 사용하고 있어 다음과 같은 매운맛이 있었습니다.
이 기사는 그런 괴로움을 해소하는 기사입니다.
요약
간단한 이야기이므로 먼저 정리하면,
spark-submit
때로는 SPARK_SUBMIT_OPTS
에 jdwp
라고 하는 것입니다.
팁
Step1: Intellij에서 Remote Debugger 설정하기
1. Run -> Edit Configuration에서 설정 화면을 엽니 다.
2. "+"-> "Remote"에서 Remote Debugger 설정을 엽니 다
3. Name 에는 좋아하는 이름, Host 에는 spark-submit
하는 Host 의 IP 를 씁시다. Command line arguments for running remote JVM
라는 항목에 쓰여진 설정은 나중에 사용하므로 복사해 두십시오.
4. OK를 눌러 설정을 저장합니다.
이제 Remote Debugger를 시작할 준비가 되었습니다.
Step2: Remote Debug 가능한 설정을 하고 spark-submit 한다
SPARK_SUBMIT_OPTS
라는 환경 변수에 Step1 로 복사한 jdwp
의 설정을 넣는다.export SPARK_SUBMIT_OPTS=-agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=5005
spark-submit
실행 Step3: Remote Debugger를 실행한 Spark에 연결
spark-submit
그렇지 않으면 ConnectException
Connected to target VM, address: 'さっき指定したホスト:5005', transport: 'socket'
(Spark를 다른 서버에서 실행했기 때문에 IP가 변경되었지만 무시하십시오 ...) DataFrame
이상
Spark로 취급하는 데이터는 Local로 취급할 수 있는 양이 아닌 케이스가 대부분이므로, 이러한 Remote Debug를 할 수 있는 것은 매우 편리하네요.
Reference
이 문제에 관하여(Spark에 break point를 붙여서 Debug하는 방법), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/Civitaspo/items/ab17ffb0a9153e465830
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Reference
이 문제에 관하여(Spark에 break point를 붙여서 Debug하는 방법), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/Civitaspo/items/ab17ffb0a9153e465830텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)