spark 여러 애플 리 케 이 션 동시 실행
2313 단어 빅 데이터
https://spark.apache.org/docs/1.2.0/job-scheduling.html
spark 는 여러 애플 리 케 이 션 이 동시에 실행 되 고 여러 애플 리 케 이 션 의 자원 공유 와 관련 되 어야 합 니 다.spark on yarn 모드 에서 yarn 은 클 러 스 터 자원 을 관리 할 수 있 습 니 다.클 러 스 터 의 메모리 자원 과 cpu 자원 을 잘 이용 하기 위해 서 는 spark 의 Dynamic Resource Allocation 을 사용 해 야 합 니 다. 기능.
Dynamic Resource Allocation 에 문제 가 있 습 니 다. executor 가 비어 있 을 때 executor 는 remove 되 지만 executor 가 실 행 된 데이터 결 과 는 다른 executor 에 의 해 사 용 될 수 있 습 니 다. 이 문 제 를 해결 하기 위해 spark 는 외부 shfuffle 서 비 스 를 시작 해 야 합 니 다. 관련 설정 은 Yrn - site. xml 파일 에 다음 과 같은 내용 을 추가 합 니 다.
yarn.nodemanager.aux-services
spark_shuffle
yarn.nodemanager.aux-services.spark_shuffle.class
org.apache.spark.network.yarn.YarnShuffleService
동시에
spark - - yarn - shuffle. jar 는 hadop 의 yarn lib 라 이브 러 리 에 넣 었 습 니 다. 제 spark 버 전 은 1.3.1 입 니 다. 즉,
spark-1.3.1-yarn-shuffle.jar 문건
내 yarn 의 lib 라 이브 러 리 디 렉 터 리 는: / usr / local / hadop 2.6.0 / share / hadop / yarn / lib /
/usr / local / hadop 2.6.0 / 제 hadop 설치 디 렉 터 리 입 니 다.
하면, 만약, 만약... 파일 을 올 바른 디 렉 터 리 에 두 지 않 았 습 니 다. spark application 은 시작 할 때 accepted state 에 걸 립 니 다. 관련 인쇄 는 다음 과 같 습 니 다.
/06 10:49:14 INFO yarn.Client: client token: N/A diagnostics: N/A ApplicationMaster host: N/A ApplicationMaster RPC port: -1 queue: default start time: 1436150953666 final status: UNDEFINED tracking URL: http://ddos12:8088/proxy/application_1435917011732_0005/ user: root 15/07/06 10:49:15 INFO yarn.Client: Application report for application_1435917011732_0005 (state: ACCEPTED) 15/07/06 10:49:16 INFO yarn.Client: Application report for application_1435917011732_0005 (state: ACCEPTED) 15/07/06 10:49:17 INFO yarn.Client: Application report for application_1435917011732_0005 (state: ACCEPTED)
......................................................................
external shuffle service 는 reove 된 executor 의 계산 결과 데 이 터 를 위탁 관리 하 는 역할 을 합 니 다. 다른 running 의 executor 가 이 데 이 터 를 사용 해 야 할 때 external shuffle service 에 데 이 터 를 요청 합 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
spark 의 2: 원리 소개Google Map/Reduce 를 바탕 으로 이 루어 진 Hadoop 은 개발 자 에 게 map, reduce 원 어 를 제공 하여 병렬 일괄 처리 프로그램 을 매우 간단 하고 아름 답 게 만 들 었 습 니 다.S...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.