Apache Zeppelin 의 R 해석 기

개술
R 은 계산 과 도형 을 집계 하 는 데 사용 되 는 무료 소프트웨어 환경 이다.
Apache Zeppelin 에서 R 코드 와 시각 화 된 그래 픽 을 실행 하려 면 메 인 노드(또는 노트북 개발)에서 R 을 사용 해 야 합 니 다.
  • 대 Centos:  yum install R R-devel libcurl-devel openssl-devel
  • 대 Ubuntu:  apt-get install r-base

  • 간단 한 R 명령 으로 설치 확인: - "print(1+1)"  
    plots 를 즐 기 려 면 추가 라 이브 러 리 를 설치 하 십시오:+   devtools with `R  - "install.packages('devtools', repos = '<a href="http://cran.us.r-project.org%27%29/" "="" style="text-decoration-line: none; border-radius: 0px; background: 0px center; border: 0px; bottom: auto; float: none; height: auto; left: auto; line-height: 20px; margin: 0px; outline: 0px; overflow: visible; padding: 0px; position: static; right: auto; top: auto; vertical-align: baseline; width: auto; box-sizing: content-box; min-height: inherit; color: rgb(42, 0, 255) !important;">http://cran.us.r-project.org')" ` +   knitr with `R  - "install.packages('knitr', repos = '<a href="http://cran.us.r-project.org%27%29/" "="" style="text-decoration-line: none; border-radius: 0px; background: 0px center; border: 0px; bottom: auto; float: none; height: auto; left: auto; line-height: 20px; margin: 0px; outline: 0px; overflow: visible; padding: 0px; position: static; right: auto; top: auto; vertical-align: baseline; width: auto; box-sizing: content-box; min-height: inherit; color: rgb(42, 0, 255) !important;">http://cran.us.r-project.org')" ` +   ggplot2 with `R  - "install.packages('ggplot2', repos = '<a href="http://cran.us.r-project.org%27%29/" "="" style="text-decoration-line: none; border-radius: 0px; background: 0px center; border: 0px; bottom: auto; float: none; height: auto; left: auto; line-height: 20px; margin: 0px; outline: 0px; overflow: visible; padding: 0px; position: static; right: auto; top: auto; vertical-align: baseline; width: auto; box-sizing: content-box; min-height: inherit; color: rgb(42, 0, 255) !important;">http://cran.us.r-project.org')" ` +   Other vizualisation librairies: `R  - "install.packages(c('devtools','mplot', 'googleVis'), repos = 'http://cran.us.r-project.org'); require(devtools); install_github('ramnathv/rCharts')"
    저 희 는 즐 거 운 데이터 분석 에 사용 할 다음 과 같은 선택 가능 한 R 라 이브 러 리 를 설치 하 는 것 을 권장 합 니 다.
  • glmnet
  • PROC
  • data.table
  • caret
  • sqldf
  • wordcloud

  •  
    배치 하 다.
    R 해석 기로 Zeppelin 을 실행 하려 면 SPARK_HOME 환경 변 수 를 설정 해 야 합 니 다.가장 좋 은 방법 은 편집 conf/zeppelin-env.sh 이다.설정 하지 않 으 면 R 해석 기 는 스파크 와 인 터 페 이 스 를 할 수 없습니다.
    너 도 conf/zeppelin-site.xml.template 에서 conf/zeppelin-site.xml 을 복사 해 야 한다.이 는 제 베를린 에서 R 해석 기 를 처음 만 나 는 것 을 확보 할 것 이다.
     
    R 해석 기 사용
    기본적으로 R 해석 을 두 개의 Zeppelin 해석 기,%r%knitr 으로 표시 합 니 다.%r 은 일반 REPL 처럼 표현 된다.CLI 에서 처럼 명령 을 수행 할 수 있 습 니 다.
    R 기본 그림 이 완전히 지 원 됩 니 다.
    data.frame 을 되 돌려 주면 Zeppelin 은 Zeppelin 의 내 장 된 시각 화 를 사용 하여 표시 하려 고 시도 합 니 다.%knitr 인 터 페 이 스 는 knitr 첫 줄 의 chunk 옵션 을 직접 대상 으로 합 니 다.
    두 해석 기의 환경 은 같다.변 수 를 %r 으로 정의 하면 호출 을 사용 하면 범위 내 knitr 입 니 다.
     
    SparkR&언어 간 이동 사용SPARK_HOME 설정 하면 SparkR 패 키 지 는 자동 으로 불 러 옵 니 다:
    성화 상하 문과 어 경 SQL 을 창설 하고 현지 환경 에 주입 하면 자동 scsql 이다.
    같은 상황 에서 공유 %spark,%sql%pyspark 은 다음 과 같이 설명 한다.
    일반 R 변 수 를 scala 와 Python 에서 접근 할 수 있 습 니 다.
    반대로 도 마찬가지다.
     
    경고 및 고장 제거
  • R 해석 기의 거의 모든 문 제 는 잘못된 설정 으로 인 한 SPARK_HOME 이다.R 해석 기 는 실행 중인 Spark 와 일치 하 는 패키지 버 전 SparkR 을 불 러 오고 검색 을 통 해 SPARK_HOME 을 구현 해 야 합 니 다.Zeppelin 이 Spark 인터페이스 SPARK_HOME 으로 설정 되 지 않 으 면 R 해석 기 는 Spark 에 연결 할 수 없습니다.
  • knitr 환경 은 지속 적 이다.Zeppelin 에서 변 경 된 변 수 를 실행 하 는 블록 을 실행 하면 같은 블록 을 다시 실행 합 니 다.이 변 수 는 변경 되 었 습 니 다.변 하지 않 는 변 수 를 사용 합 니 다.
  • (%spark.r%r 은 같은 해석 을 호출 하 는 두 가지 다른 방식 입 니 다.%spark.knitr%knitr 의 기본 상황 에서 Zeppelin 은 R 해석 기 를 %spark. 번역 팀 에 두 었 기 때 문 입 니 다.
  • %r 해석 기 를 사용 합 니 다.data.frame,HTML 또는 그림 을 되 돌려 주면 결 과 를 주도 합 니 다.그래서 만약 에 세 가지 명령 을 집행 한다 면 하 나 는 hist() 이 고 다른 명령 의 결과 가 아니 라 직사 도 를 볼 수 있 을 것 이다.이것 은 Zeppelin 제한 이다.
  • 해석 기 에서 data.frame(예 를 들 어 head() 호출)%spark.r 으로 돌아 가면 Zeppelin 의 내 장 된 데이터 시각 화 시스템 으로 분 석 됩 니 다.
  • knitr 아니에요.rmarkdown?왜 htmlwidgets 이 없 습 니까?htmlwidgets 을 지원 하기 위해 서 는 간접 적 인 의존 을 가지 고 있 으 며,rmarkdownpandoc 을 사용 하여 시디롬 을 기록 하고 읽 어야 합 니 다.이것 은 그것 으로 하여 금 knitr RAM 보다 훨씬 느리게 운행 하 게 한다.
  • 은 왜 ggvisshiny 이 아 닙 니까?shiny 을 지원 하려 면 역방향 대 리 를 Zeppelin 에 통합 해 야 합 니 다.이것 은 작업 입 니 다.
  • 최대 OS X 와 대소 문 자 를 구분 하지 않 는 파일 시스템.대소 문 자 를 구분 하지 않 는 파일 시스템(Mac OS X 기본 값)에 설치 하려 고 시도 하면 Maven 은 무의식중에 설치 디 렉 터 리 를 삭제 할 수 있 습 니 다.rR 이 같은 하위 디 렉 터 리 가 되 었 기 때 문 입 니 다.
  • 오류 unable to start device X11 과 REPL 해석.셸 로그 인 스 크 립 트 를 확인 하고 DISPLAY 에서 환경 변 수 를 조정 하 는 지 확인 하 십시오.이것 은 일부 운영 체제 에서 흔히 볼 수 있 는 ssh 문제 의 해결 방법 이지 만 R 그림 그리 기 를 방해 할 수 있 습 니 다.
  • akka 라 이브 러 리 버 전 또는 TTransport 오류.SPARK 를 사용 해 보시 면HOME 에서 Zeppelin 을 실행 하 는데 이 버 전의 Spark 버 전 은 -Pspark-1.x 이 Zeppelin 을 컴 파일 할 때 지정 한 버 전과 다르다.

  • 좋은 웹페이지 즐겨찾기