Pentaho Repository 및 PDI 활용 방법 정보

3550 단어 PDIpentahoETL

Pentaho Repository 소개


페타호의 7개 버전부터 페타호 리포지토리(Community Edition·무료 Edition)에서는 이 기능을 사용할 수 있다.
버전 6시리즈까지 Enterprise Repository로 불리는 기능으로 Enterprise 버전(유상판)만 사용할 수 있다.
Repository 이름처럼 Pentaho Server의 아카이브를 사용하여 Spoon에서 만든 ETL 정의체(Job 및 Transformation)를 저장할 수 있습니다.또한 Repository를 사용하면 다음과 같은 기능을 사용할 수 있습니다.
  • ETL의 정의체 보존(상기 참조)
  • ETL 정의체의 사용자 업데이트 또는 버전 관리(이전 버전으로 되돌아갈 수도 있음)
  • ETL 정의체의 잠금 기능7.0까지 Bug이므로 실제로 사용할 수 없지만 7.1로 변경됨
  • DB/Hadoop/SlaveServer에 연결 정보 공유
  • 공유 파티션 설정
  • 공유 클러스터 설정
  • 사용자/롤러 설정(ETL 정의체와 각종 연결 정보를 관리할 수 있는 권한)
  • PentahoServer를 사용한 스케줄링
  • 대개 파일에 저장된 ETL의 정의체로, Pentaho Repository를 사용하면 다양한 기능을 사용할 수 있으며 궁금한 점이 있으면 시도해 보십시오.

    설정 방법


    우선 초기 설정이다.
    Pentaho Repository의 본체가 Pentaho Server이기 때문에 먼저 Pentaho Server를 시작합니다.
    (Pentaho 설치 및 시작 방법은 여기에 있음)
    그런 다음 Spoon을 시작합니다.
    (PDI 설치 및 Spoon을 다음과 같이 시작합니다.)
    Spoon을 시작하면 오른쪽에 "Connect"라는 링크가 있으므로 Click을 사용합니다.

    이렇게 하면 아래 창이 일어나서 그림에 따라 설정됩니다.
    Display Name: Repositoryの表示名(わかりやすい名前で設定)
    URL: Repositoryとして使用するPentahoServerの接続先(例 http://localhost:8080/pentaho)
    Description: 説明文(必要であれば)
    
    초기 설정은 이것으로 끝냅니다.

    Pentaho Repository에 연결


    그런 다음 처음에 설정된 Pentaho Repository에 연결합니다.
    물론 PentahoServer를 시작해야 하기 때문에 PentahoServer가 시작된 상태에서 Spoon에서 다음과 같이 연결됩니다(사용자/비밀번호는 PentahoServer와 통용됩니다).

    Pentaho Repository 사용


    ETL 정의체 저장


    Spoon에서 Transformation을 적당히 만듭니다.이번에는 데이터 격자 절차만 하나 놓았다.생성 후 저장합니다.

    저장된 ETL 정의체 확인(Repository Explorer)


    Repository Explorer를 통해 저장된 ETL 정의체를 확인합니다.

    또한 Pentaho Repository는 Pentaho Server 내부에 있으므로 Pentaho Server를 통해서도 확인할 수 있습니다.
    브라우저에서 PentahoServer에 액세스하여 확인합니다.

    기타 기능 정보


    기본적으로 리포지토리 익스플로러에서 사용할 수 있지만, 이해하기 어려운 부분도 있어 별도로 정리할 예정이다.

    투고시 주의사항


    투고 기간(2017년 8월 13일)에"Spoon의""Connect""링크가 사라지는 Bug도 가끔 있습니다.".
    수정되지 않은 것 같아서 링크가 사라진 경우'데이터-integration/system/karaf/cachees/spoon/data*'를 삭제하고 Spoon을 다시 시작하십시오.

    좋은 웹페이지 즐겨찾기