WSL에 HIVE 설치

5508 단어 bigdatahadoophive

하이브 설치 및 실행



Windows Linux 하위 시스템에 Apache Hive 설치
Apache Hive를 구성하려면 먼저 Hive를 다운로드하고 압축을 풀어야 합니다. 그런 다음 다음 파일 및 설정을 사용자 지정해야 합니다.
Ubuntu 명령줄에서 wget 명령과 다운로드 경로를 차례로 사용하여 압축된 Hive 파일을 다운로드합니다.

wget https://downloads.apache.org/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz



다운로드 프로세스가 완료되면 압축된 Hive 패키지의 압축을 풉니다.

tar xzf apache-hive-3.1.2-bin.tar.gz




2 단계



Hive 환경 변수 구성(~/.bashrc)
$HIVE_HOME 환경 변수는 클라이언트 셸을 apache-hive-3.1.2-bin 디렉터리로 지정해야 합니다. 선택한 텍스트 편집기를 사용하여 .bashrc 셸 구성 파일을 편집합니다(nano를 사용함).

source vim ~/.bashrc


다음 Hive 환경 변수를 .bashrc 파일에 추가합니다.

export HIVE_HOME= "home/anuj/hadoop/apache-hive-3.1.2-bin"
export PATH=$PATH:$HIVE_HOME/bin



Hive 변수를 추가한 후 .bashrc 파일을 저장하고 종료합니다. 다음 명령을 사용하여 현재 환경에 변경 사항을 적용합니다.

source ~/.bashrc


3단계



hive-config.sh 파일 편집
Apache Hive는 Hadoop 분산 파일 시스템과 상호 작용할 수 있어야 합니다. 이전에 만든 $HIVE_HOME 변수를 사용하여 hive-config.sh 파일에 액세스합니다.

sudo vim $HIVE_HOME/bin/hive-config.sh




세트-4



HDFS에서 Hive 디렉토리 생성
  • 임시 tmp 디렉토리는 Hive 프로세스의 중간 결과를 저장합니다.
  • 웨어하우스 디렉토리는 Hive 관련 테이블을 저장할 예정입니다.
    tmp 디렉토리 생성
    HDFS 스토리지 계층 내에 tmp 디렉토리를 생성합니다. 이 디렉토리는 Hive가 HDFS로 전송하는 중간 데이터를 저장합니다.

  • hdfs dfs -mkdir /tmp
    


    tmp 그룹 구성원에게 쓰기 및 실행 권한을 추가합니다.

    hdfs dfs -chmod g+w /tmp
    


    권한이 올바르게 추가되었는지 확인하십시오.

    hdfs dfs -ls /
    


    출력은 사용자에게 이제 쓰기 및 실행 권한이 있음을 확인합니다.
    hadoop fs -ls/명령을 입력하십시오.

    창고 디렉토리 생성
    /user/hive/상위 디렉토리 내에 웨어하우스 디렉토리를 생성합니다.

    hdfs dfs -mkdir -p /user/hive/warehouse
    


    웨어하우스 그룹 구성원에게 쓰기 및 실행 권한을 추가하십시오.

    hdfs dfs -chmod g+w /user/hive/warehouse
    


    권한이 올바르게 추가되었는지 확인하십시오.

    hdfs dfs -ls /user/hive
    


    출력은 사용자에게 이제 쓰기 및 실행 권한이 있음을 확인합니다.



    세트-5



    hive-site.xml 파일 구성(선택 사항)
    Apache Hive 배포에는 기본적으로 템플릿 구성 파일이 포함되어 있습니다. 템플릿 파일은 Hive conf 디렉토리에 있으며 기본 Hive 설정을 간략하게 설명합니다.

    다음 명령을 사용하여 올바른 파일을 찾습니다.

    cd $HIVE_HOME/conf
    


    ls 명령을 사용하여 폴더에 포함된 파일을 나열합니다.


    hive-default.xml.template을 사용하여 hive-site.xml 파일을 생성합니다.

    cp hive-default.xml.template hive-site.xml
    


    nano 텍스트 편집기를 사용하여 hive-site.xml 파일에 액세스합니다.

    sudo vim hive-site.xml
    


    6단계



    Apache Hive는 Derby 데이터베이스를 사용하여 메타데이터를 저장합니다. schematool 명령을 사용하여 Hive bin 디렉터리에서 Derby 데이터베이스를 시작합니다.

    $HIVE_HOME/bin/schematool -dbType derby -initSchema
    


    프로세스를 완료하는 데 몇 분 정도 걸릴 수 있습니다.


    Derby는 Hive의 기본 메타데이터 저장소입니다. MySQL 또는 PostgreSQL과 같은 다른 데이터베이스 솔루션을 사용하려는 경우 hive-site.xml 파일에서 데이터베이스 유형을 지정할 수 있습니다.

    Ubuntu에서 Hive 클라이언트 셸 실행
    다음 명령을 사용하여 Hive 명령줄 인터페이스를 시작합니다.

    cd $HIVE_HOME/bin
    



    hive
    


    이제 SQL과 유사한 명령을 실행하고 HDFS와 직접 상호 작용할 수 있습니다.

    좋은 웹페이지 즐겨찾기