0부터 시작하는 Hortonworks(sandbox 설정에서 HDFS로 데이터 로드)

7005 단어 HortonworksAzure
Horton Works는 데이터 분석의 어떤 거죠?
얼마 안 되는 아는 나는 Hortonworks를 접촉해 보았다.

이 보도의 내용은 세 줄로 한다

  • Hortonworks의 샌드박스는 다양한 데이터 분석을 즐길 수 있습니다.
  • Microsoft Azure를 사용하면 버튼을 조금만 누르면 사용할 수 있습니다.

  • 강좌가 충실하다
  • 시작하기 전에


    Hortonworks는 어떤 서비스의 이름입니까?
    아니면 회사 이름?
    Hortonworks
    http://jp.hortonworks.com/
    확실히
  • Hortonworks는 회사명입니다
  • Hortonworks의 w는 소문자입니다
  • 기업이 보유한 데이터를 잘 활용하는 것을 제공한다
  • 좋은 느낌의 무언가를 이용해 볼 수 있을까요?
    및 제품
    샌드박스를 사용하는 튜토리얼이 있어서요.
    여기서부터 봤어요.

    Azure에 sandbox 배포


    Azure로 샌드박스 환경을 만들어 보세요.
    배치 방법에 관해서는 아래의 문장을 참고하여 제작하였다.
    Azure의 Hortonworks Data Platform에서 Hadoop, Spark 시도
    http://qiita.com/kkitase/items/1d2e4662c2e8c9b0fd59
    템플릿에서 배치할 때의 설명문을 읽어보시면
    Sandbox comes with over fifty hands-on tutorials that will guide you through the Hadoop, Spark, Storm, HBase, Kafka, Hive, Ambari and YARN; tutorials built on the experience gained from training thousands of people in our Hortonworks University Training classes.
    If you are new to Hadoop, HDP and the Sandbox we suggest sequence of tutorials to get started:
    sandbox 환경, 많은 강좌를 즐길 수 있습니다!http://<Azureで割り振られたパブリックIPアドレス>:8080/에서 기술한 장면은 다음과 같은 절차를 이용하여 명세표를 작성하여 개념 디자인에서 체량의 부피를 분석하도록 한다.
    초기 사용자 ID 및 암호의
    maria_dev/maria_dev
    대화상자, 사용자 정의 형식을 정의할 수 있습니다.

    설정 시도


    샌드박스 설정을 추진합니다.
    http://jp.hortonworks.com/hadoop-tutorial/learning-the-ropes-of-the-hortonworks-sandbox/

    2.1 SETUP AMBARI ADMIN PASSWORD MANUALLY


    Ambari의 관리자 암호를 재설정하고 재부팅합니다.
    $ sudo ambari-admin-password-reset
    Please set the password for admin:
    Please retype the password for admin:
    
    The admin password has been set.
    Restarting ambari-server to make the password change effective...
    
    Using python  /usr/bin/python2
    Restarting ambari-server
    Using python  /usr/bin/python2
    Stopping ambari-server
    Ambari Server stopped
    Using python  /usr/bin/python2
    Starting ambari-server
    Ambari Server running with administrator privileges.
    Organizing resource files at /var/lib/ambari-server/resources...
    Server PID at: /var/run/ambari-server/ambari-server.pid
    Server out at: /var/log/ambari-server/ambari-server.out
    Server log at: /var/log/ambari-server/ambari-server.log
    Waiting for server start....................
    Ambari Server 'start' completed successfully.
    
    $ sudo ambari-agent restart
    Restarting ambari-agent
    Verifying Python version compatibility...
    Using python  /usr/bin/python2
    Found ambari-agent PID: 3262
    Stopping ambari-agent
    Removing PID file at /var/run/ambari-agent/ambari-agent.pid
    ambari-agent successfully stopped
    Verifying Python version compatibility...
    Using python  /usr/bin/python2
    Checking for previously running Ambari Agent...
    Starting ambari-agent
    Verifying ambari-agent process status...
    Ambari Agent successfully started
    Agent PID at: /var/run/ambari-agent/ambari-agent.pid
    Agent out at: /var/log/ambari-agent/ambari-agent.out
    Agent log at: /var/log/ambari-agent/ambari-agent.log
    
    그럼 Ambari에 다시 로그인할게요.
    admin/설정된 암호
    admin으로 들어갈 수 있어요.
    이제 위 메뉴의 관리자 항목을 사용할 수 있습니다.

    Hadoop 튜토리얼 시도


    대량의 강좌가 있다.
    http://jp.hortonworks.com/tutorials/
    그러나 다른 강좌들은 선결 조건에 대한 지식이 필요한 것 같다
    우선 초보자를 위한 이쪽을 추진해보자.
    Hadoop Tutorial - Getting Started with HDP
    http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/
    위 페이지의 링크에서 "Geolocation.zip"이라는 데이터를 다운로드하고 압축을 해제합니다.
    안에 csv가 두 개 있습니다.이 데이터가 가시화되기 전에 튜토리얼인 것 같습니다.
    강좌에 따라 진행하다.
    Ambari를 열고 왼쪽 위 메뉴에서 HDFS Files를 선택합니다.

    사용자 선택

    maria_dev 선택

    오른쪽 위 모서리의 새 디렉토리 선택

    데이터 디렉터리 만들기

    그리고 데이터 디렉터리로 이동

    Geolocation의 csv를 업로드합니다!

    전기!

    이전 층으로 돌아가서 데이터 폴더를 오른쪽 단추로 누르십시오.
    성능 을 선택합니다.

    파란색으로 저장하려면 쓰기 를 클릭합니다.



    이제 HDFS에 데이터를 로드할 수 있습니다.
    다음은 데이터의 표화와 분석이 시작된 것 같다.
    튜토리얼은 영어지만 그림과 설명도 많다
    여기까지 아주 쉽게 진행되었습니다.
    좌절하지 마라.

    좋은 웹페이지 즐겨찾기