0부터 시작하는 Hortonworks(sandbox 설정에서 HDFS로 데이터 로드)
7005 단어 HortonworksAzure
얼마 안 되는 아는 나는 Hortonworks를 접촉해 보았다.
이 보도의 내용은 세 줄로 한다
강좌가 충실하다
시작하기 전에
Hortonworks는 어떤 서비스의 이름입니까?
아니면 회사 이름?
Hortonworks
http://jp.hortonworks.com/
확실히
및 제품
샌드박스를 사용하는 튜토리얼이 있어서요.
여기서부터 봤어요.
Azure에 sandbox 배포
Azure로 샌드박스 환경을 만들어 보세요.
배치 방법에 관해서는 아래의 문장을 참고하여 제작하였다.
Azure의 Hortonworks Data Platform에서 Hadoop, Spark 시도
http://qiita.com/kkitase/items/1d2e4662c2e8c9b0fd59
템플릿에서 배치할 때의 설명문을 읽어보시면
Sandbox comes with over fifty hands-on tutorials that will guide you through the Hadoop, Spark, Storm, HBase, Kafka, Hive, Ambari and YARN; tutorials built on the experience gained from training thousands of people in our Hortonworks University Training classes.
If you are new to Hadoop, HDP and the Sandbox we suggest sequence of tutorials to get started:
sandbox 환경, 많은 강좌를 즐길 수 있습니다!http://<Azureで割り振られたパブリックIPアドレス>:8080/
에서 기술한 장면은 다음과 같은 절차를 이용하여 명세표를 작성하여 개념 디자인에서 체량의 부피를 분석하도록 한다.
초기 사용자 ID 및 암호의
maria_dev/maria_dev
대화상자, 사용자 정의 형식을 정의할 수 있습니다.
설정 시도
샌드박스 설정을 추진합니다.
http://jp.hortonworks.com/hadoop-tutorial/learning-the-ropes-of-the-hortonworks-sandbox/
2.1 SETUP AMBARI ADMIN PASSWORD MANUALLY
Ambari의 관리자 암호를 재설정하고 재부팅합니다.$ sudo ambari-admin-password-reset
Please set the password for admin:
Please retype the password for admin:
The admin password has been set.
Restarting ambari-server to make the password change effective...
Using python /usr/bin/python2
Restarting ambari-server
Using python /usr/bin/python2
Stopping ambari-server
Ambari Server stopped
Using python /usr/bin/python2
Starting ambari-server
Ambari Server running with administrator privileges.
Organizing resource files at /var/lib/ambari-server/resources...
Server PID at: /var/run/ambari-server/ambari-server.pid
Server out at: /var/log/ambari-server/ambari-server.out
Server log at: /var/log/ambari-server/ambari-server.log
Waiting for server start....................
Ambari Server 'start' completed successfully.
$ sudo ambari-agent restart
Restarting ambari-agent
Verifying Python version compatibility...
Using python /usr/bin/python2
Found ambari-agent PID: 3262
Stopping ambari-agent
Removing PID file at /var/run/ambari-agent/ambari-agent.pid
ambari-agent successfully stopped
Verifying Python version compatibility...
Using python /usr/bin/python2
Checking for previously running Ambari Agent...
Starting ambari-agent
Verifying ambari-agent process status...
Ambari Agent successfully started
Agent PID at: /var/run/ambari-agent/ambari-agent.pid
Agent out at: /var/log/ambari-agent/ambari-agent.out
Agent log at: /var/log/ambari-agent/ambari-agent.log
그럼 Ambari에 다시 로그인할게요.
admin/설정된 암호
admin으로 들어갈 수 있어요.
이제 위 메뉴의 관리자 항목을 사용할 수 있습니다.
Hadoop 튜토리얼 시도
대량의 강좌가 있다.
http://jp.hortonworks.com/tutorials/
그러나 다른 강좌들은 선결 조건에 대한 지식이 필요한 것 같다
우선 초보자를 위한 이쪽을 추진해보자.
Hadoop Tutorial - Getting Started with HDP
http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/
위 페이지의 링크에서 "Geolocation.zip"이라는 데이터를 다운로드하고 압축을 해제합니다.
안에 csv가 두 개 있습니다.이 데이터가 가시화되기 전에 튜토리얼인 것 같습니다.
강좌에 따라 진행하다.
Ambari를 열고 왼쪽 위 메뉴에서 HDFS Files를 선택합니다.
사용자 선택
maria_dev 선택
오른쪽 위 모서리의 새 디렉토리 선택
데이터 디렉터리 만들기
그리고 데이터 디렉터리로 이동
Geolocation의 csv를 업로드합니다!
전기!
이전 층으로 돌아가서 데이터 폴더를 오른쪽 단추로 누르십시오.
성능 을 선택합니다.
파란색으로 저장하려면 쓰기 를 클릭합니다.
↓
이제 HDFS에 데이터를 로드할 수 있습니다.
다음은 데이터의 표화와 분석이 시작된 것 같다.
튜토리얼은 영어지만 그림과 설명도 많다
여기까지 아주 쉽게 진행되었습니다.
좌절하지 마라.
Reference
이 문제에 관하여(0부터 시작하는 Hortonworks(sandbox 설정에서 HDFS로 데이터 로드)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/rina0521/items/da20648280df64d1611c
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
샌드박스 설정을 추진합니다.
http://jp.hortonworks.com/hadoop-tutorial/learning-the-ropes-of-the-hortonworks-sandbox/
2.1 SETUP AMBARI ADMIN PASSWORD MANUALLY
Ambari의 관리자 암호를 재설정하고 재부팅합니다.
$ sudo ambari-admin-password-reset
Please set the password for admin:
Please retype the password for admin:
The admin password has been set.
Restarting ambari-server to make the password change effective...
Using python /usr/bin/python2
Restarting ambari-server
Using python /usr/bin/python2
Stopping ambari-server
Ambari Server stopped
Using python /usr/bin/python2
Starting ambari-server
Ambari Server running with administrator privileges.
Organizing resource files at /var/lib/ambari-server/resources...
Server PID at: /var/run/ambari-server/ambari-server.pid
Server out at: /var/log/ambari-server/ambari-server.out
Server log at: /var/log/ambari-server/ambari-server.log
Waiting for server start....................
Ambari Server 'start' completed successfully.
$ sudo ambari-agent restart
Restarting ambari-agent
Verifying Python version compatibility...
Using python /usr/bin/python2
Found ambari-agent PID: 3262
Stopping ambari-agent
Removing PID file at /var/run/ambari-agent/ambari-agent.pid
ambari-agent successfully stopped
Verifying Python version compatibility...
Using python /usr/bin/python2
Checking for previously running Ambari Agent...
Starting ambari-agent
Verifying ambari-agent process status...
Ambari Agent successfully started
Agent PID at: /var/run/ambari-agent/ambari-agent.pid
Agent out at: /var/log/ambari-agent/ambari-agent.out
Agent log at: /var/log/ambari-agent/ambari-agent.log
그럼 Ambari에 다시 로그인할게요.admin/설정된 암호
admin으로 들어갈 수 있어요.
이제 위 메뉴의 관리자 항목을 사용할 수 있습니다.
Hadoop 튜토리얼 시도
대량의 강좌가 있다.
http://jp.hortonworks.com/tutorials/
그러나 다른 강좌들은 선결 조건에 대한 지식이 필요한 것 같다
우선 초보자를 위한 이쪽을 추진해보자.
Hadoop Tutorial - Getting Started with HDP
http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/
위 페이지의 링크에서 "Geolocation.zip"이라는 데이터를 다운로드하고 압축을 해제합니다.
안에 csv가 두 개 있습니다.이 데이터가 가시화되기 전에 튜토리얼인 것 같습니다.
강좌에 따라 진행하다.
Ambari를 열고 왼쪽 위 메뉴에서 HDFS Files를 선택합니다.
사용자 선택
maria_dev 선택
오른쪽 위 모서리의 새 디렉토리 선택
데이터 디렉터리 만들기
그리고 데이터 디렉터리로 이동
Geolocation의 csv를 업로드합니다!
전기!
이전 층으로 돌아가서 데이터 폴더를 오른쪽 단추로 누르십시오.
성능 을 선택합니다.
파란색으로 저장하려면 쓰기 를 클릭합니다.
↓
이제 HDFS에 데이터를 로드할 수 있습니다.
다음은 데이터의 표화와 분석이 시작된 것 같다.
튜토리얼은 영어지만 그림과 설명도 많다
여기까지 아주 쉽게 진행되었습니다.
좌절하지 마라.
Reference
이 문제에 관하여(0부터 시작하는 Hortonworks(sandbox 설정에서 HDFS로 데이터 로드)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/rina0521/items/da20648280df64d1611c
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Reference
이 문제에 관하여(0부터 시작하는 Hortonworks(sandbox 설정에서 HDFS로 데이터 로드)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/rina0521/items/da20648280df64d1611c텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)