Linux 학습-Hadoop 빠 른 입문

4839 단어 Linux

Hadoop 설치
1.설치 전제

JavaTM 1.5.x,설치 해 야 합 니 다.Sun 회사 가 발행 하 는 자바 버 전 을 선택 하 는 것 을 권장 합 니 다

ssh 는 원 격 Hadoop 데 몬 을 Hadoop 스 크 립 트 로 관리 할 수 있 도록 sshd 가 계속 실행 되도록 설치 하고 보증 해 야 합 니 다

2.Hadoop 클 러 스 터 를 실행 하 는 준비 작업

다운 로드 된 Hadoop 발행 판 을 압축 해제 합 니 다

conf/hadop-env.sh 파일 을 편집 하려 면 최소한 JAVAHOME 는 자바 설치 루트 경 로 를 설정 합 니 다.

다음 명령 을 시도 합 니 다:$bin/hadop 은 hadop 스 크 립 트 의 사용 문 서 를 표시 합 니 다

현재 아래 세 가지 지원 모드 중 하나 로 Hadoop 클 러 스 터 를 시작 할 수 있 습 니 다.
단일 기기 모드
위 분포 식 모델
완전 분포 식 모델
3.단기 모드 의 조작 방법:
기본적으로 Hadoop 은 비분 포식 모드 로 실행 되 는 독립 된 자바 프로 세 스 로 설정 되 어 있 습 니 다.이것 은 디 버 깅 에 매우 도움 이 된다.다음 인 스 턴 스 는 압축 해 제 된 conf 디 렉 터 리 를 입력 으로 복사 하여 주어진 정규 표현 식 과 일치 하 는 항목 을 찾 아 표시 합 니 다.출력 을 지정 한 output 디 렉 터 리 에 기록 합 니 다.

$ mkdir input 
$ cp conf/*.xml input 
$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+' 
$ cat output/*

4.의사 분포 식 모드 의 조작 방법:
Hadoop 은 단일 노드 에서 이른바 의사 분포 식 모드 로 실행 할 수 있 습 니 다.이 때 모든 Hadoop 데 몬 은 독립 된 자바 프로 세 스 로 실 행 됩 니 다.4.1 설정 은 다음 과 같은 conf/hadop-site.xml 을 사용 합 니 다.

<configuration>
  <property>
    <name>fs.default.namename>
    <value>localhost:9000value>
  property>
  <property>
    <name>mapred.job.trackername>
    <value>localhost:9001value>
  property>
  <property>
    <name>dfs.replicationname>
    <value>1value>
  property>
configuration>

4.2 비밀번호 면제 ssh 설정 암 호 를 입력 하지 않 고 ssh 로 localhost 에 로그 인 할 수 있 는 지 확인 합 니 다.

$ ssh localhost

암 호 를 입력 하지 않 으 면 ssh 로 localhost 에 로그 인 할 수 없습니다.다음 명령 을 수행 하 십시오:

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa 
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

4.3 새로운 분포 식 파일 시스템 포맷 을 실행 합 니 다.

$ bin/hadoop namenode -format

Hadoop 데 몬 시작:

$ bin/start-all.sh

NameNode 와 JobTracker 의 네트워크 인 터 페 이 스 를 탐색 합 니 다.주 소 는 기본적으로 다음 과 같 습 니 다.
NameNode - http://localhost:50070/ JobTracker - http://localhost:50030/ 입력 파일 을 분산 파일 시스템 으로 복사 합 니 다:

$ bin/hadoop fs -put conf input

발행 판 에서 제공 하 는 예제 프로그램 을 실행 합 니 다:

$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

출력 파일 보기:출력 파일 을 분포 식 파일 시스템 에서 로 컬 파일 시스템 으로 복사 합 니 다.

$ bin/hadoop fs -get output output 
$ cat output/*

또는 분포 식 파일 시스템 에서 출력 파일 보기:

$ bin/hadoop fs -cat output/*

모든 작업 이 완료 되면 데 몬 을 중단 합 니 다:

$ bin/stop-all.sh

5.완전 분포 식 모드 의 조작 방법
아래 링크 참조:http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html

이 내용에 흥미가 있습니까?

현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:

바이너리 파일cat 또는tail, 터미널 디코딩 시 처리 방법

cat으로 바이너리 파일을 보려고 할 때 코드가 엉망이 되어 식은땀이 났다. 웹에서 스크롤된 정보의 처리 방법과alias의 설정을 요약합니다. reset 명령을 사용하여 터미널을 재설정합니다.이렇게 하면 고치지 못하...

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다