Hadoop Multiple Nodes Cluster

3579 단어

데이터 1 서버 설정

  • 정적 IP 수정
    #ubuntu17.10 
    sudo nano /etc/netplan/01-netcfg.yaml 
    
    01-netcfg.yaml
    # This file describes the network interfaces available on your system
    # For more information, see netplan(5).
    # gateway4 
    network:
      version: 2
      renderer: networkd
      ethernets:
        ens33:
          dhcp4: no
          dhcp6: no
          addresses: [192.168.72.101/24]
          gateway4: 192.168.72.2 
          nameservers:
              addresses: [114.114.114.114, 8.8.8.8]
    
  • 수정된 IP를 적용합니다
    sudo netplan apply
    
  • 호스트name 호스트 이름 편집
    sudo nano /etc/hostname
    # data1
    data1
    
  • hosts 파일을 편집합니다
    sudo nano /etc/hosts
    
    127.0.0.1       localhost
    127.0.1.1       ubuntu
    # hosts
    192.168.72.100  master
    192.168.72.101  data1
    192.168.72.102  data2
    192.168.72.103  data3
    
  • 코어 사이트 편집.xml
    
      
      fs.default.name
      hdfs://master:9000
      
      
    
  • yarn-site 편집.xml
    
    
    
    
            yarn.nodemanager.aux-services
            mapreduce_shuffle
    
    
            yarn.nodemanager.aux-services.mapreduce.shuffle.class
            org.apache.hadoop.mapred.ShuffleHandler
    
        
    
      yarn.resourcemanager.resource-tracker.address
      master:8025
    
    
      yarn.resourcemanager.scheduler.address
      master:8030
    
    
      yarn.resourcemanager.address
      master:8050
    
        
    
    
    
  • mapred-site 편집.xml
    
    
            mapred.job.tracker
            master:54311
    
    
    
  • hdfs-site 편집.xml
    
    
            dfs.replication
            1
    
    
            dfs.namenode.name.dir
            file:/usr/local/hadoop/hadoop_data/hdfs/namenode
    
    
    

  • VM 복제

  • 데이터 2 복제 및 맥 주소 초기화
  • hostname 및 IP 주소 수정
    sudo nano /etc/hostname
    sudo nano /etc/netplan/*.yaml
    sudo netplan apply
    

  • 데이터 3 복제 및 맥 주소 초기화
  • hostname 및 IP 주소 수정

  • master 복제 및 mac 주소 초기화
  • hostname 및 IP 주소 수정


  • Master는 HDFS 디렉토리를 만들기 위해 Data1, data2, data3에 연결

  • 5개의 가상 머신을 시작합니다
  • ssh를 통해 데이터1, 데이터2, 데이터3를 연결하고 DataNode 노드를 설정합니다
    # data1
    ssh data1
    
    # HDFS 
    sudo rm -rf /usr/local/hadoop/hadoop_data/hdfs
    # DataNode 
    mkdir -p /usr/local/hadoop/hadoop_data/hdfs/datanode
    # hduser
    sudo chown  -R hduser:hduser /usr/local/hadoop
    exit
    
  • NameNode 노드를 설정합니다
    # HDFS 
    sudo rm -rf /usr/local/hadoop/hadoop_data/hdfs
    # NameNode 
    mkdir -p /usr/local/hadoop/hadoop_data/hdfs/namenode
    # hduser
    sudo chown  -R hduser:hduser /usr/local/hadoop
    # Namenode HDFS 
    hadoop namenode -format
    

  • Hadoop Multi Node Cluster 시작

    # HDFS
    start-dfs.sh
    # YARN
    start-yarn.sh
    # 
    start-all.sh
    
  • Hadoop ResourceManager 웹 인터페이스http://192.168.72.100:8088/
  • NameNode 웹 인터페이스http://192.168.72.100:50070
  • 좋은 웹페이지 즐겨찾기