Mac-搭建Hadoop集群_ZenDei技術網路在線

You have to work very hard to believe that you are really powerless. Mac-搭建Hadoop集群我用到了：VMware Fusion、CentOS7、FileZilla、jdk-8u181-linux-x64.tar.gz和ha ...

You have to work very hard to believe that you are really powerless.

Mac-搭建Hadoop集群

我用到了：VMware Fusion、CentOS7、FileZilla、jdk-8u181-linux-x64.tar.gz和hadoop-2.7.6.tar.gz

1、集群部署規劃

NameNode單點部署：

節點名稱	NN1	NN2	DN	RM	NM	規劃IP	other
tjt01	NameNode		DataNode		NodeManager	172.16.114.130	hive/hdfs
tjt02		SecondaryNameNode	DataNode	ResourceManager	NodeManager	172.16.114.131	hbase/kms
tjt03			DataNode		NodeManager	172.16.114.132	mysql/spark

2、三台客戶機相關準備

2.1、安裝VMware虛擬機

在虛擬機中安裝CentOS鏡像，由初始安裝的CentOS7版本的鏡像，完整克隆出另外兩台虛擬機

2.2、修改主機名

[root@tjt01 tjt]# vi /etc/hostname

分別修改三台虛擬機主機名：tjt01、tjt02、tjt03

2.3、修改host文件

配置主機host：

[root@tjt01 tjt]# vi /etc/hosts

將配置發送到其他的主機，同時在其他主機上配置：

scp -r /etc/hosts root@tjt02:/etc/
scp -r /etc/hosts root@tjt03:/etc/

測試host文件修改結果：

ping tjt01
ping tjt02
ping tjt03

2.4、設置SSH免密登錄

每兩台主機之間設置免密碼，自己的主機與自己的主機之間也要求設置免密碼；

輸入：ssh-keygen -t rsa

然後按下四次回車，之後在把密匙發到其他主機上，輸入：ssh-copy-id tjt01 並按提示輸入密碼，然後是ssh-copy-id 02和ssh-copy-id 03同樣的操作；

之後，在另外兩台虛擬機上也執行相同的步驟：

ssh-keygen -t rsa
ssh-copy-id tjt01
ssh-copy-id tjt02
ssh-copy-id tjt03

測試SSH免密登錄：

ssh tjt01、ssh tjt02、ssh tjt03

2.5、安裝配置JDK 虛擬機預設安裝了一個openjdk，卸載掉：

rpm -qa | grep jdk

可以查看已經安裝了的openjdk

yum remove *openjdk*

幹掉openjdk

yum remove copy-jdk-configs-3.3-10.el7_5.noarch

幹掉jdk-configs

將JDK安裝包上傳到/opt下，可以通過XShell的rz上傳，也可以用FileZilla：

到/opt 目錄下解壓：tar xzvf jdk-8u181-linux-x64.tar.gz

設置JAVA_HOME：

輸入：vi /etc/profile，在profile文件中的編輯模式下加上下方export配置：

export JAVA_HOME=/opt/jdk1.8.0_181
export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/sbin

修改好之後使文件生效：source /etc/profile

複製JDK到另外兩個節點：

在這之前要先把另外兩台虛擬機上的openjdk也幹掉：

yum remove *openjdk*
yum remove copy-jdk-configs-3.3-10.el7_5.noarch

然後複製jdk到另外兩個虛擬機上：

scp -r /opt/jdk1.8.0_181 root@tjt02:/opt/
scp -r /opt/jdk1.8.0_181 root@tjt03:/opt/

向其他節點複製profile文件：

scp /etc/profile root@tjt02:/etc/
scp /etc/profile root@tjt03:/etc/

然後每個節點分別執行 source /etc/profile ，使profile生效下，並通過java-version簡單測試下，jdk複製是否成功：

tjt02:

tjt03:

3、安裝Hadoop

3.1、上傳並解壓Hadoop

解壓：tar zxvf hadoop-2.7.6.tar.gz

3.2、搭建Hadoop集群

配置文件在hadoop2.7.6/etc/hadoop/下，修改設置hadoop2.7.6目錄下的可執行許可權

3.2.1、修改 core-site.xml

[root@tjt01 hadoop]# vi core-site.xml

然後在core-site.xml文件中編輯如下：

<!-- 指定HDFS中NameNode的地址 --> 
     <property>
     <name>fs.defaultFS</name>
         <value>hdfs://tjt01:9000</value>
     </property>
<!-- 指定hadoop運行時產生文件的存儲目錄 --> <property> 
     <name>hadoop.tmp.dir</name>
     <value>/opt/hadoop-2.7.6/data/full/tmp</value>
     </property>

3.2.2、修改hadoop-env.sh

[root@tjt01 hadoop]# vi hadoop-env.sh

修改JAVA_HOME：

3.2.3 修改hdfs-site.xml

[root@tjt01 hadoop]# vi hdfs-site.xml

修改 hdfs-site.xml 的配置如下：

<configuration> 
<!-- 設置dfs副本數，不設置預設是3個 --> 
    <property>
        <name>dfs.replication</name>
        <value>2</value>
</property> 
<!-- 設置secondname的埠 --> 
<property> 
  <name>dfs.namenode.secondary.http-address</name>
        <value>tjt02:50090</value>
    </property>
</configuration>

3.2.4 修改 slaves

[root@tjt01 hadoop]# vi slaves

增加slaves 配置如下：

tjt01
tjt02
tjt03

3.2.5 修改mapred-env.sh

[root@tjt01 hadoop]# vi mapred-env.sh

修改其JAVA_HOME如下：

export JAVA_HOME=/opt/jdk1.8.0_181

3.2.6 修改mapred-site.xml

[root@tjt01 hadoop]# mv mapred-site.xml.template mapred-site.xml
[root@tjt01 hadoop]# vi mapred-site.xml

修改其configuration如下：

<configuration>
<!-- 指定mr運行在yarn上 -->
    <property>
     <name>mapreduce.framework.name</name>
     <value>yarn</value>
    </property>
</configuration>

3.2.7 修改yarn-env.sh

[root@tjt01 hadoop]# vi yarn-env.sh

修改其JAVA_HOME如下：

export JAVA_HOME=/opt/jdk1.8.0_181

3.2.8 修改yarn-site.xml

[root@tjt01 hadoop]# vi yarn-site.xml

修改配置如下：

<configuration>
<!-- reducer獲取數據的方式 --> 
<property> 
 <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
     </property>
<!-- 指定YARN的ResourceManager的地址 --> 
<property> 
        <name>yarn.resourcemanager.hostname</name>
        <value>tjt02</value>
     </property>
    <property>
        <name>yarn.nodemanager.vmem-check-enabled</name>
        <value>false</value>
        <description>Whether virtual memory limits will be enforced for containers</description>
    </property>
    <property>
        <name>yarn.nodemanager.vmem-pmem-ratio</name>
        <value>4</value>
        <description>Ratio between virtual memory to physical memory when setting memory limits
for containers</description>
   </property>
</configuration>

3.3 分發hadoop到各個節點

[root@tjt01 hadoop]# scp -r /opt/hadoop-2.7.6/ root@tjt02:/opt

[root@tjt01 hadoop]# scp -r /opt/hadoop-2.7.6/ root@tjt03:/opt

3.4 配置環境變數

[root@tjt01 hadoop]# vi /etc/profile

修改配置如下：

export HADOOP_HOME=/opt/hadoop-2.7.6
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile 使profile文件生效；

[root@tjt01 hadoop]# source /etc/profile

3.5 分發profile到各個節點

[root@tjt01 hadoop]# scp /etc/profile root@tjt02:/etc/

[root@tjt01 hadoop]# scp /etc/profile root@tjt03:/etc/

到各自的服務節點上是profile 生效：

[root@tjt02 ~]# source /etc/profile

[root@tjt03 ~]# source /etc/profile

4 啟動驗證集群

4.1 啟動集群

4.1.1 如果集群是第一次啟動，需要格式化namenode

[root@tjt01 hadoop]# hdfs namenode -format

當看到19/05/03 03:45:47 INFO common.Storage: Storage directory /opt/hadoop-2.7.6/data/full/tmp/dfs/name has been successfully formatted. 就格式化OK了；

到此為止，上面存在有一個錯誤，不能在hdfs-site.xml文件中這麼寫註釋【#tjt】：

4.1.2 啟動Hdfs

[root@tjt01 hadoop-2.7.6]# start-dfs.sh

4.1.3 啟動Yarn

如果Namenode和ResourceManager不是同一臺虛擬機的話，不能在NameNode上啟動yarn，應該在ResourceManager所在的機器上啟動yarn；我的yarn配置在tjt02伺服器上，一次需要到tjt02機器上啟動yarn

[root@tjt02 hadoop]# start-yarn.sh

4.1.4 jps查看進程

[root@tjt01 hadoop]# jps

[root@tjt02 hadoop]# jps

[root@tjt03 hadoop]# jps

4.1.5 web頁面訪問

在虛擬機tjt01上訪問：http://172.16.114.130:50070

Datanode:

需要先在tjt3這台機器上關閉防火牆後，才可以在非linux伺服器中的瀏覽器訪問：

 //臨時關閉
systemctl stop firewalld
//禁止開機啟動
systemctl disable firewalld

本機訪問：http://172.16.114.130:50070/

在虛擬機tjt02上訪問：http://172.16.114.131:8088/cluster

4.2、Hadoop停止啟動方式

1）各個服務組件逐一啟動

分別啟動hdfs 組件：

hadoop-deamon.sh start | stop namenode | datnode | secondarynamenode

啟動yarn：

yarn-deamon.sh start | stop resourcemanager | nodemanager

2) 各個模塊分開啟動(常用)

start | stop-dfs.sh
start | stop-yarn.sh

3) 全部啟動

start | stop-all.sh

其他

1、關閉防火牆

 //臨時關閉
systemctl stop firewalld
//禁止開機啟動
systemctl disable firewalld

2、創建用戶，設置文件許可權

創建用戶，修改密碼：

[root@tjt01 ~]# useradd tjt
[root@tjt01 ~]# passwd tjt

設置tjt用戶具有root許可權修改 /etc/sudoers 文件，找到下麵一行，在root下麵添加一行，如下所示:

修改完畢，現在可以用tjt帳號登錄，然後用命令 su - ，即可獲得root許可權進行操作。

其實，當Web頁面訪問：http://172.16.114.130:50070，可以看到hadoop頁面時Hadoop集群就成功構建好了。