CentOS上安裝Hadoop2.7，添加數據節點，運行wordcount

-Advertisement-

安裝hadoop的步驟比較繁瑣，但是並不難。在CentOS上安裝Hadoop2.7 1. 安裝 CentOS，註：圖形界面並無必要 2. 在CentOS里設置靜態IP，手工編輯如下4個文件 /etc/hosts /etc/sysconfig/netwok /etc/hostname /etc/sy ...

安裝hadoop的步驟比較繁瑣，但是並不難。

在CentOS上安裝Hadoop2.7

1. 安裝 CentOS，註：圖形界面並無必要

2. 在CentOS里設置靜態IP，手工編輯如下4個文件

/etc/hosts
/etc/sysconfig/netwok
/etc/hostname
/etc/sysconfig/network-scripts/ifcfg-eno1677773

3. 關閉防火牆

Close firewalld
systemctl stop firewalld.service #停止firewall
systemctl disable firewalld.service #禁止firewall開機啟動

4. 設置ssh無密登錄

l 去掉/etc/ssh/sshd_config其中2行的註釋
#RSAAuthentication yes
#PubkeyAuthentication yes

l 輸入命令，ssh-keygen -t rsa，生成key，都不輸入密碼，一直回車，/root就會生成.ssh文件夾，每台伺服器都要設置

l 合併公鑰到authorized_keys文件，在Master伺服器，進入/root/.ssh目錄，通過SSH命令合併，
cat id_rsa.pub>> authorized_keys

l 把Master伺服器的authorized_keys、known_hosts複製到Slave伺服器的/root/.ssh目錄

5. 為提高軟體下載速度，可以把軟體安裝庫轉向阿裡雲

6. Install net-tools, yum, wget, vim

7. Install Java

Yum list java*
[root@beta-new1 www]# yum -y install java-1.8.0-openjdk.x86_64

8. Configure Java

[root@localhost ~]# which java

/usr/bin/java

[root@localhost ~]# ls -lrt /usr/bin/java

lrwxrwxrwx. 1 root root 22 Aug 17 15:12 /usr/bin/java -> /etc/alternatives/java

[root@localhost ~]# ls -lrt /etc/alternatives/java

lrwxrwxrwx. 1 root root 46 Aug 17 15:12 /etc/alternatives/java -> /usr/lib/jvm/jre-1.7.0-openjdk.x86_64/bin/java

9. 從官網下載Hadoop “hadoop-2.7.0.tar.gz”放到/home/hadoop目錄下

10. 輸入命令解壓

tar -xzvf hadoop-2.7.0.tar.gz

11. 在/home/hadoop目錄下創建數據存放的文件夾，tmp、hdfs、hdfs/data、hdfs/name

12. 修改Hadoop設置

／Hadoop2.7.3／etc／Hadoop／hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.131-3.b12.e17_3.x86_64

／Hadoop2.7.3／etc／Hadoop／slaves
／Hadoop2.7.3／etc／Hadoop／mapred-site.xml
／Hadoop2.7.3／etc／Hadoop／hdfs-site.xml
／Hadoop2.7.3／etc／Hadoop／core-site.xml

13. 在Master伺服器啟動hadoop

初始化

bin/hdfs namenode –format

l 全部啟動sbin/start-all.sh，也可以分開sbin/start-dfs.sh、sbin/start-yarn.sh

l 停止Hadoop服務

l sbin/stop-all.sh

l 輸入命令jps，可以看到節點相關信息

14. 訪問Hadoop

瀏覽器打開http://192.168.0.182:8088/
瀏覽器打開http://192.168.0.182:50070/

添加新數據節點步驟

安裝CentOS，設置靜態IP（4個配置文件）
加入SSH免密碼登錄
SCP把Hadoop文件複製到新機器
修改／Hadoop2.7.3／etc／Hadoop／slaves
重新初始化
重新啟動hadoop服務

運行WordCount程式

1、在HDFS中創建目錄input

hadoop fs -mkdir /input

2、將本地的 PESXXX.txt上傳到input中

hadoop fs -put PESXXX.txt /input

查看input目錄下的文件

hadoop fs -ls /input

查看PESXXX.txt文件內容

hadoop fs -cat /input/ PESXXX.txt

3、運行程式

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /input /output/

4、查看結果

查看輸出目錄hadoop fs -ls /output

查看輸出結果hadoop fs -cat /output/part-r-0000

5、可在瀏覽器查看任務

http://192.168.1.15:8088

http://192.168.1.15:50070

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

[Android FrameWork 6.0源碼學習] View的重繪過程之Measure

View繪製的三部曲，測量，佈局，繪畫今天我們分析測量過程 view的測量是從ViewRootImpl發起的，View需要重繪，都是發送請求給ViewRootImpl，然後他組織重繪在重繪的過程中，有一步就是測量，通過代碼來分析測量過程這個函數通過getRootMeasureSpec方法，獲取測 ...
如何將App程式發佈到蘋果App Store

原文網上抄錄 ...
去除ios反調試

在逆向過程中經常會遇到反調試，如下段代碼： 0008bd8e movs r1, #0xa ; argument #2 for method imp___symbolstub1__dlopen 0008bd90 blx imp___symbolstub1__dlopen 0008bd94 movw r ...
Glide實現查看圖片和保存圖片到手機

兩種方式，推薦方式一方式一 downloadOnly 創建一個 ImageActivity 以上代碼從另一個activity得到圖片的 url ，然後使用Glide 圖片載入庫將圖片顯示到 ImageView上，長按ImageView可以將圖片保存到手機的 Pictures/Beaut ...
記憶體管理機制

Objective-C中提供了兩種記憶體管理機制MRC（MannulReference Counting）和ARC(Automatic Reference Counting)，分別提供對記憶體的手動和自動管理，來滿足不同的需求. ARC: ARC是Auto Reference Counting的縮寫，即 ...
Android橫豎屏切換的生命周期

1、新建一個Activity，並把各個生命周期列印出來 2、運行Activity，得到如下信息 onCreate--> onStart--> onResume--> 3、按crtl+f12切換成橫屏時 onSaveInstanceState--> onPause--> onStop--> onDes ...
Java類載入順序

很長時間沒看這方面的內容了，寫篇文章讓自己牢記一下，順便分享一下。首先，寫代碼以便檢驗結果。測試代碼： public class Test { public static void main(String[] args) { new Test2(); } } 子類代碼： public class ...
Sqlserver根據條件去除重覆數據並且留下的是最大值數據

項目中需要根據條件獲取一些數據，但是如果條件相同的情況下，要去掉條件一樣的並且某個值是最小的數據，留下的是最大值數據。簡單記錄一下sql： ...