CentOS上安裝Hadoop2.7,添加數據節點,運行wordcount

来源:http://www.cnblogs.com/okokok/archive/2017/07/07/7071650.html
-Advertisement-
Play Games

安裝hadoop的步驟比較繁瑣,但是並不難。 在CentOS上安裝Hadoop2.7 1. 安裝 CentOS,註:圖形界面並無必要 2. 在CentOS里設置靜態IP,手工編輯如下4個文件 /etc/hosts /etc/sysconfig/netwok /etc/hostname /etc/sy ...


安裝hadoop的步驟比較繁瑣,但是並不難。

在CentOS上安裝Hadoop2.7

1. 安裝 CentOS,註:圖形界面並無必要

2. 在CentOS里設置靜態IP,手工編輯如下4個文件

  • /etc/hosts
  • /etc/sysconfig/netwok
  • /etc/hostname
  • /etc/sysconfig/network-scripts/ifcfg-eno1677773

 3. 關閉防火牆

  • Close firewalld
  • systemctl stop firewalld.service #停止firewall
  • systemctl disable firewalld.service #禁止firewall開機啟動

4. 設置ssh無密登錄

l   去掉/etc/ssh/sshd_config其中2行的註釋
#RSAAuthentication yes
#PubkeyAuthentication yes

l   輸入命令,ssh-keygen -t rsa,生成key,都不輸入密碼,一直回車,/root就會生成.ssh文件夾,每台伺服器都要設置

l   合併公鑰到authorized_keys文件,在Master伺服器,進入/root/.ssh目錄,通過SSH命令合併,
cat id_rsa.pub>> authorized_keys

l   把Master伺服器的authorized_keys、known_hosts複製到Slave伺服器的/root/.ssh目錄

 

5. 為提高軟體下載速度,可以把軟體安裝庫轉向阿裡雲

6. Install net-tools, yum, wget, vim

7. Install Java

  • Yum list java*
  • [root@beta-new1 www]# yum -y install java-1.8.0-openjdk.x86_64

8. Configure Java

  • [root@localhost ~]# which java
     
    /usr/bin/java
     
    [root@localhost ~]# ls -lrt /usr/bin/java
     
    lrwxrwxrwx. 1 root root 22 Aug 17 15:12 /usr/bin/java -> /etc/alternatives/java
     
    [root@localhost ~]# ls -lrt /etc/alternatives/java
     
    lrwxrwxrwx. 1 root root 46 Aug 17 15:12 /etc/alternatives/java -> /usr/lib/jvm/jre-1.7.0-openjdk.x86_64/bin/java

 

9. 從官網下載Hadoop “hadoop-2.7.0.tar.gz”放到/home/hadoop目錄下

10. 輸入命令解壓

  • tar -xzvf hadoop-2.7.0.tar.gz

11. 在/home/hadoop目錄下創建數據存放的文件夾,tmp、hdfs、hdfs/data、hdfs/name

12. 修改Hadoop設置

  • /Hadoop2.7.3/etc/Hadoop/hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.131-3.b12.e17_3.x86_64

  • /Hadoop2.7.3/etc/Hadoop/slaves
  • /Hadoop2.7.3/etc/Hadoop/mapred-site.xml
  • /Hadoop2.7.3/etc/Hadoop/hdfs-site.xml
  • /Hadoop2.7.3/etc/Hadoop/core-site.xml

 

13. 在Master伺服器啟動hadoop

  • 初始化

bin/hdfs namenode –format

l  全部啟動sbin/start-all.sh,也可以分開sbin/start-dfs.sh、sbin/start-yarn.sh

l  停止Hadoop服務

l  sbin/stop-all.sh

l  輸入命令jps,可以看到節點相關信息

14. 訪問Hadoop

 

 

添加新數據節點步驟

  • 安裝CentOS,設置靜態IP(4個配置文件)
  • 加入SSH免密碼登錄
  • SCP把Hadoop文件複製到新機器
  • 修改/Hadoop2.7.3/etc/Hadoop/slaves
  • 重新初始化
  • 重新啟動hadoop服務

 

 

運行WordCount程式

1、在HDFS中創建目錄input

hadoop fs -mkdir /input

2、將本地的 PESXXX.txt上傳到input中

hadoop fs -put PESXXX.txt /input

查看input目錄下的文件

hadoop fs -ls /input

查看PESXXX.txt文件內容

hadoop fs -cat /input/ PESXXX.txt

 

3、運行程式

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /input /output/

 

4、查看結果

查看輸出目錄hadoop fs -ls /output

 

查看輸出結果hadoop fs -cat /output/part-r-0000

 

5、可在瀏覽器查看任務

http://192.168.1.15:8088

http://192.168.1.15:50070

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • View繪製的三部曲, 測量,佈局,繪畫今天我們分析測量過程 view的測量是從ViewRootImpl發起的,View需要重繪,都是發送請求給ViewRootImpl,然後他組織重繪在重繪的過程中,有一步就是測量,通過代碼來分析測量過程 這個函數通過getRootMeasureSpec方法,獲取測 ...
  • 原文網上抄錄 ...
  • 在逆向過程中經常會遇到反調試,如下段代碼: 0008bd8e movs r1, #0xa ; argument #2 for method imp___symbolstub1__dlopen 0008bd90 blx imp___symbolstub1__dlopen 0008bd94 movw r ...
  • 兩種方式, 推薦方式一 方式一 downloadOnly 創建一個 ImageActivity 以上代碼 從另一個activity得到 圖片的 url , 然後使用Glide 圖片載入庫 將圖片顯示到 ImageView上, 長按ImageView可以將圖片保存到手機的 Pictures/Beaut ...
  • Objective-C中提供了兩種記憶體管理機制MRC(MannulReference Counting)和ARC(Automatic Reference Counting),分別提供對記憶體的手動和自動管理,來滿足不同的需求. ARC: ARC是Auto Reference Counting的縮寫,即 ...
  • 1、新建一個Activity,並把各個生命周期列印出來 2、運行Activity,得到如下信息 onCreate--> onStart--> onResume--> 3、按crtl+f12切換成橫屏時 onSaveInstanceState--> onPause--> onStop--> onDes ...
  • 很長時間沒看這方面的內容了,寫篇文章讓自己牢記一下,順便分享一下。 首先,寫代碼以便檢驗結果。測試代碼: public class Test { public static void main(String[] args) { new Test2(); } } 子類代碼: public class ...
  • 項目中需要根據條件獲取一些數據,但是如果條件相同的情況下,要去掉條件一樣的並且某個值是最小的數據,留下的是最大值數據。 簡單記錄一下sql: ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...