Linux下Hadoop2.7.1集群環境的搭建(超詳細版)

来源:http://www.cnblogs.com/zishengY/archive/2017/05/06/6819160.html
-Advertisement-
Play Games

本文旨在提供最基本的,可以用於在生產環境進行Hadoop、HDFS分散式環境的搭建,對自己是個總結和整理,也能方便新人學習使用。 一、基礎環境 在Linux上安裝Hadoop之前,需要先安裝兩個程式: 1.1 安裝說明 1. JDK 1.6或更高版本(本文所提到的安裝的是jdk1.7); 2. SS ...


本文旨在提供最基本的,可以用於在生產環境進行Hadoop、HDFS分散式環境的搭建,對自己是個總結和整理,也能方便新人學習使用。 一、基礎環境 在Linux上安裝Hadoop之前,需要先安裝兩個程式: 1.1 安裝說明 1. JDK 1.6或更高版本(本文所提到的安裝的是jdk1.7); 2. SSH(安全外殼協議),推薦安裝OpenSSH。   下麵簡述一下安裝這兩個程式的原因: 1. Hadoop是用Java開發的,Hadoop的編譯及MapReduce的運行都需要使用JDK。 2. Hadoop需要通過SSH來啟動salve列表中各台主機的守護進程,因此SSH也是必須安裝的,即使是安裝偽分散式版本(因為Hadoop並沒有區分集群式和偽分散式)。對於偽分散式,Hadoop會採用與集群相同的處理方式,即依次序啟動文件conf/slaves中記載的主機上的進程,只不過偽分散式中salve為localhost(即為自身),所以對於偽分散式Hadoop,SSH一樣是必須的。 1.1 JDK的安裝與配置 1、上傳壓縮包 我這裡使用的是WinScp工具 上傳jdk-7u76-linux-x64.tar.gz壓縮包 2、解壓壓縮包 tar -zxvf jdk-7u76-linux-x64.tar.gz 3、將解壓的目錄移動到/usr/local目錄下 mv /lutong/jdk1.7.0_76/ /usr/local/ 4、配置環境變數 vim /etc/profile 5、重新載入/etc/profile,使配置生效 source /etc/profile 6、查看配置是否生效 echo $PATH java -version 出現如上信息表示已經配置好了。  

二、Host配置

由於我搭建Hadoop集群包含三台機器,所以需要修改調整各台機器的hosts文件配置,命令如下: vim /etc/hosts 如果沒有足夠的許可權,可以切換用戶為root。 三台機器的內容統一增加以下host配置: 可以通過hostname來修改伺服器名稱為master、slave1、slave2 hostname master

 

三、Hadoop的安裝與配置

3.1 創建文件目錄 為了便於管理,給Master的hdfs的NameNode、DataNode及臨時文件,在用戶目錄下創建目錄: /data/hdfs/name /data/hdfs/data /data/hdfs/tmp 然後將這些目錄通過scp命令拷貝到Slave1和Slave2的相同目錄下。

3.2 下載

首先到Apache官網(http://www.apache.org/dyn/closer.cgi/hadoop/common/)下載Hadoop,從中選擇推薦的下載鏡像(http://mirrors.hust.edu.cn/apache/hadoop/common/),我選擇hadoop-2.6.0的版本,並使用以下命令下載到Master機器的 /data目錄: wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.1/hadoop-2.7.1.tar.gz 然後使用以下命令將hadoop-2.7.1.tar.gz 解壓縮到/data目錄 tar -zxvf hadoop-2.7.1.tar.gz 3.3 配置環境變數 回到/data目錄,配置hadoop環境變數,命令如下: vim /etc/profile 在/etc/profile添加如下內容 立刻讓hadoop環境變數生效,執行如下命令: source /etc/profile 再使用hadoop命令,發現可以有提示了,則表示配置生效了。 3.4 Hadoop的配置 進入hadoop-2.7.1的配置目錄: cd /data/hadoop-2.7.1/etc/hadoop 依次修改core-site.xml、hdfs-site.xml、mapred-site.xml及yarn-site.xml文件。 3.4.1 修改core-site.xml vim core-site.xml 3.4.2 修改vim hdfs-site.xml vim hdfs-site.xml 3.4.3 修改vim mapred-site.xml vim  mapred-site.xml 3.4.4 修改vim yarn-site.xml vim  yarn-site.xml 由於我們已經配置了JAVA_HOME的環境變數,所以hadoop-env.sh與yarn-env.sh這兩個文件不用修改,因為裡面的配置是: export JAVA_HOME=${JAVA_HOME}  最後,將整個hadoop-2.7.1文件夾及其子文件夾使用scp複製到slave1和slave2的相同目錄中: scp -r /data/hadoop-2.7.1 root@slave1:/data scp -r /data/hadoop-2.7.1 root@slave2:/data  

五、運行Hadoop

5.1 格式化NameNode

執行命令: hadoop namenode -format 執行過程如下圖:

最後的執行結果如下圖:

5.2 啟動NameNode

執行命令如下: /data/hadoop-2.7.1/sbin/hadoop-daemon.sh start namenode

 

在Master上執行jps命令,得到如下結果:

5.3 啟動DataNode 執行命令如下: /data/hadoop-2.7.1/sbin/hadoop-daemons.sh start datanode 執行結果如下:

master

slave1

slave2

說明Slave1和Slave2上的DataNode運行正常。 以上啟動NameNode和DataNode的方式,可以用start-dfs.sh腳本替代: 5.4 運行YARN 運行Yarn也有與運行HDFS類似的方式。啟動ResourceManager使用以下命令: 以上方式我們就不贅述了,來看看使用start-yarn.sh的簡潔的啟動方式: 在Master上執行jps:

說明ResourceManager運行正常。

在兩台Slave上執行jps,也會看到NodeManager運行正常,如下圖:  

 

六、測試hadoop

6.1 測試HDFS

最後測試下親手搭建的Hadoop集群是否執行正常,測試的命令如下圖所示:

6.2 測試YARN

可以訪問YARN的管理界面,驗證YARN,如下圖所示:

6.3 測試mapreduce

不想編寫mapreduce代碼。幸好Hadoop安裝包里提供了現成的例子,在Hadoop的share/hadoop/mapreduce目錄下。運行例子:

 

七、配置運行Hadoop中遇見的問題

7.1 JAVA_HOME未設置? 啟動的時候報:

則需要/data/hadoop-2.7.1/etc/hadoop/hadoop-env.sh,添加JAVA_HOME路徑

7.2 ncompatible clusterIDs

由於配置Hadoop集群不是一蹴而就的,所以往往伴隨著配置——>運行——>。。。——>配置——>運行的過程,所以DataNode啟動不了時,往往會在查看日誌後,發現以下問題:


此問題是由於每次啟動Hadoop集群時,會有不同的集群ID,所以需要清理啟動失敗節點上data目錄(比如我創建的/home/jiaan.gja/hdfs/data)中的數據。

7.3 NativeCodeLoader的警告

在測試Hadoop時,細心的人可能看到截圖中的警告信息:

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 正則表達式:"^[\u4e00-\u9fa5]{0,}$" 、 "/^[\u4E00-\u9FA5]{1,5}$/" 的含義: 在JS里,\uXXXX 是轉義字元,"XXXX"對應的是16進位Unicode編碼; ^ 匹配一行的開始。例如正則表達式^123能夠匹配字元串"12345"的開始,但是不能 ...
  • 最近準備換工作,需要更新一下技能樹。為做到有的放矢,想對招聘方的要求做個統計。正好之前瞭解過nodejs,所以做了個爬蟲搜索數據。 具體步驟: 1. 先用fiddler分析請求需要的header和body。 2. 再用superagent構建上述數據發送客戶端請求。 3. 最後對返回的數據使用che ...
  • 1A課程 概述 課程1A主要講解了Android UI的三種基本控制項:TextView、ImageView以及Button。筆記的主體內容主要根據課程內容的講解順序來組織,此外我對一些個人比較感興趣的內容作了一些擴展的說明。希望我的分享能對大家有所幫助。 TextView 設置TextView中的字 ...
  • 原作者,講解 Mockito 2 怎樣用於Kotlin final 類 的測試。 ...
  • 本文地址 原文地址--微信 點擊關註 微信公眾號 手機眾生相 手機大家都不陌生,不管你拿的是高逼格的蘋果手機,還是親民的安卓手機,甚至你固執地懷舊拿著諾基亞的手機,都無損於你低頭一族的一員。地鐵里,商場中,工作時,回家中,大家也都是埋著頭,神情專註地看著自己的手機,或是來把《王者榮耀》殺個頭破血流, ...
  • 目前安卓開發中使用的網路工具為OKhttp,但是okhttp的使用還不是很方便,在okhttp的基礎上再對請求進行封裝會極大的方便網路調用。 下麵直接上代碼。 請求封裝 上面對okhttp的put請求進行了簡單封裝,四個參數分別是 1.請求地址 2.請求頭,以map的形式傳入,如不需要可傳入null ...
  • iOS:詳細的正則表達式 1、簡介: 在項目中,正則的使用是很普遍的,例如登錄賬號和密碼(手機號、郵箱等)。用到的方法就是謂詞對象過濾:NSPredicate。 2、什麼是正則表達式: 正則表達式,又稱正規表示法,是對字元串操作的一種邏輯公式。正則表達式可以檢測給定的字元串是否符合我們定義的邏輯,也 ...
  • iOS 真機測試錯誤“The application bundle does not contain a valid identifier” 真機測試的時候報錯:“The application bundle does not contain a valid identifier”。在這裡找到解決方 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...