手把手教你安裝mac版hadoop2.7.3教程

来源:http://www.cnblogs.com/landed/archive/2017/05/09/6831758.html
-Advertisement-
Play Games

一.準備教程 1.jdk:版本在1.7.x以上就可以(因為hadoop2.x以上只支持1.7.x以上的jdk,我的是1.8的) 2.Hadoop:2.7.3 二.ssh的配置以及驗證 配置ssh: 1.確認mac的遠程登錄是否開啟 系統偏好設置->共用->勾選遠程登錄. 當遠程登錄狀態為打開且為綠燈 ...


一.準備教程

  1.jdk:版本在1.7.x以上就可以(因為hadoop2.x以上只支持1.7.x以上的jdk,我的是1.8的)

  2.Hadoop:2.7.3

二.ssh的配置以及驗證

  配置ssh:

  1.確認mac的遠程登錄是否開啟

    系統偏好設置->共用->勾選遠程登錄.

  當遠程登錄狀態為打開且為綠燈時,成功開啟,ok,進行下一步.

  2.打開你的terminal,在終端執行如下命令:   

ssh-keyagent -t

  然後一直回車。當執行完這條指令之後你可以在前往到~/.ssh目錄下發現如下兩個文件

  當出現這兩個文件之後,再在終端執行如下代碼(該代碼用於ssh免登錄設置):

cat ~/.ssh/id_rsa.pub > ~/.ssh/authorized_keys

  ok,ssh免登錄配置完成。

  驗證ssh

  配置完ssh之後現在來驗證ssh是否配置成功

  在終端輸入如下命令:

ssh localhost

  如果出現如下信息,則免密碼登錄ssh配置成功。

  

三.安裝jdk

  安裝jdk,在這裡就不用多啰嗦了.提醒一下的是,務必要安裝1.7以上的jdk

  JDK1.8下載地址: http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

四.安裝Hadoop

  當jdk安裝完畢以及ssh配置都成功之後我們現在可以來著手進行Hadoop的安裝了。

  Hadoop下載地址: https://archive.apache.org/dist/hadoop/common/hadoop-2.7.3/

  下載如下圖片標記的文件即可:

  

  將該文件解壓到你喜歡的地方。如果怕找不到解壓後的文件的路徑,那麼就將該文件標記一下顏色,下次輸入該文件的所在路徑的話,直接選擇你標記的顏色,找到該文件,然後拖到終端就能顯示該文件的絕對路徑了。ok,Hadoop安裝完成.

五.修改Hadoop的配置文件

  所需要修改的配置文件都在hadoop-2.7.3/etc/hadoop目錄下。

  hadoop-env.sh 

  加入以下代碼: 

export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_111.jdk/Contents/Home

  core-site.xml

  該配置文件用於指明namenode的主機名和埠,hadoop臨時目錄

<configuration>
    
    <!-- 指定HDFS老大(namenode)的通信地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://0.0.0.0:9000</value>
    </property>
    <!-- 指定hadoop運行時產生文件的存儲路徑 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/Library/hadoop-2.7.3/temp</value>
    </property>

</configuration>

  hadfs-site.xml

  預設副本數3,修改為1,dfs.namenode.name.dir指明fsimage存放目錄,多個目錄用逗號隔開。dfs.datanode.data.dir指定塊文件存放目錄,多個目錄逗號隔開

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
   <property> <name>dfs.namenode.name.dir</name> <value>file:/Library/hadoop-2.7.3/tmp/hdfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/Library/hadoop-2.7.3/tmp/hdfs/data</value> </property> <property> <name>dfs.webhdfs.enabled</name> <value>true</value> </property> <property> <name>dfs.http.address</name> <value>0.0.0.0:50070</value> </property> </configuration>

  mapred-site.xml

<configuration>
    
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

</configuration>

  yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>

</configuration>

六.配置Hadoop環境變數

  當你完成第五步之後那麼你離hadoop的使用就不遠啦。加下來我們要做的就是配置hadoop環境變數。

  打開你的終端,執行以下命令。(如果有對sudo,vim命令不熟悉的同志們,建議你們先熟悉一下這些命令,瞭解一下如何編輯如何退出,如何使文件生效就可以了)

  

//在etc目錄下創建profile併進入編輯模式
sudo vim /etc/profile  
//=後面接的是你的hadoo目錄所在的路徑,不知道路徑的同學可以直接將文件拖到終端就可以顯示該目錄的絕對路徑了
export HADOOP_HOME=/Users/eleme/Documents/ProgramFiles/apache-software-foundation/hadoop-2.7.3/hadoop 
//然後退出編輯模式,這個操作自己去瞭解一下
//執行剛纔寫的profile,使profile生效
source /etc/profile

七.運行Hadoop    

  打開終端,跟著以下命令一步一步走就可以了。

//進入hadoop安裝目錄
cd $HADOOP_HOME
//初始化namenode
hdfs namenode -format
//啟動hdfs
sbin/start-dfs.sh 
//啟動yarn
sbin/start-yarn.sh

  當啟動完hdfs以及yarn可以打開瀏覽器,輸入以下地址看是否能進入對應的頁面

  啟動完hdfs訪問: http://localhost:50070

  對應的頁面:

  

 

  啟動完yarn訪問: http://localhost:8088

  對應的頁面:

  

  如果你能進入這兩個頁面,ok,那麼你的hadoop以安裝成功!

八.運行Hadoop實例

  同第七個步驟一樣,打開終端跟著以下命令一步一步執行。

  

//1.進入你的hadoop安裝目錄
cd $HADOOP_HOME
//2.在hdfs上創建你的用戶目錄,其中中間那個需要你自己填啊別直接粘貼運行啊
hdfs dfs -mkdir -p /user/(你本機用戶名)/input
//3.這個時候你可以執行以下命令來查看目錄是否在hdfs上創建成功
hadoop fs -ls /user/(你本機用戶名)/input

  如果成功的話,那麼就會有如下圖的顯示:

  

  

//4.然後將需要統計的文件上傳到hdfs上,其中($HADOOP_HOME/etc/hadoop/*.xml)是要上傳的文件的路徑 後面有個空格 然後接你要上傳的目錄路徑(也就是你剛剛所創建的目錄)
hdfs dfs -put $HADOOP_HOME/etc/hadoop/*.xml /user/(你本機用戶名)/input
//同樣也可以用第3步的命令來查看文件是否上傳成功
//5.運行測試jar
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output ‘dfs[a-z.]+’  
//6.然後查看運行之後的產生的output文件夾下的信息
hdfs dfs -cat output/part-r-00000 

  最後在終端顯示的output文件夾下的信息的結果如下圖:

  

  如果跟上圖一致,那麼,恭喜你,你邁出了hadoop的一小步,繼續加油!

  

 

 

  


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 該View轉自 http://blog.csdn.net/Kalwang/article/details/4708721 ,感謝這位大神。 ...
  • 此次掃碼功能以iOS系統原生的AVFoundation框架為基礎。 廢話不多說,直接上代碼 #import <UIKit/UIKit.h> @interface ScanViewController : UIViewController @end 在.m文件中創建對象 #import "ScanVi ...
  • 1.原代碼提示快捷鍵為:Ctrl+空格,與Windows輸入法衝突,所以將代碼提示快捷鍵設置為:Ctrl+反斜杠。 ...
  • 入行快10年,有點積蓄,三年前買了代步車。於是乎,汽車油耗開銷就成了每個月都必須關註的問題。三年來,用過了無數油耗記錄軟體,比如最知名的“小熊油耗”,從第一次用,一直到最新一版,感覺越來越“臃腫”,功能實在是太豐富了,甚至都做到“大數據”這一層面,作為一個小白車主,其實,我只關心:我的車油耗如何。 ...
  • RunLoop是iOS線程相關的比較重要的一個概念,無論是主線程還是子線程,都對應一個RunLoop,如果沒有RunLoop,線程會馬上被系統回收。 本文主要CFRunLoop的源碼解析,並簡單闡述一下CFRunLoop的原理。 CFRunLoop是開源的,開源地址在:http://opensour ...
  • //將字元串轉化成Drawable public synchronized static Drawable StringToDrawable(String icon) { if (icon == null || icon.length() < 10) return null; byte[] img ... ...
  • 小狼咕咕最近開啟了微信小程式開發的徵程,由於微信小程式的前後臺通信必須通過https協議,所以小狼咕咕第一件要做的事就是配置一個能夠通過https訪問的後臺服務。小狼咕咕用的是阿裡雲ECS伺服器,Linux系統,安裝的tomcat。 打開阿裡雲盾——CA證書服務,找不到的朋友也可以在下圖的菜單中直接 ...
  • 如果轉載,請註明博文來源: www.cnblogs.com/xinysu/ ,版權歸 博客園 蘇家小蘿蔔 所有。望各位支持! 1 行記錄如何存儲 這裡引入兩個概念:堆跟聚集索引表。本部分參考MSDN。 1.1 堆表 堆表,沒有聚集索引的表格,可以創建一個或者多個非聚集索引。沒有按照某個規則進行存儲, ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...