Centos7.0配置Hadoop2.7.0偽分散式

-Advertisement-

一、ssh免密登錄 1.命令ssh-keygen、 overwrite輸入y一路回車 2.將生成的密鑰發送到本機 ssh-copy-id localhost中間會詢問是否繼續輸入“yes” 3.測試免密登錄是否成功 ssh localhost 二、Java配置新建一個文件夾存放java和hadoo ...

一、ssh免密登錄

1.命令ssh-keygen、

overwrite輸入y一路回車

2.將生成的密鑰發送到本機

ssh-copy-id localhost中間會詢問是否繼續輸入“yes”

3.測試免密登錄是否成功

ssh localhost

二、Java配置

新建一個文件夾存放java和hadoop這裡我在~目錄下新建了一個app文件夾下麵。

命令行移動文件到新建的app文件夾下。

解壓jdk壓縮包。

創建軟連接或重命名已解壓文件夾。

配置jdk環境變數。切換到root用戶（輸入su命令切換root用戶接著輸入root用戶密碼），然後通過

vi /etc/profile

編輯、etc/profile文件配置環境變數。

編輯好後Esc鍵接著“：”在輸入wq保存並且退出編輯。

使/etc/profile生效，並檢測是否配置成功。

配置成功。

三、Hadoop配置

由root用戶切換為普通用戶，我這裡用戶名是liu所以使用命令 su liu。

解壓Hadoop然後創建軟連接或者重命名。

驗證單擊模式Hadoop是否安裝成功，hadoop/bin/hadoop version

此時可以看到Hadoop版本2.7.0，安裝成功。可以在hadoop目錄下新建一個test.txt輸入一下內容。

測試運行Hadoop自帶的WordCount程式，統計單詞個數。

查看結果文件夾output

查看內容

四、Hadoop偽分散式配置

進入hadoop目錄下的/etc/hadoop文件

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/data/tmp</value>
    </property>
    <property>
        <name>hadoop.proxyuser.hadoop.hosts</name>
        <value>*</value>
    </property>
    <property>
        <name>hadoop.proxyuser.hadoop.groups</name>
        <value>*</value>
    </property>
</configuration>

修改core-site.xml文件

<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/data/dfs/name</value>
        <final>true</final>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/data/dfs/data</value>
        <final>true</final>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.permissions</name>
        <value>false</value>
    </property>
</configuration>

修改hdfs-site.xml文件

export JAVA_HOME=/home/liu/app/jdk1.8.0_141

修改hadoop-env.sh

<configuration>
    <property>
        <name>mapreduce.frameword.name</name>
        <value>yarn</value>
    </property>
</configuration>

修改mapred-site.xml.template

<configuration>

<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.nodemanager.aux-servies</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

修改yarn-site.xml

配置hadoop環境在 ~/.bashrc文件下

保存退出後記得source ~/.bashrc是修改生效。

然後在~下創建配置文件中的目錄，

mkdir -p data/p
mkdir -p /data/dfs/name
mkdir -p /data/dfs/data

第一次需要格式化namenode，進入hadoop目錄下。

cd /home/liu/app/hadoop

格式化。

bin/hdfs namenode -format

啟動hadoop

sbin/start-all.sh

啟動完畢後輸入jps查看。

最重要的是NameNode和DataNode。這樣就配置並且啟動成功了。

需要註意的是如果jps後並沒有則說明配置錯誤，請檢查配置文件，若配置完環境變數後檢測是否成功，提示失敗並給出路徑，很有可能是環境變數配置路徑錯誤。
若第一次啟動hadoop失敗，後邊重新啟動的時候，請刪除~下新建的data文件重新格式化NameNode。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

良許 | 同事的一個動作，讓我熬夜的工作全部白費……

熊孩子，是一種神奇的生物他們天不怕，地不怕破壞力巨大，續航能力又十足還有《未成年人保護法》為他們保駕護航…… 在家裡受到這些熊孩子的破壞也就算了，但在公司里，有些同事的破壞力不亞於那些熊孩子看到伺服器在跑，他們會這邊戳戳，那邊動動就倆字——手賤！！如果不小心，你熬夜做的工作，可能 ...
Linux之Shell編程(13)

變數：定義變數的規則： 1）變數名可以由字母、數字和下劃線組成，但不能以數字開頭 2）等號兩側不能有空格 3）變數名一般習慣大寫將命令的返回值賦值給變數： 1）使用``將命令括起來 2）使用$()來執行設置環境變數：基本語法： 1）export 變數名=變數值將shell變數輸出未環境變數 ...
Linux重器之 Vim 實用命令

Vim 常用的命令游標定位; hjkl 上下左右移動 0 $ 跳到行首或行尾 gg shift+G 跳到整個文件的開頭行或者結尾行 1G ,2G,3G........NG ,跳到第1.2.3 N 行開頭 /String(n N 可以迴圈的上一個下一個切換) 快速定位到某個有String 的行, ...
DLL：操作資料庫和表

1. 操作資料庫 C(Create 創建) R(Retrieve 查詢) U(Update 更新) D(Delete 刪除) (1) 查詢資料庫 1) 查詢所有資料庫名稱這裡有一個註意的東西，一個Database對應數據目錄中的一個實體文件夾，但是 information_schema 這個資料庫 ...
Rewrite基本概述

Rewrite基本概述什麼是rewrite Rewrite主要實現url地址重寫，以及重定向，就是把傳入的請求重定向到其他的過程。 rewrite使用場景 1、地址跳轉，用戶訪問www.drz.com這個URL是，將其定向至一個新的功能變數名稱mobile.drz.com 2、協議跳轉，用戶通過htt ...
Redis—簡介與安裝

Redis簡介 Redis安裝 Redis配置文件 Redis常用命令 ...
GFS（Google File System，谷歌文件系統）----（1）文件系統簡介

分散式文件系統系統是構建在普通的、廉價的機器上，因此故障是常態而不是意外系統希望存儲的是大量的大型文件（單個文件size很大）系統支持兩種類型讀操作：大量的順序讀取以及小規模的隨機讀取（large streaming reads and small random reads.）系統的寫操作主 ...
nginx——keepalived

nginx——keepalived 1.keepalived高可用基本概述什麼是高可用一般是指2台機器啟動著完全相同的業務系統，當有一臺機器down機了，另外一臺伺服器就能快速的接管，對於訪問的用戶是無感知的。高可用通常使用什麼軟體硬體使用F5 軟體使用keepalived keepalil ...