hadoop3自學入門筆記(2)—— HDFS分散式搭建

来源:https://www.cnblogs.com/qingmiaokeji/archive/2020/02/23/12354395.html
-Advertisement-
Play Games

一些介紹 Hadoop 2和Hadoop 3的埠區別 Hadoop 3 HDFS集群架構 我的集群規劃 | name | ip | role | | | | | | 61 | 192.168.3.61 | namenode,datanode | | 62 | 192.168.3.62 | data ...


一些介紹

Hadoop 2和Hadoop 3的埠區別

image.png

Hadoop 3 HDFS集群架構

image.png

我的集群規劃

name ip role
61 192.168.3.61 namenode,
datanode
62 192.168.3.62 datanode
63 192.168.3.63 secondnamenode
64 192.168.3.64 datanode

1.安裝JDK

利用FileZilla sftp功能進行上傳到指定文件夾下/root/software,下圖是配置sftp.
image.pngimage.png
解壓使用命令tar -xvzf jdk-8u241-linux-x64.tar.gz 解壓到當前文件夾下。
配置環境變數,輸入命令vim /etc/profile,添加

JAVA_HOME=/root/software/jdk1.8.0_241
PATH=$JAVA_HOME/bin:$PATH

最後退出vi,輸入source /etc/profile
測試輸入命令java -version,如果展示

root@localhost ~]# java -version
java version "1.8.0_241"
Java(TM) SE Runtime Environment (build 1.8.0_241-b07)
Java HotSpot(TM) 64-Bit Server VM (build 25.241-b07, mixed mode)
[root@localhost ~]# 

安裝成功!
ssh免密配置請查看

2.配置Hadoop

sftp://[email protected]/root/software/hadoop-3.2.1.tar.gz
解壓。

2.1部署及配置

Hadoop的配置涉及以下幾個文件,分別是:hadoop-env.sh、core-site.xml、hdfs-site.xml和workers。其中,hadoop-env.sh是Hadoop運行環境變數配置;core-site.xml是Hadoop公共屬性的配置;hdfs-site.xml是關於HDFS的屬性配置;workers是DataNode分佈配置。下麵我們分別配置這幾個文件。
以61為中心配置,最後複製到其他伺服器

  1. hadoop-env.sh文件

在/etc/hadoop/hadoop-env.sh中配置運行環境變數,在預設情況下,這個文件是沒有任何配置的。我們需要配置JAVA_HOME、HDFS_NAMENODE_USER和HDFS_DATANODE_USER等,HDFS_SECONDARYNAMENODE_USER配置代碼如下:
在尾部加入

export JAVA_HOME=/root/software/jdk1.8.0_241
export  HDFS_NAMENODE_USER=root
export  HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root

其中,JAVA_HOME=/root/software/jdk1.8.0_241是指定JDK的位置,HDFS_NAMENODE_USER=root是指定操作NameNode進程的用戶是root。同理,HDFS_DATANODE_USER和HDFS_SECONDARYNAMENODE_USER分別指定了操作DataNode和Secondary NameNode的用戶,在這裡我們設置為root用戶,具體應用時,讀者根據情況進行設置即可。在這裡需要註意的是,HDFS_NAMENODE_USER、HDFS_DATANODE_USER和HDFS_SECONDARYNAMENODE_USER是Hadoop 3.x為了提升安全性而引入的。

  1. core-site.xml文件

core-site.xml中主要配置Hadoop的公共屬性,配置代碼如下:

<configuration>
  <property>
        <name>fs.defaultFS</name>
        <value>hdfs://192.168.3.61:9820</value>
    </property>
<property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/hadoopdata</value>
    </property>
</configuration>

其中,fs.defaultFS是指定NameNode所在的節點,在這裡配置為node1;9820是預設埠;hdfs:是協議;hadoop.tmp.dir是配置元數據所存放的配置,這裡配置為/opt/hadoopdata,後續如果需要查看fsiamge和edits文件,可以到這個目錄下查找。

  1. hdfs-site.xml文件

hdfs-site.xml文件中主要是HDFS屬性配置,配置代碼如下:

<configuration>
<property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>192.168.3.63:9868</value>
    </property>
<property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
<property>
 <name>dfs.namenode.datanode.registration.ip-hostname-check</name>
 <value>false</value>
</property>

其中,dfs.namenode.secondary.http-address屬性是配置Secondary NameNode的節點,在這裡配置為node2。埠為9868。
關於這些配置,讀者可以從官網上查找,網址為https://hadoop.apache.org/docs/stable/index.html,其中的左下角有個Configuration項,其中包括core-default.xml等配置文件。

  1. workers文件

在workers中配DataNode節點,在其中寫入:

192.168.3.61
192.168.3.62
192.168.3.64

2.2 將配置複製到其他伺服器

進入 /root/software/hadoop-3.2.1/etc 目錄
輸入命令

scp  -r ./hadoop   192.168.3.62:/root/software/hadoop-3.2.1/etc/
 scp  -r ./hadoop   192.168.3.63:/root/software/hadoop-3.2.1/etc/
 scp  -r ./hadoop   192.168.3.64:/root/software/hadoop-3.2.1/etc/

2.3配置下hadoop的環境變數,方便輸入命令

export JAVA_HOME=/root/software/jdk1.8.0_241
export HADOOP_HOME=/root/software/hadoop-3.2.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

2.4格式化

第一次安裝Hadoop需要進行格式化,以後就不需要了。格式化命令在hadoop/bin下麵,執行如下命令:

hdfs namenode -formate

格式化後會創建一個空白的fsimage文件,可以在opt/hadoopdata/dfs/name/current中找到fsimage文件,註意此時沒有edits文件。

3.啟動

進入hadoop/sbin下麵運行start-dfs.sh,啟動HDFS集群,啟動命令如下:

./start-dfs.sh

這時,可以在不同節點中通過jps命令查看不同的進程。
61
image.png
62
image.png
63
image.png

64
image.png
表示都已經啟動。

4.打開瀏覽器查看HDFS監聽頁面

在瀏覽器中輸入http://ip:9870,比如這裡輸入http://192.168.30.61:9870/,出現以下界面則表示Hadoop完全分散式搭建成功
image.png

image.png

選擇Datanodes選項,可以看到DataNode的利用率和DataNode的節點狀態
image.png

這裡只顯示了一個比較奇怪,以後再研究。

更多精彩請關註公眾號【lovepythoncn】


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 單片機的學習情況: 目 錄 第一講 初識、試用單片機……………………………..….……..… 第二講 讓 LED 舞起來……………………………………….……. 第三講 “開挖”單片機…………………………………….….….. 第四講 藉助定時器的單片機輸入輸出控制……………………… 第五講 八段數位管 ...
  • >test.txt set /p="Hello" <nul >>test.txt set /p=" world!" <nul 正文 平時,CMD中輸出一個字元串到文本文件,可使用echo,配合輸出重定向實現: echo "line1" > test.txt echo "line2" >> test. ...
  • 內核體系設計分:單內核,微內核 windows是微內核設計。 Linux是單內核設計,但充分借鑒了為微內核體系的優點,為內核引入了模塊化機制。 內核的組成部分 kernel:內核核心,一般為bz壓縮的image文件,通常位於/boot目錄,名稱為vmlinuz VERSION release ker ...
  • 內核對象是個比較難理解的概念,問題的根源就在於即使是《核心編程》書中也沒有說清楚它的定義,只是不停地舉例和描述它的性質,還有如何使用。 盲人摸象,難見全貌。只能儘可能列舉它的性質,註意使用了。 引用計數(書中的說法是使用計數)就是內核對象的一個很關鍵的性質。由於內核對象的擁有者是內核而不是進程,所以 ...
  • 1.安裝包的下載(mysql-v5.7.25 )(NavicatforMySQL_11.2.15): 鏈接:https://pan.baidu.com/s/166hyyYd3DMjYhMwdW805FA 提取碼:18cj 複製這段內容後打開百度網盤手機App,操作更方便哦 2.安裝(兩個安裝包直接下 ...
  • Oracle行結果合計的實現,主要應用於日期結果的集計,下麵是具體的實現代碼。 With AA as ( select 'A' tNo , 10 B from dual union select 'B' , 20 from dual union select 'A' , 30 from dual ) ...
  • Oracle11以後,行列轉換有了新的方法。 下麵的是已經疏通過的代碼,請放心使用。。。 With AA as ( Select A,B,C,row_number() over (partition by B order by b) D from ( Select 10 A, 11 B, 12 C ...
  • 1.core site.xml 2.pom.xml 3.測試代碼 testDownloadFileToLocal 這裡測試請註意,本地也要裝hdfs才可以 "更多精彩請關註" 公眾號【lovepythoncn】 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...