hadoop(三):hdfs 機架感知_ZenDei技術網路在線

hadoop(三):hdfs 機架感知

-Advertisement-

client 向 Active NN 發送寫請求時，NN為這些數據分配DN地址，HDFS文件塊副本的放置對於系統整體的可靠性和性能有關鍵性影響。一個簡單但非優化的副本放置策略是，把副本分別放在不同機架，甚至不同IDC，這樣可以防止整個機架、甚至整個IDC崩潰帶來的錯誤，但是這樣文件寫必須在多個機架之 ...

client 向 Active NN 發送寫請求時，NN為這些數據分配DN地址，HDFS文件塊副本的放置對於系統整體的可靠性和性能有關鍵性影響。一個簡單但非優化的副本放置策略是，把副本分別放在不同機架，甚至不同IDC，這樣可以防止整個機架、甚至整個IDC崩潰帶來的錯誤，但是這樣文件寫必須在多個機架之間、甚至IDC之間傳輸，增加了副本寫的代價，是否有較優的方案來解決這個問題呢？

目錄：

常用策略
機架配置
分配原理

常用策略：

hdfs 在預設配置下副本數是3個，通常的策略是：

第一個副本放在和Client相同機架的Node里（如果Client不在集群範圍，第一個Node是隨機選取不太滿或者不太忙的Node）
第二個副本放在與第一個Node不同的機架中的Node
第三個副本放在與第二個Node所在機架里不同的Node. 示例圖如下：

預設情況下，Hadoop機架感知是沒有啟用的,這時任何一臺 DN 機器，不管物理上是否屬於同一個機架，NN 都會預設將他們預設為在/default-rack下, 此時，就很容易出現之前提到的增添機架間網路負載的情況，如我們前面單節介紹基於 hdp2.4安裝的集群就沒指定rack, 如下圖所示。

機架配置：

hdfs 的機架感知功能需要在NN機器的hadoop下 core-site.xml里配置net.topology.script.file.name選項,這個配置選項的value指定為一個可執行程式，通常為一個腳本，該腳本接受一個參數，輸出一個值
接受的參數通常為datanode機器的ip地址，而輸出的值通常為該ip地址對應的datanode所在的rackID
Namenode啟動時，會判斷該配置選項是否為空，如果非空，則表示已經啟用機架感知的配置，此時namenode會根據配置尋找該腳本，併在接收到每一個datanode的heartbeat時，將該datanode的ip地址作為參數傳給該腳本運行，並將得到的輸出作為該datanode所屬的機架，保存到記憶體的一個map中
腳本的編寫，參見Hadoop官方給出的腳本：http://wiki.apache.org/hadoop/topology_rack_awareness_scripts
在 hdp2.4 安裝後的 hadoop 目錄下的配置文件中，查看 hadoop的 core-site.xml 文件，已經設置了此選項，如下圖
查看 topology_script.py 腳本，裡面使用的文件是 topology_mappings.data，用vim編輯此文件，換成真實的網路拓撲，如下
```
[network_topology]
hdp2=/rack1
192.168.2.2=/rack2
hdp3=/rack2
192.168.2.99=/rack1
```
手工修改配置文件，重啟服務後修改內容會被衝掉，所以用我們在 ambaria 上去修改，選擇 "host" -> "Action" -> "Selected hosts" -> "hosts" --> "set Rack" 修改每台host對應的rack, 保存修改，重啟因修改配置而受影響的組件服務，成功後示例如下，這時再去看 topology_mappings.data 的內容已經修改成功：

分配原理：

有了機架感知，NameNode就可以畫出下圖所示的datanode網路拓撲圖,

最底層是Hx是 datanode, 則H1的rackid=/D1/R1/H1，H1的parent是R1，R1的是D1，有了這些rackid信息就可以計算出任意兩台datanode之間的距離

distance(/D1/R1/H1,/D1/R1/H1)=0  相同的datanode
distance(/D1/R1/H1,/D1/R1/H2)=2  同一rack下的不同datanode
distance(/D1/R1/H1,/D1/R1/H4)=4  同一IDC下的不同datanode
distance(/D1/R1/H1,/D2/R3/H7)=6  不同IDC下的datanode

寫文件時根據策略輸入 dn 節點列表，讀文件時按與client由近到遠距離返回 dn 列表

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

綠色的oracle客戶端和綠色的plsql查詢數據出現亂碼怎麼修改成中文？

3、可能很多小伙伴是綠色的進入註冊表沒有ORACLE這個選項這就令人非常頭疼了。因為可能是32位的原因，你到註冊表的下麵看看HKEY_LOCAL_MACHINE->SOFTWARE->Wow6432Node看看有沒有ORACLE選項,如果還沒有那咱就添加一個；代碼如下建立二個尾碼名為AMERICAN ...
SQL Server 執行計劃利用統計信息對數據行的預估原理以及SQL Server 2014中預估策略的改變

前提本文僅討論SQL Server查詢時，對於非複合統計信息，也即每個欄位的統計信息只包含當前列的數據分佈的情況下，在用多個欄位進行組合查詢的時候，如何根據統計信息去預估行數的。利用不同欄位的統計信息做數據行數預估的演算法原理，以及SQL Server 2012和SQL Server 2014 ...
大數據項目實踐：基於hadoop+spark+mongodb+mysql開發醫院臨床知識庫系統

一、前言從20世紀90年代數字化醫院概念提出到至今的20多年時間，數字化醫院（Digital Hospital)在國內各大醫院飛速的普及推廣發展，並取得驕人成績。不但有數字化醫院管理信息系統（HIS)、影像存檔和通信系統（PACS)、電子病歷系統（EMR)和區域醫療衛生服務（GMIS)等成功實施與 ...
MySQL 全量及增量備份，基於xtrabackup 2.3.5

昨天一個pgp加密盤壞了，東西全丟了。。。，我的筆記啊！我咋怎麼2呢。。備份個腳本吧，方便以後手機查看，話說我都快忘記帳號密碼了備註：腳步恢復時只能恢復到備份前的狀態，如果需要恢復到當前狀態，還需配合binlog，睡覺就這樣 ...
mysql 主從複製實踐

非同步主從複製主從部署步驟: 備份還原使用mysqldump或者xtrabackup 把主庫現有基礎數據還原到從庫授權 grant replication slave on *.* 給從庫一個複製binlog的賬號配置複製，並啟動從庫上配置複製信息，並指向master 查看主從複製信息 sh ...
HDP2.4安裝(六)：小結與回顧

基於Centos7安裝過程中常用工具及操作技術總結回顧。操作技巧： tab鍵，命令自動補全 xshell 預設： Ctrl + Insert （複製） Shift + Insert (粘貼） systemctl 服務操作命令： systemctl start postfix.service 動一個 ...
C#操作MongoDB入門

聲明：此文是我學習MongoDB一周以來的經驗總結。一來給自己做一個備份，二來給和我一樣剛接觸MongoDB的小白分享一下，有什麼問題，給位請多擔待。 1、MongoDB安裝及配置（1）下載： mongodb官網 https://www.mongodb.com/download-center 進入 ...
大話存儲 3 - 七種磁碟RAID技術

RAID技術 Redundant Array of Independent Disks由獨立的磁碟組成的具有冗餘特性的陣列。有兩個特性：陣列：需要很多磁碟來組成冗餘：允許某塊磁碟損壞之後，數據仍然可用目前，單塊磁碟容量只有幾T，對於現代應用程式來說遠遠不夠。為了提供容量更大的磁碟，發明瞭RAID技術... ...