超詳細的HDFS讀寫流程詳解（最容易理解的方式）

-Advertisement-

HDFS採用的是master/slaves這種主從的結構模型管理數據，這種結構模型主要由四個部分組成，分別是Client(客戶端)、Namenode(名稱節點)、Datanode(數據節點)和SecondaryNameNode。HDFS作為hadoop的分散式儲存框架，最重要的莫過於數據流的讀寫過程 ...

HDFS採用的是master/slaves這種主從的結構模型管理數據，這種結構模型主要由四個部分組成，分別是Client(客戶端)、Namenode(名稱節點)、Datanode(數據節點)和SecondaryNameNode。HDFS作為hadoop的分散式儲存框架，最重要的莫過於數據流的讀寫過程了，下麵就HDFS得數據流的讀寫流程做個詳細的剖析。

HDFS的寫流程

首先寫操作的代碼操作：

hdfs dfs -put ./file02 /file02

hdfs  dfs -copyFromLocal  ./file02 /file02   
FSDataOutputStream fsout = fs.create(path)；fsout.write(byte[])    
fs.copyFromLocal(path1,path2)

具體流程詳解：

如下圖所示是整個寫流程及原理（上傳）

1.客戶端向namenode發出請求上傳數據；

2.namenode在接到請求之後，開始查找元數據（查找是否存在這個目錄以及查詢上傳者是否有這個許可權），查詢後向客戶端響應是否可以上傳數據。

3.客戶端接到響應之後，再開始請求上傳第一塊數據（數據分塊是由客戶端操作的），例如圖中的0-128m為第一塊數據。

4.namenode接到請求後，向客戶端返回datanode節點信息（副本放在哪個節點上，例如放在DN1,DN2,DN3這三台機器上）。一般規則有近遠遠，近遠近

5.客戶端根據返回的副本信息向datanode請求建立傳輸通道，以級聯的方式進行請求

6.datanode向客戶端響應，若都應答成功，則傳輸通道建立成功。

7.開始傳輸數據，以packet方式傳輸，以chunk為單位進行校驗，預設1m。

8.第一塊上傳成功，第二塊開始從3-7步驟繼續傳輸

9.待傳輸完成之後，客戶端向namenode報告數據傳輸遠程，由namenode更新元數據

在hdfs的寫流程有幾個核心問題：

1.傳輸blk1的過程中，dn3如果死了，集群會怎麼處理？

不做任何處理，錯誤會想nn報告

2.接1，如果dn3又啟動了，集群會如何處理？

dn3啟動時，會向nn發送塊報告，然後nn指示dn3刪除blk1（因為傳輸數據不完整）

3.客戶端建立通道時，發現dn3連接不上，會怎麼辦？

nn會重新分配三個節點

4.傳輸過程中，packet出錯，會如何處理？

會重新上傳，但是重傳次數只有4次，超過限制則提示傳輸失敗

5.如果bk1上傳成功，blk2壞了，或者blk2上傳時，dn1掛了，如何處理？

nn會將整個文件標記為無效，下次dn向nn發送塊報告時，nn會通知這些塊所在的節點刪除

HDFS的讀操作

首先讀操作的代碼（下載）

hdfs dfs -get /file02 ./file02    
hdfs  dfs -copyToLocal  /file02 ./file02    
FSDataInputStream fsis = fs.open(path);    
fsis.read(byte[] a)    
fs.copyToLocal(path1,path2)

具體流程詳解

由圖可知HDFS的讀流程要比寫流程簡單很多，主要步驟：

1.客戶端請求下載數據

2.nn檢測數據是否存在，給客戶端響應

3.客戶端請求下載第一塊數據

4.nn返回目標文件的元數據

5.客戶端請求dn建立傳輸通道

6.dn響應

7.開始傳輸數據

註意點：

在讀操作中在客戶端和dn建立傳輸通道時不是採用級聯方式，而是首先尋找離自己最近的副本（dn1）下載，如果數據不完整或者沒有找到，就再向dn2建立傳輸通道，然後傳輸數據，依次往下，直到下載到目標文件為止。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

動態構造任意複雜的 Linq Where 表達式

前言 Linq 是 C# 中一個非常好用的集合處理庫，用好了能幫我們簡化大量又臭又長的嵌套迴圈，使處理邏輯清晰可見。EF 查詢主要也是依賴 Linq。但是 Linq 相對 sql 也存在一些缺點，最主要的就是動態構造查詢的難度。sql 只需要簡單進行字元串拼接，操作難度很低（當然出錯也相當容易），而 ...
HtmlAgility 抓取網頁上的數據

/// <summary> /// 財政部mca /// http://www.mca.gov.cn/article/sj/xzqh/1980/ /// https://github.com/zzzprojects/html-agility-pack /// https://github.com/l ...
分散式系統衛星時鐘伺服器（NTP伺服器）架設與設計

分散式系統衛星時鐘伺服器（NTP伺服器）架設與設計分散式系統衛星時鐘伺服器（NTP伺服器）架設與設計本文由安徽京準科技提供支持和原資料——更多闡述可參考微♥ ahjzsz 分散式系統由Tanenbaum定義，“分散式系統是一組獨立的電腦，在”分散式系統 — 原理和範例“中作為用戶的單一，連貫的 ...
[WinApi] C#獲取其他視窗文本框內容

聲明部分： const int WM_GETTEXT = 0x000D; const int WM_GETTEXTLENGTH = 0x000E; [DllImport("user32.dll", EntryPoint = "SendMessageA")] public static extern ...
Windows應急響應和系統加固(11)——Weblogic各類漏洞的日誌分析和調查取證

Weblogic各類漏洞的日誌分析和調查取證一、WebLogic簡介： 1.WebLogic簡介： WebLogic是著名的Oracle公司開發的Application Server，是第一個成功商業化的J2EE中間件、容器，用於開發、集成、部署、管理大型&分散式Web應用、網路應用和資料庫應用等 ...
痞子衡嵌入式：恩智浦i.MX RTxxx系列MCU啟動那些事（6.1）- FlexSPI NOR連接方式大全(RT600)

i.MXRT600內部有一個雙通道8bit的FlexSPI模塊，這個模塊與i.MXRT1xxx里是幾乎一樣的（存在微小升級），但在Pinmux設計上與i.MXRT1xxx上差異較大（主要涉及SoC設計上的兩種8線實現方法），這也是本文要介紹的重點。 ...
Linux內核事件通知鏈(notifier chain)

Linux內核基礎事件通知鏈(notifier chain) 簡介：內核許多子系統之間關聯緊密，因此在一個子系統發生或者檢測到的事件信息很可能對其他子系統來說也是有價值的。為了滿足其他子系統對這些事件信息的需求，即在某個子系統內發生或檢測到事件時，其他對此感興趣的子系統也能知道事件的發生，內核提 ...
MySQL 鎖的一些簡單概念

介紹MySQL鎖的一些內容，包括鎖的粒度、表鎖、行級鎖、死鎖等內容 ...