圖文詳解MapReduce工作機制

-Advertisement-

job提交階段 1、準備好待處理文本。 2、客戶端submit()前，獲取待處理數據的信息，然後根據參數配置，形成一個任務分配的規劃。 3、客戶端向Yarn請求創建MrAppMaster並提交切片等相關信息：job.split、wc.jar、job.xml。Yarn調用ResourceManager ...

job提交階段

1、準備好待處理文本。

2、客戶端submit()前，獲取待處理數據的信息，然後根據參數配置，形成一個任務分配的規劃。

3、客戶端向Yarn請求創建MrAppMaster並提交切片等相關信息：job.split、wc.jar、job.xml。Yarn調用ResourceManager來創建MrAppMaster，而MrAppMaster則會根據切片的個數來創建MapTask。

其中切片規劃： InputFormat（預設為TextInputFormat）通過getSplits 方法對輸入目錄中的文件進行邏輯切片，並序列化成job.split文件。預設情況下，HDFS上的一個block對應一個InputSplit，一個InputSplit對應開啟一個MapTask。

MapTask階段

1、Read階段：由RecordReader對象（預設是LineRecordReader）進行讀取，以換行符 (\n) 作為分隔符，每讀取一行數據，就返回一對<Key,Value>供Mapper使用。Key表示該行的起始位元組偏移量，Reduce表示這一行的內容。

2、Map階段: 將解析出的<Key,Value>交給用戶重寫的map()函數處理，每一行數據會調用一次map()函數。

3、Collect階段：map()函數中將數據處理完成後，一般會調用OutputCollector.collect()輸出結果。在該函數內部，它會將生成的key/value進行分區處理（調用Partitioner，預設為HashPartitioner），並寫入一個環形記憶體緩衝區中。

4、Spill階段(溢寫)：當環形緩衝區的數據達到溢寫比例時(80%)，會將數據溢寫到本地磁碟上，生成一個臨時文件。溢寫之前，還會對數據進行排序，必要時進行合併、壓縮操作。

5、Merge階段：當Mapper輸出全部文件後，產生多個臨時文件。MapTask將所有臨時文件以分區為單位，進行歸併排序，最終得到一個大文件，等待Reduce端的拉取。

ReduceTask階段

1、Copy階段：每個ReduceTask從各個MapTask上拉取對應分區的數據。拉取數據後先存儲到記憶體中，記憶體不夠時，再刷寫到磁碟。

2、Merge階段：在遠程拷貝數據的同時，ReduceTask啟動了兩個後臺線程對記憶體和磁碟上的文件進行合併，以防止記憶體使用過多或磁碟上文件過多。

3、Sort階段：用戶編寫的reduce()函數的輸入數據是按Key進行聚集的一組數據。為了將相同Key的數據聚在一起，Hadoop採用了基於排序的策略。由於各個MapTask已經對自己的處理結果進行了分區內局部排序，因此，ReduceTask只需對所有數據進行一次歸併排序即可。

4、Reduce階段：相同Key的一組鍵值對調用一次Reduce方法，進行聚合處理。之後通過context.write，預設以TextOutputFormat格式經RecordWriter寫入到HDFS文件中。

其中Map方法之後，Reduce方法之前的數據處理過程稱之為Shuffle。

溢寫階段詳情

1、每個 MapTask都有一個環形記憶體緩衝區（預設大小為100M）用於批量收集Mapper結果，以減少磁碟IO的開銷。當緩衝區的數據達到溢寫比例時(預設為80%)，溢寫線程啟動。此時MapTask仍繼續將結果寫入緩衝區，如果緩衝區被寫滿，MapTask就會阻塞直到溢出線程結束。如果數據量很小，達不到80M溢寫的話，就等所有文件都讀完後完成一次溢寫。

2、在溢寫之前，會採取快速排序演算法對緩衝區內的數據按照Key進行字典順序排序：先把數據劃分到相應的分區（Partition），然後按照key進行排序。經過排序後，相同分區的數據聚集在一起，同一分區內的數據按照key有序。

3、如果設置了Combiner 函數，則在排序後，溢寫前對每個分區中的數據進行局部聚合操作，以減輕 Shuffle 過程中網路傳輸壓力。

4、開始溢寫：按照分區編號由小到大依次將每個分區中的數據寫入任務工作目錄下的臨時文件output/spillN.out（N表示當前溢寫次數）中。每次記憶體緩衝區達到溢出閾值，就會新建一個溢出文件（spill file），當Mapper輸出全部文件時，會產生多個溢寫文件，最終會被合併成一個已分區且已排序的輸出文件。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

WPF開發學生信息管理系統【WPF+Prism+MAH+WebApi】（四）

最近通過WPF開發項目，為了對WPF知識點進行總結，所以利用業餘時間，開發一個學生信息管理系統【Student Information Management System】。前三篇文章進行了框架搭建和模塊劃分，後臺WebApi介面編寫，以及課程管理模塊開發，本文在前三篇基礎之上，繼續深入開發學生信息... ...
聊聊 C# 中的多態底層 (虛方法調用) 是怎麼玩的

最近在看 C++ 的虛方法調用實現原理，大概就是說在 class 的首位置存放著一個指向 vtable array 指針數組的指針，而 vtable array 中的每一個指針元素指向的就是各自的虛方法，實現方式很有意思，哈哈，現在我很好奇 C# 中如何實現的。一： C# 中的多態玩法 1. ...
在項目中自定義集成IdentityService4

OAuth2.0協議在開始之前呢，需要我們對一些認證授權協議有一定的瞭解。 OAuth 2.0 的一個簡單解釋 http://www.ruanyifeng.com/blog/2019/04/oauth_design.html 理解 OAuth 2.0 https://www.ruanyifeng. ...
linux的文件系統

文件系統操作系統就是處理各種數據的，這些數據在硬碟上就是二進位，人類肯定不能直接看懂這些二進位數據，要有一個翻譯器，將這些二進位的數據還原為人類能看懂的文件形式，這個工作就是由文件系統來完成的，文件系統的目的就是實現數據的查詢和存儲，由於使用場合、使用環境的不同，Linux 有多種文件系統，不同的 ...
Ubuntu系統-FFmpeg安裝及環境配置

鏡像下載、功能變數名稱解析、時間同步請點擊阿裡雲開源鏡像站 1 簡介 FCN-4是一個應用於音頻自動標註的全捲積神經網路。使用該網路完成音頻標註任務時，首先需要使用python的音頻處理工具包Librosa提取音頻的時頻特征，針對mp3格式的音頻文件，Librosa讀取音頻文件的工作依賴音頻處理後端ffm ...
20-CubeMx+Keil+Proteus模擬STM32 - 步進電動機

本文例子參考《STM32單片機開發實例——基於Proteus虛擬模擬與HAL/LL庫》源代碼：https://github.com/LanLinnet/STM33F103R6 項目要求理解H橋電路的工作原理，結合前面幾個項目學習過的定時器中斷、EXTI、串口通訊等，要求通過7個按鈕控制步進電動機 ...
2022-6-2-mysql常用的命令

mysql -uroot -proot -h192.168.56.10 表示使用mysql的客戶端進行連接資料庫管理系統 -u後面是連接資料庫的用戶名,一般預設的情況下用戶名都是root -p後面是連接資料庫的密碼，在安裝mysql的時候自己設置的 -h表示資料庫管理系統所在的伺服器的ip地址,如果 ...
Docker三劍客之Compose

一、概述 compose 是用來定義和運行一個或多個容器(通常都是多個)運行和應用的工具。使用 compose 可以簡化容器鏡像的構建以及容器的運行。 compose 使用 YAML 文件來定義多容器之間的關係。一個 docker-compose up 就可以把完整的應用跑起來。本質上，comp ...