ResourceManager學習之ApplicationMaster,NodeManager管理

来源:https://www.cnblogs.com/SmallBird-Nest/archive/2019/09/03/11453411.html
-Advertisement-
Play Games

ApplicationMaster管理部分主要由三個服務構成,分別是ApplicationMasterLauncher、AMLivelinessMonitor和ApplicationMasterService,它們共同管理應用程式的ApplicationMaster的生命周期 Application ...


ApplicationMaster管理部分主要由三個服務構成,分別是ApplicationMasterLauncher、AMLivelinessMonitor和ApplicationMasterService,它們共同管理應用程式的ApplicationMaster的生命周期   ApplicationMasterLauncher、AMLivelinessMonitor和ApplicationMasterService這三個組件是如何協同管理ApplicationMaster生命周期,介紹從ResourceManager獲得資源啟動ApplicationMaster : 
  1. 用戶向YARN ResourceManager提交應用程式,ResourceManager收到提交請求後,先向資源調度器申請用以啟動ApplicationMaster的資源,待申請到資源後,再由ApplicationMasterLauncher與對應的NodeManager通信,從而啟動應用程式的ApplicationMaster
  2. ApplicationMaster啟動完成後,ApplicationMasterLauncher會通過事件的形式,將剛剛啟動的ApplicationMaster註冊到AMLivelinessMonitor,以啟動心跳監控
  3. ApplicationMaster啟動後,先向ApplicationMasterService註冊,並將自己所在host、埠號等信息彙報給它
  4. ApplicationMaster運行過程中,周期性地向ApplicationMasterService彙報心跳信息
  5. ApplicationMasterService每次收到ApplicationMaster的心跳信息後,將通知AMLivelinessMonitor更新該應用程式的最近彙報心跳的時間
  6. 當應用程式運行完成後,ApplicationMaster向ApplicationMasterService發送請求,註銷自己
  7. ApplicationMasterService收到註銷請求後,標註應用程式運行狀態為完成,同時通知AMLivelinessMonitor移除對它的心跳監控
介紹三個服務   (1) ApplicationMasterLauncher   ApplicationMasterLauncher即是一個服務,也是一個事件處理器,它處理AMLauncherEvent類型的事件,該類型事件有兩種,分別是請求啟動一個ApplicationMaster的"LAUNCH"事件和請求清理一個ApplicationMaster的"CLEANUP"事件。ApplicationMasterLauncher維護了一個線程池,從而能夠儘快地處理這兩種事件
  • 如果ApplicationMasterLauncher收到了"LAUNCH"類型的事件,它會與對應的NodeManager通信,要求它啟動ApplicationMaster。整個過程比較簡單,首先創建一個ContainerManagementProtocol協議的客戶端,然後向對應的NodeManager發起連接請求,接著將啟動AM所需的各種信息,包括啟動命令、JAR包、環境變數等信息,封裝成一個StartContainerRequest對象,然後通過RPC函數ContainerManagementProtocol#startContainer發送給對應的NM
  • 如果ApplicationMasterLauncher收到了"CLEANUP"類型的事件,它與對應的NodeManager通信,要求它殺死ApplicationMaster。整個過程與啟動AM的過程類似
(2) AMLivelinessMonitor   該服務周期性遍歷所有應用程式的ApplicationMaster,如果一個ApplicationMaster在一定時間內未彙報心跳信息,則認為它死掉了,它上面所有正在運行的Container將被置為運行失敗;如果AM運行失敗,則由RM重新為它申請資源,以便能夠重新分配到另外一個節點上執行   (3) ApplicationMasterService   ApplicationMasterService實現了RPC協議ApplicationMasterProtocol,負責處理來自ApplicationMaster的請求,請求主要包括註冊、心跳和清理三種,其中,註冊是ApplicationMaster啟動時發生的行為,請求包中包含AM所在節點、RPC埠號和tracking URL等信息;心跳是周期性行為,包含請求資源的類型描述、待釋放的Container列表等,而AMS為之返回新分配的Container、失敗的Container等信息;清理是應用程式運行結束時發生的行為,ApplicationMaster向RM發送清理應用程式的請求,以回收資源和清理各種記憶體空間   ApplicationMasterLauncher啟動AM後,AM做的第一件事是向RM註冊,這是通過RPC函數ApplicationMasterProtocol#registerApplicationMaster實現的   AM運行過程中,需要周期性地通過RPC函數ApplicationMasterProtocol#allocate與RM通信,這主要有以下三個作用 : 
  • 請求資源
  • 獲取新分配的資源
  • 形成周期性心跳,告訴RM自己還活著
  AM運行結束後,需要通過RPC函數ApplicationMasterProtocol#finishApplicationMaster告訴RM自己運行結束,可以回收資源和清理各種數據結果了  
  NodeManager管理部分主要由三個服務構成,分別是NMLivelinessMonitor,NodesListManager和ResourceTrackerService,它們共同管理NodeManager的生命周期   介紹三個服務   (1) NMLivelinessMonitor   該服務周期性的遍歷集群中所有NodeManager,如果一個NodeManager在一定時間內未彙報心跳信息,則認為它死掉了,它上面所有正在運行的Container將被置為運行失敗。需要註意的是,RM不會重新執行這些Container,它只會通過心跳機制告訴對應的AM,由AM決定是否重新執行。如果需要,則AM重新向RM申請資源,然後由AM與對應的NodeManager通信以重新運行失敗的Container   (2) NodesListManager   NodesListManager管理exlude(類似於黑名單)和inlude(類似於白名單)節點列表,這兩個列表所在的文件分別可通過yarn.resourcemanager.nodes.include-path和yarn.resourcemanager.nodes.exclude-path配置,其中,exlude節點列表可認為是黑名單,它們不允許直接與RM通信,而inlude節點列表可認為是白名單。預設情況下,這兩個列表均為空,表示任何節點均被允許接入RM。需要註意的是,管理員可通過命令"bin/yarn rmadmin -refreshNodes"動態載入這兩個文件   (3) ResourceTrackerService   ResourceTrackerService實現了RPC協議ResourceTracker,負責處理來自各個NodeManager的請求,請求主要包括註冊和心跳兩種,其中,註冊是NodeManager啟動時發生的行為,請求包中包含節點ID,可用的資源上限等信息;而心跳時周期性行為,包含各個Container運行狀態,運行的Application列表,節點健康狀況,而ResourceTrackerService則為NM返回待釋放的Container列表、Application列表等   NM啟動時,它所作的第一件事是向RM註冊,這是通過RPC函數ResourceTracker#registerNodeManager實現的,註冊信息包括節點可用資源總量,對外開放的HTTP埠號等   NM啟動後,他會周期性地通過RPC函數ResourceTracker#nodeHeartbeat彙報心跳,心跳信息包含各個Container運行狀態,運行的Application列表,節點健康狀況等信息,而RM則為之返回需要釋放的Container列表,Application列表等   我每天會寫文章記錄大數據技術學習之路,另外我自己整理了些大數據的學習資料,目前全部放在我的公眾號"SmallBird技術分享",加入我們一起學習交流,並且回覆'分享'會有大數據資源驚喜等著你~  
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.一個問題 InnoDB一棵B+樹可以存放多少行數據?這個問題的簡單回答是:約2千萬。為什麼是這麼多呢?因為這是可以算出來的,要搞清楚這個問題,我們先從InnoDB索引數據結構、數據組織方式說起。 我們都知道電腦在存儲數據的時候,有最小存儲單元,這就好比我們今天進行現金的流通最小單位是一毛。在計 ...
  • 定義 各類別的出現概率不均衡的情況 如信用風險中正常用戶遠多於逾期、違約用戶;流失風險中留存用戶多於流失用戶 隱患 降低對少類樣本的靈敏性。但我們建模就是要找到這少類樣本,所以必須對數據加以處理,來提高靈敏性。 解決方案 1. 過採樣 對壞的人群提高權重,即複製壞樣本,提高壞樣本的占比。 優點: 簡 ...
  • 前面說到了 Flink的TaskManager啟動(源碼分析) 啟動了TaskManager 然後 Flink的Job啟動JobManager端(源碼分析) 說到JobManager會將轉化得到的TDD發送到TaskManager的RPC 這篇主要就講一下,Job在TaskManager端是如何啟動 ...
  • 流式計算分為無狀態和有狀態兩種情況。無狀態計算觀察每個獨立的事件,Storm就是無狀態的計算框架,每一條消息來了以後和前後都沒有關係,一條是一條。比如我們接收電力系統感測器的數據,當電壓超過240v就報警,這就是無狀態的數據。但是如果我們需要同時判斷多個電壓,比如三相電路,我們判斷三相電都高於某個值 ...
  • 原因:使用負載均衡的時候,第一次請求phpMyAdmin主頁的時候web01進行處理,頁面返回的cookie存放在web01上.填寫用戶名密碼提交之後,是web02進行處理的,此時給頁面的cookie不是web01上的cookie,所以會報錯 解決方法:將cookie都放到單獨的資料庫redis中 ...
  • javascript當中火狐的firebug如何單步調試程式 ...
  • python連接mysql的客戶端 MySQL註入問題 之前我們進行用戶名密碼認證是先將用戶名和密碼保存到一個文件中,然後通過讀文件裡面的內容,來和客戶端發送過來的用戶名密碼進行匹配,現在我們學了資料庫,我們可以將這些用戶數據保存到資料庫中,然後通過資料庫裡面的數據來對客戶端進行用戶名和密碼的認證。 ...
  • 一、詞頻 TF • 假設:如果一個詞很重要,應該會在文章中多次出現 • 詞頻——TF(Term Frequency):一個詞在文章中出現的次數 • 也不是絕對的!出現次數最多的是“的”“是”“在”,這類最常用的詞,叫做停用詞(stop words)• 停用詞對結果毫無幫助,必須過濾掉的詞 • 過濾掉 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...