【深入淺出 Yarn 架構與實現】4-4 RM 管理 Application

来源:https://www.cnblogs.com/shuofxz/archive/2023/01/11/17044622.html
-Advertisement-
Play Games

在 YARN 中,Application 是指應用程式,它可能啟動多個運行實例,每個運行實例由 —個 ApplicationMaster 與一組該 ApplicationMaster 啟動的任務組成,它擁有名稱、隊列、優先順序等屬性,是一個比較寬泛的概念,可以是一個 MepReduce 作業、一個 D... ...


在 YARN 中,Application 是指應用程式,它可能啟動多個運行實例,每個運行實例由 —個 ApplicationMaster 與一組該 ApplicationMaster 啟動的任務組成,它擁有名稱、隊列、優先順序等屬性,是一個比較寬泛的概念,可以是一個 MepReduce 作業、一個 DAG 應用程式等。YARN 中 Application 管理涉及應用程式的許可權管理、啟動與關閉、生命周期管理等,本節只介紹最基本的管理內容,比如許可權管理、啟動與關閉等,而生命周期管理則放到下一節中介紹。

一、ApplicationACLsManager

ApplicationACLsManager 負責管理應用程式訪問許可權

  • 查看許可權
    • 程式基本信息:運行時間、優先順序等
  • 修改許可權
    • 修改程式優先順序、殺死應用程式

二、RMAppManager

RMAppManager 負責應用程式啟動和關閉。接下來結合源碼主要分析啟動和結束兩個操作。

1、啟動

在「4-1 ResourceManager 功能概述」中,提到了 ClientRMService 處理來自客戶端各種 RPC 請求,比如提交、終止獲取應用運行狀態等。
ClientRMService 當收到客戶端提交的應用後,將調用函數 RMAppManager#submitApplication 創建一個 RMApp 對象,維護應用程式的整個生命周期。

protected void submitApplication() {
    // 創建 app,並添加到 RMActiveServiceContext.applications
	RMAppImpl application =
    	createAndPopulateNewRMApp(submissionContext, submitTime, user, false);

    // 發送 app start event,繼續由其他事件處理器處理
    this.rmContext.getDispatcher().getEventHandler()
        .handle(new RMAppEvent(applicationId, RMAppEventType.START));
}

2、結束

當 RMAPP 運行結束後,將向 RMAPPManager 發送一個 RMAPPManagerEventType.APP_COMPLETED 事件。看源碼將執行 3 個操作:

  public void handle(RMAppManagerEvent event) {
    ApplicationId applicationId = event.getApplicationId();
    LOG.debug("RMAppManager processing event for " 
        + applicationId + " of type " + event.getType());
    switch(event.getType()) {
      case APP_COMPLETED: 
      {
        finishApplication(applicationId);
        logApplicationSummary(applicationId);
        checkAppNumCompletedLimit(); 
      } 
  • finishApplication()
    • 將 Application 放入到記憶體的已完成列表 completedApps 中,用戶可查詢歷史應用執行信息(如 yarn web)。
  • logApplicationSummary()
    • 列印日誌信息。
  • checkAppNumCompletedLimit()
    • 上面提到的 completedApps 列表容量有限,預設 10000,可修改。超過該值時,將從在這裡被移除,後續可從 History Server 中進行查看。
    • 將應用程式從 RMStateStore 中移除。RMStateStore 記錄了運行中的應用程式的運行日誌,當集群故障重啟後,RM 可通過這些日誌恢復應用程式運行狀態,從而避免全部重新運行,一旦應用程式運行結束後,這些日誌便失去了意義, 故可以對其進行刪除。

三、ContainerAllocationExpirer

當 AM 獲得 Container 後,必須在一定時間內(預設為 10min,可修改),在對應的 NM 上啟動該 Container,否則 RM 將強制回收該 Container。因為 YARN 不允許 AM 長時間不對其使用,會降低整個集群的利用率。

protected void expire(AllocationExpirationInfo allocationExpirationInfo) {
  dispatcher.handle(new ContainerExpiredSchedulerEvent(
      allocationExpirationInfo.getContainerId(),
          allocationExpirationInfo.isIncrease()));
}

該類也繼承自抽象類 AbstractLivelinessMonitor,前面已經講過,這裡不再贅述。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • CSS 樣式太多,重覆寫 在學習 UnoCSS 之前,我提出幾個問題: 你是否有過寫完了 HTML 之後,跳轉到 style 寫 CSS 這樣來回跳轉的痛苦? 你是否有過不知道如何給節點取類名的痛苦(有的節點確實沒啥必要取類名,但就是需要寫 CSS)? 你是否有過管理重覆、繁雜、繁多的 CSS 而痛 ...
  • JavaScript 可以使用類似於 canvas 和 web workers 來實現圖像壓縮。 使用 canvas,可以將圖像繪製到 canvas 上,然後使用 canvas 提供的 toBlob() 或 toDataURL() 方法將其轉換為不同格式的圖像。在這些方法中指定圖像質量參數即可實現壓... ...
  • 視頻格式就是通常所說的.mp4,.flv,.ogv,.webm等。簡單來說,它其實就是一個盒子,用來將實際的視頻流以一定的順序放入,確保播放的有序和完整性。 ...
  • 電銷是什麼?就是坐席拿著電話給客戶打電話嗎?no no no,讓我們一起走進京音平臺之電銷系統。 京音平臺2020年初開始建設,過去的兩年多的時間里,經歷了跌宕起伏,有經驗、有教訓,整體來說平臺經歷了人工、自動化階段,目前處於初步智能化階段,希望可以將過去的一些心路歷程分享給大家,共同交流、共同進... ...
  • 1. 直接創建 C++ 使用 new 創建二維數組最直接的方法就是 new T[M][N]。返回的指針類型是 T (*)[N],它是指向數組的指針,可以直接使用數組下標形式訪問元素。釋放記憶體直接使用delete[]。示例代碼: #include <iostream> class A { public ...
  • 前言 考研結束半個月了,自己也簡單休整了一波,估了一下分,應該能進覆試,但還是感覺不夠托底。不管怎樣,要把代碼能力和八股撿起來了,正好看到卡哥有這個演算法訓練營,遂果斷參加,為機試和日後求職打下一個基礎。 我之前斷斷續續地刷過一些LeetCode,但是不成體系,數量也少得可憐,才區區50+,在尋找暑期 ...
  • 題目傳送門 題意簡述 看到題目顯而易見是求逆序對個數。 思路分析 看到數據範圍 $x_i,y_i \le 2^{31}-1$,$k \le 10^5$。數據值域大但是個數少,且與數據之間的大小關係有關,因此考慮離散化。 離散化簡單介紹 離散化實際就是一種映射,當數據值域過大而個數有限時,可以嘗試離散 ...
  • Image模塊是PIL最基本的模塊,其中導出了Image類,一個Image類實例對象就對應了一副圖像。同時,Image模塊還提供了很多有用的函數。本文只是初步學習了一些用法與實際操作。 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...