記憶體不足時Linux 內核自動觸發OOM-killer

来源:https://www.cnblogs.com/yaoshuigebiss/archive/2023/02/28/17164143.html
-Advertisement-
Play Games

問題產生: 作者最近在搭建Hadoop+Hive集群時,將NameNode、DataNode、Rm全部部署到一臺物理機上,查詢量較大時連接掛掉。 問題定位: 使用JPS命令查看Metastore服務正常運行,hive2--Runjar掛掉。重啟之後,過段時間又會掛掉。 Linux 內核有個機制叫OO ...


問題產生:

作者最近在搭建Hadoop+Hive集群時,將NameNode、DataNode、Rm全部部署到一臺物理機上,查詢量較大時連接掛掉。

問題定位:

使用JPS命令查看Metastore服務正常運行,hive2--Runjar掛掉。重啟之後,過段時間又會掛掉。

Linux 內核有個機制叫OOM killer(Out Of Memory killer),該機制會監控那些占用記憶體過大,尤其是瞬間占用記憶體很快的進程,然後防止記憶體耗盡而自動把該進程殺掉。內核檢測到系統記憶體不足、挑選並殺掉某個進程的過程可以參考內核源代碼linux/mm/oom_kill.c,當系統記憶體不足的時候,out_of_memory()被觸發,然後調用select_bad_process()選擇一個”bad”進程殺掉。如何判斷和選擇一個”bad進程呢?linux選擇”bad”進程是通過調用oom_badness(),挑選的演算法和想法都很簡單很朴實:最bad的那個進程就是那個最占用記憶體的進程。

查看系統日誌:

grep "Out of memory" /var/log/messages

問題分析:

hive2服務需要total-vm(進程使用的虛擬記憶體),anon-rss匿名記憶體(RAM實際分配的大小),file-rss映射到文件和設備的大小。

hive2服務生成mr程式,進行查詢數據時,瞬間會占用大量記憶體。物理機的記憶體耗盡出發了系統的oom  killer導致。

問題解決:

參數/proc/sys/vm/overcommit_memory可以控制進程對記憶體過量使用的應對策略

overcommit_memory=0 允許進程輕微過量使用記憶體,但對於大量過載請求則不允許(預設)

overcommit_memory=1 永遠允許進程overcommit

overcommit_memory=2 永遠禁止overcommit

增大機器記憶體

服務部署分散到不同的機器上。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 背景 大家好,我是棧長。 前些天,棧長給大家分享了兩篇有意思的文章: 帶了一個 3 年的開發,不會迴圈刪除 List 中的元素,我簡直崩潰!! 面試官:怎麼去除 List 中的重覆元素?我一行代碼搞定,趕緊拿去用! 這兩篇文章確實能幫助一大部分人,其中分享的一些實現技巧,編程很多年的高手也不一定用過 ...
  • Java方法:方法的重載、命令行傳參、遞歸 方法的重載 重載就是在一個類中,有相同的函數名稱,但是形參不同的函數。 方法重載的規則: 方法名稱必須相同; 參數列表必須不同(個數不同或者類型不同或者參數排列順序不同等); 方法的返回類型可以相同也可以不相同; 僅僅返回類型不同不足以成為方法的重載。 實 ...
  • 問題描述: 編譯器無法使用cmd命令來執行py文件,結果可能報ModuleNotFoundError的錯誤。 比如在cmd任務欄執行:python E:\myProgram\Python\spider\NetDealer\core\others\audi.py,項目NetDealer 包core 文 ...
  • 1.年輕代存活的對象太多,老年代了放不下 01.示例代碼 public class DemoTest1 { public static void main(String[] args) { byte[] array1 = new byte[4 * 1024 * 1024]; array1 = nul ...
  • 一:背景 1. 講故事 前段時間微信上有一位老朋友找到我,說他的程式跑著跑著記憶體會突然爆高,有時候會下去,有什麼會下不去,懷疑是不是某些情況下存在記憶體泄露,讓我幫忙分析一下,其實記憶體泄露方面的問題還是比較好解決的,看過這個dump之後覺得還是有一定的分享價值,拿出來和大家分享一下吧。 二:WinDb ...
  • 概述 代理模式就是給某一個對象提供一個代理,並由代理對象控制對原對象的引用。在一些情況下,一個客戶不想或者不能直接引用一個對象,而代理對象可以在客戶端和目標對象之間起到中介的作用。例如電腦桌面的快捷方式就是一個代理對象,快捷方式是它所引用的程式的一個代理。 代理模式一般又分為安全代理,虛擬代理 ,遠 ...
  • 1.系統是預設安裝的,查看系統是否安裝logrotate centos rpm -ql logrotate /etc/cron.daily/logrotate /etc/logrotate.conf /etc/logrotate.d /etc/rwtab.d/logrotate /usr/sbin/ ...
  • 1.IO的概念 IO簡單來講就是對輸入輸出設備的簡化表達形式 單片機中各種介面,進行數據流的傳輸 從磁碟中讀取數據至記憶體,又或者從記憶體中寫入磁碟 編程中的IO 此時的IO其應用程式的運行態,即進程 》IO調用 特別強調的是我們的應用程式其實並不存在實質的IO過程,真正的IO過程是操作系統的事情, 這 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...