深入理解 Linux Cgroup 系列(一):基本概念

来源:https://www.cnblogs.com/ryanyangcs/archive/2019/07/16/11198140.html
-Advertisement-
Play Games

本文主要介紹了 cgroup 的一些基本概念,包括其在 CentOS 系統中的預設設置和控制工具,以 CPU 為例闡述 cgroup 如何對資源進行控制。 ...


原文鏈接:深入理解 Linux Cgroup 系列(一):基本概念

Cgroup 是 Linux kernel 的一項功能:它是在一個系統中運行的層級制進程組,你可對其進行資源分配(如 CPU 時間、系統記憶體、網路帶寬或者這些資源的組合)。通過使用 cgroup,系統管理員在分配、排序、拒絕、管理和監控系統資源等方面,可以進行精細化控制。硬體資源可以在應用程式和用戶間智能分配,從而增加整體效率。

cgroup 和 namespace 類似,也是將進程進行分組,但它的目的和 namespace 不一樣,namespace 是為了隔離進程組之間的資源,而 cgroup 是為了對一組進程進行統一的資源監控和限制。

cgroup 分 v1 和 v2 兩個版本,v1 實現較早,功能比較多,但是由於它裡面的功能都是零零散散的實現的,所以規劃的不是很好,導致了一些使用和維護上的不便,v2 的出現就是為瞭解決 v1 中這方面的問題,在最新的 4.5 內核中,cgroup v2 聲稱已經可以用於生產環境了,但它所支持的功能還很有限,隨著 v2 一起引入內核的還有 cgroup namespace。v1 和 v2 可以混合使用,但是這樣會更複雜,所以一般沒人會這樣用。

1. 為什麼需要 cgroup


在 Linux 里,一直以來就有對進程進行分組的概念和需求,比如 session group, progress group 等,後來隨著人們對這方面的需求越來越多,比如需要追蹤一組進程的記憶體和 IO 使用情況等,於是出現了 cgroup,用來統一將進程進行分組,併在分組的基礎上對進程進行監控和資源控制管理等。

2. 什麼是 cgroup


術語 cgroup 在不同的上下文中代表不同的意思,可以指整個 Linux 的 cgroup 技術,也可以指一個具體進程組。

cgroup 是 Linux 下的一種將進程按組進行管理的機制,在用戶層看來,cgroup 技術就是把系統中的所有進程組織成一顆一顆獨立的樹,每棵樹都包含系統的所有進程,樹的每個節點是一個進程組,而每顆樹又和一個或者多個 subsystem 關聯,樹的作用是將進程分組,而 subsystem 的作用就是對這些組進行操作。cgroup 主要包括下麵兩部分:

  • subsystem : 一個 subsystem 就是一個內核模塊,他被關聯到一顆 cgroup 樹之後,就會在樹的每個節點(進程組)上做具體的操作。subsystem 經常被稱作 resource controller,因為它主要被用來調度或者限制每個進程組的資源,但是這個說法不完全準確,因為有時我們將進程分組只是為了做一些監控,觀察一下他們的狀態,比如 perf_event subsystem。到目前為止,Linux 支持 12 種 subsystem,比如限制 CPU 的使用時間,限制使用的記憶體,統計 CPU 的使用情況,凍結和恢復一組進程等,後續會對它們一一進行介紹。
  • hierarchy : 一個 hierarchy 可以理解為一棵 cgroup 樹,樹的每個節點就是一個進程組,每棵樹都會與零到多個 subsystem 關聯。在一顆樹裡面,會包含 Linux 系統中的所有進程,但每個進程只能屬於一個節點(進程組)。系統中可以有很多顆 cgroup 樹,每棵樹都和不同的 subsystem 關聯,一個進程可以屬於多顆樹,即一個進程可以屬於多個進程組,只是這些進程組和不同的 subsystem 關聯。目前 Linux 支持 12 種 subsystem,如果不考慮不與任何 subsystem 關聯的情況(systemd 就屬於這種情況),Linux 裡面最多可以建 12 顆 cgroup 樹,每棵樹關聯一個 subsystem,當然也可以只建一棵樹,然後讓這棵樹關聯所有的 subsystem。當一顆 cgroup 樹不和任何 subsystem 關聯的時候,意味著這棵樹只是將進程進行分組,至於要在分組的基礎上做些什麼,將由應用程式自己決定,systemd 就是一個這樣的例子。

3. 將資源看作一塊餅


在 CentOS 7 系統中(包括 Red Hat Enterprise Linux 7),通過將 cgroup 層級系統與 systemd 單位樹捆綁,可以把資源管理設置從進程級別移至應用程式級別。預設情況下,systemd 會自動創建 slicescope 和 service 單位的層級(具體的意思稍後再解釋),來為 cgroup 樹提供統一結構。可以通過 systemctl 命令創建自定義 slice 進一步修改此結構。

如果我們將系統的資源看成一塊餡餅,那麼所有資源預設會被劃分為 3 個 cgroup:SystemUser 和 Machine。每一個 cgroup 都是一個 slice,每個 slice 都可以有自己的子 slice,如下圖所示:

下麵我們以 CPU 資源為例,來解釋一下上圖中出現的一些關鍵詞。

如上圖所示,系統預設創建了 3 個頂級 sliceSystemUser 和 Machine),每個 slice 都會獲得相同的 CPU 使用時間(僅在 CPU 繁忙時生效),如果 user.slice 想獲得 100% 的 CPU 使用時間,而此時 CPU 比較空閑,那麼 user.slice 就能夠如願以償。這三種頂級 slice 的含義如下:

  • system.slice —— 所有系統 service 的預設位置
  • user.slice —— 所有用戶會話的預設位置。每個用戶會話都會在該 slice 下麵創建一個子 slice,如果同一個用戶多次登錄該系統,仍然會使用相同的子 slice。
  • machine.slice —— 所有虛擬機和 Linux 容器的預設位置

控制 CPU 資源使用的其中一種方法是 shares。shares 用來設置 CPU 的相對值(你可以理解為權重),並且是針對所有的 CPU(內核),預設值是 1024。因此在上圖中,httpd, sshd, crond 和 gdm 的 CPU shares 均為 1024,System, User 和 Machine 的 CPU shares 也是 1024

假設該系統上運行了 4 個 service,登錄了兩個用戶,還運行了一個虛擬機。同時假設每個進程都要求使用儘可能多的 CPU 資源(每個進程都很繁忙)。

  • system.slice 會獲得 33.333% 的 CPU 使用時間,其中每個 service 都會從 system.slice 分配的資源中獲得 1/4 的 CPU 使用時間,即 8.25% 的 CPU 使用時間。
  • user.slice 會獲得 33.333% 的 CPU 使用時間,其中每個登錄的用戶都會獲得 16.5% 的 CPU 使用時間。假設有兩個用戶:tom 和 jack,如果 tom 註銷登錄或者殺死該用戶會話下的所有進程,jack 就能夠使用 33.333%的 CPU 使用時間。
  • machine.slice 會獲得 33.333% 的 CPU 使用時間,如果虛擬機被關閉或處於 idle 狀態,那麼 system.slice 和 user.slice 就會從這 33.333% 的 CPU 資源里分別獲得 50% 的 CPU 資源,然後均分給它們的子 slice。

如果想嚴格控制 CPU 資源,設置 CPU 資源的使用上限,即不管 CPU 是否繁忙,對 CPU 資源的使用都不能超過這個上限。可以通過以下兩個參數來設置:

cpu.cfs_period_us = 統計CPU使用時間的周期,單位是微秒(us) 
cpu.cfs_quota_us = 周期內允許占用的CPU時間(指單核的時間,多核則需要在設置時累加) 

systemctl 可以通過 CPUQuota 參數來設置 CPU 資源的使用上限。例如,如果你想將用戶 tom 的 CPU 資源使用上限設置為 20%,可以執行以下命令:

$ systemctl set-property user-1000.slice CPUQuota=20%

在使用命令 systemctl set-property 時,可以使用 tab 補全:

$ systemctl set-property user-1000.slice
AccuracySec=            CPUAccounting=          Environment=            LimitCPU=               LimitNICE=              LimitSIGPENDING=        SendSIGKILL=
BlockIOAccounting=      CPUQuota=               Group=                  LimitDATA=              LimitNOFILE=            LimitSTACK=             User=
BlockIODeviceWeight=    CPUShares=              KillMode=               LimitFSIZE=             LimitNPROC=             MemoryAccounting=       WakeSystem=
BlockIOReadBandwidth=   DefaultDependencies=    KillSignal=             LimitLOCKS=             LimitRSS=               MemoryLimit=
BlockIOWeight=          DeviceAllow=            LimitAS=                LimitMEMLOCK=           LimitRTPRIO=            Nice=
BlockIOWriteBandwidth=  DevicePolicy=           LimitCORE=              LimitMSGQUEUE=          LimitRTTIME=            SendSIGHUP=

這裡有很多屬性可以設置,但並不是所有的屬性都是用來設置 cgroup 的,我們只需要關註 BlockCPU 和 Memory

如果你想通過配置文件來設置 cgroup,service 可以直接在 /etc/systemd/system/xxx.service.d 目錄下麵創建相應的配置文件,slice 可以直接在 /run/systemd/system/xxx.slice.d 目錄下麵創建相應的配置文件。事實上通過 systemctl 命令行工具設置 cgroup 也會寫到該目錄下的配置文件中:

$ cat /run/systemd/system/user-1000.slice.d/50-CPUQuota.conf
[Slice]
CPUQuota=20%

查看對應的 cgroup 參數:

$ cat /sys/fs/cgroup/cpu,cpuacct/user.slice/user-1000.slice/cpu.cfs_period_us
100000

$ cat /sys/fs/cgroup/cpu,cpuacct/user.slice/user-1000.slice/cpu.cfs_quota_us
20000

這表示用戶 tom 在一個使用周期內(100 毫秒)可以使用 20 毫秒的 CPU 時間。不管 CPU 是否空閑,該用戶使用的 CPU 資源都不會超過這個限制。

CPUQuota 的值可以超過 100%,例如:如果系統的 CPU 是多核,且 CPUQuota 的值為 200%,那麼該 slice 就能夠使用 2 核的 CPU 時間。

4. 總結


本文主要介紹了 cgroup 的一些基本概念,包括其在 CentOS 系統中的預設設置和控制工具,以 CPU 為例闡述 cgroup 如何對資源進行控制。下一篇文章將會通過具體的示例來觀察不同的 cgroup 設置對性能的影響。

5. 參考資料




您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • App_Code 下創建的.cs文件僅僅是“內容”不是代碼。設置文件為“編譯”就可正常引用。 ...
  • 這篇文章主要講解C#中的泛型,泛型在C#中有很重要的地位,尤其是在搭建項目框架的時候。 一、什麼是泛型 泛型是C#2.0推出的新語法,不是語法糖,而是2.0由框架升級提供的功能。 我們在編程程式時,經常會遇到功能非常相似的模塊,只是它們處理的數據不一樣。但我們沒有辦法,只能分別寫多個方法來處理不同的 ...
  • 主要記錄下如何在EF 中連接Oracle s資料庫,很傻瓜式,非常簡單,但是不知道的童鞋,也會搞得很難受,我自己就是 1.創一個控制台程式,並且添加 Oracle.ManagedDataAccess.EntityFramework 2.添加完之後,會自動在App.config 中添加一堆配置信息,主 ...
  • 一、項目中一直用到了文字轉語音的功能,需求也比較簡單,就是將一段報警信息通過語音的方式播放出來,之前一直採用CS客戶端,利用微軟自帶的Speech語音播放庫就可以完成, 1.1 封裝winSpedk類代碼如下: namespace Speak { using System; using System ...
  • 當我傻啊,用戶在電商網站購買成功,還在微服務中,那肯定就是有一套微服務架構的電商系統。 設計一套電商系統還不簡單 簡單想象一下,既然是一個電商系統,有用戶去購買,就肯定得有一個用戶模塊,購買什麼東西總不是西北風吧,購買肯定是商品吧,省掉購物車,就得有商品模塊吧,商品總得有庫存吧,庫存就暫時跟商品放一 ...
  • string path = "test.txt"; FileStream mystream = new FileStream(path, FileMode.OpenOrCreate); StreamWriter myWrite = new StreamWriter(mystream); myWrit ...
  • 本項目採用ASP.Net Core微服務技術,搭建博客和Saas平臺。 全文將圍繞(1)設計模式 (2)敏捷開發 目的: 結構足夠合理,代碼足夠優美,擴展性、可讀性、易維護性做到最優。 以下目錄僅為整體思路,後期逐漸完善補充。 1.配置linux環境實現持續集成 2.快速搭建 ASP.net cor ...
  • LinuxShell——正則表達式 摘要:本文主要學習了Shell中的正則表達式。 簡介 含義 正則表達式,也稱作正規表示法,是用於描述字元排列和匹配模式的一種語法規則,它主要用於字元串的模式分割、匹配、査找及替換操作。 正則表達式是用來匹配文件中的字元串的方法,它會先把整個文本分成一行一行的字元串 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...