Linux Cgroup v1(中文翻譯)(4):Block IO Controller

来源:https://www.cnblogs.com/aosp/archive/2022/06/10/16359379.html
-Advertisement-
Play Games

Block IO Controller 1 概覽 cgroup子系統blkio實現了block io控制器。無論是對存儲結構上的葉子節點和還是中間節點,它對各種IO控制策略(proportional BW, max BW)都是必須的。設計規劃就是使用同樣的cgroup,基於blkio控制器的管理介面 ...


Block IO Controller

1 概覽

cgroup子系統blkio實現了block io控制器。無論是對存儲結構上的葉子節點和還是中間節點,它對各種IO控制策略(proportional BW, max BW)都是必須的。設計規劃就是使用同樣的cgroup,基於blkio控制器的管理介面和後臺的用戶選項來切換IO策略。

IO控制策略就是節流閥門策略,能用來規定設備上的較上層IO速度限制。這個策略在通用塊層實現,能被用在葉子節點和較高層的邏輯設備(像設備映射器device mapper)上。

2 如何控制限制策略

使能Block IO控制器:

CONFIG_BLK_CGROUP=y

在塊層使能節流閥門控制:

CONFIG_BLK_DEV_THROTTLING=y

掛載blkio控制器(參考Control Groups,為什麼需要cgroups):

mount -t cgroup -o blkio none /sys/fs/cgroup/blkio

為根分組(root group)上的特定設備規定帶寬速率,策略格式是“: <bytes_per_second>”:

echo "8:16  1048576" > /sys/fs/cgroup/blkio/blkio.throttle.read_bps_device

這將限制根分組下主次設備號8:16的設備讀取速率為1MB/秒。

運行dd命令來讀取文件,看看是否速率被控制在1MB/s:

# dd iflag=direct if=/mnt/common/zerofile of=/dev/null bs=4K count=1024
1024+0 records in
1024+0 records out
4194304 bytes (4.2 MB) copied, 4.0001 s, 1.0 MB/s

寫入限制使用blkio.throttle.write_bps_device來控制。

3 分層的cgroups

節流閥門實現了分層支持。然而分層結構的支持是由cgroup的sane_behavior來使能的,而它是一個開發選項而不是公共可用選項。

如果創建這樣一個分層結構:

   root
   /  \
 test1 test2
   |
 test3

有"sane_behavior"的節流閥門能正確地處理結構。應用到整個子樹(統計本地IO的)的所有的閥門限制直接由該cgroup中的任務生成。

沒有“sane_behavior”使能的節流閥門幾乎把所有分組當作同級對待,它看起來是這樣的:

        pivot
     /  /   \  \
root  test1 test2  test3

4 用戶可見的配置項

CONFIG_BLK_CGROUP
Block IO controller.

CONFIG_BFQ_CGROUP_DEBUG
調試幫助。使能該選型,有一些額外的統計文件出現在cgroup。

CONFIG_BLK_DEV_THROTTLING
在塊層使能塊設備節流閥門。

5 cgroup文件詳情

5.1 比重策略文件

blkio.bfq.weight
規定每個cgroup權重。所有設備上的分組權重都是預設值,除非被blkio.bfq.weight_device更改。
當前允許的權重範圍1~1000。更多詳情請參看BFQ(Budget Fair Queueing)。

blkio.bfq.weight_device
規定每個設備上每個cgroup的權重,會覆蓋預設的分組權重。格式如下:

# echo dev_maj:dev_minor weight > blkio.bfq.weight_device

在該cgroup內的設備/dev/sdb(8:16)上配置權重300:

# echo 8:16 300 > blkio.bfq.weight_device
# cat blkio.bfq.weight_device
dev     weight
8:16    300

在該cgroup內的設備/dev/sda(8:0)上配置權重500:

# echo 8:0 500 > blkio.bfq.weight_device
# cat blkio.bfq.weight_device
dev     weight
8:0     500
8:16    300

移除為/dev/sda規定的權重:

# echo 8:0 0 > blkio.bfq.weight_device
# cat blkio.bfq.weight_device
dev     weight
8:16    300

blkio.time
每個設備上分配給cgroup的磁碟時間(毫秒)。頭兩個域定義了主次設備號,第三個域定義了分配給分組的磁碟時間(毫秒)。

blkio.sectors
被分組遷入或者移出磁碟的sector數量。頭兩個域定義了主次設備號,第三個域定義了遷入或者移出磁碟的sector數量。

blkio.io_service_bytes
被分組遷入或者移出磁碟的位元組數量。它按操作類型(讀或寫,同步或非同步)細分。頭兩個域定義了主次設備號,第三個域定義了操作類型,第四個域定義了位元組數量。

blkio.io_serviced
被分組發給磁碟的IO(bio)數量。它按操作類型(讀或寫,同步或非同步)細分。頭兩個域定義了主次設備號,第三個域定義了操作類型,第四個域定義了IO數量。

blkio.io_service_time
在cgroup內請求發送和請求完成的IO時間總量,以納秒為時間單位。對隊列深度(queue depth)為1的設備,這個時間表示實際服務時間。如果queue_depth>1, 這個請求可能會出現服務故障。這可能使得給定IO的服務時間包含了多個IO的服務時間,導致總的io_service_time大於實際已用時間。這個時間按操作類型(讀或寫,同步或非同步)細分。頭兩個域定義了主次設備號,第三個域定義了操作類型,第四個域定義了io_service_time納秒。

blkio.io_wait_time
cgroup里耗費在調度器隊列內等待服務的IO時間總量(納秒)。這個時間可能大於總的已用時間,因為它累加了所有IO的io_wait_time。它不是cgroup等待時間總量的估量,而是單個wait_time的估量。對queue_depth>1的設備,這個度量不包括IO被派發給設備但它實際上還沒被服務到的等待服務的時間(可能由於設備對請求的重新排序而有時滯)。這個時間按操作類型(讀或寫,同步或非同步)細分。頭兩個域定義了主次設備號,第三個域定義了操作類型,第四個域定義了io_wait_time納秒。

blkio.io_merged
cgroup內的bio請求總量。它按操作類型(讀或寫,同步或非同步)細分。

blkio.io_queued
cgroup內任意給定時刻的排隊請求總量。它按操作類型(讀或寫,同步或非同步)細分。

blkio.avg_queue_size
調試目的,由CONFIG_BFQ_CGROUP_DEBUG=y來使能。整個cgroup生存期內的平均隊列大小。這個cgroup內其中一個隊列每次獲取到時間片(timeslice),隊列大小採樣就進行一次。

blkio.group_wait_time
調試目的,由CONFIG_BFQ_CGROUP_DEBUG=y來使能。cgroup從它變忙(請求隊列從0變為1)到其中一個隊列獲取到時間片而必須等待的時間數量。它不同於io_wait_time,這個是納秒單位的。cgroup在等待(waiting)狀態時讀取,這個統計僅報告累計到它最後一次獲取到時間片的group_wait_time,不包括當前delta增量。

blkio.empty_time
調試目的,由CONFIG_BFQ_CGROUP_DEBUG=y來使能。cgroup沒有被服務也沒有等待請求的時間數量(納秒)。它不包含cgroup內任何一個隊的空閑何時間。cgroup在空(empty)狀態時讀取。這個統計將只報告累計到它最後一次有等待請求的empty_time,不包括當前delta增量。

blkio.idle_time
調試目的,由CONFIG_BFQ_CGROUP_DEBUG=y來使能。IO調度器花在期待更好的請求而不是現存的請求上的空閑時間數量(納秒)。cgroup在空閑(idling)狀態時讀取,這個統計將只報告累加到最後一個空閑周期的idle_time,,不包括當前delta增量。

blkio.dequeue
調試目的,由CONFIG_BFQ_CGROUP_DEBUG=y來使能。這個統計cgroup從設備服務樹出隊(dequeue)多少次。頭兩個域定義了主次設備號,第三個域定義了從特定設備出隊的次數,第四個域定義了io_wait_time納秒。

blkio.*_recursive
各種統計的遞歸版本。這個文件跟他們的非遞歸版本對應部分顯示的信息相同,但是多包含了所有派生cgroup的統計數據。

5.2 限制策略文件

blkio.throttle.read_bps_device
規定了設備讀取速率的上層限制(位元組/秒)。這個規則是針對設備的,格式如下:

echo "<major>:<minor>  <rate_bytes_per_second>" > /cgrp/blkio.throttle.read_bps_device

blkio.throttle.write_bps_device
規定了設備寫入速率的上層限制(位元組/秒)。這個規則是針對設備的,格式如下:

echo "<major>:<minor>  <rate_bytes_per_second>" > /cgrp/blkio.throttle.write_bps_device

blkio.throttle.read_iops_device
規定了設備讀取速率的上層限制(IO/秒)。這個規則是針對設備的,格式如下:

echo "<major>:<minor>  <rate_io_per_second>" > /cgrp/blkio.throttle.read_iops_device

blkio.throttle.write_iops_device
規定了設備寫入速率的上層限制(IO/秒)。這個規則是針對設備的,格式如下:

echo "<major>:<minor>  <rate_io_per_second>" > /cgrp/blkio.throttle.write_iops_device

註意:如果設備上BW和IOPS規則都被定義了,那麼IO受兩種規則的限制。

blkio.throttle.io_serviced
派發給分組內磁碟的IO(bio)數量。它又按操作類型(讀或寫,同步或非同步)細分。頭兩個域定義了主次設備號,第三個域定義了操作類型,第四個域定義了IO數量。

blkio.throttle.io_service_bytes
被分組遷入或者移出磁碟的位元組數量。它又按操作類型(讀或寫,同步或非同步)細分。頭兩個域定義了主次設備號,第三個域定義了操作類型,第四個域定義了位元組數量。

5.3 多種策略間的公共文件

blkio.reset_stats
寫入整型數會重置cgroup所有統計數據。


英文原文:
https://www.kernel.org/doc/html/latest/admin-guide/cgroup-v1/blkio-controller.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一個工作了3年的粉絲,去一個互聯網公司面試,結果被面試官懟了。 面試官說:”這麼簡單的問題你都不知道? 沒法聊了,回去等通知吧“。 這個問題是: ”什麼是可重入鎖,以及它的作用是什麼?“ 對於這個問題,來看看普通人和高手的回答吧 普通人: 嗯。。。。。。。。。。。。。。。。。。 高手: 好的。 可重 ...
  • JDBC概述 JDBC(Java Data Base Connectivity,java資料庫連接)是一種用於執行SQL語句的Java API,可以為多種關係資料庫提供統一訪問,它由一組用Java語言編寫的類和介面組成。是Java訪問資料庫的標準規範。 JDBC提供了一種基準,據此可以構建更高級的工 ...
  • 手把手教你使用 Spring Boot 3 開發上線一個前後端分離的生產級系統(一) - 介紹 手把手教你使用 Spring Boot 3 開發上線一個前後端分離的生產級系統(二) - 資料庫設計 手把手教你使用 Spring Boot 3 開發上線一個前後端分離的生產級系統(三) - 項目初始化 ...
  • 來源:cnblogs.com/lwtyyds/p/15678152.html 常用類概述 內部類 Object類 包裝類 數學類 時間類 字元串 String Builder和StringBuffer DecimalFormat 內部類 「概念」 :在一個類內部再定義一個完整的類。 一般情況下類與類 ...
  • 0. 文章目的 面向有一定基礎的C#初學者,介紹C#中介面的意義、使用以及特點。 1. 閱讀基礎 瞭解C#基本語法(如定義一個類、繼承一個類) 理解OOP中的基本概念(如繼承,多態) 2. 什麼是介面 2.1 現實中的協定與介面 貓貓頭在整理電腦文件,需要一個小工具來分類文件,於是貓貓頭向群里求助: ...
  • 好久沒到園子裡面逛了,回來看了看,.NET有點式微呀?Java/Spring/Linux……比以前多了很多,為什麼?博客園可是.NET的大本營了呀! 好吧,我承認,飛哥也動搖了,去年在ASP.NET的基礎上,開了一期Java Web班。給大家彙報一下心得體會吧: 錄課程前 其實我最開始學(2008年 ...
  • 【SignalR全套系列】之在.Net Core 中實現SignalR實時通信 ...
  • Cgroup Freezer cgroup freezer對於批量啟動和停止任務集合的任務管理系統來說是很有用的,這個程式經常被用在HPC族上來調度訪問。cgroup freezer使用cgroups來描述被批處理任務管理系統啟動和停止的任務集合。他也提供了方法來啟動和停止任務。 cgroup fr ...
一周排行
    -Advertisement-
    Play Games
  • .Net8.0 Blazor Hybird 桌面端 (WPF/Winform) 實測可以完整運行在 win7sp1/win10/win11. 如果用其他工具打包,還可以運行在mac/linux下, 傳送門BlazorHybrid 發佈為無依賴包方式 安裝 WebView2Runtime 1.57 M ...
  • 目錄前言PostgreSql安裝測試額外Nuget安裝Person.cs模擬運行Navicate連postgresql解決方案Garnet為什麼要選擇Garnet而不是RedisRedis不再開源Windows版的Redis是由微軟維護的Windows Redis版本老舊,後續可能不再更新Garne ...
  • C#TMS系統代碼-聯表報表學習 領導被裁了之後很快就有人上任了,幾乎是無縫銜接,很難讓我不想到這早就決定好了。我的職責沒有任何變化。感受下來這個系統封裝程度很高,我只要會調用方法就行。這個系統交付之後不會有太多問題,更多應該是做小需求,有大的開發任務應該也是第二期的事,嗯?怎麼感覺我變成運維了?而 ...
  • 我在隨筆《EAV模型(實體-屬性-值)的設計和低代碼的處理方案(1)》中介紹了一些基本的EAV模型設計知識和基於Winform場景下低代碼(或者說無代碼)的一些實現思路,在本篇隨筆中,我們來分析一下這種針對通用業務,且只需定義就能構建業務模塊存儲和界面的解決方案,其中的數據查詢處理的操作。 ...
  • 對某個遠程伺服器啟用和設置NTP服務(Windows系統) 打開註冊表 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\W32Time\TimeProviders\NtpServer 將 Enabled 的值設置為 1,這將啟用NTP伺服器功 ...
  • title: Django信號與擴展:深入理解與實踐 date: 2024/5/15 22:40:52 updated: 2024/5/15 22:40:52 categories: 後端開發 tags: Django 信號 松耦合 觀察者 擴展 安全 性能 第一部分:Django信號基礎 Djan ...
  • 使用xadmin2遇到的問題&解決 環境配置: 使用的模塊版本: 關聯的包 Django 3.2.15 mysqlclient 2.2.4 xadmin 2.0.1 django-crispy-forms >= 1.6.0 django-import-export >= 0.5.1 django-r ...
  • 今天我打算整點兒不一樣的內容,通過之前學習的TransformerMap和LazyMap鏈,想搞點不一樣的,所以我關註了另外一條鏈DefaultedMap鏈,主要調用鏈為: 調用鏈詳細描述: ObjectInputStream.readObject() DefaultedMap.readObject ...
  • 後端應用級開發者該如何擁抱 AI GC?就是在這樣的一個大的浪潮下,我們的傳統的應用級開發者。我們該如何選擇職業或者是如何去快速轉型,跟上這樣的一個行業的一個浪潮? 0 AI金字塔模型 越往上它的整個難度就是職業機會也好,或者說是整個的這個運作也好,它的難度會越大,然後越往下機會就會越多,所以這是一 ...
  • @Autowired是Spring框架提供的註解,@Resource是Java EE 5規範提供的註解。 @Autowired預設按照類型自動裝配,而@Resource預設按照名稱自動裝配。 @Autowired支持@Qualifier註解來指定裝配哪一個具有相同類型的bean,而@Resourc... ...