【原創】(十二)Linux記憶體管理之vmap與vmalloc

来源:https://www.cnblogs.com/LoyenWang/archive/2019/12/01/11965787.html
-Advertisement-
Play Games

背景 By 魯迅 By 高爾基 說明: 1. Kernel版本:4.14 2. ARM64處理器,Contex A53,雙核 3. 使用工具:Source Insight 3.5, Visio 1. 概述 在之前的系列文章中,分析到了 的頁框分配, 的小塊記憶體對象分配,這些分配的地址都是物理記憶體連續 ...


背景

  • Read the fucking source code! --By 魯迅
  • A picture is worth a thousand words. --By 高爾基

說明:

  1. Kernel版本:4.14
  2. ARM64處理器,Contex-A53,雙核
  3. 使用工具:Source Insight 3.5, Visio

1. 概述

在之前的系列文章中,分析到了Buddy System的頁框分配,Slub分配器的小塊記憶體對象分配,這些分配的地址都是物理記憶體連續的。當記憶體碎片後,連續物理記憶體的分配就會變得困難,可以使用vmap機制,將不連續的物理記憶體頁框映射到連續的虛擬地址空間中。vmalloc的分配就是基於這個機制來實現的。

還記得下邊這張圖嗎?

vmap/vmalloc的區域就是在VMALLOC_START ~ VMALLOC_END之間。

開啟探索之旅吧。

2. 數據結構

2.1 vmap_area/vm_struct

這兩個數據結構比較簡單,直接上代碼:

struct vm_struct {
    struct vm_struct    *next;
    void            *addr;
    unsigned long       size;
    unsigned long       flags;
    struct page     **pages;
    unsigned int        nr_pages;
    phys_addr_t     phys_addr;
    const void      *caller;
};

struct vmap_area {
    unsigned long va_start;
    unsigned long va_end;
    unsigned long flags;
    struct rb_node rb_node;         /* address sorted rbtree */
    struct list_head list;          /* address sorted list */
    struct llist_node purge_list;    /* "lazy purge" list */
    struct vm_struct *vm;
    struct rcu_head rcu_head;
};

struct vmap_area用於描述一段虛擬地址的區域,從結構體中va_start/va_end也能看出來。同時該結構體會通過rb_node掛在紅黑樹上,通過list掛在鏈表上。
struct vmap_areavm欄位是struct vm_struct結構,用於管理虛擬地址和物理頁之間的映射關係,可以將struct vm_struct構成一個鏈表,維護多段映射。

關係如下圖:

2.2 紅黑樹

紅黑樹,本質上是一種二叉查找樹,它在二叉查找樹的基礎上增加了著色相關的性質,提升了紅黑樹在查找,插入,刪除時的效率。在紅黑樹中,節點已經進行排序,對於每個節點,左側的的元素都在節點之前,右側的元素都在節點之後。
紅黑樹必須滿足以下四條規則:

  1. 每個節點不是紅就是黑;
  2. 紅黑樹的根必須是黑;
  3. 紅節點的子節點必須為黑;
  4. 從節點到子節點的每個路徑都包含相同數量的黑節點,統計黑節點個數時,空指針也算黑節點;

定義如下:

struct rb_node {
    unsigned long  __rb_parent_color;
    struct rb_node *rb_right;
    struct rb_node *rb_left;
} __attribute__((aligned(sizeof(long))));
    /* The alignment might seem pointless, but allegedly CRIS needs it */

由於內核會頻繁的進行vmap_area的查找,紅黑樹的引入就是為瞭解決當查找數量非常多時效率低下的問題,在紅黑樹中,搜索元素,插入,刪除等操作,都會變得非常高效。至於紅黑樹的演算法操作,本文就不再深入分析,知道它的用途即可。

3. vmap/vunmap分析

3.1 vmap

vmap函數,完成的工作是,在vmalloc虛擬地址空間中找到一個空閑區域,然後將page頁面數組對應的物理記憶體映射到該區域,最終返回映射的虛擬起始地址。

整體流程如下:

操作流程比較簡單,來一個樣例分析,就清晰明瞭了:

vmap調用中,關鍵函數為alloc_vmap_area,它先通過vmap_area_root二叉樹來查找第一個區域first vm_area,然後根據這個first vm_area去查找vmap_area_list鏈表中滿足大小的空間區域。

alloc_vmap_area函數中,有幾個全局的變數:

static struct rb_node *free_vmap_cache;
static unsigned long cached_hole_size;
static unsigned long cached_vstart;
static unsigned long cached_align;

用於緩存上一次分配成功的vmap_area,其中cached_hole_size用於記錄緩存vmap_area對應區域之前的空洞的大小。緩存機制當然也是為了提高分配的效率。

3.2 vunmap

vunmap執行的是跟vmap相反的過程:從vmap_area_root/vmap_area_list中查找vmap_area區域,取消頁表映射,再從vmap_area_root/vmap_area_list中刪除掉vmap_area,頁面返還給伙伴系統等。由於映射關係有改動,因此還需要進行TLB的刷新,頻繁的TLB刷新會降低性能,因此將其延遲進行處理,因此稱為lazy tlb

來看看逆過程的流程:

4. vmalloc/vfree分析

4.1 vmalloc

vmalloc用於分配一個大的連續虛擬地址空間,該空間在物理上不連續的,因此也就不能用作DMA緩衝區。vmalloc分配的線性地址區域,在文章開頭的圖片中也描述了:VMALLOC_START ~ VMALLOC_END

直接分析調用流程:

從過程中可以看出,vmallocvmap的操作,大部分的邏輯操作是一樣的,比如從VMALLOC_START ~ VMALLOC_END區域之間查找並分配vmap_area, 比如對虛擬地址和物理頁框進行映射關係的建立。不同之處,在於vmap建立映射時,page是函數傳入進來的,而vmalloc是通過調用alloc_page介面向Buddy System申請分配的。

  • vmalloc VS kmalloc
    到現在,我們應該能清楚vmallockmalloc的差異了吧,kmalloc會根據申請的大小來選擇基於slub分配器或者基於Buddy System來申請連續的物理記憶體。而vmalloc則是通過alloc_page申請order = 0的頁面,再映射到連續的虛擬空間中,物理地址不連續,此外vmalloc可以休眠,不應在中斷處理程式中使用。
    vmalloc相比,kmalloc使用ZONE_DMA和ZONE_NORMAL空間,性能更快,缺點是連續物理記憶體空間的分配容易帶來碎片問題,讓碎片的管理變得困難。

4.2 vfree

直接上代碼:

void vfree(const void *addr)
{
    BUG_ON(in_nmi());

    kmemleak_free(addr);

    if (!addr)
        return;
    if (unlikely(in_interrupt()))
        __vfree_deferred(addr);
    else
        __vunmap(addr, 1);
}

如果在中斷上下文中,則推遲釋放,否則直接調用__vunmap,所以它的邏輯基本和vunmap一致,不再贅述了。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一個簡單的api模板項目,基於.netcore 3.0,其中包含swagger文檔,jwt許可權驗證,模型驗證,ioc,appEvent,分塊上傳等等現成的功能,幫你快速開始api的構建 ...
  • winform界面如下: 1 using System; 2 using System.Collections.Generic; 3 using System.ComponentModel; 4 using System.Data; 5 using System.Drawing; 6 using S ...
  • 1、使用dotnet new grpc -o GrpcGreeter && cd GrpcGreeter && code . ,進入項目文件中,使用code .使用vscode打開。 [註]你可能會遇到'code' command not found? 解決辦法:1)首次使用打開vscode -> ...
  • 前言 這是我今天在回答SO問題時偶然遇到的,覺得可能還比較通用,就記錄下來以供參考。 通常,我們使用 最簡單的方式是這樣: 這樣在游標懸浮在 上方時,會顯示一個提示條,但是這似乎又違背了一個設計原則: ToolTip作為提示,應該僅在當前內容顯示不全,且用戶有意願查看完整內容時作為替代元素出現 這很 ...
  • 【Powershell 教程】學習資源彙總 一、書籍教程 1、《Windows PowerShell實戰指南》第3版 作者:[美] Don,Jones(道·瓊斯),Jeffery,Hicks(傑弗瑞·希克斯) 譯者:宋沄劍 譯 資源:微信讀書、iReader、網上有第 2 版的電子版 實體:淘寶、京 ...
  • Red Hat Enterprise Linux是美國紅帽公司開發的商業市場導向的Linux發行版,為方便大家學習研究,整理分享歷代紅帽官方正式版鏡像給有需要的朋友們。 ...
  • 截圖工具: 其中用到了動態鏈接庫DLL技術(Dynamic Link Library)技術,鍵盤鉤子技術,游標捕獲技術,類橡皮類CRectTracker 頭文件:尾碼名為.cpp,主要是定義和聲明之類的,比如類的定義和常量定義 源文件:尾碼名為.cpp,主要是實現之類的,比如類方法的實現 資源文件: ...
  • tar是UNIX和類UNIX系統上的壓縮,備份工具, 名字來源於Tape archive--磁碟歸檔,最初的時候是用來將數據儲存,備份到磁帶上的。而今最簡單的備份方法是添加新的磁碟或者在雲端存儲,但即使是最簡單和便宜的磁碟設備和雲儲存,也應該壓縮備份數據,降低存儲空間需求和傳輸時間,linux系統默 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...