【Example】C++ 標準庫 std::atomic 及 std::memory_order

来源:https://www.cnblogs.com/airchip/archive/2022/06/19/16390681.html
-Advertisement-
Play Games

C++ 標準庫提供了原子操作。(我已經懶得寫序言了) 先來說原子操作的概念: 原子操作是多線程當中對資源進行保護的一種手段,主要作用是和互斥量(Mutex)一樣,避免對資源的併發訪問、修改。 互斥量的粒度衡量是作用域(哪怕作用域內只有一個變數),而原子的粒度衡量則是以一個變數或對象為單位。因此,原子 ...


C++ 標準庫提供了原子操作。(我已經懶得寫序言了)

 

====================================

先來說原子操作的概念:

原子操作是多線程當中對資源進行保護的一種手段,主要作用是和互斥量(Mutex)一樣,避免對資源的併發訪問、修改。

互斥量的粒度衡量是作用域(哪怕作用域內只有一個變數),而原子的粒度衡量則是以一個變數或對象為單位。因此,原子相對於互斥量更加高效,但並非替代關係。

互斥量的主要作用是保護作用域內的資源,而原子的作用是保護一個變數或對象。

因此,當你需要保護的資源僅僅是某個變數或對象時,應首先考慮使用原子。

 

1,std::atomic

頭文件:

#include <atomic>

 

std::atomic 是一個模板類,它的語法是:

std::atomic<Type> name(default_value);

 

如果你並不明白 std::atomic (原子) 的作用,請看以下代碼及執行結果:

#include <iostream>
#include <atomic>
#include <thread>

int basic_value(0);
void ThreadChangeValue() {
    for (size_t i = 0; i < 1000000; i++)
    {
        basic_value++;
    }
    return;
}

std::atomic<int> atomic_int_value(0);
void ThreadChangeAtomic() {
    for (size_t i = 0; i < 1000000; i++)
    {
        atomic_int_value.fetch_add(1, std::memory_order_relaxed);
    }
    return;
};

int main()
{
    std::thread t1(ThreadChangeValue);
    std::thread t2(ThreadChangeValue);

    std::thread t3(ThreadChangeAtomic);
    std::thread t4(ThreadChangeAtomic);

    t1.join();
    t2.join();

    t3.join();
    t4.join();

    std::cout << "Basic Value: " << basic_value << std::endl;
    std::cout << "Atomic Value: " << atomic_int_value << std::endl;

    return EXIT_SUCCESS;
}

 

執行結果:

Basic Value: 1123299
Atomic Value: 2000000

 

以上代碼分別定義了兩個 int 變數,一個是普通的變數,一個是原子變數。兩個變數分別用兩個線程去遞增1000000次。

理論上,兩個變數最終值應同為2000000。然而,普通變數卻出現了資源競爭性錯誤,兩個線程都有接近一半的操作都是失敗的,導致最終值僅為1123299。

而受原子保護的變數,兩個線程的操作則全部成功。

 

std::atomic 的成員函數表:

名稱 作用 適用記憶體序
operator= 重載等  
operator T 從原子對象載入值  
store 用另一個非原子值替換當前原子化的值 對象類型必須和原子對象聲明時一致

memory_order_relaxed

memory_order_release

memory_order_seq_cst

load 從原子對象當中載入值(返回)

memory_order_relaxed

memory_order_consume

memory_order_acquire

memory_order_seq_cst

is_lock_free 檢查原子對象的鎖定狀態  
wait 【std20】 阻塞線程至被提醒且原子值更改  
exchange 用另一個原子值替換當前原子值 並返回先前的原子值

memory_order_relaxed

memory_order_consume

memory_order_acquire

memory_order_release

memory_order_acq_rel

memory_order_seq_cst

compare_exchange_weak

原子地比較原子對象與非原子參數的值,若相等則進行交換,若不相等則進行載入

(允許少部分不符合條件的值返回)

memory_order_relaxed

memory_order_consume

memory_order_acquire

memory_order_release

memory_order_acq_rel

memory_order_seq_cst

compare_exchange_strong 原子地比較原子對象與非原子參數的值,若相等則進行交換,若不相等則進行載入  

memory_order_relaxed

memory_order_consume

memory_order_acquire

memory_order_release

memory_order_acq_rel

memory_order_seq_cst

notify_one【std20】 通知至少一個在該原子對象等待線程  
notify_all【std20】 通知所有在該原子對象等待線程  
[常量] is_always_lock_free 指示該類型是否始終免鎖  

 

除此之外 std::atomic 還對 int 及指針類型做了特殊化增強,以下操作函數僅適用於 int 及指針類型操作:

額外備註:C++ 20 後部分特化支持 float 。

 

名稱 作用 適用特化類型 適用記憶體序
fetch_add 原子地將參數加到存儲於原子對象的值,並返回先前保有的值 int && ptr && float(std20)

memory_order_relaxed

memory_order_consume

memory_order_acquire

memory_order_release

memory_order_acq_rel

memory_order_seq_cst

fetch_sub 原子地從存儲於原子對象的值減去參數,並獲得先前保有的值 int && ptr && float(std20)

memory_order_relaxed

memory_order_consume

memory_order_acquire

memory_order_release

memory_order_acq_rel

memory_order_seq_cst

fetch_and 原子地進行參數和原子對象的值的逐位與,並獲得先前保有的值 int

memory_order_relaxed

memory_order_consume

memory_order_acquire

memory_order_release

memory_order_acq_rel

memory_order_seq_cst

fetch_or 原子地進行參數和原子對象的值的逐位或,並獲得先前保有的值 int

memory_order_relaxed

memory_order_consume

memory_order_acquire

memory_order_release

memory_order_acq_rel

memory_order_seq_cst

fetch_xor 原子地進行參數和原子對象的值的逐位異或,並獲得先前保有的值 int

memory_order_relaxed

memory_order_consume

memory_order_acquire

memory_order_release

memory_order_acq_rel

memory_order_seq_cst

operator++ 原子值遞增 int && ptr  
operator-- 原子值遞減 int && ptr  
operator+= 原子值增加 int && ptr && float(std20)  
operator-= 原子值減少 int && ptr && float(std20)  
operator&= 進行原子按位與 int  
operator|= 進行原子按位或 int  
operator^= 進行原子按位異或 int  

 

 

額外補充 std::atomic_flag :

 std::atomic_flag 是原子的最基本布爾類型,它是無鎖的,並且它沒有拷貝構造函數,也不提供 load 和 store 操作。主要用於提供比 std::atomic 更簡單基本化布爾操作效率。

 

構造語法:

std::atomic<bool> name(false);
std::atomic_flag name = ATOMIC_FLAG_INIT;

 

成員函數表:

名稱 作用
operator= 重載等
clear 將布爾值設置為 false
test_and_set 將布爾值設置為 true 並返回先前值
test【std20】 原子的返回當前值
wait 阻塞線程至被提醒且原子值更改
notify_one【std20】 通知至少一個在該原子對象等待線程
notify_all【std20】 通知所有在該原子對象等待線程

 

 2,std::memory_order

std::memory_order 指定記憶體訪問,包括常規的非原子記憶體訪問,如何圍繞原子操作排序。在沒有任何制約的多處理器系統上,多個線程同時讀或寫數個變數時,一個線程能觀測到變數值更改的順序不同於另一個線程寫它們的順序。其實,更改的順序甚至能在多個讀取線程間相異。一些類似的效果還能在單處理器系統上出現,因為記憶體模型允許編譯器變換。

庫中所有原子操作的預設行為提供序列一致順序(見後述討論)。該預設行為可能有損性能,不過可以給予庫的原子操作額外的 std::memory_order 參數,以指定附加制約,在原子性外,編譯器和處理器還必須強制該操作。

-- 《C++ Reference》

 

要理解記憶體序是做什麼的,要先從硬體講起:(儘量簡單通俗)

以一顆 CPU i7-10875H 為例,它有8顆物理內核,從物理上來講,它可以同時處理8條並行線程,通過超線程技術可以擴展到16條線程(物理上還是8條)。

再在軟體層面來講,並行的數千條線程是邏輯並行,終究都要交給 CPU 進行串列處理,而 CPU 可以同時處理的線程數量,就是由內核數量決定的。

而每個 CPU 內核所運算數據的存取,並不是直接存取到記憶體當中,而是要先經過每個內核互相獨立的 L1、L2 兩級高速緩存,再到 CPU 內核之間共用的 L3 高速緩存,再然後到記憶體。

 

這樣就造成了一個問題,就是,假設一個內核負責的一條線程修改了某個變數的值,但是還沒有刷新到內核之間共用的 L3 緩存或者記憶體之中,那麼這時候其他 CPU 內核從記憶體中讀取到的該變數就仍然是舊值。

所以,為了避免這種情況,這就是 std::memory_order 的作用。

 

首先,要明白 std::memory_order 本身是什麼,它是定義於 <atomic> 頭文件當中的六個枚舉值,使用時用做參數傳遞給 std::atomic 相關的操作函數,比如 load、store 等。

支持傳 std::memory_order 枚舉的相關操作函數上文都已經列出,這裡重點將這六個枚舉都代表什麼。

 

std::memory_order 枚舉值說明:

名稱 作用
memory_order_relexed 只保證原子值不被其他線程同時訪問,但沒有線程之間同步、順序制約,其他線程可能讀取到記憶體當中的舊值。
memory_order_consume

[C++17註:目前不建議使用]有順序的載入操作,隻影響到當前線程。

作用是保證之後的load操作不會排在聲明該枚舉值的當前load操作之前。

memory_order_acquire 有順序的載入操作,作用是保證之後所有線程的load操作不會排在聲明該枚舉值的當前load操作之前。
memory_order_release 有順序的釋放操作,作用是保證之後的 load(讀)、store(寫) 性質操作不會排在傳入該枚舉值的操作函數之前。
memory_order_acq_rel

有順序整合載入(memory_order_acquire)->釋放(memory_order_release)操作。

當前線程的所有 load(讀)、store(寫) 性質操作不會排在傳入該枚舉值的操作函數之前後。

所有帶有釋放(memory_order_release)操作同一原子對象的線程會排在傳入該枚舉值的操作函數之前。

而且當前線程對原子值的修改會同步給其他進行讀操作的同一原子對象的線程。

memory_order_seq_cst

傳入該枚舉值的操作函數,load(讀) 時會進行 memory_order_acquire 操作,store(寫)時會進行 memory_order_release 操作。

如果是讀+寫就是 memory_order_acq_rel 操作。

備註:此枚舉值為支持傳入 std::memory_order 操作函數的預設值。

 

 

以下代碼演示了一些最簡單的使用:

 

下例演示兩個線程間傳遞性的釋放獲得順序:

#include <iostream>
#include <atomic>
#include <thread>
#include <string>

std::atomic<std::string*> atom_str(nullptr);
int flag = 0;
void Producer()
{
    std::string* str = new std::string("Hello Byte");
    flag = 1;
    atom_str.store(str, std::memory_order_release);
    return;
}

void Consumer()
{
    std::string* str;
    while (!(str = atom_str.load(std::memory_order_acquire)));
    
    if (flag != 1)
    {
        // 絕不會執行
        std::cout << "Error..." << std::endl;
    }
    else
    {
        std::cout << str->c_str() << std::endl;
    }

    return;
}


int main()
{
    std::thread t1(Producer);
    std::thread t2(Consumer);

    t1.join();
    t2.join();

    if (atom_str.load() != nullptr)
    {
        delete atom_str.load();
    }

    return EXIT_SUCCESS;
}

 

 

 

下例演示三個線程間傳遞性的釋放獲得順序:

#include <iostream>
#include <atomic>
#include <thread>
#include <vector>

std::vector<int> data;
std::atomic<int> flag(0);
void Producer()
{
    data.push_back(42);
    flag.store(1, std::memory_order_release);
    return;
}

void Broker() {
    int expected = 1;
    while (!flag.compare_exchange_strong(expected, 2, std::memory_order_acq_rel)) 
    {
        expected = 1;
    }
};

void Consumer()
{
    while (flag.load(std::memory_order_acquire) < 2);

    if (data[0] != 42)
    {
        // 絕不會執行
        std::cout << "False..." << std::endl;
    }
    else
    {
        std::cout << "True..." << std::endl;
    }

    return;
}

int main()
{
    std::thread t1(Producer);
    std::thread t2(Broker);
    std::thread t3(Consumer);

    t1.join();
    t2.join();
    t3.join();

    return EXIT_SUCCESS;
}

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、開發背景 產品出設計稿要求做一個仿原生app簡訊驗證碼組件,花了兩小時搞出來一個還可以的組件,支持屏幕自適應,可以用於彈出框,或自己封裝的vue組件里,希望可以幫助那些被產品壓榨的同學,哈哈。😄 其核心思想就是利用一個輸入框使用css3,translate屬性,每輸入一次後向右位移一個單位位置 ...
  • 認識WEB **「網頁」**主要是由文字、圖像和超鏈接等元素構成,當然除了這些元素,網頁中還可以包括音頻、視頻以及Flash等。 **「瀏覽器」**是網頁顯示、運行的平臺。 「瀏覽器內核」(排版引擎、解釋引擎、渲染引擎) 常見的瀏覽器及其內核 瀏覽器 內核 備註 IE Trident IE、獵豹安全 ...
  • HTML各知識點總結: 基本標簽 標題標簽、段落標簽、換行標簽、水平線標簽、字體樣式標簽、註釋和特殊符號 網頁插入 圖像、超鏈接,視頻、音頻、列表、表格、表單、內聯框架等 超鏈接 錨鏈接、功能性鏈接 列表 有序列表、無序列表、自定義列表 表格 行、列、跨行、跨列 表單 提交格式、文本框、密碼框、單選 ...
  • 昨天太晚就沒來得及更新,今天是spu管理界面,這個界面一共有三個界面需要切換,完成了兩個界面,而且今天的難度在於最後兩個章節,富有一定的邏輯性,當然中間也有很多需要註意的,比如ElementUI的照片牆需要添加list屬性而且值為你的數據並且必須是一個數組必須有name、url屬性 一.spu管理 ...
  • 本章是系列文章的第七章,終於來到了鼎鼎大名的SSA,SSA是編譯器領域最偉大的發明之一,也是影響最廣的發明。 本文中的所有內容來自學習DCC888的學習筆記或者自己理解的整理,如需轉載請註明出處。周榮華@燧原科技 7.1 控制流圖回顧 對下麵的c代碼保存成7.1.cc: 1 int max(int ...
  • 樣才能拿到大廠的offer,沒有掌握絕對的技術,那麼就要不斷的學習 他是如何拿下阿裡等大廠的offer的呢,今天分享他的秘密武器,美團資深架構師整理的Java核心知識點,面試時面試官必問的知識點,篇章包括了很多知識點,其中包括了有基礎知識、Java集合、JVM、多線程併發、spring原理、微服務、 ...
  • 引言:今天看MicrosoftDoc關於CFileDialog的doModal函數返回值的部分,提到了實際上MFC提供了錯誤信息顯示。 個人技術博客(文章整理+源碼): https://zobolblog.github.io/LearnWinAPI/ 1.用法: CFileDialog::DoMod ...
  • 一、MybatisSpring的使用 1.創建 Maven 工程。 2.添加依賴,代碼如下 <dependency> <groupId>org.mybatis</groupId> <artifactId>mybatis</artifactId> <version>3.5.7-ybe</version ...
一周排行
    -Advertisement-
    Play Games
  • .Net8.0 Blazor Hybird 桌面端 (WPF/Winform) 實測可以完整運行在 win7sp1/win10/win11. 如果用其他工具打包,還可以運行在mac/linux下, 傳送門BlazorHybrid 發佈為無依賴包方式 安裝 WebView2Runtime 1.57 M ...
  • 目錄前言PostgreSql安裝測試額外Nuget安裝Person.cs模擬運行Navicate連postgresql解決方案Garnet為什麼要選擇Garnet而不是RedisRedis不再開源Windows版的Redis是由微軟維護的Windows Redis版本老舊,後續可能不再更新Garne ...
  • C#TMS系統代碼-聯表報表學習 領導被裁了之後很快就有人上任了,幾乎是無縫銜接,很難讓我不想到這早就決定好了。我的職責沒有任何變化。感受下來這個系統封裝程度很高,我只要會調用方法就行。這個系統交付之後不會有太多問題,更多應該是做小需求,有大的開發任務應該也是第二期的事,嗯?怎麼感覺我變成運維了?而 ...
  • 我在隨筆《EAV模型(實體-屬性-值)的設計和低代碼的處理方案(1)》中介紹了一些基本的EAV模型設計知識和基於Winform場景下低代碼(或者說無代碼)的一些實現思路,在本篇隨筆中,我們來分析一下這種針對通用業務,且只需定義就能構建業務模塊存儲和界面的解決方案,其中的數據查詢處理的操作。 ...
  • 對某個遠程伺服器啟用和設置NTP服務(Windows系統) 打開註冊表 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\W32Time\TimeProviders\NtpServer 將 Enabled 的值設置為 1,這將啟用NTP伺服器功 ...
  • title: Django信號與擴展:深入理解與實踐 date: 2024/5/15 22:40:52 updated: 2024/5/15 22:40:52 categories: 後端開發 tags: Django 信號 松耦合 觀察者 擴展 安全 性能 第一部分:Django信號基礎 Djan ...
  • 使用xadmin2遇到的問題&解決 環境配置: 使用的模塊版本: 關聯的包 Django 3.2.15 mysqlclient 2.2.4 xadmin 2.0.1 django-crispy-forms >= 1.6.0 django-import-export >= 0.5.1 django-r ...
  • 今天我打算整點兒不一樣的內容,通過之前學習的TransformerMap和LazyMap鏈,想搞點不一樣的,所以我關註了另外一條鏈DefaultedMap鏈,主要調用鏈為: 調用鏈詳細描述: ObjectInputStream.readObject() DefaultedMap.readObject ...
  • 後端應用級開發者該如何擁抱 AI GC?就是在這樣的一個大的浪潮下,我們的傳統的應用級開發者。我們該如何選擇職業或者是如何去快速轉型,跟上這樣的一個行業的一個浪潮? 0 AI金字塔模型 越往上它的整個難度就是職業機會也好,或者說是整個的這個運作也好,它的難度會越大,然後越往下機會就會越多,所以這是一 ...
  • @Autowired是Spring框架提供的註解,@Resource是Java EE 5規範提供的註解。 @Autowired預設按照類型自動裝配,而@Resource預設按照名稱自動裝配。 @Autowired支持@Qualifier註解來指定裝配哪一個具有相同類型的bean,而@Resourc... ...