## 1、標準原子類型 標準原子類型的定義位於頭文件``內。原子操作的關鍵用途是取代需要互斥的同步方式,但假設原子操作本身也在內部使用了互斥,就很可能無法達到期望的性能提升。有三種方法來判斷一個原子類型是否屬於無鎖數據結構: - 所有標準原子類型(`std::atomic_flag`除外,因為它必須 ...
1、標準原子類型
標準原子類型的定義位於頭文件<atomic>
內。原子操作的關鍵用途是取代需要互斥的同步方式,但假設原子操作本身也在內部使用了互斥,就很可能無法達到期望的性能提升。有三種方法來判斷一個原子類型是否屬於無鎖數據結構:
- 所有標準原子類型(
std::atomic_flag
除外,因為它必須採取無鎖操作)都具有成員函數is_lock_free()
,若它返回true
則表示給定類型上的操作是能由原子指令直接實現的,若返回false
則表示需要藉助編譯器和程式庫的內部鎖來實現。 - C++程式庫提供了一組巨集:
ATOMIC_BOOL_LOCK_FREE
、ATOMIC_CHAR_LOCK_FREE
、ATOMIC_CHAR16_T_LOCK_FREE
、ATOMIC_CHAR32_T_LOCK_FREE
、ATOMIC_WCHAR_T_LOCK_FREE
、ATOMIC_SHORT_LOCK_FREE
、ATOMIC_INT_LOCK_FREE
、ATOMIC_LONG_LOCK_FREE
、ATOMIC_LLONG_LOCK_FREE
、ATOMIC_POINTER_LOCK_FREE
。巨集取值為0
表示對應的std::atomic<>
特化類型從來都不屬於無鎖結構,取值為1
表示運行時才能確定是否屬於無鎖結構,取值為2
表示它一直屬於無鎖結構。 - 從C++17開始,全部原子類型都含有一個靜態常量表達式成員變數
X::is_always_lock_free
,功能與上述那些巨集相同,用於在編譯期判定一個原子類型是否屬於無鎖結構。當且僅當在所有支持運行該程式的硬體上,原子類型X
全都以無鎖結構形式實現,該成員變數的值才為true
。
除了std::atomic_flag
,其餘原子類型都是通過模板std::atomic<>
特化得到的。由內建類型特化得到的原子類型,其介面反映出自身性質,例如C++標準沒有為普通指針定義位運算(如&=
),所以不存在專為原子化指針而定義的位運算。一些內建類型的std::atomic<>
特化如下表:
原子類型的別名 | 對應的特化 |
---|---|
atomic_bool | std::atomic<bool> |
atomic_char | std::atomic<char> |
atomic_schar | std::atomic<signed char> |
atomic_uchar | std::atomic<unsigned char> |
atomic_int | std::atomic<int> |
atomic_uint | std::atomic<unsigned> |
atomic_short | std::atomic<short> |
atomic_ushort | std::atomic<unsigned short> |
atomic_long | std::atomic<long> |
atomic_ulong | std::atomic<unsigned long> |
atomic_llong | std::atomic<long long> |
atomic_ullong | std::atomic<unsigned long long> |
atomic_char16_t | std::atomic<char16_t> |
atomic_char32_t | std::atomic<char32_t> |
atomic_wchar_t | std::atomic<wchar_t> |
原子類型對象無法複製,也無法賦值,但可以接受內建類型賦值,也支持隱式地轉換成內建類型。需要註意的是:按照C++慣例,賦值操作符通常返回一個引用,指向接受賦值的目標對象;而原子類型的賦值操作符不返回引用,而是按值返回(該值屬於對應的非原子類型)。
2、原子操作
各種原子類型上可以執行的操作如下表所示:
操作 | atomic_flag | atomic<bool> | atomic<T*> | 整數原子類型 | 其它原子類型 |
---|---|---|---|---|---|
test_and_set | Y | ||||
clear | Y | ||||
is_lock_free | Y | Y | Y | Y | |
load | Y | Y | Y | Y | |
store | Y | Y | Y | Y | |
exchange | Y | Y | Y | Y | |
compare_exchange_weak, compare_exchange_strong | Y | Y | Y | Y | |
fetch_add, += | Y | Y | |||
fetch_sub, -= | Y | Y | |||
fetch_or, |= | Y | ||||
fetch_and, &= | Y | ||||
fetch_xor, ^= | Y | ||||
++, -- | Y | Y |
2.1、操作std::atomic_flag
std::atomic_flag
是最簡單的標準原子類型,表示一個布爾標誌,它只有兩種狀態:成立或置零。std::atomic_flag
對象必須由巨集ATOMIC_FLAG_INIT
初始化,它把標誌初始化為置零狀態,例如:std::atomic_flag f = ATOMIC_FLAG_INIT;
。如果不進行初始化,則std::atomic_flag
對象的狀態是未指定的。std::atomic_flag
有兩個成員函數:
clear()
:將標誌清零。test_and_set()
:獲取舊值並設置標誌成立。
使用std::atomic_flag
實現一個自旋鎖的示例如下:
class spinlock_mutex
{
std::atomic_flag flag;
public:
spinlock_mutex() : flag(ATOMIC_FLAG_INIT) {}
void lock()
{
while (flag.test_and_set());
}
void unlock()
{
flag.clear();
}
};
2.2、操作std::atomic<bool>
相比於std::atomic_flag
,std::atomic<bool>
是一個功能更齊全的布爾標誌。儘管它也無法拷貝構造或拷貝賦值,但還是能依據非原子布爾量創建其對象,也能接受非原子布爾量的賦值:
std::atomic<bool> b(true);
b = false;
store()
是存儲操作,可以向原子對象寫入值。load()
是載入操作,可以讀取原子對象的值。exchange()
是“讀-改-寫”操作,它獲取原有的值,然後用自行選定的新值作為替換。
std::atomic<bool> b;
bool x = b.load();
b.store(true);
x = b.exchange(false);
compare_exchange_weak()
與compare_exchange_strong()
被稱為“比較-交換”操作,它們的作用是:使用者給定一個期望值,原子變數將它和自身的值進行比較,如果相等,就存入另一既定的值;否則,更新期望值所屬的變數,向它賦予原子變數的值。“比較-交換”操作返回布爾類型,如果完成了保存動作(前提是兩值相等),則返回true
,否則返回false
。對於compare_exchange_weak()
,即使原子變數的值等於期望值,保存動作還是有可能失敗,在這種情形下,原子變數維持原值不變,函數返回false
。原子化的“比較-交換”必須由一條指令單獨完成,而某些處理器沒有這種指令,無從保證該操作按原子化方式完成。要實現“比較-交換”,負責的線程則須改為連續運行一系列指令,但在這些電腦上,只要出現線程數量多於處理器數量的情形,線程就有可能執行到中途因系統調度而切出,導致操作失敗。這種敗因不是變數值本身存在問題,而是函數執行時機不對,所以compare_exchange_weak()
往往必須配合迴圈使用。
bool expected = false;
extern atomic<bool> b;
while(!b.compare_exchange_weak(expected,true) && !expected);
2.3、操作std::atomic<T*>
除了std::atomic<bool>
所支持的操作外,std::atomic<T*>
還支持算術形式的指針運算。fetch_add()
和fetch_sub()
分別就對象中存儲的地址進行原子化加減,然後返回原來的地址。另外,該原子類型還具有包裝成重載運算符的+=
和-=
,以及++
和--
的前尾碼版本,這些運算符作用在原子類型之上,效果與作用在內建類型上一樣。
class Foo {};
Foo some_array[5];
std::atomic<Foo*> p(some_array);
Foo* x = p.fetch_add(2);
assert(x == some_array);
assert(p.load() == &some_array[2]);
x = (p -= 1);
assert(x == &some_array[1]);
assert(p.load() == &some_array[1]);
2.4、操作標準整數原子類型
在std::atomic<int>
這樣的整數原子類型上,除了std::atomic<T*>
所支持的操作外,還支持fetch_and()
、fetch_or()
、fetch_xor()
操作,也支持對應的&=
、|=
、^=
複合賦值形式。
2.5、泛化的std::atomic<>類模板
除了前文的標準原子類型,使用者還能利用泛化模板,依據自定義類型創建其它原子類型。然而,對於某個自定義的類型UDT
,必須要滿足一定條件才能具現化出std::atomic<UDT>
:
- 必須具有平實拷貝賦值運算符(平直、簡單的原始記憶體賦值及其等效操作)。若自定義類型具有基類或非靜態數據成員,則它們同樣必須具備平實拷貝賦值運算符。
- 不得含有虛函數,也不可以從虛基類派生得出。
- 必須由編譯器代其隱式生成拷貝賦值運算符。
由於以上限制,賦值操作不涉及任何用戶編寫的代碼,因此編譯器可以借用memcpy()
或採取與之等效的行為完成它。另外值得註意的是,“比較-交換”操作採取的是逐位比較運算,效果等同於直接使用memcmp()
函數。
3、記憶體順序
編譯器優化代碼時可能會進行指令重排,而且CPU執行指令時也可能會亂序執行,所以代碼的執行順序不一定和書寫順序一致。例如下麵的代碼可能會按照如表所示的順序執行,從而引發斷言錯誤。可以看出,指令重排在單線程環境下不會造成邏輯錯誤,但在多線程環境下可能會造成邏輯錯誤。
int a = 0;
bool flag = false;
void func1()
{
a = 1;
flag = true;
}
void func2()
{
if (flag)
{
assert(a == 1);
}
}
std::thread t1(func1);
std::thread t2(func2);
t1.join();
t2.join();
step | 線程t1 | 線程t2 |
---|---|---|
1 | flag = true |
|
2 | if (flag) |
|
3 | assert(a == 1) |
|
4 | a = 1 |
記憶體順序的作用,本質上是要限制單個線程中的指令順序,從而解決多線程環境下可能出現的問題。原子類型上的操作服從6種記憶體順序,在不同的CPU架構上,這幾種記憶體模型也許會有不同的運行開銷。
enum memory_order {
memory_order_relaxed,
memory_order_consume,
memory_order_acquire,
memory_order_release,
memory_order_acq_rel,
memory_order_seq_cst
};
-
memory_order_seq_cst
這是所有原子操作的記憶體順序參數的預設值,語義上要求底層提供順序一致性模型,不存在任何重排,可以解決一切問題,但是效率最低。
-
memory_order_release / memory_order_acquire / memory_order_consume
release操作可以阻止這個調用之前的讀寫操作被重排到後面去;acquire操作則可以保證這個調用之後的讀寫操作不會重排到前面去;consume操作比acquire操作寬鬆一些,它只保證這個調用之後的對原子變數有依賴的操作不會被重排到前面去。release與acquire/consume操作需要在同一個原子對象上配對使用,例如:
std::atomic<int> a; std::atomic<bool> flag; void func1() { a = 1; flag.store(true, memory_order_release); } void func2() { if (flag.load(memory_order_acquire)) { assert(a == 1); } }
-
memory_order_acq_rel
兼具acquire和release的特性。
-
memory_order_relaxed
只保證原子類型的成員函數操作本身是不可分割的,但是對於順序性不做任何保證。
三類操作支持的記憶體順序如下表所示:
存儲(store)操作 | 載入(load)操作 | “讀-改-寫”(read-modify-write)操作 | |
---|---|---|---|
memory_order_seq_cst | Y | Y | Y |
memory_order_release | Y | Y | |
memory_order_acquire | Y | Y | |
memory_order_consume | Y | Y | |
memory_order_acq_rel | Y | ||
memory_order_relaxed | Y | Y | Y |