上一篇文章說了 CAS 原理,其中說到了 Atomic 類,他們實現原子操作的機制就依靠了 volatile 的記憶體可見性特性。如果還不瞭解 CAS 和 Atomic ,建議看一下 "我們說的 CAS 自旋鎖是什麼" 併發的三個特性 首先說我們如果要使用 volatile 了,那肯定是在多線程併發的 ...
上一篇文章說了 CAS 原理,其中說到了 Atomic* 類,他們實現原子操作的機制就依靠了 volatile 的記憶體可見性特性。如果還不瞭解 CAS 和 Atomic*,建議看一下我們說的 CAS 自旋鎖是什麼
併發的三個特性
首先說我們如果要使用 volatile 了,那肯定是在多線程併發的環境下。我們常說的併發場景下有三個重要特性:原子性、可見性、有序性。只有在滿足了這三個特性,才能保證併發程式正確執行,否則就會出現各種各樣的問題。
原子性,上篇文章說到的 CAS 和 Atomic* 類,可以保證簡單操作的原子性,對於一些負責的操作,可以使用synchronized 或各種鎖來實現。
可見性,指當多個線程訪問同一個變數時,一個線程修改了這個變數的值,其他線程能夠立即看得到修改的值。
有序性,程式執行的順序按照代碼的先後順序執行,禁止進行指令重排序。看似理所當然的事情,其實並不是這樣,指令重排序是JVM為了優化指令,提高程式運行效率,在不影響單線程程式執行結果的前提下,儘可能地提高並行度。但是在多線程環境下,有些代碼的順序改變,有可能引發邏輯上的不正確。
而 volatile 做實現了兩個特性,可見性和有序性。所以說在多線程環境中,需要保證這兩個特性的功能,可以使用 volatile 關鍵字。
volatile 是如何保證可見性的
說到可見性,就要瞭解一下電腦的處理器和主存了。因為多線程,不管有多少個線程,最後還是要在電腦處理器中進行的,現在的電腦基本都是多核的,甚至有的機器是多處理器的。我們看一下多處理器的結構圖:
這是兩個處理器,四核的 CPU。一個處理器對應一個物理插槽,多處理器間通過QPI匯流排相連。一個處理器包含多個核,一個處理器間的多核共用L3 Cache。一個核包含寄存器、L1 Cache、L2 Cache。
在程式執行的過程中,一定要涉及到數據的讀和寫。而我們都知道,雖然記憶體的訪問速度已經很快了,但是比起CPU執行指令的速度來,還是差的很遠的,因此,在內核中,增加了L1、L2、L3 三級緩存,這樣一來,當程式運行的時候,先將所需要的數據從主存複製一份到所在核的緩存中,運算完成後,再寫入主存中。下圖是 CPU 訪問數據的示意圖,由寄存器到高速緩存再到主存甚至硬碟的速度是越來越慢的。
瞭解了 CPU 結構之後,我們來看一下程式執行的具體過程,拿一個簡單的自增操作舉例。
i=i+1;
執行這條語句的時候,在某個核上運行的某線程將 i 的值拷貝一個副本到此核所在的緩存中,當運算執行完成後,再回寫到主存中去。如果是多線程環境下,每一個線程都會在所運行的核上的高速緩存區有一個對應的工作記憶體,也就是每一個線程都有自己的私有工作緩存區,用來存放運算需要的副本數據。那麼,我們再來看這個 i+1 的問題,假設 i 的初始值為0,有兩個線程同時執行這條語句,每個線程執行都需要三個步驟:
1、從主存讀取 i 值到線程工作記憶體,也就是對應的內核高速緩存區;
2、計算 i+1 的值;
3、將結果值寫回主存中;
建設兩個線程各執行 10,000 次後,我們預期的值應該是 20,000 才對,可惜很遺憾,i 的值總是小於 20,000 的 。導致這個問題的其中一個原因就是緩存一致性問題,對於這個例子來說,一旦某個線程的緩存副本做了修改,其他線程的緩存副本應該立即失效才對。
而使用了 volatile 關鍵字後,會有如下效果:
1、每次對變數的修改,都會引起處理器緩存(工作記憶體)寫回到主存;
2、一個工作記憶體回寫到主存會導致其他線程的處理器緩存(工作記憶體)無效。
因為 volatile 保證記憶體可見性,其實是用到了 CPU 保證緩存一致性的 MESI 協議。MESI 協議內容較多,這裡就不做說明,請各位同學自己去查詢一下吧。總之用了 volatile 關鍵字,當某線程對 volatile 變數的修改會立即回寫到主存中,並且導致其他線程的緩存行失效,強制其他線程再使用變數時,需要從主存中讀取。
那麼我們把上面的 i 變數用 volatile 修飾後,再次執行,每個線程執行 10,000 次。很遺憾,還是小於 20,000 的。這是為什麼呢?
volatile 利用 CPU 的 MESI 協議確實保證了可見性。但是,註意了,volatile 並沒有保證操作的原子性,因為這個自增操作是分三步的,假設線程 1 從主存中讀取了 i 值,假設是 10 ,並且此時發生了阻塞,但是還沒有對i進行修改,此時線程 2 也從主存中讀取了 i 值,這時這兩個線程讀取的 i 值是一樣的,都是 10 ,然後線程 2 對 i 進行了加 1 操作,並立即寫回主存中。此時,根據 MESI 協議,線程 1 的工作記憶體對應的緩存行會被置為無效狀態,沒錯。但是,請註意,線程 1 早已經將 i 值從主存中拷貝過了,現在只要執行加 1 操作和寫回主存的操作了。而這兩個線程都是在 10 的基礎上加 1 ,然後又寫回主存中,所以最後主存的值只是 11 ,而不是預期的 12 。
所以說,使用 volatile 可以保證記憶體可見性,但無法保證原子性,如果還需要原子性,可以參考,之前的這篇文章。
volatile 是如何保證有序性的
Java 記憶體模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱為 happens-before 原則。如果兩個操作的執行次序無法從 happens-before 原則推導出來,那麼它們就不能保證它們的有序性,虛擬機可以隨意地對它們進行重排序。
如下是 happens-before 的8條原則,摘自 《深入理解Java虛擬機》。
- 程式次序規則:一個線程內,按照代碼順序,書寫在前面的操作先行發生於書寫在後面的操作;
- 鎖定規則:一個 unLock 操作先行發生於後面對同一個鎖的 lock 操作;
- volatile 變數規則:對一個變數的寫操作先行發生於後面對這個變數的讀操作;
- 傳遞規則:如果操作A先行發生於操作B,而操作B又先行發生於操作C,則可以得出操作A先行發生於操作C;
- 線程啟動規則:Thread對象的start()方法先行發生於此線程的每個一個動作;
- 線程中斷規則:對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生;
- 線程終結規則:線程中所有的操作都先行發生於線程的終止檢測,我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到線程已經終止執行;
- 對象終結規則:一個對象的初始化完成先行發生於他的 finalize() 方法的開始;
這裡主要說一下 volatile 關鍵字的規則,舉一個著名的單例模式中的雙重檢查的例子:
class Singleton{
private volatile static Singleton instance = null;
private Singleton() {
}
public static Singleton getInstance() {
if(instance==null) { // step 1
synchronized (Singleton.class) {
if(instance==null) // step 2
instance = new Singleton(); //step 3
}
}
return instance;
}
}
如果 instance 不用 volatile 修飾,可能產生什麼結果呢,假設有兩個線程在調用 getInstance() 方法,線程 1 執行步驟 step1 ,發現 instance 為 null ,然後同步鎖住 Singleton 類,接著再次判斷 instance 是否為 null ,發現仍然是 null,然後執行 step 3 ,開始實例化 Singleton 。而在實例化的過程中,線程 2 走到 step 1,有可能發現 instance 不為空,但是此時 instance 有可能還沒有完全初始化。
什麼意思呢,對象在初始化的時候分三個步驟,用下麵的偽代碼表示:
memory = allocate(); //1. 分配對象的記憶體空間
ctorInstance(memory); //2. 初始化對象
instance = memory; //3. 設置 instance 指向對象的記憶體空間
因為步驟 2 和步驟 3 需要依賴步驟 1,而步驟 2 和 步驟 3 並沒有依賴關係,所以這兩條語句有可能會發生指令重排,也就是或有可能步驟 3 在步驟 2 的之前執行。在這種情況下,步驟 3 執行了,但是步驟 2 還沒有執行,也就是說 instance 實例還沒有初始化完畢,正好,在此刻,線程 2 判斷 instance 不為 null,所以就直接返回了 instance 實例,但是,這個時候 instance 其實是一個不完全的對象,所以,在使用的時候就會出現問題。
而使用 volatile 關鍵字,也就是使用了 “對一個 volatile修飾的變數的寫,happens-before於任意後續對該變數的讀” 這一原則,對應到上面的初始化過程,步驟2 和 3 都是對 instance 的寫,所以一定發生於後面對 instance 的讀,也就是不會出現返回不完全初始化的 instance 這種可能。
JVM 底層是通過一個叫做“記憶體屏障”的東西來完成。記憶體屏障,也叫做記憶體柵欄,是一組處理器指令,用於實現對記憶體操作的順序限制。
最後
通過 volatile 關鍵字,我們瞭解了一下併發編程中的可見性和有序性,當然只是簡單的瞭解。更深入的瞭解,還得靠各位同學自己去鑽研。如果感覺還是有點作用的話,歡迎點個推薦。
相關文章
我們說的 CAS 自旋鎖是什麼
歡迎加入 Java 交流群,更歡迎關註微信公眾號