對於volatile型變數的特殊規則 關鍵字volatile可以說是Java虛擬機提供的最輕量級的同步機制。 在處理多線程數據競爭問題時,不僅僅是可以使用synchronized關鍵字來實現,使用volatile也可以實現。 Java記憶體模型對volatitle專門定義了一些特殊的訪問規則,當一個變 ...
對於volatile型變數的特殊規則
關鍵字volatile可以說是Java虛擬機提供的最輕量級的同步機制。
在處理多線程數據競爭問題時,不僅僅是可以使用synchronized關鍵字來實現,使用volatile也可以實現。
Java記憶體模型對volatitle專門定義了一些特殊的訪問規則,當一個變數被定義為volatile時,它將具備以下兩個特性:
第一個是保證此變數對所有線程的可見性,這裡的“可見性”是指當一條線程修改了這個變數的值,新值對於其他線程來說是可以立即得知的。而普通變數不能做到這一點,普通變數的值,線上程之間的傳遞都是需要通過主記憶體的的stroe和write操作以及read和load操作來實現的。volatile只保證了變數的可見性,但並不能保證變數運算的原子性。
第二個是禁止指令重排序優化,普通的變數僅僅會保證在該方法的執行過程中所有依賴賦值結果的地方都能獲取到正確的結果,而不能保證變數賦值操作的順序與程式代碼中的執行順序一致。
由於volatile變數只能保證可見性,在不符合以下兩條規則的運算場景中,我們仍然要通過枷鎖(使用synchronized或java.util.concurrent中的原子類)來保證原子性。
- 運算結果並不依賴變數的當前值,或者能夠確保只有單一的線程修改變數的值。
- 變數不需要與其他的狀態變數共同參與不變約束。
如下代碼就很適合使用volatile變數來控制併發:
volatile boolean shutdownRequested; public void shutdown(){ shutdownRequested = true; } public void doWork(){ while (!shutdownRequested){ //do something; } }
原子性、可見性與有序性
Java記憶體模型是圍繞著在併發過程中如何處理原子性、可見性、和有序性這3個特征來建立的,下麵來介紹一下這3個特征:
原子性(Atomicity):
由Java記憶體模型來直接保證的原子性變數操作包括read、load、assign、use、store、和write,我基本可以認為基本數據類型的訪問讀寫是具備原子性的。如果需要一個更大範圍的原子性保證,Java記憶體模型還提供了lock和unlock操作來滿足這種需求,儘管虛擬機未把這兩個操作直接開發給用戶使用,但卻提供了更高層次的位元組碼指令來隱式地使用這兩個操作,這兩個位元組碼指令反應到Java代碼中就是同步塊----synchronized關鍵字,因此synchronized塊之間的操作也具備原子性。
可見性(Visibility):
可見性是指當一個線程修改了共用變數的值,其他線程能夠立即得知這個修改。Java記憶體模型是通過在變數修改後將新值同步回主記憶體,在變數讀取前從主記憶體刷新變數值這種依賴主記憶體作為傳遞媒介的方式來實現可見性的,無論是普通變數還是volatile變數和是普通變數都是如此,普通變數與volatile變數的區別是,volatile的特殊規則保證了新值能立即同步到主記憶體,以及每次使用前立即從主記憶體刷新。
除了volatile之外,synchronized和final也可以實現可見性,synchronized的可見性是由“對一個變數執行unlock操作之前,必須先把此變數同步回主記憶體中”這條規則獲得的,final是因為被final修飾的欄位在構造器中一旦完成,並且構造器沒有吧“this”的引用傳遞出去,在其他線程中就能看見final欄位值。
有序性(Ordering):
Java程式中天然的有序性可以總結為一句話:如果在本線程內觀察,所以的操作都是有序的;如果在一個線程中觀察另一個線程,所有的操作都是無序的。前半句指“線程內表現為串列語義”,後半句指“指令重排序”現象和“工作記憶體與主記憶體同步延遲”現象。
Java提供了volatile和synchronized兩個關鍵字來保證線程之間的操作時有序的,volatile包含了精緻指令重排序的語義,而synchronized是由“一個變數在同一時刻只允許一個條線程對其進行lock操作”這條規則獲得的,這條規則決定了持有同一個鎖的兩個同步塊只能串列的進入。
先行發生原則(appens-before)
若Java記憶體模型中所有的有序性都僅依靠volatile和synchronized來完成,那麼有一些操作會變得很繁瑣,但是我們在寫java代碼中並沒有感知這一點,因為Java語言中有一個“先行發生”原則。
先行發生是Java記憶體模型中定義的兩項操作之間的偏序關係,若操作A先行發生於操作B,操作A產生的影響能被操作B觀察到,“影響”是指修改了記憶體中共用變數的值、發送了消息、調用了方法等。
如下例子:
//以下操作線上程A中執行 i = 7; //以下操作線上程B中執行 j = i; //以下操作線上程C中執行 i = 9;
如果線程A先行發生於線程B那麼變數j一定是7,因為線程A的操作會被線程B觀察到進而被影響,而此時線程C還沒有發生,所以j一定是7。但如果線程C出現線上程A和線程B之間,線程C沒有與線程B不存在先行發生,那麼此時線程C對變數i的影響可能會被線程B觀察到,也可能不會,這時線程B讀取到的數據就存在過期風險,不具備多線程安全性。
Java記憶體模型中存在一些“天然的”先行發生關係,這些先行發生關係無須任何同步器協助就已經存在。如果兩個操作之間的關係不在如下規則中,並且無法從下列規則中推導出來,那它們就沒有順序性保障,虛擬機可以對它們隨意地進行重排序。
如下:
程式次序規則:在一個線程內按照程式代碼順序,書寫在前面的操作先行發生於書寫在後面的操作。準確的地應該是控制流順序而不是程式代碼順序,因為要考慮分支、迴圈等結構。
管程鎖定規則:一個unlock操作先行發生於後面對同一個鎖的lock操作。這裡指的是同一個鎖,而“後面”是指時間上的先後順序。
volatile變數規則:對於一個變數的寫操作先行發生於後面對這個變數的讀操作,這裡的“後面”同樣指時間上的先後順序。
線程啟動規則:Thread對象的start()方法先行發生於此線程的每一個動作。
線程終止規則:線程中的所有操作都先行發生於對此線程的終止檢測,我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值等手段檢測到線程已經終止執行。
線程中斷規則:對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生,可以通過Thread.interrupted()方法檢測到是否有中斷發生。
對象終結規則:一個對象的初始化完成(構造函數執行結束)先行發生於它的finalize()方法的開始。
傳遞性:如果操作A先行發生於操作B,操作B先行發生於操作C,那就可以得出結論:操作A優先發生於操作C。
如何判斷操作是否有順序性呢?代碼示例如下:
private int value = 9; public static int getValue() { return value; } public void setValue(int value){ this.value = value; }
一組普通的getter/setter方法,若線程A先調用了“setValue(10)”,然後線程B調用了同一個對象的“getValue()”,那麼線程B得到的返回值是什麼?
分析:由於線程A和線程B時兩個線程所以程式次序規則不適用,由於沒有同步塊,也不會發生lock和unlock,所以管程鎖定規則也不適用,沒有volatile關鍵字,所以volatile變數規則也不適用,後面的線程啟動規則、線程終止規則、線程中斷規則、對象終結規則也和這裡沒關係。因為沒有一個適用的先行發生規則,所以傳遞性也不存在,因此雖然線程A在時間上先與線程B,但是無法確定線程B中“getValue()”的返回值,也就是說,這個操作不具備多線程安全性。
那麼怎麼修複這個問題,讓這個操作編程線程安全的呢?有兩種方式:
把getter/setter方法都定義為synchronized方法。
把value定義為volatile變數。
雖然時間上的先行執行不代表就會先行發生,那如果先行發生是不是就一定會是時間上的先行執行呢?
舉例說明:
//以下操作在同一個線程中執行 int i = 10; int j = 20;
由於兩條賦值語句,在同一個線程中執行,根據程式次序規則,第一條語句先行發生於第二條語句,但是第二條語句的代碼完全可能先被處理器執行,這並不影響先行發生原則的正確性,因為在這條線程之中沒有辦法感知到這一點。
通過兩個例子總結出,時間先後順序與先行發生原則之間基本沒什麼太大的關係,所以併發問題不要受時間順序的干擾,要以先行發生原則為準。
Java記憶體模型這部分也就完結了,雖然說都記錄下來,但是有的地方還是有些雲里霧裡,看來以後要回顧自己的知識,並且要根據這一部分的知識找到一兩個的面試題或者是,自己提出疑惑然後通過查資料把自己的疑惑解開,這樣能加深印象,畢竟這些理論性的知識如果不是理解透了,是很容易忘記得。
馬上就要裸辭出去找工作面試了,希望通過自己這段時間的努力,在面試過程中不會被打擊的很慘。