java關鍵字 volatile的作用及使用說明

先來看看這個關鍵字是什麼意思：volatile [ˈvɒlətaɪl] adj. 易變的，不穩定的; 從翻譯上來看，volatile表示這個關鍵字是極易發生改變的。volatile是java語言中，最輕量級的併發同步機制。這個關鍵字有如下兩個作用：1、任何對volatile變數的修改，java中的其 ...

先來看看這個關鍵字是什麼意思：
volatile [ˈvɒlətaɪl]
adj. 易變的，不穩定的;
從翻譯上來看，volatile表示這個關鍵字是極易發生改變的。
volatile是java語言中，最輕量級的併發同步機制。這個關鍵字有如下兩個作用：
1、任何對volatile變數的修改，java中的其他線程都可以感知到
2、volatile會禁止指令沖排序優化
　　在詳細講解volatile關鍵字之前，需要對java的記憶體模型有所理解，否則很難深入的認識到volatile的作用。java 記憶體可以像之前講的那樣，劃分為堆、棧、方法區等等。但是從結合物理設備的角度來看，記憶體模型的佈局設計如下：

　　之所以這樣設計記憶體模型，是因為：相對於cpu的處理速度來說，物理記憶體的IO操作耗時非常嚴重。這就造成了cpu線程快速計算結束後，需要浪費大量的時間來等待記憶體IO的操作。為了減少這種等待，java記憶體模型引入了工作記憶體的概念。工作記憶體主要是利用cpu或記憶體的寄存器、高速緩存等部分進行數據緩衝，減少cpu線程在記憶體IO期間的等待。
在java記憶體模型中，線程任何與數據有關的操作，都與並且只與工作記憶體相關。當線程需(防盜連接：本文首發自http://www.cnblogs.com/jilodream/ )要操作數據時，虛擬機會首先從主記憶體中讀取數據，然後放置一份拷貝的數據到工作記憶體中。接著java線程讀取工作記憶體中的拷貝數據，並操作得到一個全新的數據，然將將這個數據放回到工作記憶體中，覆蓋原有的值。
　　這樣做可以充分利用物理硬體的優勢：
　　(1)主記憶體，存儲區域大，但是速度不行，適於存儲，不適於快速讀寫
　　(2)工作記憶體、存儲空間小，但是速度快，適於快速讀寫，不適於存儲
同時還避免了Java線程讀寫主記憶體中數據同步問題。因為主記憶體對於各個Java線程都是可見的。如果java線程併發操作，就會導致主記憶體中的數據需要進行同步保護，否則就會出現錯誤的語義。
　　但是這樣做仍然會有一個問題：工作記憶體中的數據是拷貝數據。在Java線程操作的過程中，主記憶體中的數據可能已經發生改變，Java線程相當於是在用過時的值在計算和回寫。這個問題就是數據稱之為“同步”的含義所在，也是鎖要處理的可見性的問題（以後有文章我會專門講這個問題）。
如何解決這個問題呢？
　　只能是通過“鎖”的形式來處理。volatile關鍵字的作用之一，就是形成這樣一個“鎖”：
　　如果一個變數被定義了volatile，那麼每次Java線程在寫入這個變數時，都會加入一個“lock addl $Ox0"的操作指令。這樣會形成一個“記憶體屏障”，當cpu將這條指令寫入到主記憶體時，會告訴其他存有這份指令的工作記憶體加一個標識。表示這個變數已經發生了變化，當前工作記憶體中存儲的拷貝數據已經過時（這個過程被稱之為內核CacheInvalidate)。當其他線程需要使用該變數來操作時，系統會因為這個標識判定當前工作記憶體中的數據已經過時。從而主動刷新主記憶體中的值到自己下邊的工作記憶體中。由於在整個過程中，系統已經線上程操作數據之前，提前刷新了變數的值，所以線程無法看到已經過時的數據的。因此從表現上來看，可以認為是不存在數據不一致的問題。
　　這裡需要專門強調下long、double型。對於記憶體模型中定義的指令來說，操作的數據都是32位的。如果數據是64位，那麼就需要兩次指令操作。對於虛擬機中64位數據類型：double、long型，就會因為需要兩次操作的時間差，導致其他線程拿到的是一種修改的中間值。
　　但是volatile的記憶體屏障專門對這裡進行了處理，以保證這種中間值不會出現在其他cpu的工作記憶體中。同時目前商業的虛擬機已經都對這個問題專門進行了處理：對64位數據的讀寫也採用原子操作。為的就是防止long double這兩個常用類型，由於沒有增加volatile關鍵字，而導致在工作記憶體中出現奇怪的值。
　　volatile的另外一個作用是禁止指令重排序的優化
　　cpu線程在執行指令的過程中，為了保證速度更快，指令之間的順序往往是通過優化重排序以後的順序。為了保證重排序的指令不會有任何的歧義而僅僅是在速度上有所提升，系統會保證指令優化以後執行的結果是一致的。也就是你所獲得的結果與沒優化獲得到的結果是一樣的，不存在差異。但是由於指令順序發生了變化，所以系統是無法保證這個過程中，其他的線程獲取到的數據是能正確代表當前狀態的。這裡最經典的就是單例模式下，實例初始化的問題。請參見文章：設計模式之單例模式的第3個方法。
由於指令重排，系統會在變數沒有初始化結束前，就已經給instance變數(防盜連接：本文首發自http://www.cnblogs.com/jilodream/ )賦予地址。這時候其他線程獲取到的變數就是有問題的：instance!=null,但是裡邊的值卻沒有初始化完成。這裡就需要使用volatile關鍵字禁止指令重排序：只有在實例初始化完畢後，才賦予變數instance引用。
　　另外一個常見的例子是：
　　線程B在刷新線程A的處理結果時，可能由於線程A還沒有對變數初始化完畢，卻提前刷新了變數，導致了線程B所獲取到的變數的狀態是錯誤的。
因此在定義多線程可見變數時，前邊一定要加volatile關鍵字，保證該變數不會被因為指令順序被優化，而導致其他線程獲取到的值是無意義的。
關於Java語言的有序性在《深入理解Java虛擬機》中有一句話，總結的非常好：如果在本線程內觀察，所有的操作都是有序的。如果在一個其它線程觀察本線程，則所有的操作都是無序的。
　　前邊是指，無論虛擬機怎麼優化指令，當前線程在執行的語義和結果上都應該是一致的。（“線程內表現為串列的語義"Within-Thread-As-If-Serial-Semantics)。後邊是指指令會發生重排，其它線程中獲取到的值，不能代表什麼。
其實volatile的這兩個作用是互相關聯的：正是由於volatile需要保證變數的可見性，因此不能將系統無序的中間指令結果反映到主記憶體中，讓其它線程拿去使用可見，所以需要禁止掉指令重排序。保證拿到的結果是反映出當前的執行狀態的。（這裡涉及到一個happens-before原則的概念，我會在後邊的文章中介紹）
volatile存在的問題
　　說了volatile的兩個作用，volatile也有自身的不足。那就是volatile不能保證原子性：
舉個前文講過的例子，volatile變數值被修改以後，會直接刷新到主記憶體中，並且其他線程能感知到。但是其他線程繼續使用這個變數進行計算時，卻不能保證其一直是最新的值。舉個經典例子

1 volatile int a=0；
2 int add()
3 {
4     a++;
5 }

　　兩個線程t1，t2先後執行add)方法，變數a發生了自增。但是a變數的最終結果可能是1也可能是2。這取決於t2讀取變數a的值是在第一個線程刷新a到主記憶體之前，還是主記憶體之後。
a++操作最終在執行時，會執行三條指令:
1、從主記憶體中讀取a值
2、a=a+1
3、寫入a的值到主記憶體中
　　當t1執行完第二步時，假如此時t2也讀取了a的值，則：主記憶體a=0；t1工作記憶體為a=1；t2工作記憶體為a=0；接下來t1執行回寫a操作，但是t2由於已經讀取了a的值在工作記憶體中，因此t2在執行了a++操作後，仍然會回寫a=1到主記憶體中，這時儘管t1回寫後，生成記憶體屏障，但是t2已經讀取完畢，不會在自增階段再主動刷新。(防盜連接：本文首發自http://www.cnblogs.com/jilodream/ )否則如果需要執行連續的多條指令，每次都要主動刷新變數，一旦發生變化就重頭開始，這顯然是不可能的。這種情況就需要程式員通過代碼自己來保證沒有問題。
這裡我們可以發現a變數不會因為volatile關鍵字，而使得自身的指令在外界看來是原子的。
因此volatile的使用存在如下限制場景：
　　1、volatile可以寫入，但是寫入的值不應該依賴舊值
　　2、在確認某個狀態的不變性時，不能將volatile變數作為因數。
　　這兩點在《java併發編程實戰》、《深入理解java虛擬機》中都有提到類似的語義。第一點比較容易理解。第二點比較抽象，這裡解釋一下：就是說volatile適合於判斷是否已經改變了，而不適合判斷是否還沒改變，因為volatile變數發生改變，則一定發生了變化，volatile沒有發生變化，則不能說明一定沒有發生變化。
如前文，a如果仍然等於0.此時不能認為：1、add方法沒有被調用過2、整體沒有被改變過。