作者:請叫我紅領巾,轉載請註明出處http://www.cnblogs.com/xxzhuang/p/7453746.html,簡書地址:http://www.jianshu.com/p/b963b3c0ad53 一.寫在前面 首先,本篇文章並沒有涉及原理,而是在筆者擼了《深入理解Java虛擬機》好 ...
作者:請叫我紅領巾,轉載請註明出處http://www.cnblogs.com/xxzhuang/p/7453746.html,簡書地址:http://www.jianshu.com/p/b963b3c0ad53
一.寫在前面
首先,本篇文章並沒有涉及原理,而是在筆者擼了《深入理解Java虛擬機》好幾遍的基礎上講解自己的經驗,從一個新手到現在明白JVM是個什麼玩意,怎麼去理解和明白,講解這樣一個經驗而已。這篇文章並對JVM並沒有挖掘得很深,在下目前也沒有這個能力(筆者目前只是一個正在找工作的大四狗罷了),只是儘量以通熟易懂的方式,讓讀者理解JVM是個什麼玩意。下麵開始我的講解。
二.誰說人神不得相愛——Java的跨平臺
理解Java的跨平臺特性,是對JVM最直觀的認識。所謂的“一次編譯,到處運行”,為什麼C/C++ 卻不能實現呢?這一類語言直接使用物理硬體(或者說操作系統的記憶體模型),那麼不同系統之間的記憶體模型是不同的,比如說Linux和Window,這就意味,在Window編譯好的代碼,卻不能在Linux上運行。《深入理解Java虛擬機》記錄說,Java虛擬機規範中試圖定義一種Java記憶體模型(JMM)來屏蔽掉各種硬體和操作系統的記憶體訪問差異,以實現讓Java程式在各種平臺上都能達到一致性的併發效果。舉個現實的例子,一個只會聽說中文的人,要如何和一個只會聽說英文的人交流,在Java的世界里,採用的方式即是給兩邊的人各配一名翻譯官(JVM),所以,這就是為什麼JVM要有window版本,也要有Linux版本。
眾所周知,Java的程式編譯的最終樣子是.class文件,不同虛擬機的對每一個.class文件的翻譯結果都是一致的。而對於C/C++而言,編譯生成的是純二進位的機器指令,是直接面對電腦系統的記憶體,但是,java程式的編譯結果是面向JVM,是要交付給JVM,讓他再做進一步處理從而讓電腦識別運行,這就是所謂的“屏蔽掉各種硬體和操作系統的記憶體訪問差異”。這裡的特點又和麵向對象推崇的面向介面有著不可描述的關係,我只需要有這麼個規範,不需要去知道接觸你的底層原理實現。
三.活在夢裡的真實——虛擬機
JVM,全稱Java Virtual Machine,英文為Java虛擬機,簡單的探討一下虛擬機這三個字,對後面的學習也是挺舒服的。百度百科描述說,“虛擬機(Virtual Machine)指通過軟體模擬的具有完整硬體系統功能的、運行在一個完全隔離環境中的完整電腦系統”,但是虛擬機本質還是該電腦系統的一個進程,可以類比香港澳門具有高度自治,但本質上他們還是屬於中國的。為了方便描述,我們把整個電腦當成一幢大樓,而虛擬機則是某一個樓層。大樓劃分了一個區域給一個樓層,讓這個樓層自己管理自己,也就對應著,電腦劃分了一個記憶體給JVM,讓JVM自己管理自己。下麵這張圖是筆者的阿裡雲伺服器上的記憶體使用情況,可以看到JVM足足占用了接近500M的記憶體。那麼問題來了,JVM要這麼多的記憶體乾什麼,這裡面又是怎麼劃分?
四.你來到我的世界里——記憶體
在現階段無論什麼編程語言,都是由人類設計發明的,編程語言對於人類來講,是方便自己實現目的的工具之一,所以,編程語言看似是全新的東西,但是這裡面處處都可以看見人類思想的影子,都可以從現實中找到相似的例子。
接著上面的例子,JVM是作為某一個樓層,單獨占有了一大塊區域(記憶體)。這個樓層中,有主廳,客廳,客房,這四個之間的區別之一就行,主廳和客廳是公有的,而主房和客房是私有的,這裡對應到JVM層次上即是,有某幾塊記憶體,是無論是誰訪問,有多少人(線程)訪問,這些共有區域都可以為他們服務,而客房,私有區域,假定我們這個樓層比較牛逼,來了多少個客人,就會單獨為他們建造每一件客房,每個客人都有自己私有區域,A客人是進不了B客人的房間。
對應的JVM的層次,即是JVM運行時數據區域劃分為兩大塊,線程隔離的區域和線程共用的區域。我們可以簡單的理解為,每個客人即是一條線程。具體對應的區域又是如何劃分的,又有什麼作用,這裡只能從概念上理解和記憶了,傳送門在此輕鬆認識JVM運行時數據區域
五.離開我,卻沒有帶走你的痕跡——什麼是垃圾
回想起小時候,很多小伙伴都會一起結伴過來我家玩耍,雖然大家玩得很開心,等到了時間點之後,他們就拍拍屁股走人,留下我家裡一片狼藉,這個時候如果我不收拾一下垃圾的話,我老媽估計就要來拍拍我的屁股了。客人(線程)同樣如此,我來過你的世界,總會留下屬於我的痕跡,是不是垃圾,就要看你自己如何判定了。這裡就引出另一個問題,我怎麼判斷是哪個才是垃圾,哪個不是垃圾,只不過是玩耍的時候,我或者小伙伴隨手把老媽的戒指扔到地上而已。站在人類的視角上看,一眼就知道哪個是垃圾,哪個不是垃圾,但是電腦可不是這樣,電腦有些時候確實不如人類,明明人類一眼或者幾秒能完成的事情,要讓電腦同樣能夠完成對應的功能的話,需要付出千萬倍的代價才能夠實現。
筆者的老媽在家裡收拾垃圾的時候,為了確保扔掉的東西是垃圾,她會將這個東西,一個一個問家裡的每個人,這個東西是不是你的,你還要不要,當沒有一個人承認說這個東西是屬於他的時候,老媽就將這個東西視為垃圾,當有人說這個不是垃圾,是他的寶貝的時候,我老媽就這個東西標記一下。JVM採用的是類似的做法,每個對象到GC ROOT都有一定的聯繫和路徑可達,當某個對象,對於GC ROOT不可達(即沒有人說這個東西是屬於他的)的對象,JVM則判定為垃圾。JVM里稱此行為是可達性分析。
finalize的作用:假設一個本子已經被老媽認定為垃圾了,但老媽在扔掉垃圾的時候必須先經過一個程式,即finalize,假如在這個程式過程中,我突然想起這個本子對我還是有用的,那麼這個本子就不會被認定為垃圾,從而繼續保留在記憶體中。
六. 我要怎樣忘了你是誰——垃圾回收演算法
知道什麼是垃圾,找到了垃圾的位置,接下來的問題是我要怎麼處理這個垃圾,即垃圾回收。我要怎樣忘了你是誰,關鍵是要怎麼字,這個動作是怎麼發生的。
標記清除:在這個樓層中,垃圾四處都有,甚至散亂在非垃圾之間或者周圍,即然我老媽已經給有用的東西做個標誌,那麼這就意味著我老媽只需要清除那些沒有標識的東西。標記清除的做法形象成就是我老媽拿著垃圾桶,從頭到尾,看到垃圾就把他扔到垃圾桶裡面。這種做法無疑是最簡單的,但是帶來的後果也是很明顯的,空間碎片太多。這裡的空間碎片又要做如何理解,每個物品(每個對象)都是需要占據著一定的的面積(即記憶體),他要站住腳跟嘛,但是如果空間碎片的太多,就會導致大的物品來臨的時候,區域(記憶體)不夠用,就會再次引發垃圾回收(意味著你打游戲的時候可能要停頓個幾秒)。再舉個現實中的例子,打包行李箱的時候,隨隨便便,散亂的放置東西,行李廂很容易被撐滿,這個時候你還想放一雙鞋進去,你會發現空間不夠用,只能把所以東西都倒出來,整整齊齊的,從上到下從左到右的放置物品。對於空間的利用率,整齊的做法比散亂無章的行為更來得高,這就引出了另外一個做法,標記整理演算法。
標記整理:你見過有誰掃地的時候,看到垃圾就直接把掃到掃帚了裡面,看到就掃。不存在的!人是有惰性的,所有總會找到更高效的做法,更習慣的做法是將垃圾掃到一起,再統一將其扔到垃圾桶中。
複製:這個演算法就有點奢侈了,不管這個記憶體里有多少垃圾,我老媽都統一將他們扔掉,然後重新再買一次那些我們還需要用的物品,俗稱複製。因此,如果存活對象太多,這個演算法是不適合的(想想就知道了-.-),其二,JVM裡面需要將可用記憶體分為兩半,一半供目前使用,一半供複製後的對象使用。
未完待續……