Java性能問題一直困擾著廣大程式員,由於平臺複雜性,要定位問題,找出其根源確實很難。隨著10多年Java平臺的改進以及新出現的多核多處理器,Java軟體的性能和擴展性已經今非昔比了。現代JVM持續演進,內建了更為成熟的優化技術、運行時技術和垃圾收集器。與此同時,底層的硬體平臺和操作系統也在演化。 ...
Java性能問題一直困擾著廣大程式員,由於平臺複雜性,要定位問題,找出其根源確實很難。隨著10多年Java平臺的改進以及新出現的多核多處理器,Java軟體的性能和擴展性已經今非昔比了。現代JVM持續演進,內建了更為成熟的優化技術、運行時技術和垃圾收集器。與此同時,底層的硬體平臺和操作系統也在演化。
目錄:
一、Java性能優化系列之一--設計優化
二、Java性能優化系列之二--程式優化
三、Java性能優化系列之三--併發程式設計詳解
四、Java性能優化系列之四--Java記憶體管理與垃圾回收機制詳解
五、Java性能優化系列之五--JavaIO
現代大規模關鍵性系統中的Java性能調優,是一項富有挑戰的任務。你需要關註各種問題,包括演算法結構、記憶體分配模式以及磁碟和文件I/O的使用方式。性能調優最困難的通常是找到問題所在,即便是經驗豐富的人也會被他們的直覺所誤導。性能殺手總是隱藏在最意想不到的地方。
這一次,我將在本文中著重介紹Java性能優化的一系列舉措,希望能夠對現在的你有所幫助。覺得有幫助的朋友也可以轉發、收藏一下。
一、Java性能優化系列之一--設計優化
1、善於利用 Java 中的設計模式:享元模式、代理模式、裝飾器模式等。詳見我的博客文章“大話”設計模式
文章鏈接:https://blog.csdn.net/person_limit/article/details/79806639
2、Java 中的緩衝區:
(1)緩衝最常用的場景就是提高 IO 速度:比如 BufferedWriter 可以用來裝飾 FileWriter ,為 FileWriter 加上緩衝。 BufferedOutputStream 可以用來裝飾 FileOutputStream 。使用這兩個裝飾器時候可以指定緩衝區大小,預設的 size 為 8K 。
(2)JavaNIO 中的各種 Buffer 類族,有更加強大的緩衝區控制功能。
(3)除了性能上的優化,緩衝區也可以作為上層組件和下層組件的一種通信工具,將上層組件好下層組件進行解耦。比如生產者消費者模式中的緩衝區。
2、緩存:
(1)比如 Hibernate 採用的兩級緩存:一級緩存和二級緩存。二級緩存指的是 sessionFactory層面上的緩存, Hibernate 採用的是 EHCache 。一級緩存指的是 session 層面上的緩存。
3、對象復用技術 -- 池的使用
(1)資料庫連接池:較常使用的資料庫連接池組件是 C3P0 和 Proxool 。其中 C3P0 是伴隨 Hibernate 一起發佈的, Hibernate 預設採用的資料庫連接池。
(2)線程池:自定義線程池以及 jdk1.5 提供的線程池組件。
4、並行代替串列。
5、時間換空間:不引入中間變數實現兩個數字的交換。代價是增加 CPU 運算。
6、空間換時間:使用下標數組排序。
二、Java性能優化系列之二--程式優化
常用的程式設計優化技巧:
1、字元串優化處理
(1)String 類的特點:不變性、針對常量池的優化( String.intern() 方法的意義)
(2)subString 方法的記憶體泄漏 :
(3)字元串分割和查找不要使用 split 函數,效率低,而是使用 StringTokenizer 或者 indexOf結合 subString() 函數完成分割。
(4)用 charAt ()方法代替 startWith ()方法。
(5)對於靜態字元串或者變數字元串的連接操作, Java 在編譯的時候會進行徹底的優化,將多個連接操作的字元串在編譯時合成一個單獨的字元串,而不是生成大量的 String 實例。只生成一個對象。
(6)在無需考慮線程安全情況下儘量使用 StringBuilder 。
(7)StringBuffer 和 StringBuilder 初始化的時候都可以設置一個初始值,預設是 16B 。如果字元串的長度大於 16B 的時候,則需要進行擴容。擴容策略是將原有的容量大小翻倍,以新的容量申請記憶體空間,建立 char 數組,然後將數組中的內容複製到這個新的數組中,使用 Arrays.copyOf() 函數。因此,如果能預先評估 StringBuilder 的大小,則可以節省這些複製操作,從而提高系統的性能。
2、List 介面
( 1 ) ArrayList 和 Vector 的區別:它們幾乎使用了相同的演算法,它們的唯一區別是對多線程的支持。 ArrayList 是不安全的,而 Vector 是線程安全的。
( 2 ) LinkedList 和 ArrayList 的區別:
|---1 、 linkedList 採用鏈表實現,適合於數據刪除和插入非常頻繁的情況,不適合隨機訪問。
|---2 、 ArrayList 採用數組實現,適用於隨機查找和順序讀的情況,不適合刪除和插 入數據非常頻繁的場景。
(3)基於數組的 List 都會有一個容量參數。當 ArrayList 所存儲的元素容量超過其已有大小的時候就會進行擴容,數組的擴容會導致整個數組進行一次記憶體複製。因此合理的數組大小會減小數組擴容的次數從而提高系統性能。
(4)遍歷列表的時候儘量使用迭代器,速度塊。
2、Map 介面:
(1)HashMap 的實現原理:簡單的說, HashMap 就是將 key 做 hash 演算法,然後將 hash 值映射到記憶體地址,直接取得 key 所對應的數據。在 HashMap 中,底層數據結構使用的是數組,所謂的記憶體地址指的是數組的下標索引。
(2)容量參數與擴容:預設情況下, hashmap 的初始容量為 16 ,負載因數為 0.75 ,也就是說當 hashmap 的實際容量達到了初始容量 * 負載因數( hashmap 內部維護的一個 threshold 值)的時候, hashmap 就會進行擴容。在擴容時,會遍歷整個 hashmap ,因此應該設置合理的初始大小和負載因數,可以減小 hashmap 擴容的次數。
(3)LinkedHashMap-- 有序的 HashMap : HashMap 的最大缺點是其無序性,被存入到 Hashmap 中的元素,在遍歷 HashMap 的時候,其輸出不一定按照輸入的順序,而是 HashMap 會根據 hash 演算法設定一個查找高效的順序。如果希望保存輸入順序,則需要使用 LinkedHashMap 。LinkedHashmap 在內部又增加了一個鏈表,用於保存元素的順序。
(4)LinkedList 可以提供兩種類型的順序:一個是元素插入時候的順序,一個是最近訪問的順序。註意: LinkedHashMap 在迭代過程中,如果設置為按照最後訪問時間進行排序,即:每當使用 get() 方法訪問某個元素時,該元素便會移動到鏈表的尾端。但是這個時候會出現異常,因此, LinkedHashMap 工作在這種模式的時候,不能在迭代器中使用 get() 操作。
(5)關於 ConcurrentModificationException :該異常一般會在集合迭代過程中被修改時拋出。因此,不要在迭代器模式中修改集合的結構。這個特性適合於所有的集合類,包括 HashMap 、 Vector 、 ArrayList 等。
(6)TreeMap-- 如果要對元素進行排序,則使用 TreeMap 對 key 實現自定義排序,有兩種方式:在 TreeMap 的構造函數中註入一個 Comparator 或者使用一個實現了 Comparable 的 key 。
(7)如果需要將排序功能加入 HashMap ,最好是使用 Treemap 而不是在應用程式自定義排序。
(8)HashMap 基於 Hash 表實現, TreeMap 基於紅黑樹實現。
3 、 Map 和 Set 的關係:
( 1 )所有 Set 的實現都只是對應的 Map 的一種封裝,其內部維護一個 Map 對象。即: Set只是相應的 Map 的 Value 是一種特殊的表現形式的一種特例。
( 2 ) Set 主要有三種實現類: HashSet 、 LinkedHashSet 、 TreeSet 。其中 HashSet 是基於 Hash 的快速元素插入,元素之間無序。 LinkedHashSet 同時維護著元素插入順序,遍歷集合的時候,總是按照先進先出的順序排序。 TreeSet 是基於紅黑樹的實現,有著高效的基於元素 Key 的排序演算法。
4 、優化集合訪問代碼:
( 1 )、分離迴圈中被重覆調用的代碼:例如, for 迴圈中使用集合的 size() 函數,則不應該把這個函數的調用放到迴圈中,而是放到迴圈外邊、
( 2 )、省略相同的操作:
5 、 RandomAccess 介面:通過 RandomAccess 可知道 List 是否支持隨機快速訪問。同時,如果應用程式需要通過索引下標對 List 做隨機訪問,儘量 buyaoshiyongLinkedList , ArrayList 或者 Vector 可以。
6 、 JavaNIO 的特性:
1 、為所有的原始類型提供 Buffer 支持。
2 、使用 Java.nio.charset.Charset 作為字元編碼解碼解決方案。
3 、增加通道抽象代替原有的 IO 流抽象。
4 、支持鎖和記憶體映射文件的文件訪問介面。
5 、提供基於 Selector 的非同步網路 IO 。
7 、 Java 中 NIO 的使用。 Channel 是一個雙向通道,即可讀也可寫。應用程式不能直接操作 Channel ,必須藉助於 Buffer 。例如讀數據的時候,必須把數據從通道讀入到緩衝區,然後在緩衝區中進行讀取。以文件讀取為例,首先通過文件輸入流獲得文件通道,然後把文件通道的內容讀入到緩衝區中,然後就可以對緩衝區操作。
8 、 Buffer 的基本原理:
1 、 Buffer 的創建: Buffer 的靜態 allocate(int size) 方法或者 Buffer.wrap(byte[]src) 。
2 、 Buffer 的工作原理:三個變數: position ,代表當前緩衝區的位置,寫緩衝區的時候,將從 position 的下一個位置寫數據。 Capacity ,代表緩衝區的總容量上限。 Limit ,緩衝區的實際上限,也就是說,讀數據的時候,數據即是從 position 到 limit 之間的數據
3 、 flip 操作: limit=position,position=0, 一般是在讀寫切換的時候使用。寫完數據之後,需要限定下有效數據範圍,才能讀數據;
4 、 clear 操作: position-0 , limit=capacity. 。為重新寫入緩衝區做準備。
5 、 rewind 操作: position=0 ,為讀取緩衝區中有效數據做準備,一半 limit 已經被合理設置。
9 、讀寫緩衝區:
1 、 public byte get() :順序讀取緩衝區的一個位元組, position 會加一
2 、 public Buffer get(byte[]dst): 將緩衝區中的數據讀入到數組 dst 中,並適當的移動 position
3 、 public byte get(int index) :得到第 index 個位元組,但不移動 posoiion
4 、 public ByteBuffer put(byte b) :將位元組 b 放入到緩衝區中,並移動 position
5 、 public ByteBuffer put(int index,byte b) :將位元組 b 放到緩衝區的 index 位位置
6 、 pubglic final ByteBuffer(byte[]src) :將位元組數組 src 放到緩衝區中。
10 、標誌緩衝區:類似於一個書簽的功能,在數據的處理過程中,可隨時記錄當前位置。然後在任意時刻,回到這個位置。 Mark 用於記錄當前位置, reset 用於恢復到 mark 所在的位置、
11 、複製緩衝區:使用 Buffer 的 duplicate 方法可以複製一個緩衝區,副本緩衝區和原緩衝區共用一份空間但是有有著獨立的 position 、 capacity 和 limit 值。
20 、緩衝區分片:緩衝區分片使用 slice 方法實現。它將在現有的緩衝區中,創建的子緩衝區。子緩衝區和父緩衝區共用數據。這個方法有助於將系統模塊化。緩衝區切片可以將一個大緩衝區進行分割處理,得到的子緩衝區都具有緩衝的緩衝區模型結構;因此。這個操作有助於系統的模塊化。
12 、只讀緩衝區:只讀緩衝區可以保證核心數據的安全,如果不希望數據被隨意篡改,返回一個只讀緩衝區是很有幫助的。
13 、文件映射到記憶體: NIO 提供了一種將文件映射到記憶體的方法進行 IO 操作,這種方法比基於流 IO 快很多。這個操作主要由 FileChanne.map() 操作。使用文件記憶體的方式,將文本通過 FileChannel 映射到記憶體中。然後從記憶體中讀取數據。同時,通過修改 Buffer, 將對記憶體中數據的修改寫到對應的硬碟文件中。
14 、處理結構化數據:散射和聚集。散射就是將數據讀入到一組 bytebuffer 中,而聚集正好相反。通過 ScatteringByteChannel 和 GatheringByteChannel 可以簡化對結構數據的操作。
15 、直接記憶體訪問: DirectBuffer 直接分配在物理記憶體中,並不占用對空間,因此也不受對空間限制。 DirectBuffer 的讀寫操作比普通 Buffer 塊,因為 DirectBuffer 直接操縱的就是內核緩衝區。
16 、引用類型:強、軟、若、虛四種引用類型。
WeakHashMap :是弱引用的一中典型應用,它使用弱引用作為內部數據的存儲方案。可以作為簡單的緩存表解決方案。
如果在系統中,需要一張很大的 Map 表, Map 中的表項作為緩存之用。這也意味著即使沒能從該 Map 中取得相應地數據,系統也可以通過選項方案獲取這些數據,雖然這樣會消耗更多的時間,但是不影響系統的正常運行。這個時候,使用 WeakHashMap 是最合適的。因為 WeakHashMap 會在系統記憶體範圍內,保存所有表項,而一旦記憶體不夠,在 GC 時,沒有被引用的又會很快被清除掉,避免系統記憶體溢出。
17 、有助於改善系統性能的技巧:
1 、慎用異常: for 迴圈中使用 try-catch 會大大降低系統性能
2 、使用局部變數:局部變數的訪問速度遠遠高於類的靜態變數的訪問速度,因為類的 變數是存在在堆空間中的。
3 、位運算代替乘除法:右移代表除以二、左移代表乘以二。
4 、有的時候考慮是否可以使用數組代替位運算。
5 、一維數組代替二維數組。
6 、提取表達式:儘可能讓程式少做重覆的計算,尤其要關註在迴圈體的代碼,從迴圈提中提取重覆的代碼可以有效的提升系統性能。
三、Java性能優化系列之三--併發程式設計詳解
1、併發程式設計模式:
( 1 )、 Future-Callable 模式: FutureTask 類實現了 Runnable 介面,可以作為單獨的線程運行,其 Run 方法中通過 Sync 內部類調用 Callable 介面,並維護 Callable 介面的返回值。當調用FutureTask.get() 的時候將返回 Callable 介面的返回對象。 Callable 介面是用戶自定義的實現,通過實現 Callable 介面的 call() 方法,指定 FutureTask 的實際工作內容和返回對象。 Future 取得的結果類型和 Callable 返回的類型必須一致,這是由定義 FutureTask 的時候指定泛型保證的。 Callable 要採用 ExecutorSevice 的 submit 方法提交,返回的 future 對象可以取消任務。
( 2 )、 Master-Worker 格式:其核心思想是系統由兩類進程協作工作: Master 進程和 Worker 進程。 Master 進程負責接收和分配任務, Worker 負責處理子任務。當各個子任務處理完成後,將結果返回給 Master 進程。由 Master 進程進行歸納會彙總,從而得到系統的最終結果。
( 3 )、保護暫停模式:其核心思想是僅當服務進程準備好時,才提供服務。設想一種場景,伺服器會在很短時間內承受大量的客戶端請求,客戶端請求的數量可能超過伺服器本身的即時處理能力。為了不丟棄任意一個請求,最好的方式就是將這個客戶端進行排列,由伺服器逐個處理。
( 4 )、不變模式:為了儘可能的去除這些由於線程安全而引發的同步操作,提高並行程式性能 ,可以使用一種不可變的對象,依靠對象的不變性,可以確保在沒有同步操作的多線程環境中依然保持內部狀態的一致性和正確性。
( 5 )、 Java 實現不變模式的條件:
1) 、去除 setter 方法以及所有修改自身屬性的方法。
2 )、將所有屬性設置為私有,並用 final 標記,確保其不可修改。
3 )、確保沒有子類可以重載修改它的行為。
4 )、有一個可以創建完整對象的構造函數。
Java 中,不變模式的使用有: java.lang.String 類。以及所有的元數據類包裝類。
(6)、生產者 - 消費者模式:生產者進程負責提交用戶請求,消費者進程負責具體處理生產者進程提交的任務。生產者和消費者之間通過共用記憶體緩衝區進行通信。通過 Java 提供和餓 BlockingQueue 可以實現生產者消費者模式。
2、JDK 多任務執行框架:
( 1 )、簡單線程池實現:線程池的基本功能就是進行線程的復用。當系統接受一個提交的任務,需要一個線程時,並不著急立即去創建進程,而是先去線程池查找是否有空餘的進程,若有則直接使用線程池中的線程工作。如果沒有,則再去創建新的進程。待任務完成後,不是簡單的銷毀進程,而是將線程放入線程池的空閑隊列,等待下次使用。使用線程池之後,線程的創建和關閉通常由線程池維護,線程通常不會因為會執行晚一次任務而被關閉,線程池中的線程會被多個任務重覆使用。
( 2 )、 Executor 框架: Executor 框架提供了創建一個固定線程數量的線程池、返回一個只有一個線程的線程池、創建一個可根據實際情況進行線程數量調整的線程池、可調度的單線程池以及可變線程數量的可調度的線程池。
( 3 )、自定義線程池 : 使用 ThreadPoolExecutor 介面: ThreadPoolExecutor 的構造函數參數如下:
corePoolSize :指的是保留的線程池大小
maximumPoolSize : 指的是線程池的最大大小
keepAliveTime :指的是空閑線程結束的超時時間
Unit : 是一個枚舉,表示 keepAliveTime 的單位
workQueue : 表示存放任務的隊列。
ThreadFactory :創建線程的時候,使用到的線程工廠
handler : 當線程達到最大限制,並且工作隊列裡面也已近存放滿了任務的時候,決定如何處理提交到線程池的任務策略
上述的幾種線程池的內部實現均使用了 ThreadPoolExecutor 介面。我們可以自定義提交但是未被執行的任務隊列被執行的順序,常見的有直接提交的隊列、有界的任務隊列、無界的任務隊列、優先任務隊列,這樣可以在系統繁忙的時候忽略任務的提交先後次序,總是讓優先順序高的任務先執行。使用優先隊列時,必須讓 target 實現 Comparable 介面。
(4)、優化線程池大小: NThreads=Ncpi*Ucpu*(1+W/C) , Java 中使用: Runtime.getRuntime().availableProcesses() 獲取可用的 CPU 數量。
3、JDK 併發數據結構:
( 1 )併發 List : Vector 或者 CopyOnWriteArrayList 是兩個線程安全的 List 實現。
CopyOnWriteArrayList 很好的利用了對象的不變性,在沒有對對象進行寫操作之前,由於對象未發生改變,因此不需要加鎖。而在試圖改變對象的時候,總是先獲得對象的一個副本,然後對副本進行修改,最後將副本寫回。 CopyOnWriteArrayList 適合讀多寫少的高併發場合。而 Vector適合高併發寫的場合。
( 2 )併發 Set : synchronizedSet 適合高併發寫的情景、 CopyOnWriteSet 適合讀多寫少的高併發場合。
( 3 )併發 Map : ConcurrentHashMap 是專門為線程併發而設計的 HashMap ,它的 get 操作是無鎖的,其 put 操作的鎖粒度小於 SynchronizedHashMap ,因此其整體性能優於 SynchronizedHashMap 。
( 4 )併發 Queue :在併發隊列上, JDK 提供了兩種實現,一個是以 ConcurrentLinkedQueue 為代表的高性能隊列,一個是以 BlockingQueue 介面為代表的阻塞隊列。如果需要一個能夠在高併發時,仍能保持良好性能的隊列,可以使用 ConcurrentLinkedQueue 對象。而 BlockingQueue的主要適用場景就是生產者消費者模式中的實現數據共用。 BlockingQueue 介面主要有兩種實現: ArrayBlockingQueue 是一種基於數組的阻塞隊列實現,也就是說其內部維護著一個定長數組,用於緩存隊列中的數據對象。 LinkedBlockingQueue 則使用一個鏈表構成的數據緩衝隊列。
4 、併發控制方法:
( 1 )、 Java 中的記憶體模型與 Volatile :在 Java 中,每一個線程有一塊工作記憶體區,其中存放著被所有線程共用的主記憶體中的變數的值的拷貝。當線程執行時,它在自己的記憶體中操作變數。為了存取一個共用的變數,一個線程通常要先獲取鎖定並且清除它的記憶體緩衝區,這保證該共用變數從所有線程的共用記憶體區正確地裝入到線程的工作記憶體區;當線程解鎖時保證該工作記憶體區中變數的值寫回到共用記憶體中。
( 2 )、 Volatile 關鍵字:聲明為 Volatile 的變數可以做以下保證:
1 )、其他線程對變數的修改,可以隨即反應在當前進程中。
2 )、確保當前線程對 Volatile 變數的修改,能隨即寫回到共用主記憶體中,並被其他線程所見
3 )、使用 Volatile 聲明的變數,編譯器會保證其有序性。
4 )、 double 和 long 類型的非原子處理:如果一個 double 類型或者 long 類型的變數沒有被聲明為 volatile 類型,則變數在進行 read 和 write 操作的時候,主記憶體會把它當成兩個 32 位的read 或者 write 操作。因此,在 32 為操作系統中,必須對 double 或者 long 進行同步
原因在於:使用 Volatile 標誌變數,將迫使所有線程均讀寫主記憶體中的對應變數,從而使得 Volatile 變數在多線程間可見。
(3)、同步關鍵字 -Synchronized ,其本質是一把鎖: Synchronized 關鍵字可以作用在方法或者代碼塊中。當作用的是成員方法時,預設的鎖是該對象 this ,這個時候一般在共用資源上進行Synchronized 操作。該關鍵字一般和 wait ()和 notify ()方法一起使用,調用這兩個方法的時候一般指的是資源本身。由於所有的對象都能當成資源,因此這兩個方法是從 Object 繼承而來的,而不是 Thread 或者 Runnable 才具有的方法。
(4)、 ReentrantLock 鎖:比 Synchronized 的功能更強大,可中斷、可定時。所有使用內部鎖實現的功能,都可以使用重入鎖實現。重入鎖必須放入 finally 塊中進行釋放,而內部鎖可以自動釋放。 重入鎖有著更強大的功能,比如提供了鎖等待時間 (boolean tryLock(long time.TimeUnit unit)) 、支持鎖中斷 (lockInterruptibly()) 和快速鎖輪詢 (boolean tryLock()) 以及一套 Condition 機制,這個機制類似於內部鎖的 wait() 和 notify() 方法。
(5)、 ReadWriteLock :讀寫分列鎖。如果 系統中讀操作次數遠遠大於寫操作,而讀寫鎖就可以發揮巨大的作用。
(6)Condition 對象: await() 方法和 signal() 方法。 Condition 對象需要和重入鎖( ReentrantLock )配合工作以完成多線程協作的控制。
(7)Semaphore 信號量:信號量為多線程寫作提供了更為強大的控制方法。廣義上講,信號量是對鎖的擴展。無論是內部鎖( Synchronized )還是重入鎖( ReentrantLock ),一次都只允許一個進程訪問一個資源。而信號量卻可以指定多個線程同時訪問某一個資源。
(8)ThreadLocal 線程局部變數: ThreadLocal 是一種多線程間併發訪問變數的解決方案。與synchronized 等加鎖方式不同, ThreadLocal 完全不提供鎖,而使用以空間換時間的手段,為每個線程提供變數的獨立副本,以保障線程安全,因此並不是一種數據共用的解決方案。
5、同步工具類:
( 1 ) CountDownLatch (閉鎖):確保一個服務不會開始,直到它依賴的其他服務都準備就緒。 CountDownLatch 作用猶如倒計時計數器,調用 CountDownLatch 對象的 countDown 方法就將計數器減 1 ,當計數到達 0 時,則所有等待者或單個等待者開始執行。比如有 10 個運動員的田徑比賽 , ,有兩個裁判 A 和 B , A 在起點吹哨起跑, B 在終點記錄記錄並公佈每個運動員的成績。剛開始的時候,運動員們都趴在跑道上( A.await() )等到裁判吹哨。 A 吹哨耗費了 5 秒,此時調用 A.countDown() 方法將等待時間減為 4 秒。當減為 0 的時候,所有的運動員開始起跑。這個時候, B 裁判開始工作。啟動一個初始值為 10 的定時器,每當有一個運動員跑到重點的時候,就將計數器減一,代表已經有一個運動員跑到終點。當計時器為 0 的時候,代表所有的運動員都跑到了終點。此時可以根據公佈成績了。
( 2 ) CylicBarrier (關卡):
1 )、類似於閉鎖,它們能夠阻塞一組線程直到某些事件發生
2 )、與同步鎖的不同之處是一個可以重用,一個不可以重用
3 )、所有線程必須同時到達關卡點,才能繼續處理。
類似組團旅游,導游就是一個關卡。表示大家彼此等待,大家集合好後才開始出發,分散活動後又在指定地點集合碰面,這就好比整個公司的人員利用周末時間集體郊游一樣,先各自從家出發到公司集合後,再同時出發到公園游玩,在指定地點集合後再同時開始就餐。
( 3 ) Exchanger :使用在兩個伙伴線程之間進行數據交換,這個交換對於兩個線程來說都是安全的。
講解 Exchanger 的比喻:好比兩個毒販要進行交易,一手交錢、一手交貨,不管誰先來到接頭地點後,就處於等待狀態了,當另外一方也到達了接頭地點(所謂到達接頭地點,也就是到到達了準備接頭的狀態)時,兩者的數據就立即交換了,然後就又可以各忙各的了。
exchange 方法就相當於兩手高高舉著待交換物,等待人家前來交換,一旦人家到來(即人家也執行到 exchange 方法),則兩者立馬完成數據的交換。
5、關於死鎖:
(1)死鎖的四個條件:
1) 、互斥條件:一個資源只能被一個線程使用:
2 )、請求與保持條件:一個線程因請求資源而阻塞時,對已獲得則資源保持不放。
3 )、不剝奪條件:進程已經獲得的資源,在未使用完之前,不能強行剝奪。
4 )、迴圈等待條件:若幹個線程已經形成了一種頭尾相接的迴圈等待資源關係。
(2)常見的死鎖:靜態順序死鎖、動態順序死鎖、協作對象間的死鎖、線程饑餓死鎖。
(3)如何儘量避免死鎖:
1 )、制定鎖的順序,來避免死鎖
2 )、嘗試使用定時鎖( lock.tryLock(timeout) )
3 )、在持有鎖的方法中進行其他方法的調用,儘量使用開放調用(當調用方法不需要持有鎖時,叫做開放調用)
4 )、減少鎖的持有時間、減小鎖代碼塊的粒度。
5 )、不要將功能互斥的 Task 放入到同一個 Executor 中執行。
6 、 代碼層面對鎖的優化機制:
1 、避免死鎖
2 、減少鎖持有時間,代碼塊級別的鎖,而不是方法級別的鎖
3 、減小鎖粒度, ConcurrentHashMap 分段加鎖
4 、讀寫鎖代替獨占鎖
5 、鎖分離,例如 LinkedBlockingQueue 的尾插頭出的特點,用兩把鎖 (putLock takeLock) 分離兩種操作。
6 、重入鎖和內部鎖
重入鎖( ReentrantLock )和內部鎖( Synchronized ):所有使用內部鎖實現的功能,都可以使用重入鎖實現。重入鎖必須放入 finally 塊中進行釋放,而內部鎖可以自動釋放。
重入鎖有著更強大的功能,比如提供了鎖等待時間 (boolean tryLock(long time.TimeUnit unit))、支持鎖中斷 (lockInterruptibly()) 和快速鎖輪詢 (boolean tryLock()) 以及一套 Condition 機制,這個機制類似於內部鎖的 wait() 和 notify() 方法。想要獲取多線程面試題的可以加群:650385180,面試題及答案在群的共用區。
7 、鎖粗化:虛擬機在遇到一連串連續的對同一個鎖不斷進行請求和釋放從操作的時候,便會把所有的鎖操作整合成對鎖的一次請求,從而減少對鎖的請求同步次數。
7 、 Java 虛擬機層面對鎖的優化機制:
1、自旋鎖:由於線程切換(線程的掛起和恢復)消耗的時間較大,則使線程在沒有獲得鎖時,不被掛起,而轉而執行一個空迴圈。在若幹空迴圈後,線程如果獲得了鎖,而繼續執行,若線程依然不能獲得鎖,而才被掛起。
2、鎖消除: JVM 通過對上下文的掃描,去除不可能存在共用資源競爭的鎖,這樣可以節省毫無意義的請求鎖時間。比如單線程中或者非共用資源的常使用的 StringBuffer 和 Vector 。
3、鎖偏向:若某一個鎖被線程獲取後,便進入偏向模式,當線程再次請求這個鎖時,無需進行相關的同步操作,從而節省了操作時間。
8 、 Java 無鎖實現併發的機制:
( 1 )非阻塞的同步 / 無鎖: ThreadLocal ,讓每個進程擁有各自獨立的變數副本,因此在並行計算時候,無須相互等待而造成阻塞。 CVS 演算法的無鎖併發控制方法。
( 2 )原子操作: java.util.concurrent.atomic 包。
四、Java性能優化系列之四--Java記憶體管理與垃圾回收機制詳解
1 、 JVM 運行時數據區域。
( 1 )、程式計數器:每一個 Java 線程都有一個程式計數器來用於保存程式執行到當前方法的哪一個指令。此記憶體區域是唯一一個在 JVM Spec 中沒有規定任何 OutOfMemoryError 情況的區域。
( 2 )、 Java 虛擬機棧:該塊記憶體描述的是 Java 方法調用的記憶體模型,每個方法在被執行的時候,都會同時創建一個幀( Frame )用於存儲本地變數表、操作棧、動態鏈接、方法出入口等信息。
( 3 )、本地方法棧。本地方法調用的記憶體模型。
( 4 )、 Java 堆。 Java 中的對象以及類的靜態變數的存放地方。
( 5 )、方法區:方法區中存放了每個 Class 的結構信息,包括常量池、欄位描述、方法描述等等
( 6 )、運行時常量池: Class 文件中除了有類的版本、欄位、方法、介面等描述等信息外,還有一項信息是常量表 (constant_pool table) ,用於存放編譯期已可知的常量,這部分內容將在類載入後進入方法區(永久代)存放。但是 Java 語言並不要求常量一定只有編譯期預置入 Class 的常量表的內容才能進入方法區常量池,運行期間也可將新內容放入常量池(最典型的 String.intern() 方法)。運行時常量池是方法區的一部分,自然受到方法區記憶體的限制,當常量池無法在申請到記憶體時會拋出 OutOfMemoryError 異常。
( 7 )、本機直接記憶體( Direct Memory )
在 JDK1.4 中新加入了 NIO 類,引入一種基於渠道與緩衝區的 I/O 方式,它可以通過本機 Native 函數庫直接分配本機記憶體,然後通過一個存儲在 Java 堆裡面的 DirectByteBuffer 對象作為這塊記憶體的引用進行操作。這樣能在一些場景中顯著提高性能,因為避免了在 Java 對和本機堆中來回覆制數據。
2、Java 類載入機制的特點:
(1)基於父類的委托機制:運行一個程式時,總是由 AppClass Loader (系統類載入器)開始載入指定的類,在載入類時,每個類載入器會將載入任務上交給其父,如果其父找不到,再由自己去載入, Bootstrap Loader (啟動類載入器)是最頂級的類載入器了,其父載入器為 null 。如果父類載入器找不到給定的類名,則交由子載入器去載入,如果最低一層的子載入器也無法找到,則拋出異常。
(2)全盤負責機制:所謂全盤負責,就是當一個類載入器負責載入某個 Class 時,該 Class 鎖依賴的和引用的其他 Class 也將由該類載入器負責載入,除非顯式使用另外一個類載入器來載入。
(3)緩存機制:緩存機制將會保證所有載入過的 Class 對象都會被緩存,當程式中需要使用某個 Class 時,類載入器會先從緩衝區中搜尋該 Class ,只有當緩存區中不存在該 Class 對象時,系統才會讀取該類對應的二進位數據,並將其轉化為 Class 對象,存入緩存區中。這就是為什麼修改了 Class 後,必須重新啟動 JVM ,程式所做的修改才會生效的原因。同時,往們比較 A.getClass() 與 B.getClass() 是否相等時,直接使用 == 比較,因為緩存機制保證類的位元組碼在記憶體中只可能存在一份。
(4)類載入器的三種方法以及其區別:
1)、命令行啟動應用時候由 JVM 初始化載入
2)、通過 Class.forName() 方法動態載入
3)、通過 ClassLoader.loadClass() 方法動態載入 // 使用 Class.forName() 來載入類,預設會執行初始化塊 , // 使用 Class.forName() 來載入類,並指定 ClassLoader ,初始化時不執行靜態塊。
4)區別:使用 ClassLoader.loadClass() 來載入類,不會執行初始化塊,
3 、類的主動引用
什麼情況下需要開始類載入過程的第一個階段,也即類的初始化階段。 Java 虛擬機規定了有且只有 5 種情況下必須立即對類進行初始化:
(1)、遇到 new 、 getstatic 、 putstatic 或 invokestatic 這四條位元組碼指令時,如果類沒有進行過初始化,則需要觸發其初始化。(而且初始化的時候按照先父後子的順序)。這四條指令最常見的 Java 代碼場景是:使用 new 關鍵字實例化對象的時候、讀取或設置一個類的靜態欄位(被 final 修飾,已在編譯時期把結果放入常量池的靜態欄位除外)、調用一個類的靜態方法的的時候。
(2)使用 java.lang.reflect 包的方法對類進行反射調用的時候,如果類沒有進行過初始化,則需要先對其進行初始化。
(3)當初始化一個類的時候,如果發現其父類還沒有進行過初始化,則需要先觸發其父類的初始化。但是一個介面在初始化時,並不要求其父類介面全部都完成了初始化,只有在真正使用到父介面的時候(如引用介面中定義的常量)才會被初始化。
(4)當虛擬機啟動時,用戶需要指定一個要執行的主類(包含 main ()方法的那個類),虛擬機會先初始化這個主類。
(5)當使用 jdk1.7 的動態語言支持時,如果一個 java.lang.invoke.MethodHandle 實例最後的解析結果 REF_getStatic 、 REF_putStatic 、 REF_invokeStatic 的方法句柄,並且這個方法句柄所對應的類沒有初始化過,則需要先觸發其初始化。
4 、類的被動引用
1、對於靜態欄位,只有直接定義這個欄位的類才會被初始化,因此通過其子類來引用父類中定義的靜態欄位,只會觸發父類的初始化而不會觸發子類的初始化。
2、通過數組定義來引用類,不會觸發類的初始化 SuperClass[]sca=new SuperClass[10].
3、常量在編譯階段會存入調用類的常量池中,本質上並沒有直接引用到定義常量的類,因此不會觸發常量的類的初始化。
5 、 Java 對象的創建過程以及如何保證對象創建的多線程的安全性:
虛擬機遇到一條 new 指令時,首先將去檢查這個指令的參數是否能在常量池中定位到一個類的符號引用,並且檢查這個符號引用代表的類是否已經被載入、解析和初始化過。如果沒有則進行類載入過程。
在類載入通過後,接下來虛擬機將為新生對象分配記憶體。對象所需的記憶體的大小在類載入完成後便可完全確定。為對象分配空間的任務等價於把一塊確定大小的記憶體從 Java 堆中劃分出來。
保證多線程的安全性。 有兩種方案,一種是對分配記憶體的動作進行同步操作,實際上虛擬機採用 CAS 加上失敗重試的方式保證更新操作的原子性。另一種是把記憶體分配的動作按照線程劃分在不同的空間中進行。即為每個線程在 Java 堆中預先分配一小塊記憶體,成為本地線程分配緩衝( TLAB )。哪個線程要分配記憶體,就在哪個 TLAB 上分配,只有 TLAB 用完並分配新的 TLAB時,才需要分配新的 TLAB 。
6、 什麼時候判斷一個對象可以被回收?
用可達性分析演算法。這個演算法的基本思路就是通過一系列的成為“ GC roots ”的對象作為起始點,從這些節點開始向下搜索,如果一個對象到 GCroots 沒有任何引用鏈相連,則證明此對象是不可用的。可作為 GCroots 的對象包括虛擬機棧中引用的對象、方法區中常量引用的對象、方法區中靜態屬性引用的對象或者本地方法棧中 JNI 引用的對象,這些對象的共同點都是生命周期與程式的生命周期一樣長,一般不會被 GC 。判斷一個對象死亡,至少經歷兩次標記過程:如果對象在進行可達性演算法後,發現沒有與 GC Roots 相連接的引用鏈,那他將會被第一次標記,併在稍後執行其 finalize ()方法。執行是有機會,並不一定執行。稍後 GC 進行第二次標記,如果第一次標記的對象在 finalize ()方法中拯救自己,比如把自己賦值到某個引用上,則第二次標記時它將被移除出“即將回收”的集合,如果這個時候對象還沒有逃脫,那基本上就會被 GC 了。
7 、 關於 finalize ()方法的作用的說明:
finalize ()方法的工作原理理論上是這樣的:一旦垃圾回收器準備好釋放占用的存儲空間,將首先調用其 finalize ()方法,並且在下一次垃圾回收動作發生時,才會真正回收對象占用的記憶體,所以使用 finalize ()的目的就是在垃圾回收時刻做一些重要的清理工作。我們知道,使用 GC 的唯一原因就是回收程式不再使用的記憶體,所以對於與垃圾回收有關的任何行為來說,包括 finalize() 方法,它們也必須同記憶體及其回收有關。個人認為 Java 對象的 finalize ()方法有兩個作用( 1 )回收通過創建對象方式以外的方式為對象分配了存儲空間。比如,比如在 Java 代碼中採用了 JNI 操作,即在記憶體分配時,採用了類似 C 語言中的 malloc 函數來分配記憶體,而且沒有調用free 函數進行釋放。此時就需要在 finalize ()中用本地方法調用 free 函數以釋放記憶體。( 2 )對象終結條件的驗證,即用來判定對象是否符合被回收條件。比如,如果要回收一個對象,對象被清理時應該處於某種狀態,比如說是一個打開的文件,在回收之前應該關閉這個文件。只要對象中存在沒有被適當清理的部分, finalize ()就可以用來最終法相這種情況。因為對象在被清理的時候肯定處於生命周期的最後一個階段,如果此時還含有一些未釋放的資源,則有能力釋放這些資源。這個不是 C/C++ 裡面的析構函數,它運行代價高昂,不確定性大,無法保證各個對象的調用順序。需要關閉外部資源之類的事情,基本上它能做的使用 try-finally 可以做的更好。
8 、 一個類被回收的條件。
(1)、該類所有的實例都已經為 GC ,也就是說 JVM 中不存在該 Class 的任何實例。
(2)、載入該類的 ClassLoader 已經被 GC 。
(3)該類對應的 java.lang.Class 對象沒有在任何地方被引用,如不能在任何地方通過反射訪問類的方法。
9、 垃圾回收演算法 :
(1)、標記 - 清除演算法:標記階段根據根節點標記所有從根節點開始的可達對象。則未被標記的對象就是未被引用的垃圾對象,然後在清除階段,清楚所有未被標記的對象。其最大缺點是空間碎片。
(2)、複製演算法:將原有的記憶體空間分為兩塊,每次只使用其中一塊,在垃圾回收時,將正在使用的記憶體中的存活對象複製到未使用的記憶體塊中,之後清楚正在使用的記憶體快中的所有對象,然後交換兩個記憶體的角色。完成垃圾回收。這種演算法比較適合新生代,因為在新生代,垃圾對象通常會多於存活對象,複製演算法效果較好。 Java 的新生代串列 GC 中,就使用了複製演算法的思想。新生代分為 eden 空間、 from 空間和 to 空間三個部分。 From 和 to 空間可以視為用於複製的兩塊大小相同、地位相等、且可以進行角色互換的空間塊。 From 和 to 空間也成為 survivor 空間,即幸存者空間,用於存放未被回收的對象。
(3)、標記 - 壓縮演算法:標記過程與標記清楚演算法一樣,但後續不是直接對可回收對象進行清理,而是讓所有存活的對象向一段移動,然後直接清理掉端邊界以外的記憶體。適合老年代的回收。
(4)、分代收集演算法。
10 、 垃圾回收器。
( 1 )、 Serial 收集器
單線程收集器,收集時會暫停所有工作線程(我們將這件事情稱之為 Stop The World ,下稱 STW ),使用複製收集演算法,虛擬機運行在 Client 模式時的預設新生代收集器。
(2)、 ParNew 收集器就是 Serial 的多線程版本,除了使用多條收集線程外,其餘行為包括演算法、 STW 、對象分配規則、回收策略等都與 Serial 收集器一摸一樣。對應的這種收集器是虛擬機運行在 Server 模式的預設新生代收集器,在單 CPU 的環境中, ParNew 收集器並不會比 Serial 收集器有更好的效果。
(3)Parallel Scavenge 收集器(下稱 PS 收集器)也是一個多線程收集器,也是使用複製演算法,但它的對象分配規則與回收策略都與 ParNew 收集器有所不同,它是以吞吐量最大化(即 GC 時間占總運行時間最小)為目標的收集器實現,它允許較長時間的 STW 換取總吞吐量最大化。
(4)4.Serial Old 收集器 Serial Old 是單線程收集器,使用標記-整理演算法,是老年代的收集器
(5) Parallel Old 收集器
老年代版本吞吐量優先收集器,使用多線程和標記-整理演算法, JVM 1.6 提供,在此之前,新生代使用了 PS 收集器的話,老年代除 Serial Old 外別無選擇,因為 PS 無法與 CMS 收集器配合工作。
(6)CMS ( Concurrent Mark Sweep )收集器
CMS 是一種以最短停頓時間為目標的收集器,使用 CMS 並不能達到 GC 效率最高(總體 GC時間最小),但它能儘可能降低 GC 時服務的停頓時間,這一點對於實時或者高交互性應用(譬如證券交易)來說至關重要。
( 7 )、 G1 收集器。
11 、記憶體分配與回收策略:
( 1 )、規則一:通常情況下,對象在 eden 中分配。當 eden 無法分配時,觸發一次 Minor GC 。
( 2 )、規則二:配置了 PretenureSizeThreshold 的情況下,對象大於設置值將直接在老年代分配。
( 3 )、規則三:在 eden 經過 GC 後存活,並且 survivor 能容納的對象,將移動到 survivor 空間內,如果對象在 survivor 中繼續熬過若幹次回收(預設為 15 次)將會被移動到老年代中。回收次數由 MaxTenuringThreshold 設置。
( 4 )、規則四:如果在 survivor 空間中相同年齡所有對象大小的累計值大於 survivor 空間的一半,大於或等於該年齡的對象就可以直接進入老年代,無需達到 MaxTenuringThreshold 中要求的年齡。
( 5 )、規則五:在 Minor GC 觸發時,會檢測之前每次晉升到老年代的平均大小是否大於老年代的剩餘空間,如果大於,改為直接進行一次 Full GC ,如果小於則查看 HandlePromotionFailure 設置看看是否允許擔保失敗,如果允許,那仍然進行 Minor GC ,如果不允許,則也要改為進行一次 Full GC 。
11、 關於 Minor GC 與 Full GC
Java 堆,分配對象實例所在空間,是 GC 的主要對象。分為新生代 (Young Generation/New)和老年代 (Tenured Generation/Old) 。新生代又劃分成 Eden Space 、 From Survivor/Survivor 0 、
To Survivor/Survivor 1 。
新生代要如此劃分是因為新生代使用的 GC 演算法是複製收集演算法。新生代使用賦值收集演算法,但是為了記憶體利用率,只使用一個 Survivor 空間來作為輪轉備份(之所以把該空間分為 FromSpace 和 ToSpace 兩部分是為了在 Minor GC 的時候把一些 age 大的對象從新生代空間中複製到老年代空間中)這種演算法效率較高,而 GC 主要是發生在對象經常消亡的新生代,因此新生代適合使用這種複製收集演算法。由於有一個假設:在一次新生代的 GC(Minor GC) 後大部分的對象占用的記憶體都會被回收,因此留存的放置 GC 後仍然活的對象的空間就比較小了。這個留存的空間就是 Survivor space : From Survivor 或 To Survivor 。這兩個 Survivor 空間是一樣大小的。例如,新生代大小是 10M(Xmn10M) ,那麼預設情況下 (-XX:SurvivorRatio=8) , Eden Space 是 8M , From 和 To 都是 1M 。
在 new 一個對象時,先在 Eden Space 上分配,如果 Eden Space 空間不夠就要做一次 Minor GC 。 Minor GC 後,要把 Eden 和 From 中仍然活著的對象們複製到 To 空間中去。如果 To 空間不能容納 Minor GC 後活著的某個對象,那麼該對象就被 promote 到老年代空間。從 Eden 空間被覆制到 To 空間的對象就有了 age=1 。此 age=1 的對象如果在下一次的 Minor GC 後仍然存活,它還會被覆制到另一個 Survivor 空間 ( 如果認為 From 和 To 是固定的,就是又從 To 回到了From 空間 ) ,而它的 age=2 。如此反覆,如果 age 大於某個閾值 (-XX:MaxTenuringThreshold=n),那個該對象就也可以 promote 到老年代了。
如果 Survivor 空間中相同 age( 例如, age=5) 對象的總和大於等於 Survivor 空間的一半,那麼 age>=5 的對象在下一次 Minor GC 後就可以直接 promote 到老年代,而不用等到 age 增長到閾值。
在做 Minor GC 時,只對新生代做回收,不會回收老年代。即使老年代的對象無人索引也將仍然存活,直到下一次 Full GC 。
在發生 Minor GC 之前,虛擬機會先檢查老年代最大可用的連續空間是否大於新生代所有對象總空間,如果這個條件成立,那麼 Minor GC 可以確保是安全的。如果經過 Minor GC 後仍有大量對象存活的情況,則需要老年代進行分配擔保,把 Survior 無法容納的對象直接進入老年代。
13 、四種引用類型:
( 1 )、強引用:直接關聯,虛擬機永遠不會回收。
( 2 )、軟引用:描述一些還有用但並非必須的對象,虛擬機會在拋出記憶體溢出異常之前會對 這些對象進行第二次回收。
( 3 )弱引用:虛擬機一定會回收的對象
( 4 )虛引用:為一個對象設置虛引用關聯的唯一目的就是能在這個對象被收集器回收時收到一個系統通知。
14 、關於 Java 中生成對象的 4 種方式與區別:
( 1 )、使用 new 操作符,這是最普遍的一種(會調用相應的構造函數):
如: String s=new String("abc");
( 2 )使用反射動態生成( 會調用相應的構造函數 ):
利用 Class , ClassLoader , Constructor 中的方法可以動態的生成類實例
如: Object o=Class.forName("java.lang.String").newInstance();
Object o=String.class.getClassLoader.loadClass("java.lang.String").newInstance();
以上的方式需要目標類擁有公有無參構造函數
以下使用 Constructor 進行動態生成
class User{
public User(String user,Integer id){}
}
Constructor c=User.class.getConstructor(new Class[]{String.class,Integer.class});
User user=(User)c.newInstance(new Object[]{"zhang san",123});
( 3 )使用克隆生成對象( 不會調用構造函數 )
例如使用一個實現了 Cloneable 介面的對象,調用其 clone() 方法獲得該對象的一份拷貝,使用 Java 序列化方式實現深拷貝。
( 4 )利用反序列化從流中生成對象( 不會調用構造函數 ):
利用 ObjectInptuStream 的 readObject() 方法生成對象
五、Java性能優化系列之五--JavaIO
1 、關於 Java 序列化與反序列化:
(1)作用:
1、實現對象狀態的保存到本地,以便下一次啟動虛擬機的時候直接讀取保存的序列化位元組生成對象,而不是初始化對象; 2 、實現對象的網路傳輸( RMI 分佈對象); 3 、實現對象的深拷貝。
一:對象序列化可以實現分散式對象。主要應用例如: RMI 要利用對象序列化運行遠程主機上的服務,就像在本地機上運行對象時一樣。
二: java 對象序列化不僅保留一個對象的數據,而且遞歸保存對象引用的每個對象的數據。可以將整個對象層次寫入位元組流中,可以保存在文件中或在網路連接上傳遞。利用對象序列化可以進行對象的 " 深複製 " ,即複製對象本身及引用的對象本身。序列化一個對象可能得到整個對象序列。
(2)基本方式:
ObjectOutputStream 只能對 Serializable 介面的類的對象進行序列化。預設情況下, ObjectOutputStream 按照預設方式序列化,這種序列化方式僅僅對對象的非 transient 的實例變數進行序列化,而不會序列化對象的 transient 的實例變數,也不會序列化靜態變數。
當 ObjectOutputStream 按照預設方式反序列化時,具有如下特點:
1 ) 如果在記憶體中對象所屬的類還沒有被載入,那麼會先載入並初始化這個類。如果在 classpath 中不存在相應的類文件,那麼會拋出 ClassNotFoundException ;
2 ) 在反序列化時不會調用類的任何構造方法。
如果用戶希望控制類的序列化方式,可以在可序列化類中提供以下形式的 writeObject() 和 readObject() 方法。
private void writeObject(java.io.ObjectOutputStream out) throws IOException
private void readObject(java.io.ObjectInputStream in) throws IOException, ClassNotFoundException;
當 ObjectOutputStream 對一個 Customer 對象進行序列化時,如果該對象具有 writeObject() 方法,那麼就會執行這一方法,否則就按預設方式序列化。在該對象的 writeObjectt() 方法中,可以先調用 ObjectOutputStream 的 defaultWriteObject() 方法,使得對象輸出流先執行預設的序列化操作。同理可得出反序列化的情況,不過這次是 defaultReadObject() 方法。
有些對象中包含一些敏感信息,這些信息不宜對外公開。如果按照預設方式對它們序列化,那麼它們的序列化數據在網路上傳輸時,可能會被不法份子竊取。對於這類信息,可以對它們進行加密後再序列化,在反序列化時則需要解密,再恢復為原來的信息。
預設的序列化方式會序列化整個對象圖,這需要遞歸遍歷對象圖。如果對象圖很複雜,遞歸遍歷操作需要消耗很多的空間和時間,它的內部數據結構為雙向列表。
在應用時,如果對某些成員變數都改為 transient 類型,將節省空間和時間,提高序列化的性能。
|-1 、實體對象實現 seriable 介面以及自定義 seriousid 。
|-2 、 ObjectOutputStream out= new ObjectOutputStream(baos);
out.writeObject(new PersonDemo("rollen", 20));
out.close();
|-3 、 ByteArrayInputStream bais=new ByteArrayInputStream(baos.toByteArray());
ObjectInputStream input=new ObjectInputStream(bais);
Object obj =input.readObject();
input.close();
(3)Java 自定義序列化反序列化:覆寫實現了 seriliable 的實體類的 readObject() 和 writeObject() 的方法的原因:
有些對象中包含一些敏感信息,這些信息不宜對外公開。如果按照預設方式對它們序列化,那麼它們的序列化數據在網路上傳輸時,可能會被不法份子竊取。對於這類信息,可以對它們進行加密後再序列化,在反序列化時則需要解密,再恢復為原來的信息。此時便不能使用預設的 readObject 和 writeObject() 方法。
private void writeObject(java.io.ObjectOutputStream out) throws IOException{
out.defaultWriteObject();
out.writeUTF(name);
}
private void readObject(java.io.ObjectInputStream in) throws IOException, ClassNotFoundException{
in.defaultReadObject();
name=in.readUTF();
}
一般情況直接實現 Serializable 介面就可以實現序列化的要求,但是有些情況需要對序列化做一些特殊的要求。
(4)Transits 關鍵字的作用:屏蔽一些不想進行序列化的成員變數,解屏蔽的方法可以用( 3)
(5)Externalize 的作用:
Externalizable 介面繼承自 Serializable 介面,如果一個類實現了 Externalizable 介面,那麼將完全由這個類控制自身的序列化行為。 Externalizable 介面聲明瞭兩個方法:
public void writeExternal(ObjectOutput out) throws IOException
public void readExternal(ObjectInput in) throws IOException , ClassNotFoundException
前者負責序列化操作,後者負責反序列化操作。
在對實現了 Externalizable 介面的類的對象進行反序列化時, 會先調用類的不帶參數的構造方法,這是有別於預設反序列方式的。如果把類的不帶參數的構造方法刪除 ,或者把該構造方法的訪問許可權設置為 private 、預設或 protected 級別,會拋出 java.io.InvalidException: no valid constructor 異常。
(6)與 Java 構造函數的關係:
實現了 Externalizable 介面的類的對象進行反序列化時,會先調用類的不帶參數的構造方法;而實現了 Serializable 介面的類的對象進行反序列化時,不會調用任何構造方法。僅僅是根據所保存的對象的狀態信息,在記憶體中重新構建對象!
(7)註意事項:
1) 、序列化運行時使用一個稱為 serialVersionUID 的版本號與每個可序列化類相關聯,該序列號在反序列化過程中用於驗證序列化對象的發送者和接收者是否為該對象載入了與序列化相容的類。為它賦予明確的值。顯式地定義 serialVersionUID 有兩種用途:
在某些場合,希望類的不同版本對序列化相容,因此需要確保類的不同版本具有相同的 serialVersionUID ;
在某些場合,不希望類的不同版本對序列化相容,因此需要確保類的不同版本具有不同的 serialVersionUID 。
2)、 java 有很多基礎類已經實現了 serializable 介面,比如 string,vector 等。但是比如 hashtable 就沒有實現 serializable 介面。
3)、並不是所有的對象都可以被序列化。由於安全方面的原因一個對象擁有 private,public 等 field, 對於一個要傳輸的對象 , 比如寫到文件 , 或者進行 rmi 傳輸等等 , 在序列化進行傳輸的過程中 ,這個對象的 private 等域是不受保護的;資源分配方面的原因 , 比如 socket,thread 類 , 如果可以序列化 , 進行傳輸或者保存 , 也無法對他們進行重新的資源分配 , 而且 , 也是沒有必要這樣實現 .
4)、反序列化對象時,並不會調用該對象的任何構造方法,僅僅是根據所保存的對象的狀態信息,在記憶體中重新構建對象!
5)、當一個對象被序列化時,只保存對象的非靜態成員變數,不能保存任何的成員方法和靜態的成員變數
6)、如果一個對象的成員變數是一個對象,那麼這個對象的數據成員也會被保存!這是能用序列化解決深拷貝的重要原因。
(8)序列化與單例模式的衝突解決辦法:
另外還有兩個自定義序列化方法 writeReplace 和 readResolve ,分別用來在序列化之前替換序列化對象 和 在反序列化之後的對返回對象的處理。一般可以用來避免 singleTon 對象跨 jvm 序列化和反序列化時產生多個對象實例,事實上 singleTon 的對象一旦可序列化,它就不能保證 singleTon 了。 JVM 的 Enum 實現里就是重寫了 readResolve 方法,由 JVM 保證 Enum 的值都是 singleTon 的,所以建議多使用 Enum 代替使用 writeReplace 和 readResolve 方法。
Java 代碼
private Object readResolve()
{
return INSTANCE;
}
private Object writeReplace(){
return INSTANCE;
}
註: writeReplace 調用在 writeObject 前 ;readResolve 調用在 readObject 之後。
(9)序列化解決深拷貝的代碼:
public Object deepClone() throws IOException, OptionalDataException,
ClassNotFoundException {
// 將對象寫到流里
ByteArrayOutputStream bo = new ByteArrayOutputStream();
ObjectOutputStream oo = new ObjectOutputStream(bo);
oo.writeObject(this); // 從流里讀出來
ByteArrayInputStream bi = new ByteArrayInputStream(bo.toByteArray());
ObjectInputStream oi = new ObjectInputStream(bi);
return (oi.readObject());
}
對象所屬的類要實現 Serializable 介面。同時將該方法寫入到對象所屬的類中。
深拷貝的時候,調用該方法即可。
2、JavaIO 中的裝飾模式:
Java 中使用的最廣泛的裝飾器模式就是 JavaIO 類的設計。比如, OutPutStream 是輸出流的基類,其子類有 FileOutputStream 和 FilterOutputStream, 而 FilterOutputStream 的子類有 BufferedOutputStream 和 DataOutputStream 兩個子類。其中, FileOutputStream 為系統的核心類,它實現了向文件寫數據的功能,使用 DataOutputStream 可以在 FileOutputStream 的基礎上增加多種數據類型的寫操作支持( DataOutputStream 類中有 writeUTF 、 writeInt 等函數),而 BufferdOutputStream 裝飾器可以對 FileOutputStream 增加緩衝功能,優化 I/O 性能。
3、JavaIO 流的使用場景:
(1)IO 流:用於處理設備上的數據,這裡的設備指的是:硬碟上的文件、記憶體、鍵盤輸入、屏幕顯示。
(2)位元組流和字元流:位元組流好理解,因為所有格式的文件都是以位元組形式硬碟上存儲的,包括圖片、 MP3 、 avi 等,因此位元組流可以處理所有類型的數據。字元流讀取的時候讀到一個或多個位元組時(中文對應的 位元組數是兩個,在 UTF-8 碼表中是三個位元組)時,先去查指定的編碼表,將查到的字元返回。字元流之所以出現,就是因為有了文件編碼的不同,而有了對字元進行高效操作的字元流對象。因此,只要是處理純文本數據,就要優先考慮使用字元流,除此之外都使用位元組流。
(3)流操作的基本規律:
1 )、明確數據源和數據匯,目的是明確使用輸入流還是輸出流。
2 )、明確操作的數據是否是純文本數據。
3 )、是否需要進行位元組流和字元流的轉換。
4 )、是否需要使用緩存。
(4)實例說明流操作的基本流程:把鍵盤上讀入的數據以指定的編碼存入到文件中。
1 )、明白數據源:鍵盤輸入, System.in ,可用 InputStream 和 Reader
2 )、發現 System.in 對應的流是位元組讀入流,所以要將其進行轉換,將位元組轉換為字元。
3 )、所以要使用 InputStreamReader 轉換流
4 )、如果想提高效率,要加入緩存機制,那麼就要加入字元流的緩衝區。 BufferedReader,因此前四步構造出的輸入流為:
BufferedReader bur = new BufferedReader(new InputStreamReader(System.in));
5 )、明白數據匯:既然是數據匯,則一定是輸出流,可以用 OutputStream 或 Writer 。
6 )、往文件中存儲的都是文本文件,因此選用 Writer 。
7 )、因為要指定編碼表,所以使用 Writer 中的轉換流, OutputStreamWriter 。
註意:雖然最終是文件,但是不可以選擇 FileWriter ,因為該對象是使用預設編碼表。
8 )是否要提高效率,選擇 BufferedWriter 。
9 )轉換輸出流需要接收一個位元組輸出流進來,所以要是用 OutputStream 體系,而最終輸出到一個文件中。那麼就要使用 OutputStream 體系中可以操作的文件的字元流對象, FileOutputStream 。
10 )、通過前面的分析,得到的輸出流對象如下:
//String charSet = System.getProperty("file.encoding");
String charSet = "utf-8";
BufferedWriter bufw = new BufferedWriter(new OutputStreamWriter(new
FileOutputStream("a.txt"),charSet);
4 、可以和流相關聯的集合對象 Properties 。
Map
|--HashTable
|--Properties
Properties :該集合不需要泛型,因為該集合中的鍵值都是 String 類型。
5、其他流對象:
( 1 )列印流:
PrintStream :是一個位元組列印流 System.out 對應的就是 PrintStream 。它的構造函數可以接收三種數據類型的值:字元串路徑、 File 對象、 OutputStream (當為 System.out 的時候即把輸入顯示到屏幕上)
PrintWriter :是一個字元列印流。構造函數可以接收四種類型的值。字元串路徑、 File 對象(對於這兩中類型的數據,還可以指定編碼表。也即是是字元集)、 OutPutSream 、 Writer (對於三、四類型的數據,可以指定自動刷新,註意:當自動刷新的值為 true 時,只有三個方法可以用: printlf 、 printf 、 format )
(2)管道流: PipedOutputStream 和 PipedInputStream 。一般在多線程中通信的時候用。
(3)RandomAccessFile :該對象不是流體系中的一員,但是該隊選中封裝了位元組流,同時還封裝了一個緩衝區(位元組