前言 Java多線程分類中寫了21篇多線程的文章,21篇文章的內容很多,個人認為,學習,內容越多、越雜的知識,越需要進行深刻的總結,這樣才能記憶深刻,將知識變成自己的。這篇文章主要是對多線程的問題進行總結的,因此羅列了40個多線程的問題。 這些多線程的問題,有些來源於各大網站、有些來源於自己的思考。 ...
前言 Java多線程分類中寫了21篇多線程的文章,21篇文章的內容很多,個人認為,學習,內容越多、越雜的知識,越需要進行深刻的總結,這樣才能記憶深刻,將知識變成自己的。這篇文章主要是對多線程的問題進行總結的,因此羅列了40個多線程的問題。 這些多線程的問題,有些來源於各大網站、有些來源於自己的思考。可能有些問題網上有、可能有些問題對應的答案也有、也可能有些各位網友也都看過,但是本文寫作的重心就是所有的問題都會按照自己的理解回答一遍,不會去看網上的答案,因此可能有些問題講的不對,能指正的希望大家不吝指教。 40個問題彙總 1、多線程有什麼用? 一個可能在很多人看來很扯淡的一個問題:我會用多線程就好了,還管它有什麼用?在我看來,這個回答更扯淡。所謂"知其然知其所以然","會用"只是"知其然","為什麼用"才是"知其所以然",只有達到"知其然知其所以然"的程度才可以說是把一個知識點運用自如。OK,下麵說說我對這個問題的看法: (1)發揮多核CPU的優勢 隨著工業的進步,現在的筆記本、台式機乃至商用的應用伺服器至少也都是雙核的,4核、8核甚至16核的也都不少見,如果是單線程的程式,那麼在雙核CPU上就浪費了50%,在4核CPU上就浪費了75%。單核CPU上所謂的"多線程"那是假的多線程,同一時間處理器只會處理一段邏輯,只不過線程之間切換得比較快,看著像多個線程"同時"運行罷了。多核CPU上的多線程才是真正的多線程,它能讓你的多段邏輯同時工作,多線程,可以真正發揮出多核CPU的優勢來,達到充分利用CPU的目的。 (2)防止阻塞 從程式運行效率的角度來看,單核CPU不但不會發揮出多線程的優勢,反而會因為在單核CPU上運行多線程導致線程上下文的切換,而降低程式整體的效率。但是單核CPU我們還是要應用多線程,就是為了防止阻塞。試想,如果單核CPU使用單線程,那麼只要這個線程阻塞了,比方說遠程讀取某個數據吧,對端遲遲未返回又沒有設置超時時間,那麼你的整個程式在數據返回回來之前就停止運行了。多線程可以防止這個問題,多條線程同時運行,哪怕一條線程的代碼執行讀取數據阻塞,也不會影響其它任務的執行。 (3)便於建模 這是另外一個沒有這麼明顯的優點了。假設有一個大的任務A,單線程編程,那麼就要考慮很多,建立整個程式模型比較麻煩。但是如果把這個大的任務A分解成幾個小任務,任務B、任務C、任務D,分別建立程式模型,並通過多線程分別運行這幾個任務,那就簡單很多了。 2、創建線程的方式 比較常見的一個問題了,一般就是兩種: (1)繼承Thread類 (2)實現Runnable介面 至於哪個好,不用說肯定是後者好,因為實現介面的方式比繼承類的方式更靈活,也能減少程式之間的耦合度,面向介面編程也是設計模式6大原則的核心。 3、start()方法和run()方法的區別 只有調用了start()方法,才會表現出多線程的特性,不同線程的run()方法裡面的代碼交替執行。如果只是調用run()方法,那麼代碼還是同步執行的,必須等待一個線程的run()方法裡面的代碼全部執行完畢之後,另外一個線程才可以執行其run()方法裡面的代碼。 4、Runnable介面和Callable介面的區別 有點深的問題了,也看出一個Java程式員學習知識的廣度。 Runnable介面中的run()方法的返回值是void,它做的事情只是純粹地去執行run()方法中的代碼而已;Callable介面中的call()方法是有返回值的,是一個泛型,和Future、FutureTask配合可以用來獲取非同步執行的結果。 這其實是很有用的一個特性,因為多線程相比單線程更難、更複雜的一個重要原因就是因為多線程充滿著未知性,某條線程是否執行了?某條線程執行了多久?某條線程執行的時候我們期望的數據是否已經賦值完畢?無法得知,我們能做的只是等待這條多線程的任務執行完畢而已。而Callable+Future/FutureTask卻可以獲取多線程運行的結果,可以在等待時間太長沒獲取到需要的數據的情況下取消該線程的任務,真的是非常有用。 5、CyclicBarrier和CountDownLatch的區別 兩個看上去有點像的類,都在java.util.concurrent下,都可以用來表示代碼運行到某個點上,二者的區別在於: (1)CyclicBarrier的某個線程運行到某個點上之後,該線程即停止運行,直到所有的線程都到達了這個點,所有線程才重新運行;CountDownLatch則不是,某線程運行到某個點上之後,只是給某個數值-1而已,該線程繼續運行 (2)CyclicBarrier只能喚起一個任務,CountDownLatch可以喚起多個任務 (3)CyclicBarrier可重用,CountDownLatch不可重用,計數值為0該CountDownLatch就不可再用了 6、volatile關鍵字的作用 一個非常重要的問題,是每個學習、應用多線程的Java程式員都必須掌握的。理解volatile關鍵字的作用的前提是要理解Java記憶體模型,這裡就不講Java記憶體模型了,可以參見第31點,volatile關鍵字的作用主要有兩個: (1)多線程主要圍繞可見性和原子性兩個特性而展開,使用volatile關鍵字修飾的變數,保證了其在多線程之間的可見性,即每次讀取到volatile變數,一定是最新的數據 (2)代碼底層執行不像我們看到的高級語言----Java程式這麼簡單,它的執行是Java代碼-->位元組碼-->根據位元組碼執行對應的C/C++代碼-->C/C++代碼被編譯成彙編語言-->和硬體電路交互,現實中,為了獲取更好的性能JVM可能會對指令進行重排序,多線程下可能會出現一些意想不到的問題。使用volatile則會對禁止語義重排序,當然這也一定程度上降低了代碼執行效率 從實踐角度而言,volatile的一個重要作用就是和CAS結合,保證了原子性,詳細的可以參見java.util.concurrent.atomic包下的類,比如AtomicInteger。 7、什麼是線程安全 又是一個理論的問題,各式各樣的答案有很多,我給出一個個人認為解釋地最好的:如果你的代碼在多線程下執行和在單線程下執行永遠都能獲得一樣的結果,那麼你的代碼就是線程安全的。 這個問題有值得一提的地方,就是線程安全也是有幾個級別的: (1)不可變 像String、Integer、Long這些,都是final類型的類,任何一個線程都改變不了它們的值,要改變除非新創建一個,因此這些不可變對象不需要任何同步手段就可以直接在多線程環境下使用 (2)絕對線程安全 不管運行時環境如何,調用者都不需要額外的同步措施。要做到這一點通常需要付出許多額外的代價,Java中標註自己是線程安全的類,實際上絕大多數都不是線程安全的,不過絕對線程安全的類,Java中也有,比方說CopyOnWriteArrayList、CopyOnWriteArraySet (3)相對線程安全 相對線程安全也就是我們通常意義上所說的線程安全,像Vector這種,add、remove方法都是原子操作,不會被打斷,但也僅限於此,如果有個線程在遍歷某個Vector、有個線程同時在add這個Vector,99%的情況下都會出現ConcurrentModificationException,也就是fail-fast機制。 (4)線程非安全 這個就沒什麼好說的了,ArrayList、LinkedList、HashMap等都是線程非安全的類 8、Java中如何獲取到線程dump文件 死迴圈、死鎖、阻塞、頁面打開慢等問題,打線程dump是最好的解決問題的途徑。所謂線程dump也就是線程堆棧,獲取到線程堆棧有兩步: (1)獲取到線程的pid,可以通過使用jps命令,在Linux環境下還可以使用ps -ef | grep java (2)列印線程堆棧,可以通過使用jstack pid命令,在Linux環境下還可以使用kill -3 pid 另外提一點,Thread類提供了一個getStackTrace()方法也可以用於獲取線程堆棧。這是一個實例方法,因此此方法是和具體線程實例綁定的,每次獲取獲取到的是具體某個線程當前運行的堆棧, 9、一個線程如果出現了運行時異常會怎麼樣 如果這個異常沒有被捕獲的話,這個線程就停止執行了。另外重要的一點是:如果這個線程持有某個某個對象的監視器,那麼這個對象監視器會被立即釋放 10、如何在兩個線程之間共用數據 通過線上程之間共用對象就可以了,然後通過wait/notify/notifyAll、await/signal/signalAll進行喚起和等待,比方說阻塞隊列BlockingQueue就是為線程之間共用數據而設計的 11、sleep方法和wait方法有什麼區別 這個問題常問,sleep方法和wait方法都可以用來放棄CPU一定的時間,不同點在於如果線程持有某個對象的監視器,sleep方法不會放棄這個對象的監視器,wait方法會放棄這個對象的監視器 12、生產者消費者模型的作用是什麼 這個問題很理論,但是很重要: (1)通過平衡生產者的生產能力和消費者的消費能力來提升整個系統的運行效率,這是生產者消費者模型最重要的作用 (2)解耦,這是生產者消費者模型附帶的作用,解耦意味著生產者和消費者之間的聯繫少,聯繫越少越可以獨自發展而不需要收到相互的制約 13、ThreadLocal有什麼用 簡單說ThreadLocal就是一種以空間換時間的做法,在每個Thread裡面維護了一個以開地址法實現的ThreadLocal.ThreadLocalMap,把數據進行隔離,數據不共用,自然就沒有線程安全方面的問題了 14、為什麼wait()方法和notify()/notifyAll()方法要在同步塊中被調用 這是JDK強制的,wait()方法和notify()/notifyAll()方法在調用前都必須先獲得對象的鎖 15、wait()方法和notify()/notifyAll()方法在放棄對象監視器時有什麼區別 wait()方法和notify()/notifyAll()方法在放棄對象監視器的時候的區別在於:wait()方法立即釋放對象監視器,notify()/notifyAll()方法則會等待線程剩餘代碼執行完畢才會放棄對象監視器。 16、為什麼要使用線程池 避免頻繁地創建和銷毀線程,達到線程對象的重用。另外,使用線程池還可以根據項目靈活地控制併發的數目。 17、怎麼檢測一個線程是否持有對象監視器 我也是在網上看到一道多線程面試題才知道有方法可以判斷某個線程是否持有對象監視器:Thread類提供了一個holdsLock(Object obj)方法,當且僅當對象obj的監視器被某條線程持有的時候才會返回true,註意這是一個static方法,這意味著"某條線程"指的是當前線程。 18、synchronized和ReentrantLock的區別 synchronized是和if、else、for、while一樣的關鍵字,ReentrantLock是類,這是二者的本質區別。既然ReentrantLock是類,那麼它就提供了比synchronized更多更靈活的特性,可以被繼承、可以有方法、可以有各種各樣的類變數,ReentrantLock比synchronized的擴展性體現在幾點上: (1)ReentrantLock可以對獲取鎖的等待時間進行設置,這樣就避免了死鎖 (2)ReentrantLock可以獲取各種鎖的信息 (3)ReentrantLock可以靈活地實現多路通知 另外,二者的鎖機制其實也是不一樣的。ReentrantLock底層調用的是Unsafe的park方法加鎖,synchronized操作的應該是對象頭中mark word,這點我不能確定。 19、ConcurrentHashMap的併發度是什麼 ConcurrentHashMap的併發度就是segment的大小,預設為16,這意味著最多同時可以有16條線程操作ConcurrentHashMap,這也是ConcurrentHashMap對Hashtable的最大優勢,任何情況下,Hashtable能同時有兩條線程獲取Hashtable中的數據嗎? 20、ReadWriteLock是什麼 首先明確一下,不是說ReentrantLock不好,只是ReentrantLock某些時候有局限。如果使用ReentrantLock,可能本身是為了防止線程A在寫數據、線程B在讀數據造成的數據不一致,但這樣,如果線程C在讀數據、線程D也在讀數據,讀數據是不會改變數據的,沒有必要加鎖,但是還是加鎖了,降低了程式的性能。 因為這個,才誕生了讀寫鎖ReadWriteLock。ReadWriteLock是一個讀寫鎖介面,ReentrantReadWriteLock是ReadWriteLock介面的一個具體實現,實現了讀寫的分離,讀鎖是共用的,寫鎖是獨占的,讀和讀之間不會互斥,讀和寫、寫和讀、寫和寫之間才會互斥,提升了讀寫的性能。 21、FutureTask是什麼 這個其實前面有提到過,FutureTask表示一個非同步運算的任務。FutureTask裡面可以傳入一個Callable的具體實現類,可以對這個非同步運算的任務的結果進行等待獲取、判斷是否已經完成、取消任務等操作。當然,由於FutureTask也是Runnable介面的實現類,所以FutureTask也可以放入線程池中。 22、Linux環境下如何查找哪個線程使用CPU最長 這是一個比較偏實踐的問題,這種問題我覺得挺有意義的。可以這麼做: (1)獲取項目的pid,jps或者ps -ef | grep java,這個前面有講過 (2)top -H -p pid,順序不能改變 這樣就可以列印出當前的項目,每條線程占用CPU時間的百分比。註意這裡打出的是LWP,也就是操作系統原生線程的線程號,我筆記本山沒有部署Linux環境下的Java工程,因此沒有辦法截圖演示,網友朋友們如果公司是使用Linux環境部署項目的話,可以嘗試一下。 使用"top -H -p pid"+"jps pid"可以很容易地找到某條占用CPU高的線程的線程堆棧,從而定位占用CPU高的原因,一般是因為不當的代碼操作導致了死迴圈。 最後提一點,"top -H -p pid"打出來的LWP是十進位的,"jps pid"打出來的本地線程號是十六進位的,轉換一下,就能定位到占用CPU高的線程的當前線程堆棧了。 23、Java編程寫一個會導致死鎖的程式 第一次看到這個題目,覺得這是一個非常好的問題。很多人都知道死鎖是怎麼一回事兒:線程A和線程B相互等待對方持有的鎖導致程式無限死迴圈下去。當然也僅限於此了,問一下怎麼寫一個死鎖的程式就不知道了,這種情況說白了就是不懂什麼是死鎖,懂一個理論就完事兒了,實踐中碰到死鎖的問題基本上是看不出來的。 真正理解什麼是死鎖,這個問題其實不難,幾個步驟: (1)兩個線程裡面分別持有兩個Object對象:lock1和lock2。這兩個lock作為同步代碼塊的鎖; (2)線程1的run()方法中同步代碼塊先獲取lock1的對象鎖,Thread.sleep(xxx),時間不需要太多,50毫秒差不多了,然後接著獲取lock2的對象鎖。這麼做主要是為了防止線程1啟動一下子就連續獲得了lock1和lock2兩個對象的對象鎖 (3)線程2的run)(方法中同步代碼塊先獲取lock2的對象鎖,接著獲取lock1的對象鎖,當然這時lock1的對象鎖已經被線程1鎖持有,線程2肯定是要等待線程1釋放lock1的對象鎖的 這樣,線程1"睡覺"睡完,線程2已經獲取了lock2的對象鎖了,線程1此時嘗試獲取lock2的對象鎖,便被阻塞,此時一個死鎖就形成了。 24、怎麼喚醒一個阻塞的線程 如果線程是因為調用了wait()、sleep()或者join()方法而導致的阻塞,可以中斷線程,並且通過拋出InterruptedException來喚醒它;如果線程遇到了IO阻塞,無能為力,因為IO是操作系統實現的,Java代碼並沒有辦法直接接觸到操作系統。 25、不可變對象對多線程有什麼幫助 前面有提到過的一個問題,不可變對象保證了對象的記憶體可見性,對不可變對象的讀取不需要進行額外的同步手段,提升了代碼執行效率。 26、什麼是多線程的上下文切換 多線程的上下文切換是指CPU控制權由一個已經正在運行的線程切換到另外一個就緒並等待獲取CPU執行權的線程的過程。 27、如果你提交任務時,線程池隊列已滿,這時會發生什麼 這裡區分一下:
- 如果使用的是無界隊列LinkedBlockingQueue,也就是無界隊列的話,沒關係,繼續添加任務到阻塞隊列中等待執行,因為LinkedBlockingQueue可以近乎認為是一個無窮大的隊列,可以無限存放任務
- 如果使用的是有界隊列比如ArrayBlockingQueue,任務首先會被添加到ArrayBlockingQueue中,ArrayBlockingQueue滿了,會根據maximumPoolSize的值增加線程數量,如果增加了線程數量還是處理不過來,ArrayBlockingQueue繼續滿,那麼則會使用拒絕策略RejectedExecutionHandler處理滿了的任務,預設是AbortPolicy