本文內容整理自 **博學谷狂野架構師 ** 多線程概述 基礎概念 進程和線程 進程是程式運行資源分配的最小單位 進程是操作系統進行資源分配的最小單位,其中資源包括:CPU、記憶體空間、磁碟IO等,同一進程中的多條線程共用該進程中的全部系統資源,而進程和進程之間是相互獨立的。進程是具有一定獨立功能的 ...
本文內容整理自 **博學谷狂野架構師 **
多線程概述
基礎概念
進程和線程
進程是程式運行資源分配的最小單位
進程是操作系統進行資源分配的最小單位,其中資源包括:CPU、記憶體空間、磁碟IO等,同一進程中的多條線程共用該進程中的全部系統資源,而進程和進程之間是相互獨立的。進程是具有一定獨立功能的程式關於某個數據集合上的一次運行活動,進程是系統進行資源分配和調度的一個獨立單位。
進程是程式在電腦上的一次執行活動。當你運行一個程式,你就啟動了一個進程。顯然,程式是死的、靜態的,進程是活的、動態的。進程可以分為系統進程和用戶進程。凡是用於完成操作系統的各種功能的進程就是系統進程,它們就是處於運行狀態下的操作系統本身,用戶進程就是所有由你啟動的進程。
線程是CPU調度的最小單位,必須依賴於進程而存在
線程是進程的一個實體,是CPU調度和分派的基本單位,它是比進程更小的、能獨立運行的基本單位。線程自己基本上不擁有系統資源,只擁有一點在運行中必不可少的資源(如程式計數器,一組寄存器和棧),但是它可與同屬一個進程的其他的線程共用進程所擁有的全部資源。
線程無處不在
任何一個程式都必須要創建線程,特別是Java不管任何程式都必須啟動一個main函數的主線程; Java Web開發裡面的定時任務、定時器、JSP和 Servlet、非同步消息處理機制,遠程訪問介面RM等,任何一個監聽事件, onclick的觸發事件等都離不開線程和併發的知識。
CPU核心數和線程數的關係
多核心:也指單晶元多處理器( Chip Multiprocessors,簡稱CMP),CMP是由美國斯坦福大學提出的,其思想是將大規模並行處理器中的SMP(對稱多處理器)集成到同一晶元內,各個處理器並行執行不同的進程。這種依靠多個CPU同時並行地運行程式是實現超高速計算的一個重要方向,稱為並行處理
多線程: Simultaneous Multithreading.簡稱SMT.讓同一個處理器上的多個線程同步執行並共用處理器的執行資源。
核心數、線程數:目前主流CPU都是多核的。增加核心數目就是為了增加線程數,因為操作系統是通過線程來執行任務的,一般情況下它們是1:1對應關係,也就是說四核CPU一般擁有四個線程。但 Intel引入超線程技術後,使核心數與線程數形成1:2的關係
CPU時間片輪轉機制
為什麼感受不到CPU線程數的限制
我們平時在開發的時候,感覺並沒有受cpu核心數的限制,想啟動線程就啟動線程,哪怕是在單核CPU上,為什麼?這是因為操作系統提供了一種CPU時間片輪轉機制。
時間片輪轉調度是一種最古老、最簡單、最公平且使用最廣的演算法,又稱RR調度。每個進程被分配一個時間段,稱作它的時間片,即該進程允許運行的時間。
什麼是CPU輪轉機制
百度百科對CPU時間片輪轉機制原理解釋如下:
如果在時間片結束時進程還在運行,則CPU將被剝奪並分配給另一個進程。如果進程在時間片結束前阻塞或結來,則CPU當即進行切換。調度程式所要做的就是維護一張就緒進程列表,當進程用完它的時間片後,它被移到隊列的末尾
時間片長度
時間片輪轉調度中唯一有趣的一點是時間片的長度。從一個進程切換到另一個進程是需要定時間的,包括保存和裝入寄存器值及記憶體映像,更新各種表格和隊列等。假如進程切( processwitch),有時稱為上下文切換( context switch),需要5ms,再假設時間片設為20ms,則在做完20ms有用的工作之後,CPU將花費5ms來進行進程切換。CPU時間的20%被浪費在了管理開銷上了。
為了提高CPU效率,我們可以將時間片設為5000ms。這時浪費的時間只有0.1%。但考慮到在一個分時系統中,如果有10個交互用戶幾乎同時按下回車鍵,將發生什麼情況?假設所有其他進程都用足它們的時間片的話,最後一個不幸的進程不得不等待5s才獲得運行機會。多數用戶無法忍受一條簡短命令要5才能做出響應,同樣的問題在一臺支持多道程式的個人電腦上也會發
結論可以歸結如下:時間片設得太短會導致過多的進程切換,降低了CPU效率:而設得太長又可能引起對短的交互請求的響應變差。將時間片設為100ms通常是一個比較合理的折衷。
在CPU死機的情況下,其實大家不難發現當運行一個程式的時候把CPU給弄到了100%再不重啟電腦的情況下,其實我們還是有機會把它KILL掉的,我想也正是因為這種機制的緣故。
澄清並行和併發
我們舉個例子,如果有條高速公路A上面併排有8條車道,那麼最大的並行車輛就是8輛此條高速公路A同時併排行走的車輛小於等於8輛的時候,車輛就可以並行運行。CPU也是這個原理,一個CPU相當於一個高速公路A,核心數或者線程數就相當於併排可以通行的車道;而多個CPU就相當於併排有多條高速公路,而每個高速公路併排有多個車道。
當談論併發的時候一定要加個單位時間,也就是說單位時間內併發量是多少?離開了單位時間其實是沒有意義的。
俗話說,一心不能二用,這對電腦也一樣,原則上一個CPU只能分配給一個進程,以便運行這個進程。我們通常使用的電腦中只有一個CPU,也就是說只有一顆心,要讓它一心多用同時運行多個進程,就必須使用併發技術。實現併發技術相當複雜,最容易理解的是“時間片輪轉進程調度演算法”。
綜合來說:
併發:指應用能夠交替執行不同的任務,比如單CPU核心下執行多線程並非是同時執行多個任務,如果你開兩個線程執行,就是在你幾乎不可能察覺到的速度不斷去切換這兩個任務,已達到"同時執行效果",其實並不是的,只是電腦的速度太快,我們無法察覺到而已.
並行:指應用能夠同時執行不同的任務,例:吃飯的時候可以邊吃飯邊打電話,這兩件事情可以同時執行
兩者區別:一個是交替執行,一個是同時執行.
感覺上是同時發生的,但是微觀上還是有區別的,並行是同意時刻發生的,併發是同一時刻交替執行
高併發的意義
由於多核多線程的CPU的誕生,多線程、高併發的編程越來越受重視和關註。多線程可以給程式帶來如下好處。
1. 充分利用CPU的資源
從上面的CPU的介紹,可以看的出來,現在市面上沒有CPU的內核不使用多線程併發機制的,特別是伺服器還不止一個CPU,如果還是使用單線程的技術做思路,明顯就out了。因為程式的基本調度單元是線程,並且一個線程也只能在一個CPU的一個核的一個線程跑,如果你是個i3的CPU的話,最差也是雙核心4線程的運算能力:如果是一個線程的程式的話,那是要浪費3/4的CPU性能:如果設計一個多線程的程式的話,那它就可以同時在多個CPU的多個核的多個線程上跑,可以充分地利用CPU,減少CPU的空閑時間,發揮它的運算能力,提高併發量。
就像我們平時坐地鐵一樣,很多人坐長線地鐵的時候都在認真看書,而不是為了坐地鐵而坐地鐵,到家了再去看書,這樣你的時間就相當於有了兩倍。這就是為什麼有些人時間很充裕,而有些人老是說沒時間的一個原因,工作也是這樣,有的時候可以併發地去做幾件事情,充分利用我們的時間,CPU也是一樣,也要充分利用。
2. 加快響應用戶的時間
比如我們經常用的迅雷下載,都喜歡多開幾個線程去下載,誰都不願意用一個線程去下載,為什麼呢?答案很簡單,就是多個線程下載快啊。
我們在做程式開發的時候更應該如此,特別是我們做互聯網項目,網頁的響應時間若提升1s,如果流量大的話,就能增加不少轉換量。做過高性能web前端調優的都知道,要將靜態資源地址用兩三個子功能變數名稱去載入,為什麼?因為每多一個子功能變數名稱,瀏覽器在載入你的頁面的時候就會多開幾個線程去載入你的頁面資源,提升網站的響應速度。多線程,高併發真的是無處不在。
3. 可以使你的代碼模塊化,非同步化,簡單化
例如我們實現電商系統,下訂單和給用戶發送簡訊、郵件就可以進行拆分,將給用戶發送簡訊、郵件這兩個步驟獨立為單獨的模塊,並交給其他線程去執行。這樣既增加了非同步的操作,提升了系統性能,又使程式模塊化,清晰化和簡單化。
多線程應用開發的好處還有很多,大家在日後的代碼編寫過程中可以慢慢體會它的魅力。
多線程程式需要註意事項
1. 線程之間的安全性
從前面的章節中我們都知道,在同一個進程裡面的多線程是資源共用的,也就是都可以訪問同一個記憶體地址當中的一個變數。例如:若每個線程中對全局變數、靜態變數只有讀操作,而無寫操作,一般來說,這個全局變數是線程安全的:若有多個線程同時執行寫操作,一般都需要考慮線程同步,否則就可能影響線程安全。
2. 線程之間的死鎖
為瞭解決線程之間的安全性引入了Java的鎖機制,而一不小心就會產生Java線程死鎖的多線程問題,因為不同的線程都在等待那些根本不可能被釋放的鎖,從而導致所有的工作都無法完成。假設有兩個線程,分別代表兩個饑餓的人,他們必須共用刀叉並輪流吃飯。他們都需要獲得兩個鎖:共用刀和共用叉的鎖。
假如線程A獲得了刀,而線程B獲得了叉。線程A就會進入阻塞狀態來等待獲得叉,而線程B則阻塞來等待線程A所擁有的刀。這隻是人為設計的例子,但儘管在運行時很難探測到,這類情況卻時常發生
3. 線程太多了會將伺服器資源耗盡形成死機當機
線程數太多有可能造成系統創建大量線程而導致消耗完系統記憶體以及CPU的“過渡切換”,造成系統的死機,那麼我們該如何解決這類問題呢?
某些系統資源是有限的,如文件描述符。多線程程式可能耗盡資源,因為每個線程都可能希望有一個這樣的資源。如果線程數相當大,或者某個資源的侯選線程數遠遠超過了可用的資源數則最好使用資源池。一個最好的示例是資料庫連接池。只要線程需要使用一個資料庫連接,它就從池中取出一個,使用以後再將它返回池中。資源池也稱為資源庫。
多線程應用開發的註意事項很多,希望大家在日後的工作中可以慢慢體會它的危險所在。
本文由
傳智教育博學谷狂野架構師
教研團隊發佈。如果本文對您有幫助,歡迎
關註
和點贊
;如果您有任何建議也可留言評論
或私信
,您的支持是我堅持創作的動力。轉載請註明出處!