本文中出現的,內核線程,輕量級進程,用戶進程,用戶線程等概念,如果不太熟悉, 可以參見 "內核線程、輕量級進程、用戶線程三種線程概念解惑(線程≠輕量級進程)" Linux進程類別 雖然我們在區分Linux進程類別, 但是我還是想說Linux下只有一種類型的進程,那就是task_struct,當然我也 ...
本文中出現的,內核線程,輕量級進程,用戶進程,用戶線程等概念,如果不太熟悉, 可以參見
內核線程、輕量級進程、用戶線程三種線程概念解惑(線程≠輕量級進程)
Linux進程類別
雖然我們在區分Linux進程類別, 但是我還是想說Linux下只有一種類型的進程,那就是task_struct,當然我也想說linux其實也沒有線程的概念, 只是將那些與其他進程共用資源的進程稱之為線程。
一個進程由於其運行空間的不同, 從而有內核線程和用戶進程的區分, 內核線程運行在內核空間, 之所以稱之為線程是因為它沒有虛擬地址空間, 只能訪問內核的代碼和數據, 而用戶進程則運行在用戶空間, 但是可以通過中斷, 系統調用等方式從用戶態陷入內核態。
用戶進程運行在用戶空間上, 而一些通過共用資源實現的一組進程我們稱之為線程組, Linux下內核其實本質上沒有線程的概念, Linux下線程其實上是與其他進程共用某些資源的進程而已。但是我們習慣上還是稱他們為線程或者輕量級進程
因此, Linux上進程分3種,內核線程(或者叫核心進程)、用戶進程、用戶線程, 當然如果更嚴謹的,你也可以認為用戶進程和用戶線程都是用戶進程。
關於輕量級進程這個概念, 其實並不等價於線程
不同的操作系統中依據其實現的不同, 輕量級進程其實是一個不一樣的概念
三種線程概念——內核線程、輕量級進程、用戶線程
內核線程
內核線程就是內核的分身,一個分身可以處理一件特定事情。這在處理非同步事件如非同步IO時特別有用。內核線程的使用是廉價的,唯一使用的資源就是內核棧和上下文切換時保存寄存器的空間。支持多線程的內核叫做多線程內核(Multi-Threads kernel )。
內核線程只運行在內核態,不受用戶態上下文的拖累。
- 處理器競爭:可以在全系統範圍內競爭處理器資源;
- 使用資源:唯一使用的資源是內核棧和上下文切換時保持寄存器的空間
- 調度:調度的開銷可能和進程自身差不多昂貴
- 同步效率:資源的同步和數據共用比整個進程的數據同步和共用要低一些。
輕量級進程
輕量級進程(LWP)是建立在內核之上並由內核支持的用戶線程,它是內核線程的高度抽象,每一個輕量級進程都與一個特定的內核線程關聯。內核線程只能由內核管理並像普通進程一樣被調度。
輕量級進程由clone()系統調用創建,參數是CLONE_VM,即與父進程是共用進程地址空間和系統資源。
與普通進程區別:LWP只有一個最小的執行上下文和調度程式所需的統計信息。
- 處理器競爭:因與特定內核線程關聯,因此可以在全系統範圍內競爭處理器資源
- 使用資源:與父進程共用進程地址空間
- 調度:像普通進程一樣調度
輕量級線程(LWP)是一種由內核支持的用戶線程。它是基於內核線程的高級抽象,因此只有先支持內核線程,才能有LWP。每一個進程有一個或多個LWPs,每個LWP由一個內核線程支持。這種模型實際上就是恐龍書上所提到的一對一線程模型。在這種實現的操作系統中,LWP就是用戶線程。
由於每個LWP都與一個特定的內核線程關聯,因此每個LWP都是一個獨立的線程調度單元。即使有一個LWP在系統調用中阻塞,也不會影響整個進程的執行。
輕量級進程具有局限性。
- 首先,大多數LWP的操作,如建立、析構以及同步,都需要進行系統調用。系統調用的代價相對較高:需要在user mode和kernel mode中切換。
- 其次,每個LWP都需要有一個內核線程支持,因此LWP要消耗內核資源(內核線程的棧空間)。因此一個系統不能支持大量的LWP。
用戶線程
用戶線程是完全建立在用戶空間的線程庫,用戶線程的創建、調度、同步和銷毀全又庫函數在用戶空間完成,不需要內核的幫助。因此這種線程是極其低消耗和高效的。
- 處理器競爭:單純的用戶線程是建立在用戶空間,其對內核是透明的,因此其所屬進程單獨參與處理器的競爭,而進程的所有線程參與競爭該進程的資源。
- 使用資源:與所屬進程共用進程地址空間和系統資源。
- 調度:由在用戶空間實現的線程庫,在所屬進程內進行調度
LWP雖然本質上屬於用戶線程,但LWP線程庫是建立在內核之上的,LWP的許多操作都要進行系統調用,因此效率不高。而這裡的用戶線程指的是完全建立在用戶空間的線程庫,用戶線程的建立,同步,銷毀,調度完全在用戶空間完成,不需要內核的幫助。因此這種線程的操作是極其快速的且低消耗的。
上圖是最初的一個用戶線程模型,從中可以看出,進程中包含線程,用戶線程在用戶空間中實現,內核並沒有直接對用戶線程進程調度,內核的調度對象和傳統進程一樣,還是進程本身,內核並不知道用戶線程的存在。
用戶線程之間的調度由在用戶空間實現的線程庫實現。
這種模型對應著恐龍書中提到的多對一線程模型,其缺點是一個用戶線程如果阻塞在系統調用中,則整個進程都將會阻塞。
加強版的用戶線程——用戶線程+LWP
這種模型對應著恐龍書中多對多模型。
用戶線程庫還是完全建立在用戶空間中,因此用戶線程的操作還是很廉價,因此可以建立任意多需要的用戶線程。
操作系統提供了LWP作為用戶線程和內核線程之間的橋梁。LWP還是和前面提到的一樣,具有內核線程支持,是內核的調度單元,並且用戶線程的系統調用要通過LWP,因此進程中某個用戶線程的阻塞不會影響整個進程的執行。
用戶線程庫將建立的用戶線程關聯到LWP上,LWP與用戶線程的數量不一定一致。當內核調度到某個LWP上時,此時與該LWP關聯的用戶線程就被執行。
總結
Linux使用task_struct來描述進程和線程
一個進程由於其運行空間的不同, 從而有內核線程和用戶進程的區分, 內核線程運行在內核空間, 之所以稱之為線程是因為它沒有虛擬地址空間, 只能訪問內核的代碼和數據, 而用戶進程則運行在用戶空間, 不能直接訪問內核的數據但是可以通過中斷, 系統調用等方式從用戶態陷入內核態,但是內核態只是進程的一種狀態, 與內核線程有本質區別
用戶進程運行在用戶空間上, 而一些通過共用資源實現的一組進程我們稱之為線程組, Linux下內核其實本質上沒有線程的概念, Linux下線程其實上是與其他進程共用某些資源的進程而已。但是我們習慣上還是稱他們為線程或者輕量級進程
因此, Linux上進程分3種,內核線程(或者叫核心進程)、用戶進程、用戶線程, 當然如果更嚴謹的,你也可以認為用戶進程和用戶線程都是用戶進程。
內核線程擁有 進程描述符、PID、進程正文段、核心堆棧
用戶進程擁有 進程描述符、PID、進程正文段、核心堆棧 、用戶空間的數據段和堆棧
用戶線程擁有 進程描述符、PID、進程正文段、核心堆棧,同父進程共用用戶空間的數據段和堆棧