一、進程與線程 進程是處於執行期的程式,但是並不僅僅局限於一段可執行程式代碼。通常,進程還要包含其他資源,像打開的文件,掛起的信號,內核內部數據,處理器狀態,一個或多個具有記憶體映射的記憶體地址空間及一個或多個執行線程,當然還包括用來存放全局變數的數據段等。在Linux內核中,進程也通常叫做任務。 執行 ...
一、進程與線程
進程是處於執行期的程式,但是並不僅僅局限於一段可執行程式代碼。通常,進程還要包含其他資源,像打開的文件,掛起的信號,內核內部數據,處理器狀態,一個或多個具有記憶體映射的記憶體地址空間及一個或多個執行線程,當然還包括用來存放全局變數的數據段等。在Linux內核中,進程也通常叫做任務。
執行線程,簡稱線程,是在進程中活動的對象。每個線程都擁有一個獨立的程式計數器、進程棧和一組進程寄存器。內核調度的對象是線程,而不是進程。在傳統的UNIX系統中,一個進程只包含一個線程,但在現在的系統中,包含多個線程的多線程程式司空見慣。在Linux系統中,線程和進程並不特別區分,對Linux而言,線程是一種特殊的進程。
Linux實現線程的機制很獨特。從內核角度來說,它並沒有線程這個概念。Linux把所有的線程都當做進程來實現。內核並沒有準備特別的調度演算法或是定義特別的數據結構來表徵線程。相反,線程僅僅被視為一個與其他進程共用某些資源的進程。每個線程都擁有唯一隸屬於自己的 task_struct ,所以在內核中,它看起來就像是一個普通的進程。
二、進程描述符及任務結構
1)進程描述符
內核把進程的列表存放在任務隊列中,任務隊列是一個雙向迴圈鏈表如圖1所示。鏈表中每一項都是類型為 task_struct 的結構體,被稱為 進程描述符,該結構定義在 <linux/sched.h>文件中。進程描述符中包含一個具體進程的所有信息。進程描述符中包含的數據能完整地描述一個正在執行的程式:它打開的文件、進程的地址空間、掛起的信號、進程的狀態以及其他信息。
圖1 進程描述符及任務隊列
Linux通過slab分配器分配 task_struct 結構,這樣能達到對象復用和緩存著色的目的,為了找到 task_struct,只需在棧底(對於向下增長的棧)或棧頂(對於向上增長的棧)創建一個新的結構 struct thread_info,該結構存放著指向任務實際 task_struct 的指針。結構的定義如下:
struct thread_info{ struct task_struct *task; struct exec_domain *exec_domain; _u32 flags; _u32 status; _u32 cpu; int preempt_count; mm_segment_t addr_limit; struct restart_block restart_block; void *sysenter_return; int uaccess_err; };
2)進程狀態
進程描述符中的 state 域描述了進程的當前狀態。系統中的每個進程都必然處於五種進程狀態中的一種:
TASK_RUNNING(運行) | 表示進程正在執行,或者在運行隊列中等待執行; |
TASK_INTERRUPTIBLE(可中斷) |
表示進程正在睡眠(被阻塞),等待某些條件的達成。一旦這些條件達成,內核就會把進程狀態設置為運行,處於此狀態的進程也會因為接收到信號而提前被喚醒並隨時準備投入運行; |
TASK_UNINTERRUPTIBLE(不可中斷) | 除了就算接收到信號也不會被喚醒或者準備投入運行外,這個狀態與可中斷狀態相同。這個狀態通常在進程必須等待時不受干擾或者等待事件很快就會發生時出現; |
__TASK_TRACED | 被其他進程跟蹤的進程; |
__TASK_STOPPED(停止) | 進程停止執行,進程沒有投入運行也不能投入運行。通常,這種狀態發生在接收到 SIGSTOP、SIGTSTP、SIGTTIN、SIGTTOU等信號的時候。此外,在調試期間接收到任何信號,都會使進程進入這種狀態。 |
可以使用 set_task_state(task,state) 函數來設置當前進程狀態:
set_task_state(task,state); // 將進程task的狀態設置為 state
三、進程創建
linux使用 fork() 和 exec() 函數來創建進程。首先,使用 fork()函數拷貝當前進程創建一個子進程,這個子進程與父進程之間的區別僅在於 PID、PPID 以及某些資源統計量不同;然後調用 exec() 函數,把當前進程映像替換成新的進程文件,得到一個新程式。
傳統的 fork() 系統調用直接把所有的資源複製給新創建的進程。這種實現過於簡單且效率低下,因為它拷貝的數據也許並不共用。Linux 的 fork() 使用寫時拷貝頁實現,寫時拷貝是一種可以推遲甚至免除拷貝數據的技術。內核此時並不複製整個進程地址空間,而是讓父進程和子進程共用同一個拷貝。只有在需要寫入的時候,數據才會被覆制,從而使各個進程擁有各自的拷貝。也就是說,資源的複製只有在需要寫入的時候才會進行,在此之前,只是以只讀的方式共用。這種技術使得地址空間上的頁的拷貝被推遲到實際發生寫入的時候才進行。在頁根本不會被寫入的情況下,它們就無須複製了。
四、進程終結
調用 do_exit() 來終結進程。當一個進程被終結時,內核必須釋放它所占有的資源,並告知其父進程。
在調用 do_exit() 之後,儘管線程已經僵死不能再運行了,但是系統還是保留了它的進程描述符。在父進程獲得已終結的子進程的信息後,或者通知內核它並不關註那些信息後,子進程的 task_struct 結構才被釋放。調用 release_task() 來釋放進程描述符。