本文主要參考自孫鐘秀主編的《操作系統教程》一書中關於進程和線程的部分。 進程 為什麼引入進程? 一,刻畫系統動態性,發揮系統併發性,提高資源利用率。 以C 為例,在編輯器Visual Studio Code寫了幾行代碼,保存為cs文件。在未運行狀態的下的代碼,稱之為靜態的程式。靜態的程式是一個相對的 ...
本文主要參考自孫鐘秀主編的《操作系統教程》一書中關於進程和線程的部分。
進程
為什麼引入進程?
一,刻畫系統動態性,發揮系統併發性,提高資源利用率。
以C#為例,在編輯器Visual Studio Code寫了幾行代碼,保存為cs文件。在未運行狀態的下的代碼,稱之為靜態的程式。靜態的程式是一個相對的概念。當程式運行起來,它的運行依賴於處理器(CPU)和主存儲器資源,我可以稱之為動態的程式。以該程式動態執行的過程為基本單位,抽象出一個概念,進程,即進行中的程式。
進程二字,主要是強調動態性。處理器調動進程,存儲器為進程分配進程空間,為處理器分配調動控制進程的空間,進程因此創建。當資源不足,或者需等待某個事件發生,進程暫停執行。乃至最後進程運行結果,程式退出主存儲器,進程消亡。進程的出現到消亡,無疑是在不斷地動態變化。
二,解決共用性。
當你完成一個公用函數時,該函數可以被多個程式調用。
函數A在被程式甲調用,程式甲正在等待寫入磁碟數據操作的返回,處理器空閑,為提高處理器利用效率,程式乙於此同時開始執行,進入起始點a。
此時,如何描述函數A?A處於等待點?A處於起始點a?試著引入進程的概念,將函數和程式聯繫起來,A對於程式甲構成進程A甲,A對於程式乙構成進程A乙。進程A甲處於等待點,進程A乙處於起始點。
進程(process)這個名詞最早是1960年在MIT的MULTICS和IBM公司的 TSS/360系統中提出的,直到目前對進程的定義和名稱均不統一,不同的系統中採用不同的術語名稱,例如,MIT稱進程(process),IBM公司稱任務(task)和 Univac公司稱活動(active)。可以說進程的定義多種多樣,國內學術界較為一致的看法是:進程是一個可併發執行的具有獨立功能的程式關於某個數據集合的一次執行過程,也是操作系統進行資源分配和保護的基本單位(1978 年全國操作系統學術會議)。
進程屬性:
- 結構性。進程至少有三要素組成:程式塊、數據塊、進程式控制制塊。
- 共用性。多個進程可共用相同的程式。
- 動態性。進程是動態的概念,有生命周期。程式作為一組有序指令的序列合集,是靜態概念,程式可以作為一種系統資源永遠存在。
- 獨立性。進程既是系統中資源分配和保護的基本單位,也是系統調度的獨立單位(單線程進程)。凡是未建立進程的程式,都不能作為獨立單位參與運行。通常,每個進程都可以各自獨立的速度在 CPU上推進。
- 制約性:併發進程之間存在著制約關係,進程在進行的關鍵點上需要相互等待或互通消息,以保證程式執行的可再現性和計算結果的惟一性。
- 併發性:進程可以併發地執行,進程的併發性能改進資源利用率和提高系統效率。
線程
隨著並行技術、網路技術和軟體設計技術的發展,給併發程式設計效率帶來了一系列新的問題,主要表現在:
- 進程時空的開銷大,頻繁的進程調度將耗費大量處理器時間,要為每個進程分配存儲空間限制了操作系統中進程的總數。
- 進程通信的代價大,每次通信均要涉及通信進程之間或通信進程與操作系統之間的信息傳遞。
- 進程之間的併發性粒度較粗,併發度不高,過多的進程切換和通信延遲使得細粒度的併發得不償失。
- 不適合併行計算和分佈並行計算的要求,對於多處理器和分散式的計算環境來說,進程之間大量頻繁的通信和切換,會大大降低並行度。
- 不適合客戶!伺服器計算的要求。對於 C/S結構來說,那些需要頻繁輸入輸出並同時大量計算的伺服器進程(如資料庫伺服器、事務監督程式)很難體現效率。
如果說操作系統中引入進程的目的是為了使多個程式能併發執行,以改善資源使用率和提高系統效率,那麼,在操作系統中再引入線程,則是為了減少程式併發執行時所付出的時空開銷,使得併發粒度更細、併發性更好。
進程可以分為兩項功能:一是獨立分配資源,二是被調度分派執行。分配資源仍由進程實現,無需頻繁切換。抽出線程的概念,將被調度分派執行的任務移交給線程,可以被頻繁的調度和切換。
進程和線程的相對概念
單線程(結構)進程(single threaded process):進程在任一時刻只有一個執行控制流
在單線程(結構)進程(single threaded process)中,進程和線程的概念可以不加區分。
多線程(結構)進程(multiple threaded process):
- 在同一進程中設計出多條控制流;
- 多控制流之間可以並行執行;
- 多控制流切換不需通過進程調度;
- 多控制流之間還可以通過記憶體區直接通信,降低通信開銷
多線程環境中進程的定義:進程是操作系統中進行保護和資源分配的基本單位。
它具有:
- 一個虛擬地址空間,用來容納進程的映像;
- 對處理器、其他(通信的)進程、文件和 I/O資源等的有控制有保護的訪問。
而傳統進程原先所承擔的控制流執行任務交給稱作線程的部分完成。
多線程環境中的線程概念:線程是操作系統進程中能夠獨立執行的實體(控制流),是處理器調度和分派的基本單位。線程是進程的組成部分,每個進程內允許包含多個併發執行的實體(控制流),這就是多線程。同一個進程中的所有線程共用進程獲得的主存空間和資源,但不擁有資源。
線程具有:
- 線程執行狀態(運行、就緒、等待⋯⋯)。
- 當線程不運行時,有一個受保護的線程上下文,用於存儲現場信息。所以,觀察線程的一種方式是運行在進程內一個獨立的程式計數器。
- 一個執行堆棧。
- 一個容納局部變數的主存存儲區。
線程屬性:
- 併發性:同一進程的多個線程可在一個或多個處理器上併發或並行地執行,而進程之間的併發執行演變為不同進程的線程之間的併發執行。
- 共用性:同一個進程中的所有線程共用但不擁有進程的狀態和資源,且駐留在進程的同一個主存地址空間中,可以訪問相同的數據。所以,需要有線程之間的通信和同步機制。通信和同步的實現十分方便。
- 動態性:線程是程式在相應數據集上的一次執行過程,由創建而產生,至撤銷而消亡,有其生命周期,經歷各種狀態的變化。每個進程被創建時,至少同時為其創建一個線程,需要時線程可以再創建其他線程。
- 結構性:線程是操作系統中的基本調度和分派單位,因此,它具有惟一的標識符和線程式控制制塊,其中應包含調度所需的一切私有信息。
進程可以劃分為兩個部分:資源集合和線程集合。進程要支撐線程運行,為線程提供地址空間和各種資源,它封裝了管理信息,包括對指令代碼、全局數據和 I/O狀態數據等共用部分的管理。線程封裝了執行信息,包括對CPU寄存器、執行棧(用戶棧、內核棧)和局部變數、過程調用參數、返回值等線程私有部分的管理。由於線程具有許多傳統進程所具有的特征,所以也把線程稱為輕量進程 LWP(Light-Weight Process)。