《程式員的自我修養》學習筆記——揭秘源文件到可執行文件的編譯過程【第一彈】

来源:https://www.cnblogs.com/Only-xiaoxiao/archive/2023/03/03/17174043.html
-Advertisement-
Play Games

程式代碼到可執行程式編譯鏈接過程 預編譯 以c++/c 語言為例,預編譯階段的工作有以下幾點: 處理所有#define 及條件預編譯指令(如 #if,#ifdef.....),並展開所有巨集定義。 刪除所有註釋("//" ,"/**/")。 處理 "#include",將被包含文件插入該預編譯指令位置 ...


程式代碼到可執行程式編譯鏈接過程

預編譯

以c++/c 語言為例,預編譯階段的工作有以下幾點:

  1. 處理所有#define 及條件預編譯指令(如 #if,#ifdef.....),並展開所有巨集定義。
  2. 刪除所有註釋("//" ,"/**/")。
  3. 處理 "#include",將被包含文件插入該預編譯指令位置。(整過過程遞歸進行,因為被包含文件也可能包含其他文件)
  4. 添加行號與文件標識。(用於調試時產生的編譯錯誤及報錯等信息)
預編譯過程相當於如下命令:

gcc -E hello.c -o hello.i  (-E 表示只進行預編譯)
或者
cpp hello.c > hello.i
編譯

編譯過程可以分為如下步驟:

image

  1. 掃描

  2. 詞法分析

    ​ 運用一種類似於有限狀態機的演算法,將源代碼的字元序列分割為一系列記號(關鍵字、標識符、字面常量、特殊符號等)。【一個名叫lex的程式可以完成這項任務】

  3. 語法分析

    ​ 對由掃描器產生的記號進行語法分析,進而產生語法樹。(採用上下文無關的語法分析手段)【同樣一個叫做yacc的工具也可完成這項任務】

  4. 語義分析

    ​ 包括靜態語義(如聲明和類型的匹配、類型的轉化等)和動態語義(運行階段才能確定)。

  5. 源代碼優化【這階段也包括中間代碼(例如llvm 中的 IR)的生成】

    ​ 由於直接在語法樹上作優化難度較大,源代碼優化器通常將語法樹轉化為中間代碼,再進行優化。

  6. 目標代碼生成和目標代碼優化

    ​ 代碼生成器將中間代碼轉化成目標機器代碼。

    ​ 接著目標代碼優化器對上述目標代碼進行優化。(如選擇合適的定址方式,刪除多餘指令等)

編譯過程相當於如下命令:
gcc -S hello.i -o hello.s (.s 是彙編輸出文件的尾碼)
或者
gcc -S hello.c -o hello.s  (預編譯和編譯合併了)

彙編

彙編器將彙編代碼轉變為機器可以執行的指令。(生成可重定位文件 .o)

編譯過程相當於如下命令:
as  hello.s -o hello.o 
或者
gcc -c hello.s -o hello.o 
或者
gcc -c hello.c -hello.o (上面三個過程一步完成)

鏈接

對於一個複雜的軟體,將每個源代碼模塊獨立地翻譯,然後組裝。這個組裝模塊的過程就是鏈接。(主要包括地址和空間分配、符號決議、重定位等步驟)

最基本的靜態鏈接過程:每個模塊的源代碼文件(如.c)文件經過編譯器編譯成可重定位文件(Object File,擴展名為.o或.obj),可重定位文件和庫一起鏈接形成最終可執行文件(.out)。

image

鏈接過程相當於如下命令:

gcc  hello.o -o hello.out 
以如下代碼為例:

#include<stdio.h>

int main()
{
printf("hello world");
return 0;
}
預編譯(hello.i) 編譯(hello.s)
image image
彙編(hello.o) 鏈接(hello.out)
image image

可重定位文件 [.o 或 .obj]

可重定位文件的格式

目前PC平臺流行的可執行文件格式(Executable)主要是:

PE(Windows)和 ELF(Linux)。【兩者都發源自 COFF 可執行文件格式】

另外的如ios 是 Mach-O格式android 是dex格式。

而可重定位文件是源代碼編譯後但未進行鏈接的中間文件。(Windows 下的.obj 和 Linux 下的.o)。

因此,可重定位文件和可執行文件的內容和結構是很相似的。(可以廣義的將二者看作一種類型的文件)

同時動態鏈接庫(Windows 下的.dll 和 Linux 下的.so)和 靜態鏈接庫(Windows 下的.lib 和 Linux 下的.a)文件都可按照可執行文件格式存儲。

【小技巧: Linux 下可使用file命令查看相應的文件格式】

程式的指令和數據分開存放的好處:

  1. 程式裝載後,數據和指令分別映射到兩個虛存區域。數據區域對進程而言是可讀寫的,指令區域對於進程而言是只讀的。這樣可以防止程式指令被有意或者無意地更改。
  2. 利於提高程式的局部性。(提高緩存的命中率)
  3. 當系統中運行著多個該程式副本時,記憶體中只需要保存一份該程式的指令部分。(最重要的原因)

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 摘要:本文將以Sermant的SpringBoot 註冊插件的性能測試及優化過程為例,分享在Java Agent場景如何進行更好的性能測試優化及在Java Agent下需要著重註意的性能陷阱。 作者:欒文飛 高級軟體工程師 一、背景介紹 Sermant是一個主打服務治理領域的Java Agent框架 ...
  • PHP語言線上運行編譯,是一款可線上編程編輯器,在編輯器上輸入PHP語言代碼,點擊運行,可線上編譯運行PHP語言,PHP語言代碼線上運行調試,PHP語言線上編譯,可快速線上測試您的PHP語言代碼,線上編譯PHP語言代碼發現是否存在錯誤,如果代碼測試通過,將會輸出編譯後的結果。 該線上工具由IT寶庫提 ...
  • Vue 3 備忘清單 Vue 3漸進式 JavaScript 框架 Vue 3 備忘清單的快速參考列表,包含常用 API 和示例入門,為開發人員分享快速參考備忘單。 開發速查表大綱 入門 介紹 創建應用 應用實例 通過 CDN 使用 Vue 使用 ES 模塊構建版本 模板語法 文本插值 原始 HTM ...
  • 前言 TCP三次握手和四次揮手是面試題的熱門考點,它們分別對應TCP的連接和釋放過程 1.TCP通信包含那幾步? TCP通信過程包括三個步驟:建立TCP連接通道,傳輸數據,斷開TCP連接通道 上圖主要包括三部分:*建立連接、傳輸數據、斷開連接。* 建立TCP連接很簡單,通過三次握手便可建立連接。 建 ...
  • 1.單線程 單線程:只有一個線程,即CPU只執行一個任務(一個線程) 1 class Hero{ 2 String name; 3 Hero(String name){ 4 this.name = name; 5 } 6 public void show(){ 7 System.out.printl ...
  • #使用引用 #include <iostream> using namespace std; struct Time{ int h; int m; int s; }; void timeCompute(Time &t, int sec){ //引用作為形參 t.m = t.m + (t.s + se ...
  • Problem description unsigned char key[16] = {0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01}; unsigned ...
  • 日常開發中,基於 Redis 天然支持分散式鎖,大家線上上分散式項目中都使用過 Redis 鎖。本文主要針對日常開發中加鎖過程中某些異常場景進行講解與分析。本文講解示例代碼都在 https://github.com/wayn111/newbee-mall-pro 項目 test 目錄下 RedisL ...
一周排行
    -Advertisement-
    Play Games
  • GoF之工廠模式 @目錄GoF之工廠模式每博一文案1. 簡單說明“23種設計模式”1.2 介紹工廠模式的三種形態1.3 簡單工廠模式(靜態工廠模式)1.3.1 簡單工廠模式的優缺點:1.4 工廠方法模式1.4.1 工廠方法模式的優缺點:1.5 抽象工廠模式1.6 抽象工廠模式的優缺點:2. 總結:3 ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 本章將和大家分享ES的數據同步方案和ES集群相關知識。廢話不多說,下麵我們直接進入主題。 一、ES數據同步 1、數據同步問題 Elasticsearch中的酒店數據來自於mysql資料庫,因此mysql數據發生改變時,Elasticsearch也必須跟著改變,這個就是Elasticsearch與my ...
  • 引言 在我們之前的文章中介紹過使用Bogus生成模擬測試數據,今天來講解一下功能更加強大自動生成測試數據的工具的庫"AutoFixture"。 什麼是AutoFixture? AutoFixture 是一個針對 .NET 的開源庫,旨在最大程度地減少單元測試中的“安排(Arrange)”階段,以提高 ...
  • 經過前面幾個部分學習,相信學過的同學已經能夠掌握 .NET Emit 這種中間語言,並能使得它來編寫一些應用,以提高程式的性能。隨著 IL 指令篇的結束,本系列也已經接近尾聲,在這接近結束的最後,會提供幾個可供直接使用的示例,以供大伙分析或使用在項目中。 ...
  • 當從不同來源導入Excel數據時,可能存在重覆的記錄。為了確保數據的準確性,通常需要刪除這些重覆的行。手動查找並刪除可能會非常耗費時間,而通過編程腳本則可以實現在短時間內處理大量數據。本文將提供一個使用C# 快速查找並刪除Excel重覆項的免費解決方案。 以下是實現步驟: 1. 首先安裝免費.NET ...
  • C++ 異常處理 C++ 異常處理機制允許程式在運行時處理錯誤或意外情況。它提供了捕獲和處理錯誤的一種結構化方式,使程式更加健壯和可靠。 異常處理的基本概念: 異常: 程式在運行時發生的錯誤或意外情況。 拋出異常: 使用 throw 關鍵字將異常傳遞給調用堆棧。 捕獲異常: 使用 try-catch ...
  • 優秀且經驗豐富的Java開發人員的特征之一是對API的廣泛瞭解,包括JDK和第三方庫。 我花了很多時間來學習API,尤其是在閱讀了Effective Java 3rd Edition之後 ,Joshua Bloch建議在Java 3rd Edition中使用現有的API進行開發,而不是為常見的東西編 ...
  • 框架 · 使用laravel框架,原因:tp的框架路由和orm沒有laravel好用 · 使用強制路由,方便介面多時,分多版本,分文件夾等操作 介面 · 介面開發註意欄位類型,欄位是int,查詢成功失敗都要返回int(對接java等強類型語言方便) · 查詢介面用GET、其他用POST 代碼 · 所 ...
  • 正文 下午找企業的人去鎮上做貸後。 車上聽同事跟那個司機對罵,火星子都快出來了。司機跟那同事更熟一些,連我在內一共就三個人,同事那一手指桑罵槐給我都聽愣了。司機也是老社會人了,馬上聽出來了,為那個無辜的企業經辦人辯護,實際上是為自己辯護。 “這個事情你不能怪企業。”“但他們總不能讓銀行的人全權負責, ...