《程式員的自我修養》學習筆記——揭秘源文件到可執行文件的編譯過程【第一彈】

来源:https://www.cnblogs.com/Only-xiaoxiao/archive/2023/03/03/17174043.html
-Advertisement-
Play Games

程式代碼到可執行程式編譯鏈接過程 預編譯 以c++/c 語言為例,預編譯階段的工作有以下幾點: 處理所有#define 及條件預編譯指令(如 #if,#ifdef.....),並展開所有巨集定義。 刪除所有註釋("//" ,"/**/")。 處理 "#include",將被包含文件插入該預編譯指令位置 ...


程式代碼到可執行程式編譯鏈接過程

預編譯

以c++/c 語言為例,預編譯階段的工作有以下幾點:

  1. 處理所有#define 及條件預編譯指令(如 #if,#ifdef.....),並展開所有巨集定義。
  2. 刪除所有註釋("//" ,"/**/")。
  3. 處理 "#include",將被包含文件插入該預編譯指令位置。(整過過程遞歸進行,因為被包含文件也可能包含其他文件)
  4. 添加行號與文件標識。(用於調試時產生的編譯錯誤及報錯等信息)
預編譯過程相當於如下命令:

gcc -E hello.c -o hello.i  (-E 表示只進行預編譯)
或者
cpp hello.c > hello.i
編譯

編譯過程可以分為如下步驟:

image

  1. 掃描

  2. 詞法分析

    ​ 運用一種類似於有限狀態機的演算法,將源代碼的字元序列分割為一系列記號(關鍵字、標識符、字面常量、特殊符號等)。【一個名叫lex的程式可以完成這項任務】

  3. 語法分析

    ​ 對由掃描器產生的記號進行語法分析,進而產生語法樹。(採用上下文無關的語法分析手段)【同樣一個叫做yacc的工具也可完成這項任務】

  4. 語義分析

    ​ 包括靜態語義(如聲明和類型的匹配、類型的轉化等)和動態語義(運行階段才能確定)。

  5. 源代碼優化【這階段也包括中間代碼(例如llvm 中的 IR)的生成】

    ​ 由於直接在語法樹上作優化難度較大,源代碼優化器通常將語法樹轉化為中間代碼,再進行優化。

  6. 目標代碼生成和目標代碼優化

    ​ 代碼生成器將中間代碼轉化成目標機器代碼。

    ​ 接著目標代碼優化器對上述目標代碼進行優化。(如選擇合適的定址方式,刪除多餘指令等)

編譯過程相當於如下命令:
gcc -S hello.i -o hello.s (.s 是彙編輸出文件的尾碼)
或者
gcc -S hello.c -o hello.s  (預編譯和編譯合併了)

彙編

彙編器將彙編代碼轉變為機器可以執行的指令。(生成可重定位文件 .o)

編譯過程相當於如下命令:
as  hello.s -o hello.o 
或者
gcc -c hello.s -o hello.o 
或者
gcc -c hello.c -hello.o (上面三個過程一步完成)

鏈接

對於一個複雜的軟體,將每個源代碼模塊獨立地翻譯,然後組裝。這個組裝模塊的過程就是鏈接。(主要包括地址和空間分配、符號決議、重定位等步驟)

最基本的靜態鏈接過程:每個模塊的源代碼文件(如.c)文件經過編譯器編譯成可重定位文件(Object File,擴展名為.o或.obj),可重定位文件和庫一起鏈接形成最終可執行文件(.out)。

image

鏈接過程相當於如下命令:

gcc  hello.o -o hello.out 
以如下代碼為例:

#include<stdio.h>

int main()
{
printf("hello world");
return 0;
}
預編譯(hello.i) 編譯(hello.s)
image image
彙編(hello.o) 鏈接(hello.out)
image image

可重定位文件 [.o 或 .obj]

可重定位文件的格式

目前PC平臺流行的可執行文件格式(Executable)主要是:

PE(Windows)和 ELF(Linux)。【兩者都發源自 COFF 可執行文件格式】

另外的如ios 是 Mach-O格式android 是dex格式。

而可重定位文件是源代碼編譯後但未進行鏈接的中間文件。(Windows 下的.obj 和 Linux 下的.o)。

因此,可重定位文件和可執行文件的內容和結構是很相似的。(可以廣義的將二者看作一種類型的文件)

同時動態鏈接庫(Windows 下的.dll 和 Linux 下的.so)和 靜態鏈接庫(Windows 下的.lib 和 Linux 下的.a)文件都可按照可執行文件格式存儲。

【小技巧: Linux 下可使用file命令查看相應的文件格式】

程式的指令和數據分開存放的好處:

  1. 程式裝載後,數據和指令分別映射到兩個虛存區域。數據區域對進程而言是可讀寫的,指令區域對於進程而言是只讀的。這樣可以防止程式指令被有意或者無意地更改。
  2. 利於提高程式的局部性。(提高緩存的命中率)
  3. 當系統中運行著多個該程式副本時,記憶體中只需要保存一份該程式的指令部分。(最重要的原因)

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 摘要:本文將以Sermant的SpringBoot 註冊插件的性能測試及優化過程為例,分享在Java Agent場景如何進行更好的性能測試優化及在Java Agent下需要著重註意的性能陷阱。 作者:欒文飛 高級軟體工程師 一、背景介紹 Sermant是一個主打服務治理領域的Java Agent框架 ...
  • PHP語言線上運行編譯,是一款可線上編程編輯器,在編輯器上輸入PHP語言代碼,點擊運行,可線上編譯運行PHP語言,PHP語言代碼線上運行調試,PHP語言線上編譯,可快速線上測試您的PHP語言代碼,線上編譯PHP語言代碼發現是否存在錯誤,如果代碼測試通過,將會輸出編譯後的結果。 該線上工具由IT寶庫提 ...
  • Vue 3 備忘清單 Vue 3漸進式 JavaScript 框架 Vue 3 備忘清單的快速參考列表,包含常用 API 和示例入門,為開發人員分享快速參考備忘單。 開發速查表大綱 入門 介紹 創建應用 應用實例 通過 CDN 使用 Vue 使用 ES 模塊構建版本 模板語法 文本插值 原始 HTM ...
  • 前言 TCP三次握手和四次揮手是面試題的熱門考點,它們分別對應TCP的連接和釋放過程 1.TCP通信包含那幾步? TCP通信過程包括三個步驟:建立TCP連接通道,傳輸數據,斷開TCP連接通道 上圖主要包括三部分:*建立連接、傳輸數據、斷開連接。* 建立TCP連接很簡單,通過三次握手便可建立連接。 建 ...
  • 1.單線程 單線程:只有一個線程,即CPU只執行一個任務(一個線程) 1 class Hero{ 2 String name; 3 Hero(String name){ 4 this.name = name; 5 } 6 public void show(){ 7 System.out.printl ...
  • #使用引用 #include <iostream> using namespace std; struct Time{ int h; int m; int s; }; void timeCompute(Time &t, int sec){ //引用作為形參 t.m = t.m + (t.s + se ...
  • Problem description unsigned char key[16] = {0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01}; unsigned ...
  • 日常開發中,基於 Redis 天然支持分散式鎖,大家線上上分散式項目中都使用過 Redis 鎖。本文主要針對日常開發中加鎖過程中某些異常場景進行講解與分析。本文講解示例代碼都在 https://github.com/wayn111/newbee-mall-pro 項目 test 目錄下 RedisL ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...