Linux中的目標文件

来源:https://www.cnblogs.com/baobaobashi/archive/2023/01/23/17063448.html
-Advertisement-
Play Games

eunomia-bpf 0.3.0 發佈:只需編寫內核態代碼,輕鬆構建、打包、發佈完整的 eBPF 應用 eunomia-bpf 簡介 eBPF 源於 BPF,本質上是處於內核中的一個高效與靈活的虛擬機組件,以一種安全的方式在許多內核 hook 點執行位元組碼,開發者可基於 eBPF 開發性能分析工具 ...


一、目標文件的格式

Linux:ELF(Executable Linkable Format)
Windows:PE(Portable Executable)

COFF格式:PE和ELF都是源自COFF格式,Unix最早是a.out文件格式,為瞭解決共用庫問題,引入了COFF格式。

  • 引入了段的機制,不同目標文件可以擁有不同數量的段和類型
  • 定義了調試數據格式

二、目標文件是什麼?

目標文件就是與那代碼編譯後但未能鏈接的那些中間文件。(Linux中的.o,Windows中的.obj)

4種ELF文件

image

三、Linux中的目標文件

目標文件是經過了預處理、編譯、彙編產生的ELF格式的文件。目標文件將代碼、數據以及一些連接時需要的信息,通過 “節”或 “段” 存儲。
分段的原因:

  • 數據和指令映射到兩個虛存空間,這兩個空間的許可權不同,可以防止程式指令被改寫。
  • 現代CPU緩存一般被設計成數據緩存和指令緩存分離,分段有利於提高程式的局部性。
  • 程式中如果運行著許多副本,記憶體中只需要保存一份程式的指令部分。

主要分為兩種段,代碼段(.text)和數據段(.data,.bss)

名稱 存儲內容
局部變數、函數參數、返回地址
動態分配記憶體
BSS段 未初始化或者初始值為0的全局變數或者局部靜態變數
數據段(.test) 已初始化且初始化值不為0的全局變數或者局部靜態變數
代碼段 (.data) 可執行代碼、字元串字面值、只讀變數

示例代碼

#include<stdio.h>
int data1;		//.bss
int data2 = 0;		//.bss
int data3 = 10;		//.data

static int data4;		//.bss
static int data5 = 0;	//.bss
static int data6 = 20;		//.data

int main()			//.text
{
    int a;			//.text
    int b = 0;			//.text
    int c = 10;			//.text

    static int data7;		//.bss
    static int data8 = 0;	//.bss
    static int data9 = 40;	//.data

    return 0;
}

image

四、深入 .o文件

編譯:gcc -c main.c
查看文件解構:objdump -h main.o

image
Size:段的長度
File off:段的位置
image

4.1 代碼段

objdump -s -d main.o

image

4.2 數據段

objdump -x -s -d main.o

可以清楚的發現,.data段中的前4個位元組,從低到高為"0x0a 0x00 0x00 0x00 "這個值剛好是data3的值,10進位的10。
image

4.3 BSS段

objdump -x -s -d main.o

image
在之前的段表之中發現,.bss和.comment段的起始地址都是一樣的。有些編譯器會將全局的未初始化的變數放在.bss中,有些只是預留一個未定義的全局變數符號,等到鏈接的時候再在.bss段中分配空間。
可以在段表中發現,一些變數並未在.bss段中。
image

4.4 其他段

image

問題:將一個二進位文件作為目標文件的一個段?
image

4.5 自定義段

//變數:
__attribute__((section("FUN"))) int x = 10;
//函數:
__attribute__((section("BAR"))) void fun()
{

}

五、ELF文件

ELF目標文件格式:
image

  • ELF文件頭:包含著整個文件的基本屬性,ELF文件版本、目標機器型號、程式入口地址。
  • 各個段
  • 段表:所有段的基本信息,段名、長度、偏移量、讀寫許可權等
  • 字元表和符號表
    ...

5.1 文件頭

查看文件頭:readlef -h main.o 

文件頭格式:

image

魔數:
文件頭的結構和相關常數被定義在“/usr/include/elf.h”中,ELF文件有32為版本和64位版本,區別僅僅是成員大小不一樣。
image

文件類型:
e_type類型表示ELF的文件類型,通常以ET_開頭
image

機器類型:
e_machine
通常以EM_開頭
image

"elf.h"定義了自己的類型:
image

通過Elf32_Ehdr觀察文件頭的結構和之前有些相似:
image

將ELF文件頭結構與之前輸出的一一對應:
image

5.2 段表

readelf -S main.o

顯示ELF的主要段以及其他府逐段,如符號表、字元串表、段名字元串表、重定位表
image
段表的結構由"Elf32_Shdr"這個結構體數組保存,稱為段描述符。
ELF段表數組的第一個元素是無效的段描述符,類型是"NULL",也就是有效段的數量是顯示段-1。
image
這是其中每個段的含義
image

image

5.3 重定位表

鏈接器在處理目標文件的時候,需要對目標文件中某些部位進行重定位,即代碼段和數據段中隊絕對地址引用的位置。
重定位表的類型是"SHT_REL"。對於每一個需要重定位的代碼段和數據段,都會有一個重定位表。
如:.rel.text就是.text的重定位表,因為.text至少有一個絕對地址的引用,就是調用了printf函數。

5.4 字元串表

段名為:.strtab或者.shastrtab
用來保存普通字元串或者用來保存段表中用到的字元串。

六、強符號和弱符號

6.1 強符號和弱符號

強符號:編譯器預設函數和初始化的全局變數
弱符號:未初始化的全局變數
註意:強弱符號都是對定義來說的,不是針對符號的引用的

extern int ext;

int weak1;
int strong = 1;
__attribute__((weak)) weak2 = 2;

int main()
{
	return 0;
}

weak1 和 weak2 都是弱符號
strong 和 main 都是強符號
ext既不是強符號也不是弱符號,因為它是一個外部變數引用。

強弱符號也有如下規則:

  • 不允許被多次定義(目標文件中不允許有同名的強符號)
  • 一個符號在某目標文件中是強符號,在另一個文件中是弱符號,那麼選擇強符號
  • 一個符號在目標文件中都是弱符號,那麼選擇占用空間最大的那一個。

6.2 弱引用和強引用

強引用沒有找到符號的定義,鏈接器就會符號未定義的誤。

弱引用

  • 如果沒有定義,則鏈接器不報錯
  • 如果該符號有定義,則鏈接器將該符號的引用決議
  • 對於未定義的弱引用,鏈接器不認為它是一個錯誤,一般未定義的弱引用,鏈接器預設是0,或者是一個特殊的值,以便程式代碼能夠識別。
__attribute__((weakref))void fun();

int main()
{
	fun();
	return 0;
}

使用__attribute__((weakref))聲明為弱引用。
鏈接時並不會報錯,但是執行時會報錯。
因為fun函的地址為0,發生了訪址錯誤。

總結

什麼是目標文件,4種目標文件,Linux中的目標文件

ELF:

  • 文件頭
  • 段表
  • 重定位表
  • 字元串表
  • 符號表
  • 調試表

強符號和弱符號
強引用和弱引用


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • JavaScript 中的記憶體管理主要由 JavaScript 引擎負責,開發人員不需要手動管理記憶體。JavaScript 引擎使用垃圾回收演算法來實現自動垃圾回收。 JavaScript 垃圾回收演算法是指在 JavaScript 程式中,用來回收不再使用的記憶體的演算法。 ...
  • 使用 CSS 的 box-sizing 屬性 MDN docs 關於box-sizing 一種解決方法是使用 CSS 的 box-sizing 屬性來控制元素的盒模型。預設情況下,盒模型是 "content-box",這意味著元素的寬度和高度只包括其內容,而不包括 padding 和 border。 ...
  • 最近寫了個 python 的 tkinter 框架入門教程,希望給大家介紹一下這個框架的上手過程,這是一個系列文章,現在是第一篇。 ...
  • 2023-01-22 一、SSM整合 1、Spring + SpringMVC (1)容器管理對象,由DispatcherServlet管理 (2)Spring容器對象,由ContextLoaderListener管理 2、解決組件掃描的衝突問題 (1)SpringMVC只掃描Controller層 ...
  • 這篇筆記咱日後應該還會進行補充。 關於sort的比較函數 STL的algorithm庫中的sort函數,可以接受一個cmp函數作為第三個參數,用來指定排序的規則。 自定義sort比較函數 cmp(a,b)函數的返回值是一個bool值,當返回值為true時不改變元素順序。 可以把其中的a看作序列中前一 ...
  • 2023-01-22 一、SpringMVC攔截器的兩種裝配方式 1、全局裝配(放置在springmvc.xml中) <!-- 裝配攔截器--> <!-- 全局裝配--> <mvc:interceptors> <ref bean="myInterceptor"></ref> </mvc:interc ...
  • 題目描述 牛牛從鍵盤上輸入三個整數,並嘗試在屏幕上顯示第二個整數。 輸入描述 一行輸入 3 個整數,用空格隔開。 輸出描述 請輸出第二個整數的值。 示例 1 輸入:1 2 3 輸出:2 解題思路 方案一 使用 3 個整形變數依次存儲輸入的 3 個整數,然後將第二個整形變數的數據輸出。 具體代碼如下: ...
  • 是否有小伙伴在使用tab的時候想進行滑動切換Tab? 並且有滑動左出左進,右出右進的效果 ,本文將講解怎麼在Blazor中去通過滑動切換Tab 本文中的UI組件使用的是MASA Blazor,您也可以是其他的UI框架,這個並不影響實際的運行效果,本文案例是相容PC和Android的,演示效果是and ...
一周排行
    -Advertisement-
    Play Games
  • 下麵是一個標準的IDistributedCache用例: public class SomeService(IDistributedCache cache) { public async Task<SomeInformation> GetSomeInformationAsync (string na ...
  • 這個庫提供了在啟動期間實例化已註冊的單例,而不是在首次使用它時實例化。 單例通常在首次使用時創建,這可能會導致響應傳入請求的延遲高於平時。在註冊時創建實例有助於防止第一次Request請求的SLA 以往我們要在註冊的時候實例單例可能會這樣寫: //註冊: services.AddSingleton< ...
  • 最近公司的很多項目都要改單點登錄了,不過大部分都還沒敲定,目前立刻要做的就只有一個比較老的項目 先改一個試試手,主要目標就是最短最快實現功能 首先因為要保留原登錄方式,所以頁面上的改動就是在原來登錄頁面下加一個SSO登錄入口 用超鏈接寫的入口,頁面改造後如下圖: 其中超鏈接的 href="Staff ...
  • Like運算符很好用,特別是它所提供的其中*、?這兩種通配符,在Windows文件系統和各類項目中運用非常廣泛。 但Like運算符僅在VB中支持,在C#中,如何實現呢? 以下是關於LikeString的四種實現方式,其中第四種為Regex正則表達式實現,且在.NET Standard 2.0及以上平... ...
  • 一:背景 1. 講故事 前些天有位朋友找到我,說他們的程式記憶體會偶發性暴漲,自己分析了下是非托管記憶體問題,讓我幫忙看下怎麼回事?哈哈,看到這個dump我還是非常有興趣的,居然還有這種游戲幣自助機類型的程式,下次去大玩家看看他們出幣的機器後端是不是C#寫的?由於dump是linux上的程式,剛好win ...
  • 前言 大家好,我是老馬。很高興遇到你。 我們為 java 開發者實現了 java 版本的 nginx https://github.com/houbb/nginx4j 如果你想知道 servlet 如何處理的,可以參考我的另一個項目: 手寫從零實現簡易版 tomcat minicat 手寫 ngin ...
  • 上一次的介紹,主要圍繞如何統一去捕獲異常,以及為每一種異常添加自己的Mapper實現,並且我們知道,當在ExceptionMapper中返回非200的Response,不支持application/json的響應類型,而是寫死的text/plain類型。 Filter為二方包異常手動捕獲 參考:ht ...
  • 大家好,我是R哥。 今天分享一個爽飛了的面試輔導 case: 這個杭州兄弟空窗期 1 個月+,面試了 6 家公司 0 Offer,不知道問題出在哪,難道是杭州的 IT 崩盤了麽? 報名面試輔導後,經過一個多月的輔導打磨,現在成功入職某上市公司,漲薪 30%+,955 工作制,不咋加班,還不捲。 其他 ...
  • 引入依賴 <!--Freemarker wls--> <dependency> <groupId>org.freemarker</groupId> <artifactId>freemarker</artifactId> <version>2.3.30</version> </dependency> ...
  • 你應如何運行程式 互動式命令模式 開始一個互動式會話 一般是在操作系統命令行下輸入python,且不帶任何參數 系統路徑 如果沒有設置系統的PATH環境變數來包括Python的安裝路徑,可能需要機器上Python可執行文件的完整路徑來代替python 運行的位置:代碼位置 不要輸入的內容:提示符和註 ...