Linux中的目標文件

来源:https://www.cnblogs.com/baobaobashi/archive/2023/01/23/17063448.html
-Advertisement-
Play Games

eunomia-bpf 0.3.0 發佈:只需編寫內核態代碼,輕鬆構建、打包、發佈完整的 eBPF 應用 eunomia-bpf 簡介 eBPF 源於 BPF,本質上是處於內核中的一個高效與靈活的虛擬機組件,以一種安全的方式在許多內核 hook 點執行位元組碼,開發者可基於 eBPF 開發性能分析工具 ...


一、目標文件的格式

Linux:ELF(Executable Linkable Format)
Windows:PE(Portable Executable)

COFF格式:PE和ELF都是源自COFF格式,Unix最早是a.out文件格式,為瞭解決共用庫問題,引入了COFF格式。

  • 引入了段的機制,不同目標文件可以擁有不同數量的段和類型
  • 定義了調試數據格式

二、目標文件是什麼?

目標文件就是與那代碼編譯後但未能鏈接的那些中間文件。(Linux中的.o,Windows中的.obj)

4種ELF文件

image

三、Linux中的目標文件

目標文件是經過了預處理、編譯、彙編產生的ELF格式的文件。目標文件將代碼、數據以及一些連接時需要的信息,通過 “節”或 “段” 存儲。
分段的原因:

  • 數據和指令映射到兩個虛存空間,這兩個空間的許可權不同,可以防止程式指令被改寫。
  • 現代CPU緩存一般被設計成數據緩存和指令緩存分離,分段有利於提高程式的局部性。
  • 程式中如果運行著許多副本,記憶體中只需要保存一份程式的指令部分。

主要分為兩種段,代碼段(.text)和數據段(.data,.bss)

名稱 存儲內容
局部變數、函數參數、返回地址
動態分配記憶體
BSS段 未初始化或者初始值為0的全局變數或者局部靜態變數
數據段(.test) 已初始化且初始化值不為0的全局變數或者局部靜態變數
代碼段 (.data) 可執行代碼、字元串字面值、只讀變數

示例代碼

#include<stdio.h>
int data1;		//.bss
int data2 = 0;		//.bss
int data3 = 10;		//.data

static int data4;		//.bss
static int data5 = 0;	//.bss
static int data6 = 20;		//.data

int main()			//.text
{
    int a;			//.text
    int b = 0;			//.text
    int c = 10;			//.text

    static int data7;		//.bss
    static int data8 = 0;	//.bss
    static int data9 = 40;	//.data

    return 0;
}

image

四、深入 .o文件

編譯:gcc -c main.c
查看文件解構:objdump -h main.o

image
Size:段的長度
File off:段的位置
image

4.1 代碼段

objdump -s -d main.o

image

4.2 數據段

objdump -x -s -d main.o

可以清楚的發現,.data段中的前4個位元組,從低到高為"0x0a 0x00 0x00 0x00 "這個值剛好是data3的值,10進位的10。
image

4.3 BSS段

objdump -x -s -d main.o

image
在之前的段表之中發現,.bss和.comment段的起始地址都是一樣的。有些編譯器會將全局的未初始化的變數放在.bss中,有些只是預留一個未定義的全局變數符號,等到鏈接的時候再在.bss段中分配空間。
可以在段表中發現,一些變數並未在.bss段中。
image

4.4 其他段

image

問題:將一個二進位文件作為目標文件的一個段?
image

4.5 自定義段

//變數:
__attribute__((section("FUN"))) int x = 10;
//函數:
__attribute__((section("BAR"))) void fun()
{

}

五、ELF文件

ELF目標文件格式:
image

  • ELF文件頭:包含著整個文件的基本屬性,ELF文件版本、目標機器型號、程式入口地址。
  • 各個段
  • 段表:所有段的基本信息,段名、長度、偏移量、讀寫許可權等
  • 字元表和符號表
    ...

5.1 文件頭

查看文件頭:readlef -h main.o 

文件頭格式:

image

魔數:
文件頭的結構和相關常數被定義在“/usr/include/elf.h”中,ELF文件有32為版本和64位版本,區別僅僅是成員大小不一樣。
image

文件類型:
e_type類型表示ELF的文件類型,通常以ET_開頭
image

機器類型:
e_machine
通常以EM_開頭
image

"elf.h"定義了自己的類型:
image

通過Elf32_Ehdr觀察文件頭的結構和之前有些相似:
image

將ELF文件頭結構與之前輸出的一一對應:
image

5.2 段表

readelf -S main.o

顯示ELF的主要段以及其他府逐段,如符號表、字元串表、段名字元串表、重定位表
image
段表的結構由"Elf32_Shdr"這個結構體數組保存,稱為段描述符。
ELF段表數組的第一個元素是無效的段描述符,類型是"NULL",也就是有效段的數量是顯示段-1。
image
這是其中每個段的含義
image

image

5.3 重定位表

鏈接器在處理目標文件的時候,需要對目標文件中某些部位進行重定位,即代碼段和數據段中隊絕對地址引用的位置。
重定位表的類型是"SHT_REL"。對於每一個需要重定位的代碼段和數據段,都會有一個重定位表。
如:.rel.text就是.text的重定位表,因為.text至少有一個絕對地址的引用,就是調用了printf函數。

5.4 字元串表

段名為:.strtab或者.shastrtab
用來保存普通字元串或者用來保存段表中用到的字元串。

六、強符號和弱符號

6.1 強符號和弱符號

強符號:編譯器預設函數和初始化的全局變數
弱符號:未初始化的全局變數
註意:強弱符號都是對定義來說的,不是針對符號的引用的

extern int ext;

int weak1;
int strong = 1;
__attribute__((weak)) weak2 = 2;

int main()
{
	return 0;
}

weak1 和 weak2 都是弱符號
strong 和 main 都是強符號
ext既不是強符號也不是弱符號,因為它是一個外部變數引用。

強弱符號也有如下規則:

  • 不允許被多次定義(目標文件中不允許有同名的強符號)
  • 一個符號在某目標文件中是強符號,在另一個文件中是弱符號,那麼選擇強符號
  • 一個符號在目標文件中都是弱符號,那麼選擇占用空間最大的那一個。

6.2 弱引用和強引用

強引用沒有找到符號的定義,鏈接器就會符號未定義的誤。

弱引用

  • 如果沒有定義,則鏈接器不報錯
  • 如果該符號有定義,則鏈接器將該符號的引用決議
  • 對於未定義的弱引用,鏈接器不認為它是一個錯誤,一般未定義的弱引用,鏈接器預設是0,或者是一個特殊的值,以便程式代碼能夠識別。
__attribute__((weakref))void fun();

int main()
{
	fun();
	return 0;
}

使用__attribute__((weakref))聲明為弱引用。
鏈接時並不會報錯,但是執行時會報錯。
因為fun函的地址為0,發生了訪址錯誤。

總結

什麼是目標文件,4種目標文件,Linux中的目標文件

ELF:

  • 文件頭
  • 段表
  • 重定位表
  • 字元串表
  • 符號表
  • 調試表

強符號和弱符號
強引用和弱引用


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • JavaScript 中的記憶體管理主要由 JavaScript 引擎負責,開發人員不需要手動管理記憶體。JavaScript 引擎使用垃圾回收演算法來實現自動垃圾回收。 JavaScript 垃圾回收演算法是指在 JavaScript 程式中,用來回收不再使用的記憶體的演算法。 ...
  • 使用 CSS 的 box-sizing 屬性 MDN docs 關於box-sizing 一種解決方法是使用 CSS 的 box-sizing 屬性來控制元素的盒模型。預設情況下,盒模型是 "content-box",這意味著元素的寬度和高度只包括其內容,而不包括 padding 和 border。 ...
  • 最近寫了個 python 的 tkinter 框架入門教程,希望給大家介紹一下這個框架的上手過程,這是一個系列文章,現在是第一篇。 ...
  • 2023-01-22 一、SSM整合 1、Spring + SpringMVC (1)容器管理對象,由DispatcherServlet管理 (2)Spring容器對象,由ContextLoaderListener管理 2、解決組件掃描的衝突問題 (1)SpringMVC只掃描Controller層 ...
  • 這篇筆記咱日後應該還會進行補充。 關於sort的比較函數 STL的algorithm庫中的sort函數,可以接受一個cmp函數作為第三個參數,用來指定排序的規則。 自定義sort比較函數 cmp(a,b)函數的返回值是一個bool值,當返回值為true時不改變元素順序。 可以把其中的a看作序列中前一 ...
  • 2023-01-22 一、SpringMVC攔截器的兩種裝配方式 1、全局裝配(放置在springmvc.xml中) <!-- 裝配攔截器--> <!-- 全局裝配--> <mvc:interceptors> <ref bean="myInterceptor"></ref> </mvc:interc ...
  • 題目描述 牛牛從鍵盤上輸入三個整數,並嘗試在屏幕上顯示第二個整數。 輸入描述 一行輸入 3 個整數,用空格隔開。 輸出描述 請輸出第二個整數的值。 示例 1 輸入:1 2 3 輸出:2 解題思路 方案一 使用 3 個整形變數依次存儲輸入的 3 個整數,然後將第二個整形變數的數據輸出。 具體代碼如下: ...
  • 是否有小伙伴在使用tab的時候想進行滑動切換Tab? 並且有滑動左出左進,右出右進的效果 ,本文將講解怎麼在Blazor中去通過滑動切換Tab 本文中的UI組件使用的是MASA Blazor,您也可以是其他的UI框架,這個並不影響實際的運行效果,本文案例是相容PC和Android的,演示效果是and ...
一周排行
    -Advertisement-
    Play Games
  • 一:背景 1. 講故事 年前遇到了好幾例托管堆被損壞的案例,有些運氣好一些,從被破壞的托管堆記憶體現場能觀測出大概是什麼問題,但更多的情況下是無法做出準確判斷的,原因就在於生成的dump是第二現場,借用之前文章的一張圖,大家可以理解一下。 為了幫助更多受此問題困擾的朋友,這篇來整理一下如何 快狠準 的 ...
  • 前言 .NET6 開始,.NET Croe API 項目取消了 Startup.cs 文件,在 Program.cs 文件的 Main 函數中完成服務的註冊和中間件管道的管理。但當我們項目引入更多包的時候,Program.cs 文件也會看起來很臃腫。 而且,我們不只會有一個後端項目,為了方便快速創建 ...
  • 目錄 背景 get 與 post 的區別 所有介面都用 post 請求? 背景 最近在逛知乎的時候發現一個有趣的問題:公司規定所有介面都用 post 請求,這是為什麼? 看到這個問題的時候其實我也挺有感觸的,因為我也曾經這樣問過我自己。在上上一家公司的時候接到一個項目是從零開始搭建一個微服務,當時就 ...
  • *以下內容為本人的學習筆記,如需要轉載,請聲明原文鏈接 微信公眾號「englyf」https://mp.weixin.qq.com/s/2GFLTstDC7w6u3fTJxflNA 本文大概 1685 個字,閱讀需花 6 分鐘內容不多, 但也花了一些精力如要交流, 歡迎關註我然後評論區留言 謝謝你的 ...
  • 在新版本的pandas中,上述代碼會引起警告,建議改成SQLAlchemy connectable(engine/connection),後續代碼將引入這種升級的連接方式。 ...
  • 幾乎所有的高級編程語言都有自己的垃圾回收機制,開發者不需要關註記憶體的申請與釋放,Python 也不例外。Python 官方團隊的文章 https://devguide.python.org/internals/garbage-collector 詳細介紹了 Python 中的垃圾回收演算法,本文是這篇 ...
  • 如果您想查找高於或低於平均值的數字,可以不必計算該平均值,就能查看更高或更低的值。通過Java應用程式,可以自動突出顯示這些數字。除了快速突出顯示高於或低於平均值的值外,您還可以查看高於或低於的值的個數。現在讓我們看看如何在 Java應用程式中實現此操作。 引入jar包 導入方法1: 手動引入。將  ...
  • 第一種方式:使用{} firstDict = {"name": "wang yuan wai ", "age" : 25} 說明:{}為創建一個空的字典對象 第二種方式:使用fromkeys()方法 second_dict = dict.fromkeys(("name", "age")) #valu ...
  • 在golang中可以使用a := b這種方式將b賦值給a,只有當b能進行深拷貝時a與b才不會互相影響,否則就需要進行更為複雜的深拷貝。 下麵就是Go賦值操作的一個說明: Go語言中所有賦值操作都是值傳遞,如果結構中不含指針,則直接賦值就是深度拷貝;如果結構中含有指針(包括自定義指針,以及切片,map ...
  • 本文結合京東監控埋點場景,對解決樣板代碼的技術選型方案進行分析,給出最終解決方案後,結合理論和實踐進一步展開。通過關註文中的技術分析過程和技術場景,讀者可收穫一種樣板代碼思想過程和解決思路,並對Java編譯器底層有初步瞭解。 ...