C源程式需要經過預處理、編譯、彙編幾個階段,得到各自源文件對應的可重定位目標文件,可重定位目標文件就是各個源文件的二進位機器代碼,一般是.o格式。比如:util1.c、util2.c及main.c三個C源文件,經過預處理器、編譯器、彙編器的處理,就可以得到各自的目標文件util1.o,util2.o ...
C源程式需要經過預處理、編譯、彙編幾個階段,得到各自源文件對應的可重定位目標文件,可重定位目標文件就是各個源文件的二進位機器代碼,一般是.o格式。比如:util1.c、util2.c及main.c三個C源文件,經過預處理器、編譯器、彙編器的處理,就可以得到各自的目標文件util1.o,util2.o以及main.o。可重定位目標文件中的地址是從0開始的,需要鏈接器將若幹個可重定位目標文件通過符號解析、重定位等工作,鏈接成為一個可執行的二進位目標文件。在Linux下,可以使用gcc -c 對源文件進行預處理、編譯、彙編,得到目標文件:
可以看到源文件util1.c及util2.c被編譯成為了對應的目標文件util1.o及util2.o。在給定的例子中,util1.c和util2.c實際上分別定義了兩個函數add和mult,返回兩個整數的加法和乘法結果(這麼做有點兒蠢,這裡只是作為一個例子,講清楚後面靜態庫的概念)。兩個函數的定義如下:
//util1.c int add(int a,int b) { return a + b; } //util2.c int mult(int a,int b) { return a * b; }
util.h中包含了對這兩個函數的聲明。 main.c使用其中的add函數:
#include <stdio.h> #include "util.h" int main() { int a = 5; int b = 10; int c = add(a,b); printf("%d\n",c); return 0; }
實際上,所有的編譯系統都提供一種機制,將所有相關的目標模塊(即目標文件)打包成為一個單獨的文件,稱為靜態庫。在Linux中,靜態庫以一種被稱為存檔(archive)的文件格式存放在磁碟中。存檔文件由尾碼.a標識,.a格式的存檔文件是一組連接起來的可重定位目標文件的集合,有一個頭部用來描述每個成員目標文件的大小和位置。C標准定義了許多靜態庫,如標準IO操作scanf,printf,字元串操作strcpy等,它們在libc.a庫中;一些浮點數學函數如sin,cos等,它們在libm.a庫中。
當然,靜態庫是目標文件的集合,我們也可以將自己定義的函數編譯成目標代碼,加入靜態庫中。為了為若幹目標文件創建靜態庫,可以使用ar rcs:
ar rcs 後面緊跟的libutil.a是創建的靜態庫的名字,通常以lib三個字母開頭,後面的util可以自己指定,靜態庫以.a為尾碼。util1.o 及 util2.o 是我們要加入靜態庫的兩個目標文件。這樣,就創建了一個靜態庫文件libutil.a。可以使用ar t來查看靜態庫文件中包含的目標文件:
接下來,我們在main函數中使用這個庫。要在main中使用libutil.a庫,需要鏈接通過編譯main.c得到的目標文件main.o和libutil.a:
可以看到,gcc將main.c對應的目標文件與庫libutil.a鏈接起來,得到了可執行文件main。我們執行可執行文件main,得到期望的結果:
註意,main函數中include了頭文件util.h,在util.h中對libutil.a中的函數進行了聲明。
那麼,重點來了,為什麼需要引入靜態庫這種東西呢?將C標準提供的所有庫都放在一個可重定位目標模塊中不行嗎?
事實上是可以的,不過,這種設計有一個很大的缺點是系統中的每個可執行文件都要包含這個整個的大的目標模塊的完全副本,這樣做很浪費存儲空間。比如,C標準的libc.a大約5MB,現在有一臺機器裝載了15個用到了C標準庫的可執行文件,那麼這15個可執行文件里每一個實際上都經過鏈接器的鏈接,嵌入了libc.a庫中的5MB目標代碼,而實際上它們可能用到5MB目標代碼里的很小一部分(比如,某個目標文件可能只引用了標準庫中的strcpy函數),這樣,造成了嚴重的存儲空間浪費。而靜態庫實際上提供了這樣一種功能:相關的函數可以被編譯為獨立的目標模塊,然後封裝成一個單獨的靜態庫文件,當鏈接器構造一個可執行文件時,它只“提取”靜態庫里被應用程式引用的目標模塊(換句話說,對於程式中用不到的,鏈接器不會將它複製到可執行文件中去),比如例子中main.c只用到了add函數,鏈接器就只會將庫libutil.a中的multi1模塊複製到可執行文件,而不會複製multi2模塊。
還有一種方法,就是把每個函數創建獨立的可重定位目標文件。而這種方法對於應用程式員來說是及其不友好的,因為這種方法要求應用程式員顯示地鏈接需要的目標模塊到可執行文件中,這是一個容易出錯且耗時的過程。
總結來說,靜態庫提供了將每一個目標模塊獨立地打包的功能,並且可以由鏈接器自動地提取被程式引用的目標模塊,這減少了可執行文件在磁碟和記憶體中的大小,並且大大降低了程式員鏈接各個目標文件的壓力。