一、簡介 ssh(secure shell,安全外殼協議),該協議有2個常用的作用:遠程連接、遠程文件傳輸。 協議使用埠號:預設是22。 可以是被修改的,如果需要修改,則需要修改ssh服務的配置文件: #/etc/ssh/ssh_config 埠號可以修改,但是得註意2個事項: a. 註意範圍, ...
鏈接器解析符號
鏈接器解析符號引用的方法是將每個引用與它輸入的可重定位目標文件的符號表中的一個確定的符號定義關聯起來,可重定位目標文件的符號表在隨筆ELF可重定位目標文件 - mjy66 - 博客園 (cnblogs.com)中有提到,以ELF格式的目標文件舉例,.symtab節就是其符號表。
在解析符號的過程中,編譯器針對局部符號和全局符號有不同的規則。在解析局部符號的過程中,編譯器只允許每個模塊中每個局部符號有一個定義,而對於全局符號的解析,若遇到一個不是在當前模塊中定義的符號,編譯器會假設該符號是在其它模塊中定義,生成鏈接器符號表條目,若後續鏈接器在任何輸入模塊中都找不到被引用的符號定義,則會報錯。
1、鏈接器如何解析多重定義的全局符號
鏈接器的輸入是一組可重定位目標模塊,每個模塊有定義自己的一組符號,有些是局部(只對定義該符號的模塊可見),有些是全局的(對其他模塊也可見)。若多個目標模塊定義了同名的全局符號,在Linux系統中,彙編器會以強符號或者弱符號來標記每個全局符號,函數和已初始化的全局變數為強符號,未初始化的全局變數為弱符號。Linux會根據以下規則處理多重定義的符號名:
- 規則1:不允許有多個同名的強符號
- 規則2:如果有一個強符號和多個弱符號同名,則選擇強符號
- 規則3:如果有多個弱符號同名,則從這些弱符號中任意選擇一個。
例1:
//main.c
int x = 1000;
int main()
{
return 0;
}
//f.c
int x = 1000;
void f()
{
}
main.c文件中定義並初始化了一個全局變數x,f.c文件中也定義並初始化了一個全局變數x,將這兩個文件放在一起編譯,會違反第一條規則,出現了兩個同名的強符號,因此會出現如下報錯。
例2:
//main.c
int x = 1000;
int main()
{
printf("x = %d\n",x);
return 0;
}
//f.c
int x;
void f()
{
}
若不對f.c文件中x進行初始化,則f.c中的全局變數x變成了弱符號,此時根據規則2,會優先選擇main.c文件中的強符號,因此編譯之後,運行就會出現如下結果:
2、靜態庫的鏈接
假設鏈接器不是讀取一組可重定位目標文件,而是將所有相關的目標模塊打包成一個單獨的文件再作為鏈接器的輸入,當鏈接器構造一個輸出的可執行文件的時候,它只複製這個單獨文件里被應用程式引用的目標模塊,這個單獨的文件就是靜態庫。靜態庫的出現能夠在節省電腦記憶體的情況下,方便程式員調用相關函數。
在linux系統中,靜態庫以存檔的特殊文件格式存放在磁碟中,存檔文件是一組連接起來的可重定位目標文件的集合,有一個頭部用來描述每個成員目標文件的大小和位置,存檔文件名用尾碼.a標識。
實踐能夠讓我們對知識點的理解更加深刻,接下來將使用AR工具創建一個自己簡單的靜態庫。創建靜態庫的步驟如下:
1、編寫源文件
我們先創建三個分別對向量進行加減乘操作的文件,併在每個文件中記錄被調用的次數。三個文件常式如下所示:
//addvec.c
int addcnt = 0;
void addvec(int *x,int *y,int n)
{
int i;
addcnt++;
for(i = 0;i < n; i++)
y[i] = x[i] + y[i];
}
//subvec.c
int subcnt = 0;
void subvec(int *x,int *y,int n)
{
int i;
subcnt++;
for(i = 0;i < n; i++)
y[i] = y[i] - x[i];
}
//multvec.c
int multcnt = 0;
int multvec(int *x,int *y,int n)
{
int i;
multcnt++;
for(i = 0;i < n; i++)
y[i] = y[i] * x[i];
}
2、創建文件之後,在shell命令行中輸入以下命令:
[root@master test]# gcc -c addvec.c subvec.c multvec.c
[root@master test]# ar rcs libvec.a addvec.o multvec.o subvec.o
上述命令運行完成之後,便會輸出libvec.a存檔文件:
3、編寫一個應用程式來調用這個庫里的函數,同時也要寫一個聲明靜態庫中函數或變數的頭文件,應用程式如下:
#include <stdio.h>
#include “vector.h” //聲明靜態庫里的函數和全局變數
int x[2]={1,2};
int y[2]={3,4};
int z[2]={5,6};
int main()
{
addvec(x,y,2);
printf("y = [%d %d]\n",y[0],y[1]);
subvec(z,y,2);
printf("y = [%d %d]\n",y[0],y[1]);
multvec(y,y,2)
printf("y = [%d %d]\n",y[0],y[1]);
printf("addcnt = %d\n",addcnt);
printf("subcnt = %d\n",subcnt);
printf("multcnt = %d\n",multcnt);
return 0;
}
4、在編譯的時候,鏈接時帶上自己編寫的庫,在shell命令行中輸入的命令如下:
[root@master test]# gcc main.c -L. -lvec
//-lvec參數是libvec.a的縮寫
//-L.參數告訴鏈接器在當前的目錄下查找libvec.a的縮寫
命令運行之後,會生成一個a.out文件,在命令行中輸入運行該可執行文件,輸出:
3、鏈接器如何使用靜態庫來解析引用
在符號解析階段,鏈接器會維護三個集合:
- 集合E:儲存可重定位目標文件,這些文件最終會被合併起來形成可執行文件
- 集合U:儲存未解析的符號,也就是引用了但是未定義的符號
- 集合D:儲存前面輸入文件中已經定義的符號
首先,命令行上的每個輸入文件f,鏈接器會判斷f是目標文件還是存檔文件,如果f是目標文件,則將f添加到E,並通過修改U和D來反映f中的符號定義和引用。若f是存檔文件,則鏈接器嘗試匹配U中未解析的符號,若某個存檔文件成員m定義了一個符號解析U中的一個引用,則將該存檔文件成員加到E中,並根據該存檔文件成員中的符號定義和引用來修改U和D,任何不包含在E中的成員目標文件都會被丟棄。迴圈反覆以上過程,直到掃描完所有的輸入文件,若最終U是非空的,則輸出一個錯誤並終止,否則就合併E中的目標文件,構建輸出的可執行文件。
從上述過程中可以看出鏈接器對輸入的文件的處理有個先後的過程,若在輸入命令的時候不加註意,就會出現報錯,假如將一個庫文件放在調用該庫的應用文件前,此時鏈接器先處理庫文件,由於U中還是空的,因此直接跳過庫文件,直接處理應用文件,顯然應用文件中的符號不會得到匹配。
補充:
1、在生成自己的鏈接庫的時候,按照CSAPP的命令行輸入:
gcc -static -o prog main.c libvector.a
會出現/usr/bin/ld:找不到-lc的報錯。
原因:在新版的Linux系統下安裝gcc的時候,不會安裝libc.a,只會安裝libc.so,所以當加上-static選項時,找不到libc.a就報錯找不到libc了
解決方法:安裝glibc-static
參考鏈接:/usr/bin/ld: cannot find -lc錯誤原因及解決方法-CSDN博客
2、C++和Java中鏈接器如何區別重載函數之間的區別
重載函數在源代碼中都有相同的名字,但是有不同參數列表,編譯器將每一個方法和參數列表編碼成對鏈接器來說唯一的名字,這種編碼的過程叫做重整。對類來說,重整的類名字是類名字中字元的整數數量+原始名字,比如類Foo被重整為3Foo。對方法來說,方法被編碼為原始方法名+__
+被重整的類名+每個參數的單字母編碼,比如Foo::bar(int,long)
被編碼為bar__3Fooil