0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

動(dòng)態(tài)鏈接過程中是如何進(jìn)行符號(hào)重定位的

Linux愛好者 ? 來源:Linux愛好者 ? 作者:Linux愛好者 ? 2022-06-02 14:52 ? 次閱讀

在上一篇文章中,我們一起學(xué)習(xí)了Linux系統(tǒng)中 GCC編譯器在編譯可執(zhí)行程序時(shí),靜態(tài)鏈接過程中是如何進(jìn)行符號(hào)重定位的。GCC 鏈接過程中的【重定位】過程分析

為了完整性,我們這篇文章來一起探索一下:動(dòng)態(tài)鏈接過程中是如何進(jìn)行符號(hào)重定位的。

老樣子,文中使用大量的【代碼+圖片】的方式,來真實(shí)的感受一下實(shí)際的內(nèi)存模型。

文中使用了大量的圖片,建議您在電腦上閱讀此文。

關(guān)于為什么使用動(dòng)態(tài)鏈接,這里就不展開討論了,無非就幾點(diǎn):

  1. 節(jié)省物理內(nèi)存;

  2. 可以動(dòng)態(tài)更新;

動(dòng)態(tài)鏈接要解決什么問題?

靜態(tài)鏈接得到的可執(zhí)行程序,被操作系統(tǒng)加載之后就可以執(zhí)行執(zhí)行。

因?yàn)樵阪溄拥臅r(shí)候,鏈接器已經(jīng)把所有目標(biāo)文件中的代碼、數(shù)據(jù)等Section,都組裝到可執(zhí)行文件中了。

并且把代碼中所有使用的外部符號(hào)(變量、函數(shù)),都進(jìn)行了重定位(即:把變量、函數(shù)的地址,都填寫到代碼段中需要重定位的地方),因此可執(zhí)行程序在執(zhí)行的時(shí)候,不依賴于其它的外部模塊即可運(yùn)行。

詳細(xì)的靜態(tài)鏈接過程,請(qǐng)參考上一篇文章:GCC 鏈接過程中的【重定位】過程分析。

也就是說:符號(hào)重定位的過程,是直接對(duì)可執(zhí)行文件進(jìn)行修改。

但是對(duì)于動(dòng)態(tài)鏈接來說,在編譯階段,僅僅是在可執(zhí)行文件或者動(dòng)態(tài)庫中記錄了一些必要的信息。

真正的重定位過程,是在這個(gè)時(shí)間點(diǎn)來完成的:可執(zhí)行程序、動(dòng)態(tài)庫被加載之后,調(diào)用可執(zhí)行程序的入口函數(shù)之前

只有當(dāng)所有需要被重定位的符號(hào)被解決了之后,才能開始執(zhí)行程序。

既然也是重定位,與靜態(tài)鏈接過程一樣:也需要把符號(hào)的目標(biāo)地址填寫到代碼段中需要重定位的地方。

矛盾:代碼段不可寫

問題來了!

我們知道,在現(xiàn)代操作系統(tǒng)中,對(duì)于內(nèi)存的訪問是有權(quán)限控制的,一般來說:

代碼段:可讀、可執(zhí)行;

數(shù)據(jù)段:可讀、可寫;

如果進(jìn)行符號(hào)重定位,就需要對(duì)代碼進(jìn)行修改(填寫符號(hào)的地址),但是代碼段又沒有可寫的權(quán)限,這是一個(gè)矛盾!

251fd06a-e228-11ec-ba43-dac502259ad0.png

解決這個(gè)矛盾的方案,就是Linux系統(tǒng)中動(dòng)態(tài)鏈接器的核心工作!

解決矛盾:增加一層間接性

David Wheeler有一句名言:“計(jì)算機(jī)科學(xué)中的大多數(shù)問題,都可以通過增加一層間接性來解決?!?/p>

解決動(dòng)態(tài)鏈接中的代碼重定位問題,同樣也可以通過增加一層間接性來解決。

既然代碼段在被加載到內(nèi)存中之后不可寫,但是數(shù)據(jù)段是可寫的。

在代碼段中引用的外部符號(hào),可以在數(shù)據(jù)段中增加一個(gè)跳板:讓代碼段先引用數(shù)據(jù)段中的內(nèi)容,然后在重定位時(shí),把外部符號(hào)的地址填寫到數(shù)據(jù)段中對(duì)應(yīng)的位置,不就解決這個(gè)矛盾了嗎?!

如下圖所示:

25528d70-e228-11ec-ba43-dac502259ad0.png

理解了上圖的解決思路,基本上就理解了動(dòng)態(tài)鏈接過程中重定位的核心思想。

示例代碼

我們需要3個(gè)源文件來討論動(dòng)態(tài)鏈接中重定位的過程:main.c、a.cb.c,其中的a.cb.c被編譯成動(dòng)態(tài)庫,然后main.c與這兩個(gè)動(dòng)態(tài)庫一起動(dòng)態(tài)鏈接成可執(zhí)行程序。

它們之間的依賴關(guān)系是:

2583e64a-e228-11ec-ba43-dac502259ad0.png

b.c

代碼如下:

#include 

int b = 30;

void func_b(void)
{
    printf("in func_b. b = %d 
", b);
}

代碼說明:

定義一個(gè)全局變量和一個(gè)全局函數(shù),被 a.c 調(diào)用。

a.c

代碼如下(稍微復(fù)雜一些,主要是為了探索:不同類型的符號(hào)如何處理重定位):

#include 

// 內(nèi)部定義【靜態(tài)】全局變量
static int a1 = 10;

// 內(nèi)部定義【非靜態(tài)】全局變量
int a2 = 20;

// 聲明外部變量
extern int b;

// 聲明外部函數(shù)
extern void func_b(void);

// 內(nèi)部定義的【靜態(tài)】函數(shù)
static void func_a2(void)
{
    printf("in func_a2 
");
}

// 內(nèi)部定義的【非靜態(tài)】函數(shù)
void func_a3(void)
{
    printf("in func_a3 
");
}

// 被 main 調(diào)用
void func_a1(void)
{
    printf("in func_a1 
");

    // 操作內(nèi)部變量
    a1 = 11;
    a2 = 21;

    // 操作外部變量
    b  = 31;

    // 調(diào)用內(nèi)部函數(shù)
    func_a2();
    func_a3();

    // 調(diào)用外部函數(shù)
    func_b();
}

代碼說明:

  1. 定義了 2 個(gè)全局變量:一個(gè)靜態(tài),一個(gè)非靜態(tài);

  2. 定義了 3 個(gè)函數(shù):

func_a2是靜態(tài)函數(shù),只能在本文件中調(diào)用;

func_a1func_a3是全局函數(shù),可以被外部調(diào)用;

  1. 在 main.c 中會(huì)調(diào)用func_a1。

main.c

代碼如下:

#include 
#include 
#include 

// 聲明外部變量
extern int a2;
extern void func_a1();

typedef void (*pfunc)(void);

int main(void)
{
    printf("in main 
");

    // 打印此進(jìn)程的全局符號(hào)表
    void *handle = dlopen(0, RTLD_NOW);
    if (NULL == handle)
    {
        printf("dlopen failed! 
");
        return -1;
    }

    printf("
------------ main ---------------
");
    // 打印 main 中變量符號(hào)的地址
    pfunc addr_main = dlsym(handle, "main");
    if (NULL != addr_main)
        printf("addr_main = 0x%x 
", (unsigned int)addr_main);
    else
        printf("get address of main failed! 
");

    printf("
------------ liba.so ---------------
");
    // 打印 liba.so 中變量符號(hào)的地址
    unsigned int *addr_a1 = dlsym(handle, "a1");
    if (NULL != addr_a1)
        printf("addr_a1 = 0x%x 
", *addr_a1);
    else
        printf("get address of a1 failed! 
");

    unsigned int *addr_a2 = dlsym(handle, "a2");
    if (NULL != addr_a2)
        printf("addr_a2 = 0x%x 
", *addr_a2);
    else
        printf("get address of a2 failed! 
");

    // 打印 liba.so 中函數(shù)符號(hào)的地址
    pfunc addr_func_a1 = dlsym(handle, "func_a1");
    if (NULL != addr_func_a1)
        printf("addr_func_a1 = 0x%x 
", (unsigned int)addr_func_a1);
    else
        printf("get address of func_a1 failed! 
");

    pfunc addr_func_a2 = dlsym(handle, "func_a2");
    if (NULL != addr_func_a2)
        printf("addr_func_a2 = 0x%x 
", (unsigned int)addr_func_a2);
    else
        printf("get address of func_a2 failed! 
");

    pfunc addr_func_a3 = dlsym(handle, "func_a3");
    if (NULL != addr_func_a3)
        printf("addr_func_a3 = 0x%x 
", (unsigned int)addr_func_a3);
    else
        printf("get address of func_a3 failed! 
");


    printf("
------------ libb.so ---------------
");
    // 打印 libb.so 中變量符號(hào)的地址
    unsigned int *addr_b = dlsym(handle, "b");
    if (NULL != addr_b)
        printf("addr_b = 0x%x 
", *addr_b);
    else
        printf("get address of b failed! 
");

    // 打印 libb.so 中函數(shù)符號(hào)的地址
    pfunc addr_func_b = dlsym(handle, "func_b");
    if (NULL != addr_func_b)
        printf("addr_func_b = 0x%x 
", (unsigned int)addr_func_b);
    else
        printf("get address of func_b failed! 
");

    dlclose(handle);

    // 操作外部變量
    a2 = 100;

    // 調(diào)用外部函數(shù)
    func_a1();

    // 為了讓進(jìn)程不退出,方便查看虛擬空間中的地址信息
    while(1) sleep(5);
    return 0;
}

糾正:代碼中本來是想打印變量的地址的,但是不小心加上了 *,變成了打印變量值。最后檢查的時(shí)候才發(fā)現(xiàn),所以就懶得再去修改了。

代碼說明:

  1. 利用 dlopen 函數(shù)(第一個(gè)參數(shù)傳入 NULL),來打印此進(jìn)程中的一些符號(hào)信息(變量和函數(shù));

  2. 賦值給 liba.so 中的變量 a2,然后調(diào)用 liba.so 中的 func_a1 函數(shù);

編譯成動(dòng)態(tài)鏈接庫

把以上幾個(gè)源文件編譯成動(dòng)態(tài)庫以及可執(zhí)行程序:

$ gcc -m32 -fPIC --shared b.c -o libb.so
$ gcc -m32 -fPIC --shared a.c -o liba.so -lb -L./
$ gcc -m32 -fPIC main.c -o main -ldl -la -lb -L./

有幾點(diǎn)內(nèi)容說明一下:

  1. -fPIC 參數(shù)意思是:生成位置無關(guān)代碼(Position Independent Code),這也是動(dòng)態(tài)鏈接中的關(guān)鍵;

  2. 既然動(dòng)態(tài)庫是在運(yùn)行時(shí)加載,那為什么在編譯的時(shí)候還需要指明?

因?yàn)樵诰幾g的時(shí)候,需要知道每一個(gè)動(dòng)態(tài)庫中提供了哪些符號(hào)。Windows 中的動(dòng)態(tài)庫的顯性的導(dǎo)出和導(dǎo)入標(biāo)識(shí),更能體現(xiàn)這個(gè)概念(__declspec(dllexport), __declspec(dllimport))。

此時(shí),就得到了如下幾個(gè)文件:

25c0662e-e228-11ec-ba43-dac502259ad0.png

動(dòng)態(tài)庫的依賴關(guān)系

對(duì)于靜態(tài)鏈接的可執(zhí)行程序來說,被操作系統(tǒng)加載之后,可以認(rèn)為直接從可執(zhí)行程序的入口函數(shù)開始(也就是ELF文件頭中指定的e_entry這個(gè)地址),執(zhí)行其中的指令碼。

但是對(duì)于動(dòng)態(tài)鏈接的程序來說,在執(zhí)行入口函數(shù)的指令之前,必須把該程序所依賴的動(dòng)態(tài)庫加載到內(nèi)存中,然后才能開始執(zhí)行。

對(duì)于我們的實(shí)例代碼來說:main程序依賴于liba.so庫,而liba.so庫又依賴于libb.so庫。

可以用ldd工具來分別看一下動(dòng)態(tài)庫之間的依賴關(guān)系:

25fd6524-e228-11ec-ba43-dac502259ad0.png26351a50-e228-11ec-ba43-dac502259ad0.png2666fbf6-e228-11ec-ba43-dac502259ad0.png

可以看出:

  1. 在 liba.so 動(dòng)態(tài)庫中,記錄了信息:依賴于 libb.so;

  2. 在 main 可執(zhí)行文件中,記錄了信息:依賴于 liba.so, libb.so;

也可以使用另一個(gè)工具patchelf來查看一個(gè)可執(zhí)行程序或者動(dòng)態(tài)庫,依賴于其他哪些模塊。例如:

26c8b508-e228-11ec-ba43-dac502259ad0.png

那么,動(dòng)態(tài)庫的加載是由誰來完成的呢?動(dòng)態(tài)鏈接器!

動(dòng)態(tài)庫的加載過程

動(dòng)態(tài)鏈接器加載動(dòng)態(tài)庫

當(dāng)執(zhí)行main程序的時(shí)候,操作系統(tǒng)首先把main加載到內(nèi)存,然后通過.interp段信息來查看該文件依賴哪些動(dòng)態(tài)庫:

26f86a5a-e228-11ec-ba43-dac502259ad0.png

上圖中的字符串/lib/ld-linux.so.2,就表示main依賴動(dòng)態(tài)鏈接庫。

ld-linux.so.2也是一個(gè)動(dòng)態(tài)鏈接庫,在大部分情況下動(dòng)態(tài)鏈接庫已經(jīng)被加載到內(nèi)存中了(動(dòng)態(tài)鏈接庫就是為了共享),操作系統(tǒng)此時(shí)只需要把動(dòng)態(tài)鏈接庫所在的物理內(nèi)存,映射main進(jìn)程的虛擬地址空間中就可以了,然后再把控制權(quán)交給動(dòng)態(tài)鏈接器。

動(dòng)態(tài)鏈接器發(fā)現(xiàn):main依賴liba.so,于是它就在虛擬地址空間中找一塊能放得下liba.so的空閑空間,然后把liba.so中需要加載到內(nèi)存中的代碼段、數(shù)據(jù)段都加載進(jìn)來。

當(dāng)然,在加載liba.so時(shí),又會(huì)發(fā)現(xiàn)它依賴libb.so,于是又把在虛擬地址空間中找一塊能放得下libb.so的空閑空間,把libb.so中的代碼段、數(shù)據(jù)段等加載到內(nèi)存中,示意圖如下所示:

271df75c-e228-11ec-ba43-dac502259ad0.png

動(dòng)態(tài)鏈接器自身也是一個(gè)動(dòng)態(tài)庫,而且是一個(gè)特殊的動(dòng)態(tài)庫:它不依賴于其他的任何動(dòng)態(tài)庫,因?yàn)楫?dāng)它被加載的時(shí)候,沒有人幫它去加載依賴的動(dòng)態(tài)庫,否則就形成雞生蛋、蛋生雞的問題了。

動(dòng)態(tài)庫的加載地址

一個(gè)進(jìn)程在運(yùn)行時(shí)的實(shí)際加載地址(或者說虛擬內(nèi)存區(qū)域),可以通過指令:$ cat /proc/[進(jìn)程的 pid]/maps 讀取出來。

例如:我的虛擬機(jī)中執(zhí)行main程序時(shí),看到的地址信息是:

273b953c-e228-11ec-ba43-dac502259ad0.png

黃色部分分別是:main, liba.so, libb.so3個(gè)模塊的加載信息。

另外,還可以看到c庫(libc-2.23.so)、動(dòng)態(tài)鏈接器(ld-2.23.so)以及動(dòng)態(tài)加載庫libdl-2.23.so的虛擬地址區(qū)域,布局如下:

27842cac-e228-11ec-ba43-dac502259ad0.png

可以看出出來:main可執(zhí)行程序是位于低地址,所有的動(dòng)態(tài)庫都位于4G內(nèi)存空間的最后1G空間中。

還有另外一個(gè)指令也很好用 $ pmap [進(jìn)程的 pid],也可以打印出每個(gè)模塊的內(nèi)存地址:

27bb516e-e228-11ec-ba43-dac502259ad0.png

符號(hào)重定位

全局符號(hào)表

在之前的靜態(tài)鏈接中學(xué)習(xí)過,鏈接器在掃描每一個(gè)目標(biāo)文件(.o文件)的時(shí)候,會(huì)把每個(gè)目標(biāo)文件中的符號(hào)提取出來,構(gòu)成一個(gè)全局符號(hào)表。

然后在第二遍掃描的時(shí)候,查看每個(gè)目標(biāo)文件中需要重定位的符號(hào),然后在全局符號(hào)表中查找該符號(hào)被安排在什么地址,然后把這個(gè)地址填寫到引用的地方,這就是靜態(tài)鏈接時(shí)的重定位。

但是動(dòng)態(tài)鏈接過程中的重定位,與靜態(tài)鏈接的處理方式差別就大很多了,因?yàn)?span>每個(gè)符號(hào)的地址只有在運(yùn)行的時(shí)候才能知道它們的地址。

例如:liba.so引用了libb.so中的變量和函數(shù),而libb.so中的這兩個(gè)符號(hào)被加載到什么位置,直到main程序準(zhǔn)備執(zhí)行的時(shí)候,才能被鏈接器加載到內(nèi)存中的某個(gè)隨機(jī)的位置。

也就是說:動(dòng)態(tài)鏈接器知道每個(gè)動(dòng)態(tài)庫中的代碼段、數(shù)據(jù)段被加載的內(nèi)存地址,因此動(dòng)態(tài)鏈接器也會(huì)維護(hù)一個(gè)全局符號(hào)表,其中存放著每一個(gè)動(dòng)態(tài)庫中導(dǎo)出的符號(hào)以及它們的內(nèi)存地址信息。

在示例代碼main.c函數(shù)中,我們通過dlopen返回的句柄來打印進(jìn)程中的一些全局符號(hào)的地址信息,輸出內(nèi)容如下:

2af96064-e228-11ec-ba43-dac502259ad0.png

上文已經(jīng)糾錯(cuò)過:本來是想打印變量的地址信息,但是 printf 語句中不小心加上了型號(hào),變成了打印變量值。

可以看到:在全局符號(hào)表中,沒有找到liba.so中的變量a1和函數(shù)func_a2這兩個(gè)符號(hào),因?yàn)樗鼈z都是static類型的,在編譯成動(dòng)態(tài)庫的時(shí)候,沒有導(dǎo)出到符號(hào)表中。

既然提到了符號(hào)表,就來看看這 3 個(gè)ELF文件中的動(dòng)態(tài)符號(hào)表信息:

  1. 動(dòng)態(tài)鏈接庫中保護(hù)兩個(gè)符號(hào)表:.dynsym(動(dòng)態(tài)符號(hào)表: 表示模塊中符號(hào)的導(dǎo)出、導(dǎo)入關(guān)系) 和 .symtab(符號(hào)表: 表示模塊中的所有符號(hào));

.symtab 中包含了 .dynsym;

  1. 由于圖片太大,這里只貼出 .dynsym 動(dòng)態(tài)符號(hào)表。

綠色矩形框前面的Ndx列是數(shù)字,表示該符號(hào)位于當(dāng)前文件的哪一個(gè)段中(即:索引);

紅色矩形框前面的Ndx列是UND,表示這個(gè)符號(hào)沒有找到,是一個(gè)外部符號(hào)(需要重定位);

2b4c801e-e228-11ec-ba43-dac502259ad0.png2b8768dc-e228-11ec-ba43-dac502259ad0.png2bb9c53e-e228-11ec-ba43-dac502259ad0.png

全局偏移表GOT

在我們的示例代碼中,liba.so是比較特殊的,它既被main可執(zhí)行程序所依賴,又依賴于libb.so

而且,在liba.so中,定義了靜態(tài)、動(dòng)態(tài)的全局變量和函數(shù),可以很好的概況很多種情況,因此這部分內(nèi)容就主要來分析liba.so這個(gè)動(dòng)態(tài)庫。

前文說過:代碼重定位需要修改代碼段中的符號(hào)引用,而代碼段被加載到內(nèi)存中又沒有可寫的權(quán)限,動(dòng)態(tài)鏈接解決這個(gè)矛盾的方案是:增加一層間接性。

例如:liba.so的代碼中引用了libb.so中的變量b,在liba.so的代碼段,并不是在引用的地方直接指向libb.so數(shù)據(jù)段中變量b的地址,而是指向了liba.so自己的數(shù)據(jù)段中的某個(gè)位置,在重定位階段,鏈接器再把libb.so中變量b的地址填寫到這個(gè)位置。

因?yàn)?code style="font-size:14px;padding:2px 4px;margin-right:2px;margin-left:2px;background-color:rgba(27,31,35,.05);font-family:'Operator Mono', Consolas, Monaco, Menlo, monospace;color:rgb(239,112,96);">liba.so自己的代碼段和數(shù)據(jù)段位置是相對(duì)固定的,這樣的話,liba.so的代碼段被加載到內(nèi)存之后,就再也不用修改了。

而數(shù)據(jù)段中這個(gè)間接跳轉(zhuǎn)的位置,就稱作:全局偏移表(GOT: Global Offset Table)。

劃重點(diǎn):

liba.so的代碼段中引用了libb.so中的符號(hào)b,既然b的地址需要在重定位時(shí)才能確定,那么就在數(shù)據(jù)段中開辟一塊空間(稱作:GOT表),重定位時(shí)把b的地址填寫到GOT表中。

liba.so的代碼段中,把GOT表的地址填寫到引用b的地方,因?yàn)?code style="font-size:14px;padding:2px 4px;margin-right:2px;margin-left:2px;background-color:rgba(27,31,35,.05);font-family:'Operator Mono', Consolas, Monaco, Menlo, monospace;color:rgb(239,112,96);">GOT表在編譯階段是可以確定的,使用的是相對(duì)地址。

這樣,就可以在不修改liba.so代碼段的前提下,動(dòng)態(tài)的對(duì)符號(hào)b進(jìn)行了重定位!

其實(shí),在一個(gè)動(dòng)態(tài)庫中存在 2 個(gè)GOT表,分別用于重定位變量符號(hào)(section名稱:.got)和函數(shù)符號(hào)( section 名稱:.got.plt)。

也就是說:所有變量類型的符號(hào)重定位信息都位于.got中,所有函數(shù)類型的符號(hào)重定位信息都位于.got.plt中。

并且,在一個(gè)動(dòng)態(tài)庫文件中,有兩個(gè)特殊的段(.rel.dyn.rel.plt)來告訴鏈接器:.got.got.plt這兩個(gè)表中,有哪些符號(hào)需要進(jìn)行重定位,這個(gè)問題下面會(huì)深入討論。

liba.so動(dòng)態(tài)庫文件的布局

為了更深刻的理解.got.got.plt這兩個(gè)表,有必要來拆解一下liba.so動(dòng)態(tài)庫文件的內(nèi)部結(jié)構(gòu)。

通過readelf -S liba.so指令來看一下這個(gè)ELF文件中都有哪些section:

2bf7a778-e228-11ec-ba43-dac502259ad0.png

可以看到:一共有28個(gè)section,其中的21、22就是兩個(gè)GOT表。

另外,從裝載的角度來看,裝載器并不是把這些sections分開來處理,而是根據(jù)不同的讀寫屬性,把多個(gè)section看做一個(gè)segment

再次通過指令 readelf -l liba.so ,來查看一下segment信息:

2c426c2c-e228-11ec-ba43-dac502259ad0.png

也就是說:

28個(gè)section中(關(guān)注綠色線條):

  1. section 0 ~ 16 都是可讀、可執(zhí)行權(quán)限,被當(dāng)做一個(gè) segment;

  2. section 17 ~ 24 都是可讀、可寫的權(quán)限,被動(dòng)作另一個(gè) segment;

再來重點(diǎn)看一下.got.got.plt這兩個(gè)section(關(guān)注黃色矩形框):

可見:.got.got.plt與數(shù)據(jù)段一樣,都是可讀、可寫的,所以被當(dāng)做同一個(gè) segment被加載到內(nèi)存中。

通過以上這2張圖(紅色矩形框),可以得到liba.so動(dòng)態(tài)庫文件的內(nèi)部結(jié)構(gòu)如下:

2c860b26-e228-11ec-ba43-dac502259ad0.png

liba.so動(dòng)態(tài)庫的虛擬地址

來繼續(xù)觀察liba.so文件segment信息中的AirtAddr列,它表示的是被加載到虛擬內(nèi)存中的地址,重新貼圖如下:

2cb92b64-e228-11ec-ba43-dac502259ad0.png

因?yàn)榫幾g動(dòng)態(tài)庫時(shí),使用了代碼位置無關(guān)參數(shù)(-fPIC),這里的虛擬地址從0x0000_0000開始。

當(dāng)liba.so的代碼段、數(shù)據(jù)段被加載到內(nèi)存中時(shí),動(dòng)態(tài)鏈接器找到一塊空閑空間,這個(gè)空間的開始地址,就相當(dāng)于一個(gè)基地址。

liba.so中的代碼段和數(shù)據(jù)段中所有的虛擬地址信息,只要加上這個(gè)基地址,就得到了實(shí)際虛擬地址。

我們還是把上圖中的輸出信息,畫出詳細(xì)的內(nèi)存模型圖,如下所示:

2ce49164-e228-11ec-ba43-dac502259ad0.png

GOT表的內(nèi)部結(jié)構(gòu)

現(xiàn)在,我們已經(jīng)知道了liba.so庫的文件布局,也知道了它的虛擬地址,此時(shí)就可以來進(jìn)一步的看一下.got.got.plt這兩個(gè)表的內(nèi)部結(jié)構(gòu)了。

從剛才的圖片中看出:

  1. .got 表的長(zhǎng)度是 0x1c,說明有 7 個(gè)表項(xiàng)(每個(gè)表項(xiàng)占 4 個(gè)字節(jié));

  2. .got.plt 表的長(zhǎng)度是 0x18,說明有 6 個(gè)表項(xiàng);

上文已經(jīng)說過,這兩個(gè)表是用來重定位所有的變量和函數(shù)等符號(hào)的。

那么:liba.so通過什么方式來告訴動(dòng)態(tài)鏈接器:需要對(duì).got.got.plt這兩個(gè)表中的表項(xiàng)進(jìn)行地址重定位呢?

在靜態(tài)鏈接的時(shí)候,目標(biāo)文件是通過兩個(gè)重定位表.rel.text.rel.data這兩個(gè)段信息來告訴鏈接器的。

對(duì)于動(dòng)態(tài)鏈接來說,也是通過兩個(gè)重定位表來傳遞需要重定位的符號(hào)信息的,只不過名字有些不同:.rel.dyn.rel.plt。

通過指令 readelf -r liba.so來查看重定位信息:

2d0aeaf8-e228-11ec-ba43-dac502259ad0.png

從黃色和綠色的矩形框中可以看出:

  1. liba.so 引用了外部符號(hào) b,類型是 R_386_GLOB_DAT,這個(gè)符號(hào)的重定位描述信息在 .rel.dyn 段中;

  2. liba.so 引用了外部符號(hào) func_b, 類型是 R_386_JUMP_SLOT,這個(gè)符號(hào)的重定位描述信息在 .rel.plt 段中;

從左側(cè)紅色的矩形框可以看出:每一個(gè)需要重定位的表項(xiàng)所對(duì)應(yīng)的虛擬地址,畫成內(nèi)存模型圖就是下面這樣:

2d67ec8a-e228-11ec-ba43-dac502259ad0.png

暫時(shí)只專注表項(xiàng)中的紅色部分:.got表中的b, .got.plt表中的func_b,這兩個(gè)符號(hào)都是libb.so中導(dǎo)出的。

也就是說:

liba.so的代碼中在操作變量b的時(shí)候,就到.got表中的0x0000_1fe8這個(gè)地址處來獲取變量b的真正地址;

liba.so的代碼中在調(diào)用func_b函數(shù)的時(shí)候,就到.got.plt表中的0x0000_200c這個(gè)地址處來獲取函數(shù)的真正地址;

匯編liba.so代碼

下面就來反匯編一下liba.so,看一下指令碼中是如何對(duì)這兩個(gè)表項(xiàng)進(jìn)行尋址的。

執(zhí)行反匯編指令:$ objdump -d liba.so,這里只貼出func_a1函數(shù)的反匯編代碼:

3092d5be-e228-11ec-ba43-dac502259ad0.png

第一個(gè)綠色矩形框(call 490 <__x86.get_pc_thunk.bx>)的功能是:把下一條指令(add)的地址存儲(chǔ)到%ebx中,也就是:

%ebx = 0x622

然后執(zhí)行: add $0x19de,%ebx,讓%ebx加上0x19de,結(jié)果就是:%ebx = 0x2000。

0x2000正是.got.plt表的開始地址!

看一下第2個(gè)綠色矩形框:

mov -0x18(%ebx),%eax: 先用%ebx減去0x18的結(jié)果,存儲(chǔ)到%eax中,結(jié)果是:%eax = 0x1fe8,這個(gè)地址正是變量b.got表中的虛擬地址。

movl $0x1f,(%eax):在把0x1f(十進(jìn)制就是31),存儲(chǔ)到0x1fe8表項(xiàng)中存儲(chǔ)的地址所對(duì)應(yīng)的內(nèi)存單元中(libb.so的數(shù)據(jù)段中的某個(gè)位置)。

因此,當(dāng)鏈接器進(jìn)行重定位之后,0x1fe8表項(xiàng)中存儲(chǔ)的就是變量b的真正地址,而上面這兩步操作,就把數(shù)值31賦值給變量b了。

3個(gè)綠色矩形框,是調(diào)用函數(shù)func_b,稍微復(fù)雜一些,跳轉(zhuǎn)到符號(hào) func_b@plt的地方,看一下反匯編代碼:

30cd8a7e-e228-11ec-ba43-dac502259ad0.png

jmp指令調(diào)用了%ebx + 0xc處的那個(gè)函數(shù)指針,從上面的.got.plt布局圖中可以看出,重定位之后這個(gè)表項(xiàng)中存儲(chǔ)的正是func_b函數(shù)的地址(libb.so中代碼段的某個(gè)位置),所以就正確的跳轉(zhuǎn)到該函數(shù)中了。

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6715

    瀏覽量

    88308
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4671

    瀏覽量

    67765
  • 動(dòng)態(tài)鏈接
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    5739

原文標(biāo)題:Linux 動(dòng)態(tài)鏈接過程中的【重定位】底層原理

文章出處:【微信號(hào):LinuxHub,微信公眾號(hào):Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    激光錫膏和普通錫膏在焊接過程中有哪些區(qū)別?

    隨著電子行業(yè)的發(fā)展迅速,科技與制造水平的不斷發(fā)展,激光錫焊工藝和設(shè)備也日趨成熟,然而激光錫膏和普通錫膏在焊接過程中也有一些區(qū)別,這些區(qū)別主要在于其使用方法和性能特點(diǎn),接下來由深圳佳金源錫膏廠家來講
    的頭像 發(fā)表于 08-30 14:37 ?100次閱讀
    激光錫膏和普通錫膏在焊<b class='flag-5'>接過程中</b>有哪些區(qū)別?

    靜態(tài)鏈接動(dòng)態(tài)鏈接

    一、靜態(tài)鏈接靜態(tài)鏈接通過靜態(tài)庫進(jìn)行鏈接,生成的目標(biāo)程序包含運(yùn)行需要的所有庫,可以直接運(yùn)行,不過就是文件比較大。靜態(tài)庫是匯編產(chǎn)生的.o文件的
    發(fā)表于 08-27 10:20

    SMT焊接過程中,錫膏管控要點(diǎn)有哪些?

    SMT焊接過程中,不管是產(chǎn)量、時(shí)間、還是質(zhì)量都是需要掌控在一定的范圍之內(nèi)的,錫膏是一個(gè)品質(zhì)控制的關(guān)鍵因素,那么我們應(yīng)該如何更好管控錫膏呢?下面深圳佳金源錫膏廠家來介紹一下:1、在存放錫膏時(shí),需要
    的頭像 發(fā)表于 07-16 16:41 ?243次閱讀
    SMT焊<b class='flag-5'>接過程中</b>,錫膏管控要點(diǎn)有哪些?

    e2 studio鏈接腳本的修改指導(dǎo)

    一般而言,程序編譯經(jīng)歷下圖四個(gè)階段,鏈接是編譯的最后一步,無論是在PC上編譯代碼,還是在PC上使用嵌入式gcc工具交叉編譯嵌入式代碼,編譯過程都是如下幾步。深入理解鏈接過程是嵌入式工程師必要掌握的能力!
    的頭像 發(fā)表于 06-13 10:49 ?333次閱讀
    e2 studio<b class='flag-5'>中</b><b class='flag-5'>鏈接</b>腳本的修改指導(dǎo)

    解析經(jīng)典藍(lán)牙設(shè)備連接過程

    應(yīng)用,藍(lán)牙設(shè)備發(fā)現(xiàn)、連接、斷開等使用場(chǎng)景較為常見,其中設(shè)備連接是至關(guān)重要的一環(huán),它涵蓋了設(shè)備之間建立連接的整個(gè)過程。本文將對(duì)經(jīng)典藍(lán)牙設(shè)備連接過程進(jìn)行解析,帶大家一起了解連接的整個(gè)
    的頭像 發(fā)表于 06-05 09:11 ?1314次閱讀
    解析經(jīng)典藍(lán)牙設(shè)備連<b class='flag-5'>接過程</b>

    接過程視覺監(jiān)控技術(shù)的應(yīng)用與挑戰(zhàn)

    小編一起了解焊接過程視覺監(jiān)控技術(shù)的應(yīng)用與挑戰(zhàn)。 視覺監(jiān)控技術(shù)的應(yīng)用 視覺監(jiān)控技術(shù)通過攝像機(jī)和傳感器實(shí)時(shí)獲取焊接過程中的圖像和數(shù)據(jù),利用圖像處理、模式識(shí)別等技術(shù)進(jìn)行分析和處理,實(shí)現(xiàn)對(duì)焊接過程
    的頭像 發(fā)表于 05-22 11:30 ?286次閱讀
    焊<b class='flag-5'>接過程</b>視覺監(jiān)控技術(shù)的應(yīng)用與挑戰(zhàn)

    淺談焊接過程中的不潤濕與反潤濕現(xiàn)象

    不潤濕和反潤濕現(xiàn)象是焊接過程中常見的缺陷,它們分別表現(xiàn)為焊料與基體金屬之間的不完全接觸和部分潤濕后的退縮。
    的頭像 發(fā)表于 05-20 09:41 ?365次閱讀
    淺談焊<b class='flag-5'>接過程中</b>的不潤濕與反潤濕現(xiàn)象

    鏈接與硬鏈接的區(qū)別

    鏈接又叫符號(hào)鏈接,和原文件不是一個(gè)文件,類似Windows的快捷方式,如果原始文件被刪除,所有指向它的符號(hào)鏈接也就都被破壞了
    的頭像 發(fā)表于 04-19 10:09 ?731次閱讀
    軟<b class='flag-5'>鏈接</b>與硬<b class='flag-5'>鏈接</b>的區(qū)別

    接過程分析系統(tǒng)

    在機(jī)械制造、航空航天、船舶加工、油氣管道等行業(yè)的金屬材料加工過程中,焊接是重要的手段之一,焊接的質(zhì)量直接關(guān)系到產(chǎn)品的性能和使用壽命,焊接過程分析數(shù)據(jù)則是檢驗(yàn)焊接質(zhì)量的重要依據(jù)。 隨著物聯(lián)網(wǎng)、大數(shù)據(jù)等
    的頭像 發(fā)表于 02-02 15:15 ?320次閱讀
    焊<b class='flag-5'>接過程</b>分析系統(tǒng)

    感應(yīng)焊接的優(yōu)點(diǎn),高頻焊接過程中應(yīng)該注意哪些問題?

    感應(yīng)焊接的優(yōu)點(diǎn),高頻焊接過程中應(yīng)該注意哪些問題?
    的頭像 發(fā)表于 12-21 14:38 ?856次閱讀

    接過程中的不潤濕與反潤濕現(xiàn)象

    不潤濕和反潤濕現(xiàn)象是焊接過程中常見的缺陷,它們分別表現(xiàn)為焊料與基體金屬之間的不完全接觸和部分潤濕后的退縮。
    的頭像 發(fā)表于 12-15 09:06 ?1234次閱讀
    焊<b class='flag-5'>接過程中</b>的不潤濕與反潤濕現(xiàn)象

    在焊接過程中發(fā)現(xiàn)錫膏太稀怎么辦?

    近日有客戶咨詢?cè)诤?b class='flag-5'>接過程中發(fā)現(xiàn)錫膏太稀怎么辦,今天佳金源錫膏廠家來為大家簡(jiǎn)單分析一下,如果錫膏太稀,可能會(huì)導(dǎo)致在焊接過程中無法獲得良好的焊點(diǎn)質(zhì)量。以下是發(fā)現(xiàn)錫膏太稀怎么辦的幾種可能的臨時(shí)解決方法:1
    的頭像 發(fā)表于 11-24 17:31 ?594次閱讀
    在焊<b class='flag-5'>接過程中</b>發(fā)現(xiàn)錫膏太稀怎么辦?

    UMTS網(wǎng)絡(luò)的SRNS定位機(jī)制進(jìn)行分析和研究

    電子發(fā)燒友網(wǎng)站提供《UMTS網(wǎng)絡(luò)的SRNS定位機(jī)制進(jìn)行分析和研究.pdf》資料免費(fèi)下載
    發(fā)表于 10-25 14:14 ?0次下載
    UMTS網(wǎng)絡(luò)<b class='flag-5'>中</b>的SRNS<b class='flag-5'>重</b><b class='flag-5'>定位</b>機(jī)制<b class='flag-5'>進(jìn)行</b>分析和研究

    智造之眼丨激光焊接定位引導(dǎo)

    在激光焊接過程中,利用機(jī)器視覺定位,提供定位參數(shù),實(shí)現(xiàn)精準(zhǔn)定位,引導(dǎo)機(jī)器人進(jìn)行高精度的激光焊接,在有效提高焊接質(zhì)量的同時(shí),也能夠幫助實(shí)現(xiàn)連續(xù)
    的頭像 發(fā)表于 10-21 17:00 ?531次閱讀
    智造之眼丨激光焊接<b class='flag-5'>定位</b>引導(dǎo)

    串口在通信的過程中是怎么對(duì)數(shù)據(jù)進(jìn)行校驗(yàn)的?

    串口在通信的過程中怎么對(duì)數(shù)據(jù)進(jìn)行校驗(yàn)
    發(fā)表于 10-11 07:13