0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)程序是如何運(yùn)行起來(lái)的

Linux閱碼場(chǎng) ? 來(lái)源:卯時(shí)卯刻 ? 作者:KINGYT ? 2021-10-12 17:48 ? 次閱讀

相信很多同學(xué)都會(huì)有疑問(wèn),一個(gè)程序是如何運(yùn)行起來(lái)的,為什么我們?cè)趕hell中執(zhí)行了一個(gè)程序,它的main函數(shù)就會(huì)被調(diào)用呢?在main函數(shù)被調(diào)用之前及之后,又經(jīng)歷了什么呢?

今天我們就來(lái)詳細(xì)的說(shuō)下這個(gè)問(wèn)題。

還是和之前一樣,我畫了一張程序運(yùn)行的全景圖,在上圖中,一個(gè)程序運(yùn)行所經(jīng)歷的代碼段,我都標(biāo)注了其所在的git倉(cāng)庫(kù)、源文件、及函數(shù)名,想要自己看源碼的,可以參考下上圖中的這些信息。

我們先從整體上講一下這張圖。

linux下,我們一般都是通過(guò)shell來(lái)執(zhí)行程序的。

shell其實(shí)也是一個(gè)普通的程序,它也有自己的main函數(shù),它在正常運(yùn)行后,會(huì)通過(guò)調(diào)用read_command函數(shù),來(lái)等待用戶輸入命令。

在接收到用戶輸入的命令后,shell會(huì)先使用fork系統(tǒng)調(diào)用,創(chuàng)建一個(gè)子進(jìn)程,然后再在這個(gè)子進(jìn)程中,通過(guò)execve系統(tǒng)調(diào)用,執(zhí)行最終的用戶程序。

在子進(jìn)程執(zhí)行用戶程序期間,shell主進(jìn)程會(huì)調(diào)用waitpid函數(shù),阻塞等待子進(jìn)程的完成,子進(jìn)程完成之后,waitpid從阻塞狀態(tài)中返回,且status參數(shù)中會(huì)帶著子進(jìn)程的退出碼,這個(gè)退出碼會(huì)在后續(xù)的邏輯中被保存起來(lái),供用戶查詢。

之后,shell主進(jìn)程進(jìn)入到下一次循環(huán),繼續(xù)等待用戶輸入命令并執(zhí)行。

以上就是shell的主體邏輯,對(duì)應(yīng)于上面全景圖中的藍(lán)色部分。

下面我們?cè)賮?lái)看下linux內(nèi)核中有關(guān)execve系統(tǒng)調(diào)用的代碼,也就是上面全景圖中的綠色部分。

shell通過(guò)execve系統(tǒng)調(diào)用,告知linux內(nèi)核,要在當(dāng)前進(jìn)程中執(zhí)行目標(biāo)程序,linux內(nèi)核經(jīng)過(guò)層層代碼,最終到達(dá)load_elf_binary函數(shù)。

該函數(shù)是整個(gè)系統(tǒng)調(diào)用中最核心的一段邏輯,它主要用來(lái)為目標(biāo)程序準(zhǔn)備各種執(zhí)行環(huán)境。

比如,映射代碼區(qū)、數(shù)據(jù)區(qū)等到當(dāng)前進(jìn)程的虛擬地址空間,將程序名、環(huán)境變量、程序參數(shù)、及各種其他數(shù)據(jù),有規(guī)律的壓入到新分配的棧中,等等。

之后,load_elf_binary函數(shù)會(huì)調(diào)用start_thread,進(jìn)而會(huì)調(diào)用start_thread_common函數(shù)。

在該函數(shù)里,會(huì)將返回到用戶區(qū)之后,要執(zhí)行的,用戶區(qū)程序的起始地址,設(shè)置到regs-》ip里,同時(shí)也會(huì)將上面新初始化好的,用戶堆棧的棧頂?shù)刂?,設(shè)置到regs-》sp里。

當(dāng)execve系統(tǒng)調(diào)用返回到用戶區(qū)之后,regs-》ip和regs-》sp里的值,會(huì)分別賦值到rip和rsp寄存器里,這樣指定的用戶程序就可以繼續(xù)執(zhí)行了。

這一流程我們?cè)谥暗奈恼?精致全景圖 | 系統(tǒng)調(diào)用是如何實(shí)現(xiàn)的 中講過(guò),這里就不再贅述。

不過(guò)這里還是有一點(diǎn)需要注意,就是設(shè)置到regs-》ip中的地址,并不是我們自己程序的起始地址,而是動(dòng)態(tài)鏈接器 /lib64/ld-linux-x86-64.so.2 的起始地址。

之所以要設(shè)置動(dòng)態(tài)鏈接器的起始地址,是因?yàn)槲覀冃枰诜祷氐接脩魠^(qū)之后,讓其可以繼續(xù)為我們的程序準(zhǔn)備執(zhí)行環(huán)境,比如,幫忙加載程序依賴的各種動(dòng)態(tài)鏈接庫(kù)等。

在動(dòng)態(tài)鏈接器為我們的程序準(zhǔn)備好執(zhí)行環(huán)境之后,它會(huì)從進(jìn)程堆棧的auxiliary vector區(qū),取出最終用戶程序的真正起始地址,并跳轉(zhuǎn)到該位置開始執(zhí)行。

auxiliary vector區(qū)存放的用戶程序的起始地址,是上面linux內(nèi)核初始化堆棧時(shí)設(shè)置的。

動(dòng)態(tài)鏈接器相關(guān)的代碼就是這些,它對(duì)應(yīng)于上面全景圖中紫色的部分。

在跳轉(zhuǎn)到我們自己程序的起始地址后,首先執(zhí)行的并不是我們寫的main函數(shù),而是glibc里名為_start的一段匯編代碼。

這段匯編代碼也比較簡(jiǎn)單,主要是從堆棧中獲取main函數(shù)所需的argc,argv等參數(shù),然后最終調(diào)用我們寫的main函數(shù)。

當(dāng)main函數(shù)返回之后,glibc里的后續(xù)代碼,會(huì)將main函數(shù)的返回值,當(dāng)作該進(jìn)程的退出碼,然后調(diào)用exit結(jié)束該進(jìn)程。

這些代碼對(duì)應(yīng)于上面全景圖中的粉色部分。

進(jìn)程調(diào)用exit退出之后,shell主進(jìn)程也會(huì)從waitpid的阻塞狀態(tài)中返回,然后繼續(xù)進(jìn)行下一次循環(huán)。

以上就是程序完整的啟動(dòng)和結(jié)束流程。

下面我們來(lái)看下具體的源碼實(shí)現(xiàn)。

注意,為了方便理解,很多代碼我們都做了刪減。

首先是shell部分,shell是一個(gè)普通的程序,它也有自己的main函數(shù):

372bd54e-22a0-11ec-82a8-dac502259ad0.png

該函數(shù)里調(diào)用了reader_loop:

373c6454-22a0-11ec-82a8-dac502259ad0.png

reader_loop的主體邏輯是,在while循環(huán)里不斷的使用read_command函數(shù)讀取用戶輸入的命令,然后使用execute_command執(zhí)行該命令。

execute_command函數(shù)經(jīng)過(guò)層層代碼后,會(huì)使用下圖中的fork,創(chuàng)建一個(gè)子進(jìn)程:

3788521a-22a0-11ec-82a8-dac502259ad0.png

然后在該子進(jìn)程中,使用execve系統(tǒng)調(diào)用,告知linux內(nèi)核,用當(dāng)前子進(jìn)程執(zhí)行新的用戶程序:

37c7b0b8-22a0-11ec-82a8-dac502259ad0.png

在shell主進(jìn)程中,會(huì)調(diào)用waitpid函數(shù),阻塞等待子進(jìn)程的完成:

37d9e45e-22a0-11ec-82a8-dac502259ad0.png

當(dāng)子進(jìn)程退出后,waitpid會(huì)從阻塞狀態(tài)中返回,并在status里攜帶子進(jìn)程的退出碼,之后shell主進(jìn)程又返回上面的read_command函數(shù),繼續(xù)等待用戶下一條命令的輸入。

以上就是bash的主體邏輯,對(duì)應(yīng)于上面全景圖中的藍(lán)色部分。

下面我們繼續(xù)看全景圖中的綠色部分,也就是linux內(nèi)核中有關(guān)execve的代碼。

當(dāng)shell的子進(jìn)程執(zhí)行execve函數(shù)時(shí),linux內(nèi)核中對(duì)應(yīng)的系統(tǒng)調(diào)用被觸發(fā):

37eb0efa-22a0-11ec-82a8-dac502259ad0.png

沿著函數(shù)的調(diào)用鏈,我們會(huì)找到一個(gè)名為do_execveat_common的函數(shù),在該函數(shù)中,會(huì)將目標(biāo)程序的文件名、環(huán)境變量、及各種程序參數(shù)等字符串,拷貝到新創(chuàng)建的用戶堆棧區(qū):

3822e884-22a0-11ec-82a8-dac502259ad0.png

此時(shí),新創(chuàng)建的堆棧區(qū)里內(nèi)容,就如上面全景圖中右下角的a1-a9, b1-b8部分構(gòu)成的二維網(wǎng)格區(qū)域里所示的內(nèi)容。

其中,黃色區(qū)域里存放的是程序參數(shù) 。/a.out hello world,藍(lán)色區(qū)域里存放的是環(huán)境變量 SHLVL=2, HOME=/, TERM=linux, PWD=/,橘黃色區(qū)域里存放的是要執(zhí)行的程序文件名 。/a.out。

這些內(nèi)容和我們執(zhí)行的測(cè)試程序,及其所處的環(huán)境也正好一樣:

3857cfe0-22a0-11ec-82a8-dac502259ad0.png

繼續(xù)沿著內(nèi)核函數(shù)調(diào)用鏈,我們最終會(huì)來(lái)到load_elf_binary函數(shù),該函數(shù)是整個(gè)系統(tǒng)調(diào)用的核心。

由于linux上執(zhí)行的程序基本上都是elf格式,所以內(nèi)核選擇的加載函數(shù)是load_elf_binary,看這個(gè)函數(shù)時(shí),可以參考elf格式的man文檔:

https://man.archlinux.org/man/elf.5

該函數(shù)比較復(fù)雜,我對(duì)其做了大量刪減,并添加了很多注釋:

387b14fa-22a0-11ec-82a8-dac502259ad0.png

該函數(shù)最后會(huì)調(diào)用start_thread函數(shù),進(jìn)而會(huì)調(diào)用start_thread_common函數(shù):

38a84222-22a0-11ec-82a8-dac502259ad0.png

這個(gè)函數(shù)重點(diǎn)需要注意的是對(duì)regs-》ip和regs-》sp的賦值,其作用在load_elf_binary函數(shù)的截圖中已經(jīng)注釋過(guò)了,就是在返回到用戶區(qū)之后,這兩個(gè)字段的值會(huì)被分別拷貝到rip和rsp寄存器里,所以這里的賦值,就相當(dāng)于在返回用戶區(qū)之后,對(duì)rip和rsp寄存器的賦值,這個(gè)在 精致全景圖 | 系統(tǒng)調(diào)用是如何實(shí)現(xiàn)的 有講。

到這里內(nèi)核部分的代碼就都已經(jīng)結(jié)束了。

由load_elf_binary函數(shù)截圖中可見,regs-》ip中設(shè)置的地址是elf_entry,即動(dòng)態(tài)鏈接器的起始地址,而不是我們自己程序的起始地址。

原因是,我們還需要?jiǎng)討B(tài)鏈接器繼續(xù)幫我們準(zhǔn)備執(zhí)行環(huán)境,比如幫我們加載程序依賴的動(dòng)態(tài)鏈接庫(kù)等。

所以在execve系統(tǒng)調(diào)用返回到用戶區(qū)之后,代碼流程就進(jìn)入到了動(dòng)態(tài)鏈接器里的邏輯,即上面全景圖中的紫色區(qū)域:

38b7ad3e-22a0-11ec-82a8-dac502259ad0.png

上圖中的_start是動(dòng)態(tài)鏈接器的起始執(zhí)行地址,這個(gè)可以通過(guò)下面的方式來(lái)確認(rèn):

38fd1e50-22a0-11ec-82a8-dac502259ad0.png

在_start函數(shù)中,先將rsp寄存器的值,即上面內(nèi)核新初始化的堆棧的棧頂?shù)刂?,賦值到rdi中,然后再使用call指令,調(diào)用_dl_start函數(shù)。

之所以要賦值到rdi寄存器中,是因?yàn)?a href="http://www.ttokpm.com/soft/data/21-24/" target="_blank">c語(yǔ)言的calling convention約定好的,用此方式來(lái)傳遞參數(shù)。

再看_dl_start函數(shù):

391105f0-22a0-11ec-82a8-dac502259ad0.png

該函數(shù)調(diào)用了_dl_start_final,返回一個(gè)地址,這個(gè)地址就是我們自己程序的起始地址。

再看_dl_start_final:

393b5134-22a0-11ec-82a8-dac502259ad0.png

該函數(shù)又調(diào)用了_dl_sysdep_start:

3974678a-22a0-11ec-82a8-dac502259ad0.png

在這里,動(dòng)態(tài)鏈接器通過(guò)內(nèi)核初始化的堆棧區(qū)中的auxiliary vector,找到最終用戶程序的起始執(zhí)行地址。

再之后,動(dòng)態(tài)鏈接器的函數(shù)調(diào)用鏈依次退出,最終返回到上面的_start函數(shù)。

_start函數(shù)之后會(huì)順序執(zhí)行_dl_start_user,相關(guān)代碼也在上面的_start函數(shù)的截圖里。

其邏輯是,先將rax中的值,即_dl_start函數(shù)返回的最終用戶程序的起始地址,賦值到r12寄存器中,然后再jmp到r12寄存器指向的地址,即開始執(zhí)行最終的用戶程序邏輯。

至于rax中的值,為什么是_dl_start函數(shù)返回的地址,這個(gè)其實(shí)也是 c calling convention 中的約定,感興趣可以自己查下。

以上就是動(dòng)態(tài)鏈接器的全部邏輯,其對(duì)應(yīng)于全景圖中的紫色部分。

最后,邏輯進(jìn)入到了全景圖中的粉色部分。

動(dòng)態(tài)鏈接器從內(nèi)核設(shè)置的auxiliary vector中,獲取的用戶程序的起始地址,還并不是我們的main函數(shù),而是glibc中一段名為_start的代碼,這個(gè)可以通過(guò)下面的方式確認(rèn):

39c36312-22a0-11ec-82a8-dac502259ad0.png

該_start代碼段內(nèi)容如下:

39f2140a-22a0-11ec-82a8-dac502259ad0.png

它從堆棧中獲取到argc和argv,然后調(diào)用__libc_start_main:

3a222078-22a0-11ec-82a8-dac502259ad0.png

在__libc_start_main里,才真正的調(diào)用了我們寫的main函數(shù)。

當(dāng)main函數(shù)返回之后,__libc_start_main里用main函數(shù)返回的值,作為該進(jìn)程的退出碼,然后調(diào)用exit退出當(dāng)前進(jìn)程。

當(dāng)該進(jìn)程退出后,shell主進(jìn)程也從waitpid的阻塞狀態(tài)返回,并攜帶用戶程序的退出碼。

在上面全景圖這個(gè)示例中,返回碼為99:

3a58d370-22a0-11ec-82a8-dac502259ad0.png

之后,shell主進(jìn)程又進(jìn)入到下一次循環(huán),繼續(xù)等待用戶命令并執(zhí)行,也就是說(shuō),又進(jìn)入到全景圖中的藍(lán)色部分。

至此,在linux上執(zhí)行程序的流程,就形成了一個(gè)完整閉環(huán)。

你,學(xué)廢了嗎?

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 程序
    +關(guān)注

    關(guān)注

    115

    文章

    3719

    瀏覽量

    80356
  • Shell
    +關(guān)注

    關(guān)注

    1

    文章

    359

    瀏覽量

    23192

原文標(biāo)題:精致全景圖 | 程序是如何運(yùn)行起來(lái)的

文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    STM32L011F4P6運(yùn)行起來(lái)的原因?

    stlink_v2仿真器,仿真程序 ,運(yùn)行的很好,旦把仿真器去掉,再加電后,發(fā)現(xiàn) 程序沒(méi)有運(yùn)行起來(lái)
    發(fā)表于 04-15 07:47

    程序運(yùn)行后為什么沒(méi)有結(jié)果

    是最常見的問(wèn)題之??赡艽嬖谄磳戝e(cuò)誤、語(yǔ)法錯(cuò)誤、缺少分號(hào)等問(wèn)題,這些錯(cuò)誤會(huì)導(dǎo)致程序無(wú)法正常運(yùn)行。此時(shí),可以使用調(diào)試工具(如IDE中的調(diào)試器)來(lái)逐行檢查代碼,找出錯(cuò)誤所在,并進(jìn)行修正。 其次,
    的頭像 發(fā)表于 01-09 11:00 ?2182次閱讀

    idea如何多次運(yùn)行程序

    些實(shí)際的示例。 內(nèi)容: 、使用循環(huán)結(jié)構(gòu) 1.1 for循環(huán) 最常用的多次運(yùn)行程序的方法之是使用循環(huán)結(jié)構(gòu)。其中最常用的循環(huán)結(jié)構(gòu)是for循環(huán)。for循環(huán)可以重復(fù)執(zhí)行
    的頭像 發(fā)表于 12-06 14:59 ?1100次閱讀

    運(yùn)行Python程序的幾種常見方法

    Python是種高級(jí)編程語(yǔ)言,具有簡(jiǎn)單易學(xué),易于閱讀和調(diào)試的特點(diǎn)。當(dāng)你完成了個(gè)Python程序之后,你需要運(yùn)行它以檢查
    的頭像 發(fā)表于 11-28 15:32 ?1912次閱讀

    vim編寫個(gè)程序后怎么運(yùn)行

    當(dāng)你用 Vim 編寫完個(gè)程序后,你需要執(zhí)行系列步驟來(lái)運(yùn)行程序。下面是詳盡的說(shuō)明: 保存文件:在 Vim 編輯器中,按下 Esc 鍵,然后
    的頭像 發(fā)表于 11-28 15:27 ?2497次閱讀

    運(yùn)行c程序的基本步驟

    運(yùn)行C程序的基本步驟可以分為以下四個(gè)主要步驟:編寫程序、編譯程序、鏈接程序
    的頭像 發(fā)表于 11-27 16:21 ?4382次閱讀

    c程序運(yùn)行環(huán)境和運(yùn)行c程序的方法

    C語(yǔ)言是種通用的、高效的編程語(yǔ)言,被廣泛用于系統(tǒng)開發(fā)、嵌入式設(shè)備以及科學(xué)計(jì)算等領(lǐng)域。為了正確運(yùn)行C程序,我們需要了解C程序運(yùn)行環(huán)境,并掌
    的頭像 發(fā)表于 11-27 16:00 ?1548次閱讀

    如何運(yùn)行Python程序

    運(yùn)行Python程序非常簡(jiǎn)單。Python是種解釋型語(yǔ)言,這意味著可以直接通過(guò)解釋器來(lái)執(zhí)行代碼。下面我將詳細(xì)介紹如何運(yùn)行Python程序。
    的頭像 發(fā)表于 11-24 09:31 ?1005次閱讀

    python怎么運(yùn)行程序

    Python是種廣泛使用的編程語(yǔ)言,它的簡(jiǎn)易和可讀性使得它成為初學(xué)者和專業(yè)開發(fā)人員的首選。在運(yùn)行Python程序之前,您需要安裝Python解釋器,然后按照以下步驟進(jìn)行操作。 步驟1:安裝
    的頭像 發(fā)表于 11-24 09:25 ?2350次閱讀

    python運(yùn)行次自動(dòng)再次運(yùn)行

    自動(dòng)化是現(xiàn)代計(jì)算機(jī)科學(xué)和軟件開發(fā)的個(gè)重要領(lǐng)域。在Python中,有許多方法可以實(shí)現(xiàn)自動(dòng)運(yùn)行程序的功能。本文將詳細(xì)介紹如何使用Python實(shí)現(xiàn)自動(dòng)運(yùn)行程序的不同方法。
    的頭像 發(fā)表于 11-23 15:52 ?1315次閱讀

    pycharm怎么看程序運(yùn)行到哪里了

    查看程序運(yùn)行狀態(tài)。 首先,我們需要確保已經(jīng)在PyCharm中打開了要調(diào)試的項(xiàng)目。在項(xiàng)目中選擇個(gè)運(yùn)行的源代碼文件,右鍵點(diǎn)擊這個(gè)文件并選擇
    的頭像 發(fā)表于 11-22 11:18 ?4462次閱讀

    python寫完程序之后怎么運(yùn)行

    Python是門簡(jiǎn)潔、易學(xué)的編程語(yǔ)言,被廣泛應(yīng)用于數(shù)據(jù)分析、人工智能等領(lǐng)域。在學(xué)習(xí)Python編程的過(guò)程中,了解程序運(yùn)行機(jī)制是至關(guān)重要的。本文將詳盡解析Python程序
    的頭像 發(fā)表于 11-22 11:10 ?839次閱讀

    個(gè)線程模擬單片機(jī)程序框架分享

    首先來(lái)個(gè)demo,該demo是使用電腦開兩個(gè)線程:個(gè)線程模擬單片機(jī)的定時(shí)器中斷產(chǎn)生時(shí)間片輪詢個(gè)時(shí)鐘,另一個(gè)線程則模擬主函數(shù)中
    發(fā)表于 11-19 10:39 ?2185次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>線程模擬單片機(jī)<b class='flag-5'>程序</b>框架分享

    虛擬機(jī)如何運(yùn)行c程序

    虛擬機(jī)(Virtual Machine,VM)是種模擬了物理計(jì)算機(jī)的軟件,可以在計(jì)算機(jī)上創(chuàng)建虛擬的硬件平臺(tái),使得用戶可以在其中運(yùn)行操作系統(tǒng)和應(yīng)用程序。在虛擬機(jī)中運(yùn)行C
    的頭像 發(fā)表于 11-17 10:14 ?3984次閱讀

    如何實(shí)現(xiàn)個(gè)LED流水燈程序

    define是宏定義,程序在預(yù)處理階段將用define定義的內(nèi)容進(jìn)行了替換 。因此在程序運(yùn)行時(shí),常量表中并沒(méi)有用define定義的常量,系統(tǒng)不為它分配內(nèi)存。
    的頭像 發(fā)表于 11-10 11:37 ?2048次閱讀
    如何實(shí)現(xiàn)<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>LED流水燈<b class='flag-5'>程序</b>