開篇
今天我們來聊聊 Golang 中的內(nèi)聯(lián)。
我們知道,函數(shù)調(diào)用本身是存在成本的。如果把一個實際調(diào)用的函數(shù)產(chǎn)生的指令,直接插入到的位置,來替換對應的函數(shù)調(diào)用指令。就可以消除掉這部分性能損耗。但同時也要注意,我們需要維護各個模塊的可讀性,需要保證高內(nèi)聚,低耦合,不可能把所有邏輯合到一個函數(shù),這樣可讀性大大降低。
那么,既然在代碼層面做不太好,還有沒有別的招呢?
內(nèi)聯(lián)就是來做這件事的。下面我們一起來看一下。
內(nèi)聯(lián)
所謂內(nèi)聯(lián),指的是編譯期間,直接將調(diào)用函數(shù)的地方替換為函數(shù)的實現(xiàn),它可以減少函數(shù)調(diào)用的開銷以提高程序的性能。內(nèi)聯(lián)函數(shù)是直接復制“鑲嵌”到主函數(shù)中去的,就是將內(nèi)聯(lián)函數(shù)的代碼直接放在內(nèi)聯(lián)函數(shù)的位置上,
這與一般函數(shù)不同,主函數(shù)在調(diào)用一般函數(shù)的時候,是指令跳轉(zhuǎn)到被調(diào)用函數(shù)的入口地址,執(zhí)行完被調(diào)用函數(shù)后,指令再跳轉(zhuǎn)回主函數(shù)上繼續(xù)執(zhí)行后面的代碼;而由于內(nèi)聯(lián)函數(shù)是將函數(shù)的代碼直接放在了函數(shù)的位置上,所以沒有指令跳轉(zhuǎn),指令按順序執(zhí)行。Go程序編譯時,默認將進行內(nèi)聯(lián)優(yōu)化。
當然,內(nèi)聯(lián)也并不是沒有代價,這本質(zhì)是一種以空間換時間的優(yōu)化方法,其帶來的優(yōu)點是使CPU需要執(zhí)行的指令數(shù)變少了,不需要根據(jù)地址跳轉(zhuǎn)的過程了,不用壓棧和出棧的過程了,我們把可以復用的程序指令在調(diào)用它的地方完全展開了。如果一個函數(shù)在很多地方都被調(diào)用了,那么就會展開很多次,整個程序占用的空間就會變大了。
需要注意,內(nèi)聯(lián)也是有門檻的,并不是隨便一個函數(shù)調(diào)用都可以原地替換。Golang 編譯器內(nèi)部會有一套自己的判斷規(guī)則,判斷一次函數(shù)調(diào)用能否被內(nèi)聯(lián),后面的章節(jié)我們會提到。這也是為什么我們會說:
Inlining is the act of combining smaller functions into their respective callers.
這個 small 的程度很關(guān)鍵。
簡單小結(jié)一下,內(nèi)聯(lián)帶來的好處有兩個:
解除函數(shù)調(diào)用的開銷,以空間換時間;
支持編譯器更有效地應用其他優(yōu)化策略。
函數(shù)調(diào)用開銷
一個goroutine會有一個單獨的棧,棧又會包含多個棧幀,棧幀是函數(shù)調(diào)用時在棧上為函數(shù)所分配的區(qū)域。函數(shù)調(diào)用存在一些固定開銷:
創(chuàng)建棧幀;
讀寫寄存器;
棧溢出檢測。
內(nèi)聯(lián)什么時候最有效
函數(shù)執(zhí)行的開銷 vs 函數(shù)調(diào)用的開銷。這兩個開銷的比值會很大程度上決定【內(nèi)聯(lián)】的效果。
內(nèi)聯(lián)其實就是把函數(shù)調(diào)用這份固定開銷給消除了,所以尤其對于函數(shù)體極其簡單的函數(shù)有效果。如果你的函數(shù)執(zhí)行了一系列復雜邏輯,開銷遠超【函數(shù)調(diào)用】本身,這里的優(yōu)化就微不足道了。
內(nèi)聯(lián)雖然可以減少函數(shù)調(diào)用的開銷,但是也可能因為存在重復代碼,從而導致 CPU 緩存命中率降低,所以并不能盲目追求過度的內(nèi)聯(lián),需要結(jié)合 profile 結(jié)果來具體分析。
Golang 編譯器對內(nèi)聯(lián)的要求
參考官方 wiki:github.com/golang/go/w…[1]
想要內(nèi)聯(lián),方法本身必須滿足以下條件:
函數(shù)足夠簡單,當解析AST時,Go申請了80個節(jié)點作為內(nèi)聯(lián)的預算。每個節(jié)點都會消耗一個預算。函數(shù)的開銷不能超過這個預算;
不能包含閉包,defer,recover,select;
不能以 go:noinline 或 go:unitptrescapes 開頭;
必須有函數(shù)體;
其他等復雜要求,詳細可見src/cmd/compile/internal/gc/inl.go相關(guān)內(nèi)容。我們可以使用 gcflags 參數(shù)來判斷能不能內(nèi)聯(lián)。
內(nèi)聯(lián)的實現(xiàn)原理建議大家看看這篇文章:gocompiler.shizhz.me/8.-golang-b…[2]
如何禁止內(nèi)聯(lián)
單個函數(shù)級別:在函數(shù)定義前一行添加//go:noinline;
全局編譯級別:可通過-gcflags="-l"選項全局禁用內(nèi)聯(lián),與一個-l禁用內(nèi)聯(lián)相反,如果傳遞兩個或兩個以上的-l則會打開內(nèi)聯(lián),并啟用更激進的內(nèi)聯(lián)策略。
gcflags
go build 時可以使用 -gcflags 指定編譯選項,-gcflags 參數(shù)的格式是:
-gcflags="pattern=arg list"
pattern 是選擇包的模式,arg list 是空格分割的編譯選項,如果編譯選項中含有空格,可以使用引號包起來。
如:-gcflags="all=-N -l" 代表的是表示主模塊和它所有的依賴都禁用【編譯器優(yōu)化】和【內(nèi)聯(lián)】。更多編譯選項參照 go tool compile --help
Use -gcflags -m to observe the result of escape analysis and inlining decisions for the gc toolchain.
使用 go build 編譯時,我們可以使用參數(shù)-gflags="-m"運行,可顯示被內(nèi)聯(lián)的函數(shù),使用運行參數(shù)-gflags="-m -m"可以看到原因。類似:
./main.go:14:6:cannotinlinexxx:unhandledopXXX /ins.go:9:6:cannotinlinexxx:functiontoocomplex:cost104exceedsbudget80
我們可以用下面的命令分析變量是否逃逸:
gorun-gcflags'-m-l'main.go
-m 其實是打印優(yōu)化策略的語義,實際上最多總共可以用 4 個 -m,但是信息量較大,一般用 1 個就可以了;
-l 會禁用函數(shù)內(nèi)聯(lián),在這里禁用掉內(nèi)聯(lián)能更好的觀察逃逸情況,減少干擾
內(nèi)聯(lián)后堆棧信息還對不對
內(nèi)聯(lián)會將函數(shù)調(diào)用的過程抹掉,這會引入一個新的問題:代碼的堆棧信息還能否保證。其實這一點不用擔心,Golang 內(nèi)部會為每個存在內(nèi)聯(lián)優(yōu)化的 goroutine 維持一個內(nèi)聯(lián)樹(inlining tree),該樹可通過 -gcflags="-d pctab=pctoinline" 命令查看,Go在生成的代碼中映射了內(nèi)聯(lián)函數(shù)。并且,也映射了行號。這張表被嵌入到了二進制文件中,所以在運行時可以得到準確的堆棧信息。
審核編輯:湯梓紅
-
寄存器
+關(guān)注
關(guān)注
31文章
5295瀏覽量
119823 -
函數(shù)
+關(guān)注
關(guān)注
3文章
4284瀏覽量
62325 -
編譯器
+關(guān)注
關(guān)注
1文章
1617瀏覽量
49016
原文標題:初探 Golang 內(nèi)聯(lián)
文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論