0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

編譯器優(yōu)化那些事兒:別名分析概述

冬至子 ? 來源:畢昇編譯 ? 作者:邢玉帥 ? 2023-05-24 16:16 ? 次閱讀

1.簡介

別名分析是編譯器理論中的一種技術(shù),用于確定存儲位置是否可以以多種方式訪問。如果兩個指針指向相同的位置,則稱這兩個指針為別名。但是,它不能與指針分析混淆,指針分析解決的問題是一個指針可能指向哪些對象或者指向哪些地址,而別名分析解決的是兩個指針指向的是否是同一個對象。指針分析和別名分析通常通過靜態(tài)代碼分析來實現(xiàn)。

別名分析在編譯器理論中非常重要,在代碼優(yōu)化和安全方面有著非常廣泛且重要的應(yīng)用。編譯器級優(yōu)化需要指針別名信息來執(zhí)行死代碼消除(刪除不影響程序結(jié)果的代碼)、冗余加載/存儲指令消除、指令調(diào)度(重排列指令)等。編譯器級別的程序安全使用別名分析來檢測內(nèi)存泄漏和內(nèi)存相關(guān)的安全漏洞。

2.別名分析分類

別名分析種類繁多,通常按如下屬性進行分類:域敏感度(field-sensitivity)、過程內(nèi)分析(Intra-Procedural)v.s.過程間分析(Inter-Procedural)、上下文敏感度(context-sensitivity)和流敏感度(flow-sensitivity)。

2.1 域敏感(Field-Sensitivity)

域敏感度是對用戶自定義類型進行分析的一種策略(亦可以處理數(shù)組)。在域敏感維度共有三種分析策略:域敏感(field-sensitive)、域非敏感(field-insensitive)、域基礎(chǔ)分析(field-based)。以下面代碼為例:

struct Test {  
int field1;  
int field2;  
}  
  
Test a1;  
Test a2;

Note:field這里為結(jié)構(gòu)體或者類的數(shù)據(jù)成員。

域非敏感 :對每個對象建模,而對對象中的成員不進行處理;其建模后的結(jié)果如下圖,僅有a1.*和a2.*的區(qū)別:

image.png

域基礎(chǔ)分析 :僅對結(jié)構(gòu)體中的成員進行建模,而不感知對象。其建模后的結(jié)果如下圖,僅有*.field1和*.field2:

image.png

域敏感 :既對對象建模,又對成員變量進行處理。其建模后的結(jié)果如下圖,有a1.field1、a1.field2、a2.field1、a2.field2:

image.png

處理數(shù)組時,相同的原則亦適用。以C整數(shù)數(shù)組為例:int a[10],域非敏感分析僅使用一個節(jié)點建模:a[*],而域敏感分析創(chuàng)建10個節(jié)點:a[0]、a[1]、...、a[9]。

總結(jié):域敏感別名分析準(zhǔn)確性高,但是當(dāng)存在嵌套結(jié)構(gòu)或者大數(shù)組時,節(jié)點數(shù)量會迅速增加,分析成本也會陡然上升。

2.2 過程內(nèi)分析(Intra-Procedural)v.s.過程間分析(Inter-Procedural)

過程內(nèi)分析僅分析函數(shù)體內(nèi)部的指針,并沒有考慮與其他函數(shù)之間的相互影響。需要特別指出的是,過程內(nèi)分析當(dāng)處理包含指針入?yún)⒌暮瘮?shù)或者返回指針的函數(shù)時,其分析可能不夠準(zhǔn)確。相反,過程間分析會在函數(shù)調(diào)用過程中處理指針的行為。

過程內(nèi)分析不易于擴展,精度較低。相比過程間分析,過程內(nèi)分析更容易實現(xiàn),且過程內(nèi)/間分析與上下文敏感度分析高度相關(guān),因為一個上下文敏感分析必定是一個過程間分析。

2.3 上下文敏感度(Context-Sensitivity)

上下文敏感度用來控制函數(shù)調(diào)用該如何分析。有兩種分析方法:上下文敏感(context-sensitive) 和上下文非敏感(context-insensitive)。上下文敏感在分析函數(shù)調(diào)用的目標(biāo)(被調(diào)用者)時考慮調(diào)用上下文(調(diào)用者)。以如下代碼為參考[1]:

1  public static void main(String[] args) {
2      String name1 = getName(3);  // Tainted
3      String sql1 = "select * from user where name = " + name1;
4      sqlExecute(sql1);  // Taint Sink
5     
6      String name2 = getName(-1);  // Not Tainted
7      String sql2 = "select * from user where name = " + name2;
8      sqlExecute(sql2);
9  }
10 
11  private static String getName(int x) {
12     if (x > 0) {
13          return System.getProperty("name");
14      } else {
15          return "zhangsan";
16      }
17  }

如上所示,getName()方法基于入?yún)⒌牟煌瑫祷夭煌慕Y(jié)果,在第2行和第6行,獲取到的name1和name2的污點信息不同,當(dāng)入?yún)?時,返回的是一個從環(huán)境變量中獲取的污染的數(shù)據(jù),導(dǎo)致sql注入,而當(dāng)入?yún)?1時,返回的是一個常量,不是污染數(shù)據(jù),不會有問題。在上下文敏感的分析中,在第4行應(yīng)該報一個sql注入問題,而在第8行則不應(yīng)該報sql注入問題。而上下文非敏感的分析中,不考慮傳入參數(shù)的不同,getName()方法則全部返回一個{System.getProperty("name")}∨{zhangsan},從而導(dǎo)致第4行和第8行都會報一個sql注入的問題。

上下文敏感別名分析需要有一種方法,為函數(shù)getName創(chuàng)建抽象描述,以便每次調(diào)用它時,分析器都可以將調(diào)用上下文應(yīng)用于抽象描述。

總結(jié):上下文敏感分析比較準(zhǔn)確,但是增加了復(fù)雜度。

2.4 流敏感度(Flow-Sensitivity)

流敏感度是一種是否考慮代碼順序的原則。有兩種方法:流敏感(flow-sensitive)和流非敏感(flow-insensitive)。

流非敏感不考慮代碼順序,并為整個程序生成一組別名分析結(jié)果,而流敏感考慮代碼順序,計算程序中每個指針出現(xiàn)的位置的別名信息。以如下代碼為例:

1   int a,b;  
2   int *p;  
3   p = &a;  
4   p = &b;

流非敏感的分析結(jié)果是針對整個代碼塊,其結(jié)果應(yīng)該是:指針p可能指向變量a或者變量b。流敏感生成的別名信息是,在第3行,指針p指向變量a,在第4行以后指針p指向變量b。

Note:當(dāng)程序具有許多條件語句、循環(huán)或遞歸函數(shù)時,流敏感分析的復(fù)雜性會大大增加。要執(zhí)行流敏感分析,需要完整的控制流圖。因此,流敏感分析非常精確,但對于大多數(shù)情況來說,它的分析成本過高,無法在整個程序上執(zhí)行。

3.別名分析常見算法介紹

常見的別名算法共有三種:Andersen's指針分析算法、Steensgaard's指針分析算法和數(shù)據(jù)結(jié)構(gòu)分析算法。

Andersen's指針分析是一種流非敏感和上下文非敏感的分析算法。Andersen's指針分析算法復(fù)雜度較高,實踐應(yīng)用性較差,其時間復(fù)雜度為,其中n為指針節(jié)點個數(shù)。

Steensgaard's指針分析算法也是一種流非敏感,上下文非敏感且域非敏感的別名分析算法。其時間復(fù)雜度較低,實現(xiàn)相對簡單,實踐應(yīng)用廣,其時間復(fù)雜度為,其中無限接近于1,但是其別名分析的準(zhǔn)確性較低。

數(shù)據(jù)結(jié)構(gòu)分析算法是一種流非敏感,上下文敏感和域敏感的算法。其時間復(fù)雜度較低,為O(n * log(n)) ,應(yīng)用性較好,但是由于不支持MustAlias(參考“AliasAnalysis Class概覽”章節(jié)),導(dǎo)致其應(yīng)用有局限性。

4.別名分析在LLVM中的應(yīng)用與實現(xiàn)

4.1 應(yīng)用

別名分析在代碼優(yōu)化和安全方面有著非常重要且廣泛的應(yīng)用,以下面C代碼為例,來簡單介紹別名分析在代碼優(yōu)化方面的應(yīng)用[2]。

int foo (int __attribute__((address_space(0)))* a,  
         int __attribute__((address_space(1)))* b) {  
    *a = 42;  
    *b = 20;  
    return *a;  
}

__attribute__屬性指定了變量a指向地址0,變量b指向地址1。我們知道在ARM架構(gòu)中,地址0和地址1是完全不同的,修改地址0中的內(nèi)存永遠不會修改地址1中的內(nèi)存。以下為該函數(shù)可能生成的LLVM IR信息:

define i32 @foo(i32 addrspace(0)* %a, i32 addrspace(1)* %b) #0 {  
entry:  
  store i32 42, i32 addrspace(0)* %a, align 4  
  store i32 20, i32 addrspace(1)* %b, align 4  
  %0 = load i32, i32* %a, align 4  
  ret i32 %0  
}

第一個store將42存儲到變量a指向的地址,第二個store指令將20存儲到變量b指向的地址。%0 = ... 指向的行將變量a中的值加載到一個臨時變量0中,并在最后一行返回該臨時變量0。

上述代碼是未對foo函數(shù)進行優(yōu)化的情況,下面我們考慮對foo函數(shù)進行優(yōu)化。

我們優(yōu)化后的代碼可能如下:刪除了load指令對應(yīng)的行,最后一行直接返回了常量42。

define i32 @foo(i32 addrspace(0)* %a, i32 addrspace(1)* %b) #0 {  
entry:  
  store i32 42, i32 addrspace(0)* %a, align 4  
  store i32 20, i32 addrspace(1)* %b, align 4  
  ret i32 42  
}

然而,我們進行優(yōu)化的時候需要仔細一些,因為上述優(yōu)化僅在a和b指向的地址不會相互影響時有效。例如:當(dāng)我們給foo函數(shù)傳遞的指針相互影響時:

int i = 0;  
int result = foo(&i, &i);

在未開啟優(yōu)化的版本中,變量i將先被設(shè)置為42,然后被設(shè)置為20,最后返回20。然而,在優(yōu)化版本中,雖然我們執(zhí)行了兩次store操作依次將42、20賦值給變量i,但是返回值是42,而不是20。因此優(yōu)化版本破壞了foo函數(shù)本身的行為。

如果應(yīng)用了別名分析,編譯器能夠合理地執(zhí)行上述優(yōu)化。在執(zhí)行優(yōu)化前判斷入?yún)和b是否為別名,如果是別名,則不執(zhí)行刪除load指令對應(yīng)行的操作,否則執(zhí)行刪除操作。

4.2 實現(xiàn)

本文以LLVM16.0.0版本為參考,從代碼接口入手,帶領(lǐng)大家學(xué)習(xí)別名分析的代碼實現(xiàn)。

LLVM AliasAnalysis類是LLVM系統(tǒng)中客戶使用和別名分析實現(xiàn)的主要接口,或者說一個“基類” 。除了簡單的別名分析信息外,這個類還聲明了Mod/Ref信息,從而使強大的分析和轉(zhuǎn)換能夠很好地協(xié)同工作。

源碼參考鏈接:AliasAnalysis.h[3]、AliasAnalysis.cpp[4]。

4.2.1 基礎(chǔ)知識

MemoryLocation:LLVM中對內(nèi)存地址的描述,主要應(yīng)用在別名分析中,我們需要掌握該類中三個屬性:

image.png

其中,Ptr表示內(nèi)存開始地址,Size表示內(nèi)存大小,AATags是描述內(nèi)存位置別名的metadata節(jié)點集合 。

4.2.2 AliasAnalysis Class 概覽

AliasAnalysis類定義了各種別名分析實現(xiàn)應(yīng)該支持的接口。這個類導(dǎo)出兩個重要的枚舉:AliasResult和ModRefResult,它們分別表示別名查詢或mod/ref查詢的結(jié)果。

1、關(guān)鍵代碼如下,AliasAnalysis為AAResults類別名:

image.png

2、AliasResult關(guān)鍵代碼如下:

image.png

其中NoAlias表示兩個內(nèi)存對象沒有任何重疊區(qū)域;MayAlias表示兩個指針可能指向同一對象;PartialAlias表示兩個內(nèi)存對象對應(yīng)的地址空間有重疊;MustAlias表示兩個內(nèi)存對象總是從同一位置開始。

3、ModRefResult關(guān)鍵代碼

image.png

其中NoModRef表示訪問內(nèi)存的操作既不會修改該內(nèi)存也不會引用該內(nèi)存;Ref表示訪問內(nèi)存的操作會可能引用該內(nèi)存;Mod表示訪問內(nèi)存的操作可能會修改該內(nèi)存;ModRef表示訪問內(nèi)存的操作既可能引用該內(nèi)存也可能修改該內(nèi)存。

alias接口

其接口定義如下:

image.png

別名方法是用于確定兩個MemoryLocation對象是否相互別名的主要接口。它接受兩個MemoryLocation對象作為輸入,并根據(jù)需要返回MustAlias、PartialAlias、MayAlias或NoAlias。與所有AliasAnalysis接口一樣,alias方法要求其入?yún)⒌膬蓚€MemoryLocation對象定義在同一個函數(shù)中,或者至少有一個值是常量。

其接口實現(xiàn)如下:

image.png

getModRefInfo 接口

getModReInfo方法返回關(guān)于給定的指令執(zhí)行是否可以讀取或修改給定內(nèi)存位置的信息。Mod/Ref信息具有保守性:如果一條指令可能讀或?qū)懸粋€位置,則返回ModRef。其接口定義眾多,我們以如下接口為例來進行學(xué)習(xí)。

image.png

其接口實現(xiàn)如下:

image.png

從上述代碼可知,處理共分為四步:

(1)遍歷AAs,如果發(fā)現(xiàn)其任一結(jié)果是NoModRef,則直接返回,對應(yīng)代碼行228-234;

(2)調(diào)用節(jié)點(call)操作中是否訪問了一個在LLVM IR中無法訪問的地址,如果是的話,直接返回NoModRef,否則獲取其調(diào)用節(jié)點的ModRefInfo信息,對應(yīng)代碼行239-240;

(3)處理調(diào)用節(jié)點中指針入?yún)⒌腗odRefInfo信息,如果發(fā)現(xiàn)是NoModRef,則直接返回NoModRef,否則將ModRefInfo信息和之前的結(jié)果合并,對應(yīng)代碼行247-266;

(4)如果getModRefInfo函數(shù)中的入?yún)oc指定的內(nèi)存地址具有常量屬性并且ModRefInfo信息包含Mod,則調(diào)用節(jié)點一定不會修改Loc內(nèi)存,因此需要將Ref屬于與之前的結(jié)果做邏輯與操作,對應(yīng)代碼行271-272。

4.2.3 LLVM中已經(jīng)實現(xiàn)的別名分析

-basic-aa pass

-basic-aa pass是一種激進的本地分析,它提供許多重要的事實信息[5]:

  • 不同的全局變量、堆棧分配和堆分配永遠不能別名。
  • 全局變量、棧分配的變量和堆分配變量永遠不會和空指針別名。
  • 結(jié)構(gòu)體中的不同字段不能別名。
  • 同一數(shù)組,索引不同的兩個對象不能別名。
  • 許多通用的標(biāo)準(zhǔn)C庫函數(shù)從不訪問內(nèi)存或只讀取內(nèi)存。
-globals-aa pass

這個pass實現(xiàn)了一個簡單的對內(nèi)部全局變量(該變量的地址沒有被獲取過)進行上下文敏感的mod/ref分析和別名分析。如果某個全局變量的地址沒有被獲取,則該pass可以得出如下結(jié)論:沒有指針作為該全局變量的別名。該pass還會識別從不訪問內(nèi)存或從不讀取內(nèi)存的函數(shù)。這允許某些指定的優(yōu)化(例如GVN)完全消除調(diào)用指令。

這個pass的真正威力在于它為調(diào)用指令提供了上下文敏感的mod/ref信息。這使優(yōu)化器清楚的了解到對于某些函數(shù)的調(diào)用不會破壞或讀取全局變量的值,從而允許消除加載和存儲指令。

Note:該pass在使用范圍上有一定限制,僅支持沒有被取過地址的全局變量,但是該pass分析速度非??臁?/p>

除了上述pass外,LLVM中還實現(xiàn)了cfl-steens-aa、cfl-anders-aa、tbaa、scev-aa。目前LLVM中O1,O2,O3優(yōu)化默認開啟的別名分析是basic-aa,globals-aa和tb-aa。

5.寫在最后

編譯器技術(shù)從20世紀(jì)50年代起,已經(jīng)發(fā)展了近70年的歷史,但是編譯器技術(shù)發(fā)展到今天,依然是一個非常熱門的技術(shù),各大硬件廠商都在開發(fā)自己的編譯器,包括因特爾推出的Inter C++、ARM公司推出的armclang以及華為推出的畢昇編譯器等,且上述三款編譯器都是基于LLVM開發(fā)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1617

    瀏覽量

    49016
  • C++語言
    +關(guān)注

    關(guān)注

    0

    文章

    147

    瀏覽量

    6951
  • ARM架構(gòu)
    +關(guān)注

    關(guān)注

    14

    文章

    176

    瀏覽量

    36258
收藏 人收藏

    評論

    相關(guān)推薦

    編譯器優(yōu)化那些事兒(6):別名分析概述

    指向哪些對象或者指向哪些地址,而別名分析解決的是兩個指針指向的是否是同一個對象。指針分析別名分析通常通過靜態(tài)代碼分析來實現(xiàn)。別名分析
    發(fā)表于 09-15 14:09

    SIMD計算機的優(yōu)化編譯器設(shè)計

    利用處理的相關(guān)資源,提高編譯器優(yōu)化性能和增強代碼可適應(yīng)性是SIMD處理優(yōu)化編譯的關(guān)鍵。該文基
    發(fā)表于 04-03 08:47 ?30次下載

    MCS-51程序空間擴展原理及編譯器優(yōu)化

    討論了MCS-51系列單片機程序空間擴展的原理,包括硬件與編譯器兩個方面,并提出一種編譯器優(yōu)化方案.該方案在Keil仿真上檢驗并通過關(guān)健詞:C51
    發(fā)表于 10-23 08:55 ?100次下載

    編譯器_keil的優(yōu)化選項問題

    keil編譯器優(yōu)化選項針對ARM,對STM32編譯的一些優(yōu)化的問題
    發(fā)表于 02-25 14:18 ?3次下載

    C編譯器及其優(yōu)化

    本章將幫助讀者在ARM處理上編寫高效的C代碼。本章涉及的一些技術(shù)不僅適用于ARM處理,也適用于其他RISC處理。本章首先從ARM編譯器及其優(yōu)化
    發(fā)表于 10-17 17:22 ?2次下載

    TMS320C54x匯編語言工具C/C++編譯器的功能優(yōu)化詳細概述

    該系列是一套軟件開發(fā)工具的支持,其中包括一個優(yōu)化的C/C++編譯器、匯編、鏈接,以及組合工具。本章提供了這些工具的概述,介紹了功能
    發(fā)表于 04-27 09:43 ?10次下載
    TMS320C54x匯編語言工具C/C++<b class='flag-5'>編譯器</b>的功能<b class='flag-5'>優(yōu)化</b>詳細<b class='flag-5'>概述</b>

    代碼編譯器Studio開發(fā)工具特征詳細的表格分析概述

    本文的主要內(nèi)容介紹的是代碼編譯器Studio的開發(fā)工具特征詳細的表格分析概述
    發(fā)表于 05-07 09:57 ?3次下載
    代碼<b class='flag-5'>編譯器</b>Studio開發(fā)工具特征詳細的表格<b class='flag-5'>分析</b><b class='flag-5'>概述</b>

    如何使用英特爾編譯器優(yōu)化Fortran、C和C ++

    了解如何使用適用于Fortran *,C和C ++的英特爾?編譯器優(yōu)化一些困難的循環(huán)。 示例選自經(jīng)典的netlib.org矢量基準(zhǔn)測試,這些測試不是由當(dāng)前的英特爾編譯器自動優(yōu)化的,但
    的頭像 發(fā)表于 11-08 06:02 ?3153次閱讀

    關(guān)于volatile關(guān)鍵字對編譯器優(yōu)化的影響

    volatile關(guān)鍵字對編譯器優(yōu)化的影響
    的頭像 發(fā)表于 02-28 17:15 ?2897次閱讀

    編譯器優(yōu)化對函數(shù)的影響

    編譯器如gcc,可以指定不同的優(yōu)化參數(shù),在某些條件下,有些函數(shù)可能會被優(yōu)化掉。
    的頭像 發(fā)表于 06-22 14:58 ?2790次閱讀
    <b class='flag-5'>編譯器</b><b class='flag-5'>優(yōu)化</b>對函數(shù)的影響

    基于C++編譯器的節(jié)點融合優(yōu)化方法

    LLVM是以C十十編寫的架構(gòu)編譯器的框架系統(tǒng),支持多后端和交叉編譯,用于優(yōu)化程序的編譯時間、鏈接時間、運行時間和空閑時間。節(jié)點融合是一種簡單有效的優(yōu)
    發(fā)表于 06-15 14:29 ?19次下載

    編譯器理論之別名分析分類

    別名分析編譯器理論中的一種技術(shù),用于確定存儲位置是否可以以多種方式訪問。
    的頭像 發(fā)表于 09-14 10:51 ?750次閱讀

    編譯器優(yōu)化那些事兒之區(qū)域分析

    為了有效地優(yōu)化代碼,編譯器需要在程序的各個節(jié)點建立并求解與信息有關(guān)的方程來收集數(shù)據(jù)流信息,并將這些信息分發(fā)給流程圖的每個塊,這個過程被稱為數(shù)據(jù)流分析。
    的頭像 發(fā)表于 06-07 11:36 ?764次閱讀
    <b class='flag-5'>編譯器</b><b class='flag-5'>優(yōu)化</b><b class='flag-5'>那些</b><b class='flag-5'>事兒</b>之區(qū)域<b class='flag-5'>分析</b>

    編譯器優(yōu)化選項

    一個程序首先要保證正確性,在保證正確性的基礎(chǔ)上,性能也是一個重要的考量。要編寫高性能的程序,第一,必須選擇合適的算法和數(shù)據(jù)結(jié)構(gòu);第二,應(yīng)該編寫編譯器能夠有效優(yōu)化以轉(zhuǎn)換成高效可執(zhí)行代碼的源代碼,要做到
    的頭像 發(fā)表于 11-24 15:37 ?838次閱讀
    <b class='flag-5'>編譯器</b>的<b class='flag-5'>優(yōu)化</b>選項

    Keil編譯器優(yōu)化方法

    我們都知道,代碼是可以通過編譯器優(yōu)化的,有的時候,為了提高運行速度或者減少代碼尺寸,會開啟優(yōu)化選項。
    的頭像 發(fā)表于 10-23 16:35 ?257次閱讀
    Keil<b class='flag-5'>編譯器</b><b class='flag-5'>優(yōu)化</b>方法