0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TVM中將計算算符分成四種

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2022-02-08 14:44 ? 次閱讀

作者:安平博,Xilinx高級工程師;來源:AI加速微信公眾號

算符融合將多個計算單元揉進(jìn)一個計算核中進(jìn)行,減少了中間數(shù)據(jù)的搬移,節(jié)省了計算時間。TVM中將計算算符分成四種:

1 injective。一一映射函數(shù),比如加法,點(diǎn)乘等。

2 reduction。輸入到輸出具有降維性質(zhì)的,比如sum。

3 complex-out。這是計算比較復(fù)雜的,比如卷積運(yùn)算等。

4 opaque。無法被融合的算符,比如sort。

根據(jù)以上對算符的不同類型,TVM提供了三種融合規(guī)則:

pIYBAGAJ2T6AJeJJAADW3l6UdT0832.png

從一定角度看,這種融合實(shí)際上是數(shù)據(jù)計算pipeline化,即兩次計算中間數(shù)據(jù)不再經(jīng)歷store-load的過程,而是直接給到下一個計算單元完成計算。

在走入fuse ops代碼之前,還需要了解一些算法基礎(chǔ)知識。算符融合中應(yīng)用了支配樹算法。在一個有向無環(huán)圖中,對于一個節(jié)點(diǎn)n來說,從初始節(jié)點(diǎn)s出發(fā)到達(dá)n的所有路徑都經(jīng)歷一個節(jié)點(diǎn)m,那么m就是n的支配點(diǎn)。而距離n最近的支配點(diǎn)被稱作立即支配點(diǎn)。以r為樹根,將所有立即支配點(diǎn)按照支配關(guān)系連接起來就形成了支配樹。立即后支配點(diǎn)是從一個點(diǎn)n出發(fā)所有到終止節(jié)點(diǎn)的路徑中通過的最近節(jié)點(diǎn),形成的支配樹是后支配樹。

在DAG中,對于一個點(diǎn),所有能到達(dá)它的點(diǎn)在支配樹中的LCA,就是它支配樹中的父親。為什么算符融合要建立在后支配樹的基礎(chǔ)上呢?我猜測可能是因為對于兩個可融合算符在DAG中位置分為兩種,一種是父子關(guān)系,那么可以直接執(zhí)行算符融合算法;另外一種是它們之間是后支配關(guān)系。對于具有后支配關(guān)系的兩個節(jié)點(diǎn)(n->m),就要判斷未來路徑上的節(jié)點(diǎn)是否都能夠和點(diǎn)m發(fā)生融合,如果可以,那么n也可以和m發(fā)生融合。比如下圖:

o4YBAGAJ2XyAGjlUAAAaksTA-qU713.png

Conv2d要和elemwise add融合,必須判斷它的三個op是否能和elemwise add融合。

TVM中融合流程分為三步:

1 遍歷relay樹,建立DAG用于后支配樹分析;

2 建立后支配樹;

3 應(yīng)用算符融合算法。

一 建立DAG圖

算符融合代碼在src/relay/transforms/fuse_ops.cc中。其中算符融合也應(yīng)用在常量折疊中。

首先TVM中通過如下代碼來遍歷relay樹結(jié)構(gòu)并建立DAG圖。

pIYBAGAJ2buADAxoAACiH4i61bc319.png

o4YBAGAJ2hCAXqd5AAKMwZogBVY140.png

VisitExpr可以遞歸的調(diào)用在類IndexedforwardGraph中定義的VisitExpr_函數(shù),通過深度優(yōu)先搜索遍歷relay樹,并且建立DAG圖。深度優(yōu)先搜索是從exit節(jié)點(diǎn)作為根節(jié)點(diǎn)反向搜鎖的,因此搜索樹是一個后序搜索樹。Outputs中保存了一個節(jié)點(diǎn)的輸入的邊,在構(gòu)建后序支配樹會通過這些輸入邊求取LCA。那么在這個搜索樹基礎(chǔ)上應(yīng)用支配樹算法,就能夠得到一個后序支配樹了。在這個類中針對不同節(jié)點(diǎn)類型重寫visitExpr_函數(shù),節(jié)點(diǎn)類型有FunctionNode,ConstantNode, CallNode, TuppleNode等。我們來看CallNode的訪問函數(shù)定義:

pIYBAGAJ2lmARVsVAAbKmwPUr8I233.png

在最后還會遞歸調(diào)用ExprVisitor::VisitExpr_函數(shù),最終將深度優(yōu)先搜索到的節(jié)點(diǎn)按照葉節(jié)點(diǎn)起始順序一次加入DAG圖中。只有ConstantNode的訪問函數(shù)中不再調(diào)用VisitExpr_,因為常量節(jié)點(diǎn)應(yīng)該不存在葉節(jié)點(diǎn)了。在callNode中會將其輸入加入到DAG中,同時遍歷和輸入以及其op連接的節(jié)點(diǎn),ExprVisitor中對CallNode訪問函數(shù)定義為:

o4YBAGAJ2peAYpq5AACTWGic2PA585.png

因為ExprVisitor是被IndexForwardGraph繼承的,而VisitExpr_是虛擬函數(shù),this就會指向IndexForwardGraph實(shí)例,最終就會調(diào)用這個類中定義的VisitExpr_函數(shù),實(shí)現(xiàn)遞歸的遍歷relay樹。

這里要關(guān)注一下OpPatternKind,它定義了算子類型,是不同融合算法使用的依據(jù)。其定義在include/tvm/relay/op_attr_types.h文件中。

pIYBAGAJ2tuAdZhAAAHp6B7gjc0360.png

二 建立后序支配樹

接下來看后序支配樹的構(gòu)建。構(gòu)建函數(shù)是PostDom。因為根節(jié)點(diǎn)(DAG圖的出口)在post_dfs_order中最后,所以從根節(jié)點(diǎn)開始尋找每個節(jié)點(diǎn)出點(diǎn)的LCA,這個LCA就是后序支配點(diǎn)。

o4YBAGAJ2xqAM6QfAADdIrgDoKQ847.png

GetNode函數(shù)是獲得支配點(diǎn),構(gòu)建支配樹。在GetNode中,首先初始化根節(jié)點(diǎn),然后求每個節(jié)點(diǎn)的輸入節(jié)點(diǎn)的LCA,即是這個節(jié)點(diǎn)的支配點(diǎn)。

pIYBAGAJ21mAScbsAAEpUSdPj2c136.png

LeastComonAncestor函數(shù)中主要代碼是:

pIYBAGAJ25mABK65AAF2UY5KmQs700.png

通過兩兩求節(jié)點(diǎn)的LCA,來求取所有節(jié)點(diǎn)的LCA。程序會將計算圖中的末節(jié)點(diǎn)深度設(shè)置為1。然后向上逐層增加,那么LCA的共同祖先是相同的,深度也一定是一致。遍歷所有的節(jié)點(diǎn),就得到一個后向支配樹。節(jié)點(diǎn)的pattern指向他的LCA。在計算支配點(diǎn)的pattern的時候,會依據(jù)pattern的定義,選擇pattern值最大的作為LCA的pattern。這塊不是太深入理解??赡苁瞧涠x的從最小值到最大值pattern可以向下進(jìn)行融合,比如kElemWise=0, kInjective=2, 那么前者就能融合到KInjective中。

三 融合

完成了DAG和postDominator tree構(gòu)建后,就開始融合操作。TVM中定義了group結(jié)構(gòu)體,用于表示融合后的圖結(jié)構(gòu)。Group結(jié)構(gòu)體如下:

pIYBAGAJ29eAK44AAAEOJLVDA3c904.png

如果某些算符可以融合,那么就通過這個結(jié)構(gòu)體中的parent,master_ref將這些節(jié)點(diǎn)建立連接關(guān)系。Group首先進(jìn)行初始化和DAG相同的圖。然后分別遍歷dag,postDominator tree,以及group圖中節(jié)點(diǎn),來判斷算符是否能被融合。Dag中和postDom中對應(yīng)相同index的節(jié)點(diǎn)分別是被支配點(diǎn)和支配點(diǎn)。主要融合函數(shù)是以下兩個函數(shù):

pIYBAGAJ3BaAGxgUAAD5TKkTU2I760.png

pIYBAGAJ3F2ATjJUAAPdJjrvDa0392.png

在runFuse中,有幾種情況是不進(jìn)行算符融合的:

1 算符類型是Kopaque的。

2 該節(jié)點(diǎn)不存在支配點(diǎn)。

3 能夠融合的節(jié)點(diǎn)超過了一定數(shù)量。

融合操作算法基本上是考察當(dāng)前節(jié)點(diǎn)到其支配點(diǎn)所有路徑上的節(jié)點(diǎn)是否都符合融合規(guī)則,如果符合就進(jìn)行融合,不符合就不融合。函數(shù)CheckPath就是用于考察src到sink路徑是否能夠融合的。

融合分成了三個phase,每個phase處理不同可融合類型。這里我沒有深入研究。當(dāng)判斷支配樹的前后節(jié)點(diǎn)可以融合后,就通過函數(shù)commitFuse執(zhí)行融合操作。

完成融合之后,會遍歷節(jié)點(diǎn)創(chuàng)建新的graph。

審核編輯:何安

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • TVM
    TVM
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    3642
收藏 人收藏

    評論

    相關(guān)推薦

    雙軸測徑儀的四種樣式!

    儀設(shè)計了四種外觀樣式。 45°角布置的開口測徑儀 這個樣式的雙軸測徑儀是目前大部分產(chǎn)線所使用的,樣式簡單大氣。用于外徑及橢圓度尺寸的檢測。 45°角布置的閉口測徑儀 該樣式的雙軸測徑儀將上面的開口閉合
    發(fā)表于 08-27 17:42

    濾波電路的四種類型是什么

    濾波電路是電子電路中非常重要的一部分,它主要用于對信號進(jìn)行頻率選擇,即允許特定頻率范圍內(nèi)的信號通過,而阻止其他頻率的信號。濾波電路根據(jù)其特性可以分為四種基本類型:低通濾波器(Low-Pass
    的頭像 發(fā)表于 08-08 16:25 ?462次閱讀

    負(fù)反饋的四種類型是什么

    負(fù)反饋是電子系統(tǒng)中常用的一技術(shù),它通過將系統(tǒng)輸出的一部分信號以某種方式反饋到輸入端,以減小輸出信號與期望信號之間的差異,從而提高系統(tǒng)的穩(wěn)定性和性能。負(fù)反饋主要分為四種類型:電壓串聯(lián)負(fù)反饋、電壓并聯(lián)負(fù)反饋、電流串聯(lián)負(fù)反饋和電流并聯(lián)負(fù)反饋。
    的頭像 發(fā)表于 08-08 16:15 ?909次閱讀

    負(fù)反饋的四種類型及判斷方法

    負(fù)反饋,又稱為負(fù)反饋調(diào)節(jié),是指在一個系統(tǒng)中,當(dāng)系統(tǒng)輸出的某些變化對輸入產(chǎn)生抑制作用時,系統(tǒng)會自動調(diào)節(jié)以維持穩(wěn)定狀態(tài)的現(xiàn)象。負(fù)反饋在生物、工程、經(jīng)濟(jì)等多個領(lǐng)域都有廣泛的應(yīng)用。本文將介紹負(fù)反饋的四種
    的頭像 發(fā)表于 08-02 11:01 ?627次閱讀

    簡述四種基本觸發(fā)器及其功能

    在數(shù)字電路設(shè)計中,觸發(fā)器是一基本且重要的存儲元件,用于存儲二進(jìn)制信息(即0和1)。根據(jù)功能和應(yīng)用場景的不同,觸發(fā)器可以分為多種類型,其中四種基本觸發(fā)器包括RS觸發(fā)器、JK觸發(fā)器、D觸發(fā)器和T觸發(fā)器。以下是對這四種基本觸發(fā)器及其
    的頭像 發(fā)表于 07-27 14:59 ?2843次閱讀

    介紹MCUboot支持的四種升級模式(2)

    介紹MCUboot支持的四種升級模式,分別是Overwrite、Swap、Direct XIP和加載到RAM中執(zhí)行。由于FSP不支持第四種——加載到RAM中執(zhí)行,因為我們重點(diǎn)介紹前三
    的頭像 發(fā)表于 06-13 10:56 ?520次閱讀
    介紹MCUboot支持的<b class='flag-5'>四種</b>升級模式(2)

    電氣設(shè)備的狀態(tài)有哪四種

    電氣設(shè)備的狀態(tài)可以分為四種:正常狀態(tài)、異常狀態(tài)、故障狀態(tài)和緊急狀態(tài)。這四種狀態(tài)涵蓋了電氣設(shè)備在運(yùn)行過程中可能遇到的各種情況。本文將詳細(xì)分析這四種狀態(tài)的特點(diǎn)、原因、影響以及相應(yīng)的處理措施。 一、正常
    的頭像 發(fā)表于 06-05 16:47 ?2303次閱讀

    四種電源防接反電路

    防反接電路用于防止電子元器件因正負(fù)極接反而燒毀。常見的防反接電路有四種:二極管串聯(lián)、整流橋、NMOS和PMOS。二極管串聯(lián)利用二極管的單向?qū)щ娦?,整流橋則能正反接都導(dǎo)通但會消耗電能。NMOS和PMOS的防反接電路設(shè)計則通過控制電流路徑來實(shí)現(xiàn)正負(fù)極的保護(hù)。
    發(fā)表于 05-22 16:19

    如何理解IGBT的四種SOA?

    如何理解IGBT的四種SOA? IGBT的四種SOA表示了IGBT器件在不同工作狀態(tài)下的安全操作區(qū)域。這四種SOA是:Continuous SOA、Limited SOA、Pulse SOA
    的頭像 發(fā)表于 02-18 11:04 ?784次閱讀

    A/D轉(zhuǎn)換的四種誤差

    針對A/D轉(zhuǎn)換中可能出現(xiàn)的誤差,主要分為以下四種情況,漂移誤差、線型比例誤差、非線性誤差、非單調(diào)性誤差。還有那些能夠引起AD轉(zhuǎn)換出現(xiàn)比較大的誤差類別? 先說AD轉(zhuǎn)換是怎么取值的,假設(shè)輸入信號0-3V
    發(fā)表于 01-30 14:19

    電子負(fù)載的四種功能實(shí)現(xiàn)原理

    電子負(fù)載的四種功能實(shí)現(xiàn)原理? 電子負(fù)載是一用于模擬負(fù)載、測試和評估電源、電池和其他電子設(shè)備的工具。它可以模擬電子負(fù)載的特性,并能夠提供不同的負(fù)載條件。電子負(fù)載主要通過四種功能來實(shí)現(xiàn):恒流負(fù)載、恒阻
    的頭像 發(fā)表于 01-18 14:13 ?1611次閱讀

    四種霍爾元件的感應(yīng)方式分別是什么呢?

    四種霍爾元件的感應(yīng)方式分別是什么呢? 霍爾元件是一基于霍爾效應(yīng)的電子元件,常用于測量磁場、電流和位置等物理量。根據(jù)感應(yīng)方式的不同,霍爾元件可以分為四種類型:線性霍爾元件、增量式霍爾元件、磁敏電阻
    的頭像 發(fā)表于 12-18 14:49 ?612次閱讀

    設(shè)備管理通道控制四種方式

    設(shè)備管理的主要任務(wù)之一是控制設(shè)備和內(nèi)存或處理機(jī)之間的數(shù)據(jù)傳送,外圍設(shè)備和內(nèi)存之間的輸入/輸出控制方式有四種,下面分別介紹。
    發(fā)表于 12-08 14:05 ?706次閱讀
    設(shè)備管理通道控制<b class='flag-5'>四種</b>方式

    四種接近傳感器PK,誰能勝出?

    四種接近傳感器PK,誰能勝出?
    的頭像 發(fā)表于 12-07 09:28 ?1274次閱讀
    <b class='flag-5'>四種</b>接近傳感器PK,誰能勝出?

    四種半導(dǎo)體器件基本結(jié)構(gòu)

    按施敏教授的觀點(diǎn),半導(dǎo)體器件有個最基本的結(jié)構(gòu)單元:金半接觸、PN結(jié)、異質(zhì)結(jié)、MOS結(jié)構(gòu)。所有的半導(dǎo)體器件都可以看作是這四種基本結(jié)構(gòu)的組合,比如BJT由兩個背靠背的PN結(jié)構(gòu)成,MOSFET由MOS結(jié)構(gòu)和兩對PN結(jié)構(gòu)成。
    的頭像 發(fā)表于 11-30 15:56 ?2455次閱讀
    <b class='flag-5'>四種</b>半導(dǎo)體器件基本結(jié)構(gòu)