0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于RFD的分層標簽分配(HLA)模塊設計

lhl545545 ? 來源:CV技術指南 ? 作者:CV技術指南 ? 2022-09-05 14:16 ? 次閱讀

前言 在本文中,作者提出了一種基于高斯感受野的標簽分配(RFLA)策略用于微小目標檢測。并提出了一種新的感受野距離(RFD)來直接測量高斯感受野和地面真值之間的相似性,而不是使用IoU或中心采樣策略分配樣本。

考慮到基于IoU閾值和中心采樣策略對大對象的傾斜,作者進一步設計了基于RFD的分層標簽分配(HLA)模塊,以實現(xiàn)小對象的平衡學習。在四個數(shù)據(jù)集上的大量實驗證明了所提方法的有效性。作者的方法在AI-TOD數(shù)據(jù)集上的AP點數(shù)為4.0,優(yōu)于SOTA。

創(chuàng)新思路

微小物體的像素數(shù)量極為有限(小于AI-TOD[49]中定義的16×16像素),一直是計算機視覺領域的一個難題。微小目標檢測(TOD)是最具挑戰(zhàn)性的方法之一,一般的物體檢測器通常無法在TOD任務中提供令人滿意的結果,這是由于微小物體缺乏鑒別特征。

考慮到微小物體的特殊性,提出了幾種定制的TOD基準(如AI-TOD、TinyPerson和AI-TOT-v2),以促進一系列下游任務,包括駕駛輔助、交通管理和海上救援。最近,TOD逐漸成為一個受歡迎但具有挑戰(zhàn)性的方向,獨立于一般對象檢測。

在本文中,作者認為當前的先驗盒和點及其相應的測量策略對于微小物體是次優(yōu)的,這將進一步阻礙標簽分配過程。具體來說,作者以單個先驗盒和點為例,從分布的角度重新思考它們。

a4441c10-2cd9-11ed-ba43-dac502259ad0.png

不同先驗的示意圖如圖1的第二行所示,現(xiàn)有先驗信息與其相應的測量策略相結合,對于微小物體存在以下問題。

a45357fc-2cd9-11ed-ba43-dac502259ad0.png

圖1.不同標簽分配方案的檢測結果之間的比較

第一:當特定ground truth與特定先驗不重疊時,它們的位置關系無法通過IoU或中心度解決。對于微小對象,通常情況下,真實框與幾乎所有的錨框都沒有重疊(即IoU=0)或不包含任何錨定點,導致微小對象缺少正樣本。

為此,采用啟發(fā)式方法來保證微小對象的更多正樣本。然而,賦值器通常無法基于零值IoU或中心度補償微小對象的正樣本。因此,網(wǎng)絡將減少對微小對象學習的關注。

第二,當前先驗區(qū)域主要遵循均勻分布,并同等對待先驗區(qū)域內(nèi)的每個位置。然而,基本上利用先驗信息來輔助標簽分配或特征點分配過程。

當將特征點的感受野重新映射回輸入圖像時,有效感受野實際上是高斯分布的。均勻分布先驗和高斯分布感受野之間的間隙將導致ground truth和分配給它的特征點的感受野之間不匹配。

為了緩解上述問題,作者引入了一種新的基于高斯分布的先驗知識,并建立了一種基于高斯感受野的標簽分配(RFLA)策略,該策略更有利于微小對象。

本文的主要貢獻

(1)實驗表明,當前基于錨和無錨的檢測器在微小目標標簽分配中存在尺度樣本不平衡問題。

(2) 為了緩解上述問題,引入了一種簡單但有效的基于感受野的標簽分配(RFLA)策略。RFLA很容易取代主流檢測器中的標準盒和基于點的標簽分配策略,提高了它們在TOD上的性能。

(3) 在四個數(shù)據(jù)集上的大量實驗驗證了提出的方法的性能優(yōu)越性。在具有挑戰(zhàn)性的AI-TOD數(shù)據(jù)集上,引入的方法在推理階段沒有額外成本的情況下顯著優(yōu)于最先進的競爭對手。

方法

感受野建模

基于錨的檢測器在FPN的不同層上平鋪不同尺度的先驗框,以輔助標簽分配,因此在FPN不同層上檢測不同尺度的對象。對于無錨探測器,它們將不同比例范圍內(nèi)的對象分組到不同水平的FPN上進行檢測。盡管標簽分配策略各不相同,但基于錨和無錨檢測器的一個共同點是將適當感受野的特征點分配給不同尺度的對象。

因此,在不設計啟發(fā)式錨框預設或規(guī)模分組的情況下,感受野可以直接用作標簽分配的有根據(jù)和有說服力的先驗。

a48b423e-2cd9-11ed-ba43-dac502259ad0.png

圖2.RFLA的過程

在本文中,作者直接測量有效感受野(ERF)和ground truth區(qū)域之間的匹配度,以進行標記分配,從而消除使TOD惡化的盒或點先驗。在這項工作中,將每個特征點的ERF建模為高斯分布,先通過以下公式推導出標準卷積神經(jīng)網(wǎng)絡上第n層的理論感受野(TRF),即trn:

a4add858-2cd9-11ed-ba43-dac502259ad0.png

感受野距離

獲得高斯ERF,關鍵步驟是測量特征點的ERF與某個ground truth之間的匹配度。階躍變化的均勻分布不利于ground truth體,還需要將真實值建模為另一個分布。

觀察到物體的主體聚集在邊界框的中心,作者還將ground truth框(xg、yg、wg、hg)建模為標準的二維高斯分布Ng(μg,∑g),其中每個帶注釋框的中心點用作高斯的平均向量,半邊長的平方用作協(xié)方差矩陣,即,

a4b94ddc-2cd9-11ed-ba43-dac502259ad0.png

在本文中,作者研究了高斯分布之間的三種典型距離作為感受野距離候選(RFDC)。這些距離測量包括Wasserstein距離、K-L散度和J-S散度。高斯分布之間的J-S散度沒有閉式解,在近似其解時將引入大量計算,因此,不使用J-S散度。

Wasserstein距離

Wasserstein距離來自最優(yōu)運輸理論。Wasserstein距離的主要優(yōu)點是它可以測量兩個非重疊分布。通常情況下,ground truth框與大多數(shù)在先框和點沒有重疊,并且賦值器無法將這些候選ground truth級排序到某個真實值。

因此,可以很容易地說,Wasserstein距離的特性有利于TOD,TOD可以一致地反映所有特征點與某個ground truth盒之間的匹配程度,使賦值器能夠根據(jù)合理的優(yōu)先級對微小對象補償更多的正樣本。然而,Wasserstein距離不是尺度不變的,當數(shù)據(jù)集包含大尺度方差的對象時,它可能是次優(yōu)的。

Kullback-Leibler散度

Kullback-Leibler散度(KLD)是一種經(jīng)典的統(tǒng)計距離,用于衡量一種概率分布與另一種概率的差異。KLD在兩個二維高斯分布之間具有尺度不變性,并且尺度不變性對檢測至關重要。而KLD的主要缺點是,當兩個分布的重疊可以忽略時,它不能一致地反映兩個分布之間的距離。

因此,本文選擇ERF和ground truth之間的KLD作為另一個RFDC。

然后,作者將非線性變換應用于RFDC,并得到歸一化值范圍在(0,1)之間的RFD,如下所示:

a4c94368-2cd9-11ed-ba43-dac502259ad0.png

分層標簽分配

作者通過分數(shù)排序?qū)撕灧謱臃峙浣o微小對象。為了保證任何特征點和任何ground truth之間的位置關系都可以求解,所提出的分層標簽分配(HLA)策略建立在所提出的RFD之上。在分配之前,基于ground truth計算特征點和真實值之間的RFD ground truth。

在第一階段,作者使用特定的真實值對每個特征點的RFD得分進行排序。然后,將ground truth配給具有最高k個RFD分數(shù)的特征點,并具有一定的ground truth。最后,得到分配結果r1和已分配特征的對應掩碼m。

在第二階段,為了提高整體召回率并緩解異常值,通過乘以階段因子β來略微衰減有效半徑ern,然后重復上述排序策略,并向每個ground truth補充一個正樣本,得到分配結果r2。通過以下規(guī)則獲得最終分配結果r:

a4d76a2e-2cd9-11ed-ba43-dac502259ad0.png

探測器的應用

所提出的RFLA策略可以應用于基于錨和無錨的框架。為了更快的R-CNN,RFLA可以用來代替標準的錨平鋪和MaxIoU錨分配過程。對于FCOS,消除了限制ground truth框內(nèi)特征點的限制,因為小框只覆蓋非常有限的區(qū)域,通常比大對象包含的特征點少得多。

用RFLA代替基于點的分配,實現(xiàn)平衡學習。

作者將中心度損失修改為以下公式,以避免梯度爆炸:

a4e31978-2cd9-11ed-ba43-dac502259ad0.png

實驗

如表1所示,可以看出,GIoU不如RFD,因為它無法區(qū)分相互包容的盒子的位置,而WD和KLD的性能相當。

a4f04058-2cd9-11ed-ba43-dac502259ad0.png

表1.不同感受野距離測量方法的比較

作者逐步將RFD和HLA應用到更快的RCNN中。結果列于表2,AP逐步改善,從而驗證了個體有效性。

a4fdbeae-2cd9-11ed-ba43-dac502259ad0.png

表2.不同設計的影響

在HLA中,作者為ERF設計了階段因子β,以緩解異常值效應。在表3中,作者保持所有其他參數(shù)不變,實驗表明0.9是最佳選擇。將β設置為較低的值將引入太多的低質(zhì)量樣本。

a510533e-2cd9-11ed-ba43-dac502259ad0.png

表3.分級標記賦值器(HLA)中階段因子β的影響

作者將錨直接建模為高斯分布,計算ground truth之間的RFD得分,然后使用HLA分配標簽。結果如表4所示。結果表明高斯先驗及其與HLA的結合具有很大的優(yōu)勢。

a51dbe3e-2cd9-11ed-ba43-dac502259ad0.png

表4.高斯錨和接受錨

作者將作者的方法與AI-TOD基準上的其他最先進檢測器進行了比較。如表5所示,帶RFLA的探測器達到24.8 AP,比最先進的競爭對手高出4.0 AP。

a52d8756-2cd9-11ed-ba43-dac502259ad0.png

表5.AI-TOD的主要結果

a543c66a-2cd9-11ed-ba43-dac502259ad0.png

圖3.快速R-CNN w/HLA中的top k與快速R-CNN基線中的錨定微調(diào)之間的比較

作者將標度范圍劃分為16個區(qū)間,如圖4所示,并計算分配給不同標度范圍中每個ground truth的正樣本的平均數(shù)量。圖4中的觀察結果表明現(xiàn)有檢測器存在嚴重的標度樣本不平衡問題。

a557de5c-2cd9-11ed-ba43-dac502259ad0.png

圖4.不同檢測器的比例樣本不平衡問題

AI-TOD數(shù)據(jù)集的可視化結果如圖5所示。當將RFLA應用于更快的R-CNN時,可以大大消除FN預測。

a56ab3ce-2cd9-11ed-ba43-dac502259ad0.png

圖5.AI-TOD的可視化結果

結論

在本文中,作者指出框和點先驗對于TOD不起作用,導致在分配標簽時出現(xiàn)比例樣本不平衡問題。為此,作者引入了一種新的高斯感受野先驗。

然后,作者進一步設計了一種新的感受野距離(RFD),它度量了ERF和ground truth之間的相似性,以克服TOD上IoU和中心性的不足。RFD與HLA策略一起工作,為微小對象獲得平衡學習。

在四個數(shù)據(jù)集上的實驗表明了RFLA的優(yōu)越性和魯棒性。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關注

    關注

    1

    文章

    847

    瀏覽量

    47556
  • 數(shù)據(jù)集

    關注

    4

    文章

    1197

    瀏覽量

    24537
  • RFD
    RFD
    +關注

    關注

    0

    文章

    2

    瀏覽量

    3076

原文標題:ECCV 2022 | 武大&華為提出RFLA:用于小目標檢測的基于高斯感受野的標簽分配

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    RFD垃圾分類

    RFD
    RFID超高頻應用專家
    發(fā)布于 :2023年05月05日 14:06:02

    ARM嵌入式板卡能否實現(xiàn)DDS或HLA?

    現(xiàn)有現(xiàn)成的板卡,采用ARM作為主芯片,但是需求需要板卡能接收仿真DDS/HLA的協(xié)議報文,并處理,這種方案能實現(xiàn)嗎?
    發(fā)表于 08-06 15:27

    娛樂版HLA分型網(wǎng)頁升級了 精選資料分享

    之前做了一個簡單的網(wǎng)頁,使用23andme格式+snp2hla軟件獲得hla分型數(shù)據(jù),當然準確性不咋的,也就玩玩,上線后為大約100+人提供了服務,這是伯值得驕傲的事,因為第一次能為大家提供服務
    發(fā)表于 07-26 06:33

    基于HLA和Agent的電子對抗仿真系統(tǒng)構建

    綜合運用基于HLA和Agent的建模仿真技術,設計開發(fā)分布式的仿真聯(lián)邦,研究基于HLA的Ageng通信控制、本體模型在Agent知識水平通信中的應用以及提高HLA仿真效率途徑等問題。研究結果
    發(fā)表于 04-11 09:50 ?27次下載

    基于HLA的導彈攻防仿真系統(tǒng)的設計與實現(xiàn)

    基于HLA 建立仿真應用系統(tǒng)是提高作戰(zhàn)仿真活動效率的有效途徑。分析了導彈攻防仿真系統(tǒng)的功能,并依據(jù)HLA的基本概念、方法和原理對分布式導彈攻防仿真系統(tǒng)進行系統(tǒng)設計,建
    發(fā)表于 09-03 09:53 ?26次下載

    基于HLA的導彈攻防仿真系統(tǒng)的設計與實現(xiàn)

    基于HLA 建立仿真應用系統(tǒng)是提高作戰(zhàn)仿真活動效率的有效途徑。分析了導彈攻防仿真系統(tǒng)的功能,并依據(jù)HLA的基本概念、方法和原理對分布式導彈攻防仿真系統(tǒng)進行系統(tǒng)設計,建
    發(fā)表于 12-12 13:59 ?17次下載

    基于HLA的物資保障仿真系統(tǒng)研究

    本文首先介紹了高層體系結構,然后結合物資保障活動,提出了“基于HLA 的物資保障仿真系統(tǒng)”,該系統(tǒng)采用HLA 的仿真體系結構,模塊化設計和編程,便于系統(tǒng)將來的功能擴展
    發(fā)表于 12-22 16:30 ?10次下載

    基于HLA和網(wǎng)絡服務的協(xié)同仿真環(huán)境

    詳細介紹了HLA和web SERVICE的綜合方法。為了把這種構架擴展為一個以專業(yè)技術為基礎的復雜的產(chǎn)品設計系統(tǒng),提出了基于HLA和網(wǎng)絡服務的協(xié)同仿真環(huán)境
    發(fā)表于 05-26 16:03 ?19次下載
    基于<b class='flag-5'>HLA</b>和網(wǎng)絡服務的協(xié)同仿真環(huán)境

    基于DDS和HLA聯(lián)合仿真系統(tǒng)

    高層體系結構HLA(High Level Architecture),是當前系統(tǒng)仿真領域應用最廣的一種分布式系統(tǒng)仿真規(guī)范。HLA從規(guī)范層給出了搭建仿真應用的框架,它利用運行支撐環(huán)境RTI,實現(xiàn)了仿真
    發(fā)表于 11-01 16:18 ?10次下載
    基于DDS和<b class='flag-5'>HLA</b>聯(lián)合仿真系統(tǒng)

    基于IPv6的DiffServ流標簽分配機制

    本文在DiffServ模型的基礎上,改變了路由器的功能,使用IPv6流標簽字段和源地址作為關鍵字,在路由器中建立轉發(fā)表,根據(jù)關鍵字轉發(fā)IPv6分組,提高轉發(fā)速度;同時,在DS區(qū)域使用一種流標簽分配機制,避免了流
    發(fā)表于 12-12 19:05 ?0次下載
    基于IPv6的DiffServ流<b class='flag-5'>標簽</b><b class='flag-5'>分配</b>機制

    RFD3190混合功率倍增放大器模塊的詳細數(shù)據(jù)手冊免費下載

    RFD3190是一種混合功率倍增放大器模塊。該器件采用GaAs PHEMT管芯和GaN HEMT管芯,輸出功率高,工作頻率為45 MHz~1218MHz。它具有優(yōu)良的線性度和優(yōu)異的回波損耗性能,具有低噪聲和最佳可靠性。
    發(fā)表于 09-04 11:25 ?6次下載
    <b class='flag-5'>RFD</b>3190混合功率倍增放大器<b class='flag-5'>模塊</b>的詳細數(shù)據(jù)手冊免費下載

    框圖:RFD77101_BD000378_1-00.png

    RFD77101 Block Diagram
    發(fā)表于 01-30 12:23 ?3次下載
    框圖:<b class='flag-5'>RFD</b>77101_BD000378_1-00.png

    wifi 信號轉直流電壓模塊rfd102a

    wifi 信號轉直流電壓模塊rfd102a(開關電源技術論文)-wifi 信號轉直流電壓模塊rfd102a
    發(fā)表于 08-04 17:04 ?14次下載
    wifi 信號轉直流電壓<b class='flag-5'>模塊</b><b class='flag-5'>rfd</b>102a

    基于RFD22128無線系統(tǒng)的

    View the reference design for RFD22128. http://www.ttokpm.com/soft/ has thousands of reference designs to help bring your project to life.
    發(fā)表于 09-10 16:11 ?1次下載

    Zebra RFD40 UHF RFID背夾的特性

    借助Zebra RFD40 UHF RFID背夾出色的特性,實現(xiàn)企業(yè)所需的靈活性和連接性,以提高效率并快速適應新興技術。RFD40 UHF RFID背夾系列有三個型號:RFD40 Standard,
    的頭像 發(fā)表于 09-19 15:28 ?162次閱讀