色欲天香天天综合免费,免费国产毛福利在线观看

前言在本文中，作者提出了一種基于高斯感受野的標簽分配（RFLA）策略用于微小目標檢測。并提出了一種新的感受野距離（RFD）來直接測量高斯感受野和地面真值之間的相似性，而不是使用IoU或中心采樣策略分配樣本。

考慮到基于IoU閾值和中心采樣策略對大對象的傾斜，作者進一步設計了基于RFD的分層標簽分配（HLA）模塊，以實現(xiàn)小對象的平衡學習。在四個數(shù)據(jù)集上的大量實驗證明了所提方法的有效性。作者的方法在AI-TOD數(shù)據(jù)集上的AP點數(shù)為4.0，優(yōu)于SOTA。

創(chuàng)新思路

微小物體的像素數(shù)量極為有限（小于AI-TOD［49］中定義的16×16像素），一直是計算機視覺領域的一個難題。微小目標檢測（TOD）是最具挑戰(zhàn)性的方法之一，一般的物體檢測器通常無法在TOD任務中提供令人滿意的結果，這是由于微小物體缺乏鑒別特征。

考慮到微小物體的特殊性，提出了幾種定制的TOD基準（如AI-TOD、TinyPerson和AI-TOT-v2），以促進一系列下游任務，包括駕駛輔助、交通管理和海上救援。最近，TOD逐漸成為一個受歡迎但具有挑戰(zhàn)性的方向，獨立于一般對象檢測。

在本文中，作者認為當前的先驗盒和點及其相應的測量策略對于微小物體是次優(yōu)的，這將進一步阻礙標簽分配過程。具體來說，作者以單個先驗盒和點為例，從分布的角度重新思考它們。

不同先驗的示意圖如圖1的第二行所示，現(xiàn)有先驗信息與其相應的測量策略相結合，對于微小物體存在以下問題。

圖1.不同標簽分配方案的檢測結果之間的比較

第一：當特定ground truth與特定先驗不重疊時，它們的位置關系無法通過IoU或中心度解決。對于微小對象，通常情況下，真實框與幾乎所有的錨框都沒有重疊（即IoU=0）或不包含任何錨定點，導致微小對象缺少正樣本。

為此，采用啟發(fā)式方法來保證微小對象的更多正樣本。然而，賦值器通常無法基于零值IoU或中心度補償微小對象的正樣本。因此，網(wǎng)絡將減少對微小對象學習的關注。

第二，當前先驗區(qū)域主要遵循均勻分布，并同等對待先驗區(qū)域內(nèi)的每個位置。然而，基本上利用先驗信息來輔助標簽分配或特征點分配過程。

當將特征點的感受野重新映射回輸入圖像時，有效感受野實際上是高斯分布的。均勻分布先驗和高斯分布感受野之間的間隙將導致ground truth和分配給它的特征點的感受野之間不匹配。

為了緩解上述問題，作者引入了一種新的基于高斯分布的先驗知識，并建立了一種基于高斯感受野的標簽分配（RFLA）策略，該策略更有利于微小對象。

本文的主要貢獻

（1）實驗表明，當前基于錨和無錨的檢測器在微小目標標簽分配中存在尺度樣本不平衡問題。

（2）為了緩解上述問題，引入了一種簡單但有效的基于感受野的標簽分配（RFLA）策略。RFLA很容易取代主流檢測器中的標準盒和基于點的標簽分配策略，提高了它們在TOD上的性能。

（3）在四個數(shù)據(jù)集上的大量實驗驗證了提出的方法的性能優(yōu)越性。在具有挑戰(zhàn)性的AI-TOD數(shù)據(jù)集上，引入的方法在推理階段沒有額外成本的情況下顯著優(yōu)于最先進的競爭對手。

方法

感受野建模

基于錨的檢測器在FPN的不同層上平鋪不同尺度的先驗框，以輔助標簽分配，因此在FPN不同層上檢測不同尺度的對象。對于無錨探測器，它們將不同比例范圍內(nèi)的對象分組到不同水平的FPN上進行檢測。盡管標簽分配策略各不相同，但基于錨和無錨檢測器的一個共同點是將適當感受野的特征點分配給不同尺度的對象。

因此，在不設計啟發(fā)式錨框預設或規(guī)模分組的情況下，感受野可以直接用作標簽分配的有根據(jù)和有說服力的先驗。

圖2.RFLA的過程

在本文中，作者直接測量有效感受野（ERF）和ground truth區(qū)域之間的匹配度，以進行標記分配，從而消除使TOD惡化的盒或點先驗。在這項工作中，將每個特征點的ERF建模為高斯分布，先通過以下公式推導出標準卷積神經(jīng)網(wǎng)絡上第n層的理論感受野（TRF），即trn：

感受野距離

獲得高斯ERF，關鍵步驟是測量特征點的ERF與某個ground truth之間的匹配度。階躍變化的均勻分布不利于ground truth體，還需要將真實值建模為另一個分布。

觀察到物體的主體聚集在邊界框的中心，作者還將ground truth框（xg、yg、wg、hg）建模為標準的二維高斯分布Ng（μg，∑g），其中每個帶注釋框的中心點用作高斯的平均向量，半邊長的平方用作協(xié)方差矩陣，即，

在本文中，作者研究了高斯分布之間的三種典型距離作為感受野距離候選（RFDC）。這些距離測量包括Wasserstein距離、K-L散度和J-S散度。高斯分布之間的J-S散度沒有閉式解，在近似其解時將引入大量計算，因此，不使用J-S散度。

Wasserstein距離

Wasserstein距離來自最優(yōu)運輸理論。Wasserstein距離的主要優(yōu)點是它可以測量兩個非重疊分布。通常情況下，ground truth框與大多數(shù)在先框和點沒有重疊，并且賦值器無法將這些候選ground truth級排序到某個真實值。

因此，可以很容易地說，Wasserstein距離的特性有利于TOD，TOD可以一致地反映所有特征點與某個ground truth盒之間的匹配程度，使賦值器能夠根據(jù)合理的優(yōu)先級對微小對象補償更多的正樣本。然而，Wasserstein距離不是尺度不變的，當數(shù)據(jù)集包含大尺度方差的對象時，它可能是次優(yōu)的。

Kullback-Leibler散度

Kullback-Leibler散度（KLD）是一種經(jīng)典的統(tǒng)計距離，用于衡量一種概率分布與另一種概率的差異。KLD在兩個二維高斯分布之間具有尺度不變性，并且尺度不變性對檢測至關重要。而KLD的主要缺點是，當兩個分布的重疊可以忽略時，它不能一致地反映兩個分布之間的距離。

因此，本文選擇ERF和ground truth之間的KLD作為另一個RFDC。

然后，作者將非線性變換應用于RFDC，并得到歸一化值范圍在（0，1）之間的RFD，如下所示：