YOLOv6 v3.0的主要貢獻(xiàn)簡(jiǎn)述如下:
對(duì)檢測(cè)器的Neck部件進(jìn)行了翻新:引入BiC(Bi-directional Concatenation)提供更精確的定位信息;將SPPF簡(jiǎn)化為SimCSPSPPF,犧牲較少的速度提升更多的性能。
提出一種AAT(Anchor-aided training)策略,在不影響推理效率的情況下同時(shí)受益于Anchor-basedAnchor-free設(shè)計(jì)理念。
對(duì)YOLOv6的Backbone與Neck進(jìn)行加深,在更高分辨率輸入下達(dá)成新的SOTA性能。
提出一種新的自蒸餾策略提升YOLOv6小模型的性能,訓(xùn)練階段采用更大的DFL作為增強(qiáng)版輔助回歸分支。
本文方案
Network Design
在網(wǎng)絡(luò)架構(gòu)方面,本文主要從Neck與SPP兩個(gè)維度進(jìn)行改進(jìn):
在Neck方面,本文設(shè)計(jì)了一種增強(qiáng)的PAN模塊,它次用BiC模塊對(duì)三個(gè)近鄰層特征進(jìn)行集成(可參考上圖b),額外引入了。這種處理截止可以保留更精確的定位信息,對(duì)于小目標(biāo)定位非常重要。
在SPP方面,本文對(duì)YOLOv5 v6.1版本的SPPF進(jìn)行了簡(jiǎn)化,得到了所謂的SimCSPSPPF(可參考上圖c)。
Anchor-Aided Training
YOLOv6是一種追求更高推理速度的Anchor-free檢測(cè)器。然而,作者發(fā)現(xiàn):在同等配置(YOLOv6-N)下,相比Anchor-free方案,Anchor-based方案可以帶來(lái)額外的性能增益,見(jiàn)上表。
有鑒于此,作者提出了AAT策略(即Anchor輔助訓(xùn)練,見(jiàn)上圖),它引入了一個(gè)Anchor-based輔助分支以組合兩種方案的優(yōu)勢(shì)。通過(guò)這種訓(xùn)練策略,源自的輔助分支的引導(dǎo)信息可以被有效的嵌入到Anchor-free分支。在推理階段,輔助分支將被移除掉。也就是說(shuō),AAT策略屬于"贈(zèng)品",加量不加價(jià)的那種。
Self-distillation
在YOLOv6早期版本中,自蒸餾僅在大模型中得到應(yīng)用,采用的普通KL散度蒸餾。知識(shí)蒸餾損失與整體損失定義如下:超參數(shù)用于對(duì)兩個(gè)損失進(jìn)行平衡。在訓(xùn)練的早期,源自老師模型的軟標(biāo)簽更易于學(xué)習(xí);而在訓(xùn)練的后期,學(xué)生模型從硬標(biāo)簽中受益更多。
因此,作者設(shè)計(jì)了一種cosine weight decay調(diào)整機(jī)制:由于DFL會(huì)對(duì)回歸分支引入額外的參數(shù),極大程度影響小模型的推理速度。因此,作者針對(duì)小模型設(shè)計(jì)了一種DLD(Decoupled Localization Distillation)以提升性能且不影響推理速度。具體來(lái)說(shuō),在小模型中插入一個(gè)增強(qiáng)版回歸分支作為輔助。在自蒸餾階段,小模型受普通回歸分支與增強(qiáng)回歸分支加持,老師模型近使用輔助分支。
需要注意:普通分支僅采用硬標(biāo)簽進(jìn)行訓(xùn)練,而輔助分支則用硬標(biāo)簽與源自老師模型的軟標(biāo)簽進(jìn)行訓(xùn)練。完成蒸餾后,僅普通分支保留,輔助分支被移除。這種訓(xùn)練策略又是一種加量不加價(jià)的"贈(zèng)品"。
Experiments
上表給出了不同方案的性能對(duì)比,可以看到:
相比YOLOv5-N、YOLOv7-Tiny,YOLOv6-N指標(biāo)分別提升9.5%、4.2%,同時(shí)具有最佳速度。
相比YOLOX-S、PPYOLOE-S、YOLOv6-S指標(biāo)分別提升3.5%、0.9%且速度更快;
YOLOv6-M比YOLOv5-M指標(biāo)高4.6%、速度相當(dāng),比YOLOX-M、PPYOLOE-M指標(biāo)高3.1%、1.0%且速度更快;
除了比YOLOv5-L更高更快外,YOLOv6-L比YOLOX-L、PPYOLOE-L分別高3.1%、1.4%且速度相當(dāng)。
相比YOLOv8,YOLOv6在所有尺寸下取得了相當(dāng)?shù)木?,同時(shí)具有更優(yōu)的吞吐性能。
除了上述常規(guī)模型尺寸外,作者還進(jìn)一步提升了輸入分辨率并添加了C6特征,與YOLOv5等方案對(duì)比:
相比YOLOv5系列(即YOLOv5-N6/S6/M6/L6/X6),YOLOv6具有更高的AP、相當(dāng)?shù)乃俣龋?/p>
相比YOLOv7-E6E,YOLOv6-L6指標(biāo)高出0.4%,推理速度快36%。
審核編輯:劉清
-
檢測(cè)器
+關(guān)注
關(guān)注
1文章
857瀏覽量
47630
原文標(biāo)題:超越Y(jié)OLOv8!YOLOv6 v3.0實(shí)時(shí)目標(biāo)檢測(cè)重磅升級(jí)!
文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論