0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

YOLOv6 v3.0實(shí)時(shí)目標(biāo)檢測(cè)重磅升級(jí)

CVer ? 來(lái)源:AIWalker ? 2023-01-30 17:09 ? 次閱讀

6e731eee-9654-11ed-bfe3-dac502259ad0.png

YOLOv6 v3.0的主要貢獻(xiàn)簡(jiǎn)述如下:

對(duì)檢測(cè)器的Neck部件進(jìn)行了翻新:引入BiC(Bi-directional Concatenation)提供更精確的定位信息;將SPPF簡(jiǎn)化為SimCSPSPPF,犧牲較少的速度提升更多的性能。

提出一種AAT(Anchor-aided training)策略,在不影響推理效率的情況下同時(shí)受益于Anchor-basedAnchor-free設(shè)計(jì)理念。

對(duì)YOLOv6的Backbone與Neck進(jìn)行加深,在更高分辨率輸入下達(dá)成新的SOTA性能。

提出一種新的自蒸餾策略提升YOLOv6小模型的性能,訓(xùn)練階段采用更大的DFL作為增強(qiáng)版輔助回歸分支。

本文方案

6e9a561c-9654-11ed-bfe3-dac502259ad0.png

Network Design

網(wǎng)絡(luò)架構(gòu)方面,本文主要從Neck與SPP兩個(gè)維度進(jìn)行改進(jìn):

在Neck方面,本文設(shè)計(jì)了一種增強(qiáng)的PAN模塊,它次用BiC模塊對(duì)三個(gè)近鄰層特征進(jìn)行集成(可參考上圖b),額外引入了pYYBAGPXic-AAB3gAAAFpuLanWI164.jpg。這種處理截止可以保留更精確的定位信息,對(duì)于小目標(biāo)定位非常重要。

在SPP方面,本文對(duì)YOLOv5 v6.1版本的SPPF進(jìn)行了簡(jiǎn)化,得到了所謂的SimCSPSPPF(可參考上圖c)。

Anchor-Aided Training

6ea87242-9654-11ed-bfe3-dac502259ad0.png

YOLOv6是一種追求更高推理速度的Anchor-free檢測(cè)器。然而,作者發(fā)現(xiàn):在同等配置(YOLOv6-N)下,相比Anchor-free方案,Anchor-based方案可以帶來(lái)額外的性能增益,見(jiàn)上表。

6eb9c15a-9654-11ed-bfe3-dac502259ad0.png

有鑒于此,作者提出了AAT策略(即Anchor輔助訓(xùn)練,見(jiàn)上圖),它引入了一個(gè)Anchor-based輔助分支以組合兩種方案的優(yōu)勢(shì)。通過(guò)這種訓(xùn)練策略,源自的輔助分支的引導(dǎo)信息可以被有效的嵌入到Anchor-free分支。在推理階段,輔助分支將被移除掉。也就是說(shuō),AAT策略屬于"贈(zèng)品",加量不加價(jià)的那種

Self-distillation

在YOLOv6早期版本中,自蒸餾僅在大模型中得到應(yīng)用,采用的普通KL散度蒸餾。知識(shí)蒸餾損失與整體損失定義如下:超參數(shù)用于對(duì)兩個(gè)損失進(jìn)行平衡。在訓(xùn)練的早期,源自老師模型的軟標(biāo)簽更易于學(xué)習(xí);而在訓(xùn)練的后期,學(xué)生模型從硬標(biāo)簽中受益更多。

因此,作者設(shè)計(jì)了一種cosine weight decay調(diào)整機(jī)制:由于DFL會(huì)對(duì)回歸分支引入額外的參數(shù),極大程度影響小模型的推理速度。因此,作者針對(duì)小模型設(shè)計(jì)了一種DLD(Decoupled Localization Distillation)以提升性能且不影響推理速度。具體來(lái)說(shuō),在小模型中插入一個(gè)增強(qiáng)版回歸分支作為輔助。在自蒸餾階段,小模型受普通回歸分支與增強(qiáng)回歸分支加持,老師模型近使用輔助分支。

需要注意:普通分支僅采用硬標(biāo)簽進(jìn)行訓(xùn)練,而輔助分支則用硬標(biāo)簽與源自老師模型的軟標(biāo)簽進(jìn)行訓(xùn)練。完成蒸餾后,僅普通分支保留,輔助分支被移除。這種訓(xùn)練策略又是一種加量不加價(jià)的"贈(zèng)品"。

Experiments

6ecdec7a-9654-11ed-bfe3-dac502259ad0.png

上表給出了不同方案的性能對(duì)比,可以看到:

相比YOLOv5-N、YOLOv7-Tiny,YOLOv6-N指標(biāo)分別提升9.5%、4.2%,同時(shí)具有最佳速度。

相比YOLOX-S、PPYOLOE-S、YOLOv6-S指標(biāo)分別提升3.5%、0.9%且速度更快;

YOLOv6-M比YOLOv5-M指標(biāo)高4.6%、速度相當(dāng),比YOLOX-M、PPYOLOE-M指標(biāo)高3.1%、1.0%且速度更快;

除了比YOLOv5-L更高更快外,YOLOv6-L比YOLOX-L、PPYOLOE-L分別高3.1%、1.4%且速度相當(dāng)。

相比YOLOv8,YOLOv6在所有尺寸下取得了相當(dāng)?shù)木?,同時(shí)具有更優(yōu)的吞吐性能。

除了上述常規(guī)模型尺寸外,作者還進(jìn)一步提升了輸入分辨率并添加了C6特征,與YOLOv5等方案對(duì)比:

相比YOLOv5系列(即YOLOv5-N6/S6/M6/L6/X6),YOLOv6具有更高的AP、相當(dāng)?shù)乃俣龋?/p>

相比YOLOv7-E6E,YOLOv6-L6指標(biāo)高出0.4%,推理速度快36%。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    857

    瀏覽量

    47630

原文標(biāo)題:超越Y(jié)OLOv8!YOLOv6 v3.0實(shí)時(shí)目標(biāo)檢測(cè)重磅升級(jí)!

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    YOLOV7網(wǎng)絡(luò)架構(gòu)解讀

    繼美團(tuán)發(fā)布YOLOV6之后,YOLO系列原作者也發(fā)布了YOLOV7。
    的頭像 發(fā)表于 11-29 10:00 ?1746次閱讀
    <b class='flag-5'>YOLOV</b>7網(wǎng)絡(luò)架構(gòu)解讀

    電腦店U盤(pán)啟動(dòng)盤(pán)制作工具V3.0(智能裝機(jī)版)

    : FBCFF103B69C2755CE0299EC4A6C608ASHA1: 92514FE9AFA23FB9E2FB1B04E9888B17D9A4B464CRC32: 687F586E電腦店U盤(pán)啟動(dòng)盤(pán)制作工具 V3.0(智能裝機(jī)版)更新:1、更新免格式化
    發(fā)表于 10-20 13:33

    MCUBootUtility v3.0怎么樣?

    MCUBootUtility v3.0怎么樣?
    發(fā)表于 02-10 06:07

    YOLOv6中的用Channel-wise Distillation進(jìn)行的量化感知訓(xùn)練

    1、YOLOv6中的用Channel-wise Distillation進(jìn)行的量化感知訓(xùn)練來(lái)自哪里  知識(shí)蒸餾 (KD)已被證明是一種用于訓(xùn)練緊湊密集預(yù)測(cè)模型的簡(jiǎn)單有效的工具。輕量級(jí)學(xué)生網(wǎng)絡(luò)通過(guò)
    發(fā)表于 10-09 16:25

    茂名信息網(wǎng) v3.0

    v3.0正式版升級(jí)說(shuō)明: 1、重新改版整個(gè)網(wǎng)站的美工以及排版 2、調(diào)整了全站代碼,連帶所有的無(wú)效符號(hào)全部清理干凈 本版本沒(méi)有任何功能限制,但只能在本地使用127.0.0.1測(cè)
    發(fā)表于 03-08 22:01 ?29次下載

    海爾25T6D-TD(8823 V3.0)存儲(chǔ)器數(shù)據(jù)

    海爾25T6D-TD(8823 V3.0)存儲(chǔ)器數(shù)據(jù)
    發(fā)表于 06-01 09:58 ?36次下載

    FilterPro v3.0設(shè)計(jì)工具的最新版本

    FilterPro v3.0設(shè)計(jì)工具的最新版本 TI推出其普及型 FilterProTM 設(shè)計(jì)工具的最新版本。該 FilterPro v3.0 更新了各種功能,如調(diào)節(jié)無(wú)源元件容差、查看
    發(fā)表于 05-17 13:36 ?8153次閱讀

    STM32F103ZET6 V3.0核心板電路圖

    STM32F103ZET6 V3.0核心板電路圖。
    發(fā)表于 10-29 17:00 ?59次下載

    EP1122集合版V3.0

    液晶燒錄EP1122集合版V3.0用于燒錄驅(qū)動(dòng)板
    發(fā)表于 11-30 15:56 ?0次下載

    STM32F4 EMWIN開(kāi)發(fā)手冊(cè)V3.0

    STM32F4 EMWIN開(kāi)發(fā)手冊(cè)V3.0 STM32F4 EMWIN開(kāi)發(fā)手冊(cè)V3.0
    發(fā)表于 07-25 17:45 ?40次下載

    VORX-NH 說(shuō)明書(shū)V3.0

    VORX-NH 說(shuō)明書(shū)V3.0
    發(fā)表于 12-30 14:50 ?0次下載

    NodeMCU V3.0 Arduino開(kāi)發(fā)之點(diǎn)燈

    NodeMCU V3.0 Arduino開(kāi)發(fā)之點(diǎn)燈測(cè)試程序手頭到了一個(gè)NodeMCU v3.0,3.0版本和2.0差別不大,只是v2.0串口芯片是CP2101,而v3.0是CH340,
    發(fā)表于 10-25 18:21 ?14次下載
    NodeMCU <b class='flag-5'>V3.0</b> Arduino開(kāi)發(fā)之點(diǎn)燈

    YOLOv6在LabVIEW中的推理部署(含源碼)

    YOLOv6 是美團(tuán)視覺(jué)智能部研發(fā)的一款目標(biāo)檢測(cè)框架,致力于工業(yè)應(yīng)用。如何使用python進(jìn)行該模型的部署,官網(wǎng)已經(jīng)介紹的很清楚了,但是對(duì)于如何在LabVIEW中實(shí)現(xiàn)該模型的部署,筆者目前還沒(méi)有看到
    的頭像 發(fā)表于 11-06 16:07 ?137次閱讀
    <b class='flag-5'>YOLOv6</b>在LabVIEW中的推理部署(含源碼)

    YOLOv6模型文件的輸入與輸出結(jié)構(gòu)

    ? YOLOv6人臉檢測(cè)模型 YOLOv6上次(應(yīng)該是很久以前)發(fā)布了一個(gè)0.3.1版本,支持人臉檢測(cè)與五點(diǎn)landmark調(diào)用,后來(lái)我就下載,想使用一下,發(fā)現(xiàn)居然沒(méi)有文檔,也沒(méi)有例子
    的頭像 發(fā)表于 06-25 15:37 ?891次閱讀
    <b class='flag-5'>YOLOv6</b>模型文件的輸入與輸出結(jié)構(gòu)

    YOLOv8+OpenCV實(shí)現(xiàn)DM碼定位檢測(cè)與解析

    YOLOv8是YOLO系列模型的最新王者,各種指標(biāo)全面超越現(xiàn)有對(duì)象檢測(cè)與實(shí)例分割模型,借鑒了YOLOv5、YOLOv6、YOLOX等模型的設(shè)計(jì)優(yōu)點(diǎn),全面提升改進(jìn)
    的頭像 發(fā)表于 08-10 11:35 ?1227次閱讀
    <b class='flag-5'>YOLOv</b>8+OpenCV實(shí)現(xiàn)DM碼定位<b class='flag-5'>檢測(cè)</b>與解析