0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

YOLOv10:引領(lǐng)無(wú)NMS實(shí)時(shí)目標(biāo)檢測(cè)的新紀(jì)元

新機(jī)器視覺(jué) ? 來(lái)源:新機(jī)器視覺(jué) ? 2024-11-13 17:12 ? 次閱讀

來(lái)自中國(guó)清華大學(xué)的研究人員推出了YOLOv10,這是一種具有卓越進(jìn)步的創(chuàng)新模型,展示了在計(jì)算機(jī)視覺(jué)領(lǐng)域的重要突破。這次發(fā)布體現(xiàn)了讓AI既易于使用又功能強(qiáng)大的承諾,標(biāo)志著重大進(jìn)展和改進(jìn)。

YOLO(You Only Look Once)系列一直是實(shí)時(shí)目標(biāo)檢測(cè)的基準(zhǔn),成功平衡了計(jì)算成本和檢測(cè)性能。盡管在架構(gòu)設(shè)計(jì)和優(yōu)化策略方面取得了進(jìn)展,但對(duì)非最大值抑制(NMS)的依賴阻礙了端到端部署,影響了推理延遲。YOLOv10通過(guò)消除NMS并優(yōu)化模型架構(gòu)推進(jìn)了效率和性能的邊界。

在這些進(jìn)展的背景下,OpenSistemas在AI領(lǐng)域脫穎而出,特別是在訓(xùn)練、測(cè)試和部署如YOLOv10這樣的模型方面。憑借對(duì)前沿技術(shù)的深刻理解和專長(zhǎng),OpenSistemas能夠充分利用YOLOv10的功能,提升目標(biāo)檢測(cè)任務(wù)的精度和效率。這種合作象征著創(chuàng)新與實(shí)際應(yīng)用的融合,推動(dòng)了AI技術(shù)的可能性。

YOLOv10 的特別之處

YOLOv10的主要顯著進(jìn)步是消除了非最大值抑制(NMS)。NMS是許多目標(biāo)檢測(cè)模型中用于消除檢測(cè)到同一對(duì)象的冗余邊界框的后處理步驟。它通過(guò)保留得分最高的邊界框并移除其他重疊顯著的框來(lái)工作。盡管有效,但NMS增加了計(jì)算復(fù)雜性并增加了推理延遲,這會(huì)減慢實(shí)時(shí)應(yīng)用的速度。

YOLOv10通過(guò)采用一致的雙分配方法進(jìn)行無(wú)NMS訓(xùn)練,改變了模型處理重疊檢測(cè)的方式。通過(guò)將這一過(guò)程集成到模型的架構(gòu)和訓(xùn)練策略中,YOLOv10減少了后處理的需要,大大縮短了推理時(shí)間。這種延遲的減少對(duì)于速度和效率至關(guān)重要的實(shí)時(shí)應(yīng)用,如自動(dòng)駕駛、監(jiān)控和實(shí)時(shí)視頻分析至關(guān)重要。消除NMS不僅簡(jiǎn)化了部署過(guò)程,還通過(guò)提高模型的效率和響應(yīng)能力來(lái)提升其性能。

預(yù)訓(xùn)練模型

自從Ultralytics發(fā)布YOLOv5以來(lái),我們已經(jīng)習(xí)慣了每次YOLO發(fā)布時(shí)提供各種模型尺寸:nano、small、medium、large和xlarge。YOLOv10也不例外,清華大學(xué)的研究人員也提供了一系列預(yù)訓(xùn)練模型,可以用于各種目標(biāo)檢測(cè)任務(wù)。

所有這些模型在延遲和平均精度(AP)方面表現(xiàn)出優(yōu)于之前YOLO版本的性能,如下圖所示:

bcd8dda8-9067-11ef-a511-92fbcf53809c.png

(圖:各YOLO模型在延遲(左)和參數(shù)數(shù)量(右)方面的性能比較)

你可以在下表中查看實(shí)際性能:

bcf3f8d6-9067-11ef-a511-92fbcf53809c.png

(表:可用的YOLOv10預(yù)訓(xùn)練模型,來(lái)源:Ultralytics網(wǎng)站)

使用

我們將嘗試使用原始的倉(cāng)庫(kù):

git clone https://github.com/THU-MIG/yolov10
cd yolov10
pip install -e .

# Choose the size of your model I will use the XLarge version
wget https://github.com/THU-MIG/yolov10/releases/download/v1.1/yolov10n/s/m/b/l/x.pt

然后,使用方法類似于YOLOv8:

Python

from ultralytics import YOLOv10 # Note the "v10" in the end
# Load a model
model = YOLOv10('yolov10x.pt') # load an official model
# Predict with the model
model.predict(0) # predict on your webcam

CLI

yolo predict model=yolov10x.pt source=0 # predict with official model on webcam

Ultralytics框架的預(yù)測(cè)源也可用:

bd235f04-9067-11ef-a511-92fbcf53809c.png

(圖:可用于預(yù)測(cè)的源,來(lái)源:Ultralytics文檔)

結(jié)果

bd4e0d30-9067-11ef-a511-92fbcf53809c.png

(圖:YOLOv10的目標(biāo)檢測(cè)示例。推理分辨率為384x640)

YOLOv8 vs YOLOv10: 推理延遲

比較YOLOv8和YOLOv10時(shí),最顯著的改進(jìn)之一是推理延遲的減少。推理延遲,即模型處理圖像并進(jìn)行預(yù)測(cè)所需的時(shí)間,對(duì)于自動(dòng)駕駛、視頻監(jiān)控和交互式AI系統(tǒng)等實(shí)時(shí)應(yīng)用至關(guān)重要。

YOLOv8盡管高效且強(qiáng)大,但依賴于非最大值抑制(NMS)來(lái)過(guò)濾冗余邊界框。這個(gè)額外步驟雖然有效地提高了檢測(cè)準(zhǔn)確性,但增加了計(jì)算開銷并延長(zhǎng)了整體推理時(shí)間。

而YOLOv10通過(guò)一致的雙分配方法進(jìn)行無(wú)NMS訓(xùn)練,消除了對(duì)NMS的需求。通過(guò)將這一過(guò)程集成到模型架構(gòu)中,YOLOv10顯著減少了推理過(guò)程中所需的計(jì)算步驟。這使得處理時(shí)間更快,延遲更低,使YOLOv10更適合高速實(shí)時(shí)應(yīng)用。

在同一個(gè)視頻上,我使用NVIDIA GeForce RTX 4060 Laptop GPU, 7940MiB,得到的日志顯示差異非常大:

bd7a2e06-9067-11ef-a511-92fbcf53809c.png

(圖:YOLOv10在384x640分辨率下的推理延遲)

bd99119a-9067-11ef-a511-92fbcf53809c.png

(圖:YOLOv8在384x640分辨率下的推理延遲)

導(dǎo)出模型

如果你想了解導(dǎo)出模型的好處,可以查看這篇詳細(xì)介紹速度改進(jìn)的文章。類似于其他任務(wù),如檢測(cè)、分割和姿勢(shì)估計(jì),你可以使用Ultralytics框架導(dǎo)出YOLOv10模型。此過(guò)程包括將模型轉(zhuǎn)換為ONNX、CoreML、TensorFlow Lite等格式,確保與各種平臺(tái)和設(shè)備的兼容性。

這種多功能性允許在不同環(huán)境中更廣泛的集成,從移動(dòng)應(yīng)用到邊緣設(shè)備。與前輩一樣,YOLOv10框架支持模型導(dǎo)出,便于在各種平臺(tái)上無(wú)縫部署。

Python

from ultralytics import YOLOv10
# Load a model
model = YOLOv10('yolov10x.pt') # load an official model
model = YOLOv10('path/to/best.pt') # load a custom trained model

# Export the model
model.export(format='onnx')

CLI

yolo export model=yolov10x.pt format=onnx # export official model
yolo export model=path/to/best.pt format=onnx # export custom trained model

結(jié)論

清華大學(xué)研究人員推出的YOLOv10,作為首個(gè)無(wú)NMS目標(biāo)檢測(cè)模型,代表了計(jì)算機(jī)視覺(jué)領(lǐng)域的重大進(jìn)步。與YOLOv8相比,YOLOv10顯著減少了推理延遲,使其更適合高速實(shí)時(shí)應(yīng)用,如自動(dòng)駕駛、視頻監(jiān)控和交互式AI系統(tǒng)。這種推理過(guò)程中計(jì)算步驟的減少突顯了YOLOv10的效率和響應(yīng)能力。

此外,YOLOv10采用了新的無(wú)NMS訓(xùn)練方法,對(duì)其各部分進(jìn)行了微調(diào)以提高性能,并在速度和準(zhǔn)確性之間達(dá)到了很好的平衡。這些升級(jí)使得模型的部署更容易,性能更強(qiáng),速度更快,響應(yīng)更迅速。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29886

    瀏覽量

    268174
  • 目標(biāo)檢測(cè)
    +關(guān)注

    關(guān)注

    0

    文章

    202

    瀏覽量

    15579
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    8

    文章

    1695

    瀏覽量

    45910

原文標(biāo)題:YOLOv10:無(wú)NMS實(shí)時(shí)目標(biāo)檢測(cè)的先鋒

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    在樹莓派上部署YOLOv5進(jìn)行動(dòng)物目標(biāo)檢測(cè)的完整流程

    卓越的性能。本文將詳細(xì)介紹如何在性能更強(qiáng)的計(jì)算機(jī)上訓(xùn)練YOLOv5模型,并將訓(xùn)練好的模型部署到樹莓派4B上,通過(guò)樹莓派的攝像頭進(jìn)行實(shí)時(shí)動(dòng)物目標(biāo)檢測(cè)。 一、在電腦上訓(xùn)練
    的頭像 發(fā)表于 11-11 10:38 ?181次閱讀
    在樹莓派上部署<b class='flag-5'>YOLOv</b>5進(jìn)行動(dòng)物<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>的完整流程

    高精度3D Hall搖桿專用芯片,開啟操控新紀(jì)元

    在飛控領(lǐng)域中的3D霍爾搖桿,開啟操控新紀(jì)元!
    的頭像 發(fā)表于 10-30 09:29 ?163次閱讀
    高精度3D Hall搖桿專用芯片,開啟操控<b class='flag-5'>新紀(jì)元</b>

    倒計(jì)時(shí)1天 | 第三屆OpenHarmony技術(shù)大會(huì)——明天,上海見(jiàn)!

    技術(shù)引領(lǐng)筑生態(tài),萬(wàn)物智聯(lián)創(chuàng)未來(lái) OpenHarmony 開源生態(tài) 繁榮于各方共建,又賦能于千行百業(yè) 開創(chuàng)了萬(wàn)物智聯(lián)的新紀(jì)元,開源盛事,亦是開源盛世!
    發(fā)表于 10-11 23:29

    跨越地理限制:動(dòng)態(tài)海外住宅IP技術(shù)引領(lǐng)全球化網(wǎng)絡(luò)新紀(jì)元

    跨越地理限制:動(dòng)態(tài)海外住宅IP技術(shù)引領(lǐng)全球化網(wǎng)絡(luò)新紀(jì)元這一主題,凸顯了動(dòng)態(tài)海外住宅IP技術(shù)在全球化網(wǎng)絡(luò)環(huán)境中的重要作用。
    的頭像 發(fā)表于 09-27 08:30 ?241次閱讀

    能耗管理系統(tǒng)新紀(jì)元:智能科技引領(lǐng)綠色生活風(fēng)尚

    能耗管理系統(tǒng)新紀(jì)元:智能科技引領(lǐng)綠色生活風(fēng)尚 在科技日新月異的今天,我們的生活正經(jīng)歷著前所未有的變革,而能耗管理系統(tǒng)作為連接環(huán)保與可持續(xù)發(fā)展的橋梁,正步入一個(gè)由智能科技引領(lǐng)新紀(jì)元。這
    的頭像 發(fā)表于 08-15 18:17 ?463次閱讀

    基于迅為RK3588【RKNPU2項(xiàng)目實(shí)戰(zhàn)1】:YOLOV5實(shí)時(shí)目標(biāo)分類

    【RKNPU2項(xiàng)目實(shí)戰(zhàn)1】:YOLOV5實(shí)時(shí)目標(biāo)分類 https://www.bilibili.com/video/BV1ZN411D7V8/?spm_id_from=333.999.0.0
    發(fā)表于 08-15 10:51

    AI技術(shù)引領(lǐng)奧運(yùn)轉(zhuǎn)播新紀(jì)元

    隨著第33屆夏季奧林匹克運(yùn)動(dòng)會(huì)在法國(guó)巴黎璀璨啟幕,一場(chǎng)前所未有的科技與體育盛宴正席卷全球。在這場(chǎng)盛宴中,AI技術(shù)以其獨(dú)特的魅力,深度融入了賽事的每一個(gè)角落,從數(shù)據(jù)的實(shí)時(shí)捕捉與分析,到超高清畫面的全球無(wú)縫對(duì)接,正引領(lǐng)著奧運(yùn)轉(zhuǎn)播邁向一個(gè)嶄新的
    的頭像 發(fā)表于 08-06 17:08 ?682次閱讀

    比爾·蓋茨展望AI:耳機(jī)與智能眼鏡引領(lǐng)人機(jī)交互新紀(jì)元

    我們描繪了一幅人工智能(AI)技術(shù)普及后,生活與工作方式的全新圖景。他特別指出,耳機(jī)與智能眼鏡將成為AI硬件領(lǐng)域的兩大焦點(diǎn),引領(lǐng)人機(jī)交互進(jìn)入前所未有的新紀(jì)元。
    的頭像 發(fā)表于 07-04 16:34 ?847次閱讀

    YOLOv5的原理、結(jié)構(gòu)、特點(diǎn)和應(yīng)用

    YOLOv5(You Only Look Once version 5)是一種基于深度學(xué)習(xí)的實(shí)時(shí)目標(biāo)檢測(cè)算法,它屬于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的范疇。下面我將詳細(xì)介紹
    的頭像 發(fā)表于 07-03 09:23 ?4600次閱讀

    用OpenVINO C# API在intel平臺(tái)部署YOLOv10目標(biāo)檢測(cè)模型

    最近YOLO家族又添新成員:YOLOv10,YOLOv10提出了一種一致的雙任務(wù)方法,用于無(wú)nms訓(xùn)練的YOLOs,它同時(shí)帶來(lái)了具有競(jìng)爭(zhēng)力的性能和較低的推理延遲。此外,還介紹了整體效率
    的頭像 發(fā)表于 06-21 09:23 ?919次閱讀
    用OpenVINO C# API在intel平臺(tái)部署<b class='flag-5'>YOLOv10</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>模型

    技嘉科技推出GIGABYTE AI TOP,引領(lǐng)本地AI訓(xùn)練新紀(jì)元

    技嘉科技在COMPUTEX 2024前夕推出GIGABYTE AI TOP,引領(lǐng)本地AI訓(xùn)練新紀(jì)元   在即將到來(lái)的COMPUTEX 2024科技盛會(huì)前夕,全球知名的計(jì)算機(jī)硬件制造商技嘉
    的頭像 發(fā)表于 06-11 14:11 ?817次閱讀

    一圖看懂2024華為智能充電網(wǎng)絡(luò)開啟超充新紀(jì)元

    一圖看懂2024華為智能充電網(wǎng)絡(luò)開啟超充新紀(jì)元
    的頭像 發(fā)表于 04-29 10:27 ?526次閱讀
    一圖看懂2024華為智能充電網(wǎng)絡(luò)開啟超充<b class='flag-5'>新紀(jì)元</b>

    OpenVINO? C# API部署YOLOv9目標(biāo)檢測(cè)和實(shí)例分割模型

    YOLOv9模型是YOLO系列實(shí)時(shí)目標(biāo)檢測(cè)算法中的最新版本,代表著該系列在準(zhǔn)確性、速度和效率方面的又一次重大飛躍。
    的頭像 發(fā)表于 04-03 17:35 ?704次閱讀
    OpenVINO? C# API部署<b class='flag-5'>YOLOv</b>9<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>和實(shí)例分割模型

    高通重磅發(fā)布第三代驍龍7+,引領(lǐng)AI與性能新紀(jì)元

    近日,科技界掀起一陣狂潮,高通技術(shù)公司盛大發(fā)布第三代驍龍7+移動(dòng)平臺(tái),此舉不僅將終端側(cè)生成式AI技術(shù)首次引入驍龍7系,更在性能上實(shí)現(xiàn)飛躍,CPU性能飆升15%,GPU性能更是驚人提升45%。這一革命性的移動(dòng)平臺(tái),無(wú)疑將引領(lǐng)智能手機(jī)行業(yè)進(jìn)入全新的AI與性能新紀(jì)元。
    的頭像 發(fā)表于 03-25 09:46 ?1337次閱讀

    深入淺出Yolov3和Yolov4

    Yolov3是目標(biāo)檢測(cè)Yolo系列非常非常經(jīng)典的算法,不過(guò)很多同學(xué)拿到Yolov3或者Yolov4的cfg文件時(shí),并不知道如何直觀的可視化查
    的頭像 發(fā)表于 01-11 10:42 ?728次閱讀
    深入淺出<b class='flag-5'>Yolov</b>3和<b class='flag-5'>Yolov</b>4