0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國(guó)際計(jì)算機(jī)視覺(jué)競(jìng)賽PASCAL VOC,中星微以89.0分的總成績(jī)位列第一

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-07-09 08:55 ? 次閱讀

近日,在國(guó)際計(jì)算機(jī)視覺(jué)競(jìng)賽PASCAL VOC,中星微以89.0分的總成績(jī)位列第一,獲得目標(biāo)檢測(cè)單模型第一名。獲勝的模型是一步法的目標(biāo)檢測(cè)模型,本文帶來(lái)技術(shù)詳解。

近日,在PASCAL VOC comp4目標(biāo)檢測(cè)競(jìng)賽中,中星微再創(chuàng)佳績(jī),獲得了目標(biāo)檢測(cè)單模型第一名。

Pascal VOC是世界計(jì)算機(jī)視覺(jué)領(lǐng)域知名的競(jìng)賽,比賽中,參賽者要對(duì)人、貓、鳥(niǎo)、飛機(jī)、汽車(chē)、船、盆栽等20類(lèi)物體進(jìn)行檢測(cè)。由于訓(xùn)練樣本較少,場(chǎng)景變化多端,非常具有挑戰(zhàn)性。中星微人工智能參賽團(tuán)隊(duì)VIM_SSD以89.0分的總成績(jī)位列第一。

中星微人工智能芯片技術(shù)公司董事長(zhǎng)兼總經(jīng)理張韻東表示:“本次參賽的模型適合終端設(shè)備部署的簡(jiǎn)單模型一步法算法,能夠取得與云端服務(wù)器復(fù)雜多模型算法相媲美的結(jié)果,實(shí)屬不易。作為人工智能芯片公司,我們不僅要在芯片設(shè)計(jì)方面精益求精,同時(shí)更要在算法的精簡(jiǎn)優(yōu)化方面取得突破,為客戶(hù)提供前端智能設(shè)備的整體解決方案?!?/p>

一步法目標(biāo)檢測(cè)模型

中星微本次提交的深度學(xué)習(xí)模型和上次參加比賽的深度學(xué)習(xí)模型基本一致,仍然沿用了一步法的目標(biāo)檢測(cè)模型,基礎(chǔ)網(wǎng)絡(luò)采用VGG16,并未使用ResNet-101, ResNet-152等更復(fù)雜的網(wǎng)絡(luò),保證精度的情況下速度更快。第一次參加比賽的成績(jī)是87.6,這次是89.0,精度提高很多。該結(jié)果不僅領(lǐng)先于所有的一步法算法,同時(shí)擊敗了所有的二步法算法。

中星微人工智能芯片技術(shù)公司研發(fā)副總裁艾國(guó)表示:“本次我們深度學(xué)習(xí)模型是上次模型的全面升級(jí),仍然沿用了一步法的網(wǎng)絡(luò)架構(gòu),重點(diǎn)改進(jìn)和優(yōu)化了訓(xùn)練相關(guān)的方法和技術(shù),在不增加算法復(fù)雜度的情況下,使得網(wǎng)絡(luò)的精度越來(lái)越高,這是我們公司要打造的核心技術(shù)。在前端嵌入式設(shè)備計(jì)算資源受限的情況下,我們通過(guò)調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練的方法提高精度,而不是不斷增加網(wǎng)絡(luò)復(fù)雜度。”

VOC 2012數(shù)據(jù)集圖片測(cè)試結(jié)果

不僅是單模型,而且是一步法,尤其適用于嵌入式NPU

多模型融合是深度學(xué)習(xí)比賽中經(jīng)常使用到的一個(gè)利器,它通??梢栽诟鞣N不同的機(jī)器學(xué)習(xí)任務(wù)中使結(jié)果獲得提升。顧名思義,多模型融合就是綜合考慮多個(gè)不同模型的情況,并將它們的結(jié)果融合到一起。

雖然通過(guò)模型進(jìn)行融合往往效果較好,但是其實(shí)現(xiàn)代價(jià)和計(jì)算開(kāi)銷(xiāo)也比較大。目前,中星微主要是從實(shí)際項(xiàng)目應(yīng)用的角度來(lái)考慮,特別是前端應(yīng)用,一般都是單模型。當(dāng)然,后期也會(huì)考慮使用模型融合,來(lái)提升比賽結(jié)果的精度。

下表是目前PASCAL VOC競(jìng)賽前十名,可以看出,下面算法中大部分應(yīng)用了更復(fù)雜的基礎(chǔ)網(wǎng)絡(luò)ResNet-101和ResNet-152,并且是兩步法,也有多模型融合(ensemble)。而中星微的模型不僅是單模型,而且是一步法,在嵌入式NPU可以達(dá)到很高的幀率。

Method Backbone mAP (%)
Ali_DCN_SSD_ENSEMBLE ResNet-101 89.2 ensemble
VIM_SSD(COCO+07++12, single model, one-stage) VGG16 89.0 one-stage single
FOCAL_DRFCN(VOC+COCO, single model) ResNet-152 88.8 two-stage single
R4D_faster_rcnn - 88.6 - -
FF_CSSD(VOC+COCO, one-stage, single model) [?] ResNet101 88.4 one-stage single
R-FCN, ResNet Ensemble(VOC+COCO) ResNet 88.4 two-stage ensemble
HIK_FRCN ResNet-101 87.9 two-stage single
VIM_SSD VGG16 87.6 one-stage single
Deformable R-FCN, ResNet-101 (VOC+COCO) ResNet-101 87.1 two-stage single
RefineDet(VOC+COCO,singlemodel,VGG16,one-stage) VGG16 86.8 one-stage single

阿里巴巴達(dá)摩院多模型融合網(wǎng)絡(luò)Ali_DCN_SSD_ENSEMBLE的得分是89.2,只比中星微單模型網(wǎng)絡(luò)高了0.2點(diǎn),而阿里巴巴達(dá)摩院FF_CSSD(VOC+COCO, one-stage, single model)一步法單模型的精度是88.4,基礎(chǔ)網(wǎng)絡(luò)是ResNet101,和中星微差了0.6個(gè)點(diǎn)。

從安防監(jiān)控到保護(hù)瀕危野生動(dòng)物,應(yīng)用場(chǎng)景廣泛

目標(biāo)檢測(cè)技術(shù)應(yīng)用廣泛,是AI場(chǎng)景落地的關(guān)鍵性技術(shù)之一。中星微的深度學(xué)習(xí)模型運(yùn)行在前端智能設(shè)備(如智能攝像頭上),廣泛用于安防監(jiān)控、安全生產(chǎn)、環(huán)境保護(hù)、個(gè)人健康監(jiān)測(cè)等領(lǐng)域。

下面是一個(gè)環(huán)境保護(hù)的例子,在我國(guó)西部及藏區(qū)應(yīng)用,其采用人工智能、深度學(xué)習(xí)對(duì)野生保護(hù)動(dòng)物進(jìn)行檢測(cè)、識(shí)別、統(tǒng)計(jì)。從而達(dá)到對(duì)野生動(dòng)物保護(hù),生態(tài)環(huán)境平衡的目標(biāo)。根據(jù)國(guó)家要求,增強(qiáng)保護(hù)野生動(dòng)物、保護(hù)環(huán)境的意識(shí),特別是對(duì)瀕臨滅絕的野生動(dòng)物的研究和保護(hù),更要加大力度;要從科研、技術(shù)角度解決野生動(dòng)物保護(hù)和數(shù)量的實(shí)時(shí)狀態(tài)。

如下圖,是對(duì)藏羚羊的檢測(cè)、識(shí)別、統(tǒng)計(jì):

如下圖,是對(duì)藏野驢的監(jiān)測(cè)、識(shí)別、統(tǒng)計(jì):

概念說(shuō)明

精度:目標(biāo)檢測(cè)中衡量識(shí)別精度的指標(biāo)是mAP(mean average precision)。在多個(gè)類(lèi)別物體檢測(cè)中,每一個(gè)類(lèi)別都可以根據(jù)recall和precision繪制一條曲線(xiàn),AP就是該曲線(xiàn)下的面積,mAP是多個(gè)類(lèi)別AP的平均值,理論上最高mAP為1.0,也就是我們說(shuō)的100分,89分其實(shí)就是0.89 mAP,下面是示例說(shuō)明。

前端智能和云端智能:前端智能是將智能分析算法嵌入到前端設(shè)備,拿安防攝像機(jī)舉例,就是攝像機(jī)采集的視頻內(nèi)容立即進(jìn)行分析,提取出畫(huà)面中關(guān)鍵的、感興趣的、有效的信息,形成結(jié)構(gòu)化的數(shù)據(jù)。前端智能因受各種資源限制,需要對(duì)算法復(fù)雜度、網(wǎng)絡(luò)模型大小等有限制。

云端智能是將前端傳感器采集的數(shù)據(jù)通過(guò)云端來(lái)完成智能分析,一般通過(guò)大型的GPU服務(wù)器來(lái)完成。因此相對(duì)于前端智能,計(jì)算資源、內(nèi)存資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源等都較大,因此對(duì)算法模型的限制比較小,可以部署很大的很復(fù)雜網(wǎng)絡(luò)模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 中星微
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    11216
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46701

    瀏覽量

    237219
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    8

    文章

    1695

    瀏覽量

    45910

原文標(biāo)題:目標(biāo)檢測(cè)競(jìng)賽利器:中星微一步法模型獲國(guó)際算法競(jìng)賽第一名!

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    計(jì)算機(jī)視覺(jué)有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺(jué)作為人工智能領(lǐng)域的個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類(lèi)樣理解和解釋圖像和視頻中的信息。這
    的頭像 發(fā)表于 08-14 09:49 ?664次閱讀

    地平線(xiàn)科研論文入選國(guó)際計(jì)算機(jī)視覺(jué)頂會(huì)ECCV 2024

    近日,地平線(xiàn)兩篇論文入選國(guó)際計(jì)算機(jī)視覺(jué)頂會(huì)ECCV 2024,自動(dòng)駕駛算法技術(shù)再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?847次閱讀
    地平線(xiàn)科研論文入選<b class='flag-5'>國(guó)際</b><b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>頂會(huì)ECCV 2024

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)有什么區(qū)別

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。 、定義 機(jī)器視覺(jué) 機(jī)器視覺(jué),又稱(chēng)為
    的頭像 發(fā)表于 07-16 10:23 ?450次閱讀

    計(jì)算機(jī)視覺(jué)的五大技術(shù)

    計(jì)算機(jī)視覺(jué)作為深度學(xué)習(xí)領(lǐng)域最熱門(mén)的研究方向之,其技術(shù)涵蓋了多個(gè)方面,為人工智能的發(fā)展開(kāi)拓了廣闊的道路。以下是對(duì)計(jì)算機(jī)視覺(jué)五大技術(shù)的詳細(xì)解析
    的頭像 發(fā)表于 07-10 18:26 ?1160次閱讀

    計(jì)算機(jī)視覺(jué)的工作原理和應(yīng)用

    圖像和視頻中提取有用信息,進(jìn)而進(jìn)行決策和行動(dòng)。自1960年代第一批學(xué)術(shù)論文問(wèn)世以來(lái),計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)取得了長(zhǎng)足的發(fā)展,并在多個(gè)領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力和價(jià)值。
    的頭像 發(fā)表于 07-10 18:24 ?1520次閱讀

    計(jì)算機(jī)視覺(jué)與人工智能的關(guān)系是什么

    引言 計(jì)算機(jī)視覺(jué)門(mén)研究如何使計(jì)算機(jī)能夠理解和解釋視覺(jué)信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的知識(shí)。人工智能則是研究如
    的頭像 發(fā)表于 07-09 09:25 ?490次閱讀

    計(jì)算機(jī)視覺(jué)與智能感知是干嘛的

    引言 計(jì)算機(jī)視覺(jué)(Computer Vision)是門(mén)研究如何使計(jì)算機(jī)能夠理解和解釋視覺(jué)信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等
    的頭像 發(fā)表于 07-09 09:23 ?708次閱讀

    計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)區(qū)別在哪

    ,旨在實(shí)現(xiàn)對(duì)圖像和視頻的自動(dòng)分析和理解。 機(jī)器視覺(jué) 機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)個(gè)分支,主要應(yīng)用于工業(yè)自動(dòng)化領(lǐng)域。它利用
    的頭像 發(fā)表于 07-09 09:22 ?387次閱讀

    計(jì)算機(jī)視覺(jué)和圖像處理的區(qū)別和聯(lián)系

    計(jì)算機(jī)視覺(jué)和圖像處理是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計(jì)算機(jī)視覺(jué) 計(jì)算機(jī)視覺(jué)
    的頭像 發(fā)表于 07-09 09:16 ?1099次閱讀

    計(jì)算機(jī)視覺(jué)屬于人工智能嗎

    屬于,計(jì)算機(jī)視覺(jué)是人工智能領(lǐng)域的個(gè)重要分支。 引言 計(jì)算機(jī)視覺(jué)門(mén)研究如何使
    的頭像 發(fā)表于 07-09 09:11 ?1061次閱讀

    計(jì)算機(jī)視覺(jué)的主要研究方向

    計(jì)算機(jī)視覺(jué)(Computer Vision, CV)作為人工智能領(lǐng)域的個(gè)重要分支,致力于使計(jì)算機(jī)能夠像人眼樣理解和解釋圖像和視頻中的信息
    的頭像 發(fā)表于 06-06 17:17 ?792次閱讀

    【量子計(jì)算機(jī)重構(gòu)未來(lái) | 閱讀體驗(yàn)】+ 初識(shí)量子計(jì)算機(jī)

    感覺(jué)量子技術(shù)神奇神秘,希望通過(guò)閱讀此書(shū)來(lái)認(rèn)識(shí)量子計(jì)算機(jī)。 先瀏覽下目錄: 通過(guò)目錄,基本可以確定這是本關(guān)于量子計(jì)算機(jī)的科普書(shū)籍,主要包括什么是量子
    發(fā)表于 03-05 17:37

    計(jì)算機(jī)視覺(jué)的十大算法

    視覺(jué)技術(shù)的發(fā)展起到了重要的推動(dòng)作用。、圖像分割算法圖像分割算法是計(jì)算機(jī)視覺(jué)領(lǐng)域的基礎(chǔ)算法之,它的主要任務(wù)是將圖像分割成不同的區(qū)域或?qū)ο蟆?/div>
    的頭像 發(fā)表于 02-19 13:26 ?1182次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的十大算法

    什么是計(jì)算機(jī)視覺(jué)?計(jì)算機(jī)視覺(jué)的三種方法

    計(jì)算機(jī)視覺(jué)是指通過(guò)為計(jì)算機(jī)賦予人類(lèi)視覺(jué)技術(shù)目標(biāo),從而賦能裝配線(xiàn)檢查到駕駛輔助和機(jī)器人等應(yīng)用。計(jì)算機(jī)
    的頭像 發(fā)表于 11-16 16:38 ?4423次閱讀
    什么是<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>?<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的三種方法

    最適合AI應(yīng)用的計(jì)算機(jī)視覺(jué)類(lèi)型是什么?

    計(jì)算機(jī)視覺(jué)是指為計(jì)算機(jī)賦予人類(lèi)視覺(jué)技術(shù)目標(biāo),從而賦能裝配線(xiàn)檢查到駕駛輔助和機(jī)器人等應(yīng)用。計(jì)算機(jī)
    的頭像 發(fā)表于 11-15 16:38 ?409次閱讀
    最適合AI應(yīng)用的<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>類(lèi)型是什么?