近日,在國(guó)際計(jì)算機(jī)視覺(jué)競(jìng)賽PASCAL VOC,中星微以89.0分的總成績(jī)位列第一,獲得目標(biāo)檢測(cè)單模型第一名。獲勝的模型是一步法的目標(biāo)檢測(cè)模型,本文帶來(lái)技術(shù)詳解。
近日,在PASCAL VOC comp4目標(biāo)檢測(cè)競(jìng)賽中,中星微再創(chuàng)佳績(jī),獲得了目標(biāo)檢測(cè)單模型第一名。
Pascal VOC是世界計(jì)算機(jī)視覺(jué)領(lǐng)域知名的競(jìng)賽,比賽中,參賽者要對(duì)人、貓、鳥(niǎo)、飛機(jī)、汽車(chē)、船、盆栽等20類(lèi)物體進(jìn)行檢測(cè)。由于訓(xùn)練樣本較少,場(chǎng)景變化多端,非常具有挑戰(zhàn)性。中星微人工智能參賽團(tuán)隊(duì)VIM_SSD以89.0分的總成績(jī)位列第一。
中星微人工智能芯片技術(shù)公司董事長(zhǎng)兼總經(jīng)理張韻東表示:“本次參賽的模型適合終端設(shè)備部署的簡(jiǎn)單模型一步法算法,能夠取得與云端服務(wù)器復(fù)雜多模型算法相媲美的結(jié)果,實(shí)屬不易。作為人工智能芯片公司,我們不僅要在芯片設(shè)計(jì)方面精益求精,同時(shí)更要在算法的精簡(jiǎn)優(yōu)化方面取得突破,為客戶(hù)提供前端智能設(shè)備的整體解決方案?!?/p>
一步法目標(biāo)檢測(cè)模型
中星微本次提交的深度學(xué)習(xí)模型和上次參加比賽的深度學(xué)習(xí)模型基本一致,仍然沿用了一步法的目標(biāo)檢測(cè)模型,基礎(chǔ)網(wǎng)絡(luò)采用VGG16,并未使用ResNet-101, ResNet-152等更復(fù)雜的網(wǎng)絡(luò),保證精度的情況下速度更快。第一次參加比賽的成績(jī)是87.6,這次是89.0,精度提高很多。該結(jié)果不僅領(lǐng)先于所有的一步法算法,同時(shí)擊敗了所有的二步法算法。
中星微人工智能芯片技術(shù)公司研發(fā)副總裁艾國(guó)表示:“本次我們深度學(xué)習(xí)模型是上次模型的全面升級(jí),仍然沿用了一步法的網(wǎng)絡(luò)架構(gòu),重點(diǎn)改進(jìn)和優(yōu)化了訓(xùn)練相關(guān)的方法和技術(shù),在不增加算法復(fù)雜度的情況下,使得網(wǎng)絡(luò)的精度越來(lái)越高,這是我們公司要打造的核心技術(shù)。在前端嵌入式設(shè)備計(jì)算資源受限的情況下,我們通過(guò)調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練的方法提高精度,而不是不斷增加網(wǎng)絡(luò)復(fù)雜度。”
VOC 2012數(shù)據(jù)集圖片測(cè)試結(jié)果
不僅是單模型,而且是一步法,尤其適用于嵌入式NPU
多模型融合是深度學(xué)習(xí)比賽中經(jīng)常使用到的一個(gè)利器,它通??梢栽诟鞣N不同的機(jī)器學(xué)習(xí)任務(wù)中使結(jié)果獲得提升。顧名思義,多模型融合就是綜合考慮多個(gè)不同模型的情況,并將它們的結(jié)果融合到一起。
雖然通過(guò)模型進(jìn)行融合往往效果較好,但是其實(shí)現(xiàn)代價(jià)和計(jì)算開(kāi)銷(xiāo)也比較大。目前,中星微主要是從實(shí)際項(xiàng)目應(yīng)用的角度來(lái)考慮,特別是前端應(yīng)用,一般都是單模型。當(dāng)然,后期也會(huì)考慮使用模型融合,來(lái)提升比賽結(jié)果的精度。
下表是目前PASCAL VOC競(jìng)賽前十名,可以看出,下面算法中大部分應(yīng)用了更復(fù)雜的基礎(chǔ)網(wǎng)絡(luò)ResNet-101和ResNet-152,并且是兩步法,也有多模型融合(ensemble)。而中星微的模型不僅是單模型,而且是一步法,在嵌入式NPU可以達(dá)到很高的幀率。
Method | Backbone | mAP (%) | ||
Ali_DCN_SSD_ENSEMBLE | ResNet-101 | 89.2 | ensemble | |
VIM_SSD(COCO+07++12, single model, one-stage) | VGG16 | 89.0 | one-stage | single |
FOCAL_DRFCN(VOC+COCO, single model) | ResNet-152 | 88.8 | two-stage | single |
R4D_faster_rcnn | - | 88.6 | - | - |
FF_CSSD(VOC+COCO, one-stage, single model) [?] | ResNet101 | 88.4 | one-stage | single |
R-FCN, ResNet Ensemble(VOC+COCO) | ResNet | 88.4 | two-stage | ensemble |
HIK_FRCN | ResNet-101 | 87.9 | two-stage | single |
VIM_SSD | VGG16 | 87.6 | one-stage | single |
Deformable R-FCN, ResNet-101 (VOC+COCO) | ResNet-101 | 87.1 | two-stage | single |
RefineDet(VOC+COCO,singlemodel,VGG16,one-stage) | VGG16 | 86.8 | one-stage | single |
阿里巴巴達(dá)摩院多模型融合網(wǎng)絡(luò)Ali_DCN_SSD_ENSEMBLE的得分是89.2,只比中星微單模型網(wǎng)絡(luò)高了0.2點(diǎn),而阿里巴巴達(dá)摩院FF_CSSD(VOC+COCO, one-stage, single model)一步法單模型的精度是88.4,基礎(chǔ)網(wǎng)絡(luò)是ResNet101,和中星微差了0.6個(gè)點(diǎn)。
從安防監(jiān)控到保護(hù)瀕危野生動(dòng)物,應(yīng)用場(chǎng)景廣泛
目標(biāo)檢測(cè)技術(shù)應(yīng)用廣泛,是AI場(chǎng)景落地的關(guān)鍵性技術(shù)之一。中星微的深度學(xué)習(xí)模型運(yùn)行在前端智能設(shè)備(如智能攝像頭上),廣泛用于安防監(jiān)控、安全生產(chǎn)、環(huán)境保護(hù)、個(gè)人健康監(jiān)測(cè)等領(lǐng)域。
下面是一個(gè)環(huán)境保護(hù)的例子,在我國(guó)西部及藏區(qū)應(yīng)用,其采用人工智能、深度學(xué)習(xí)對(duì)野生保護(hù)動(dòng)物進(jìn)行檢測(cè)、識(shí)別、統(tǒng)計(jì)。從而達(dá)到對(duì)野生動(dòng)物保護(hù),生態(tài)環(huán)境平衡的目標(biāo)。根據(jù)國(guó)家要求,增強(qiáng)保護(hù)野生動(dòng)物、保護(hù)環(huán)境的意識(shí),特別是對(duì)瀕臨滅絕的野生動(dòng)物的研究和保護(hù),更要加大力度;要從科研、技術(shù)角度解決野生動(dòng)物保護(hù)和數(shù)量的實(shí)時(shí)狀態(tài)。
如下圖,是對(duì)藏羚羊的檢測(cè)、識(shí)別、統(tǒng)計(jì):
如下圖,是對(duì)藏野驢的監(jiān)測(cè)、識(shí)別、統(tǒng)計(jì):
概念說(shuō)明
精度:目標(biāo)檢測(cè)中衡量識(shí)別精度的指標(biāo)是mAP(mean average precision)。在多個(gè)類(lèi)別物體檢測(cè)中,每一個(gè)類(lèi)別都可以根據(jù)recall和precision繪制一條曲線(xiàn),AP就是該曲線(xiàn)下的面積,mAP是多個(gè)類(lèi)別AP的平均值,理論上最高mAP為1.0,也就是我們說(shuō)的100分,89分其實(shí)就是0.89 mAP,下面是示例說(shuō)明。
前端智能和云端智能:前端智能是將智能分析算法嵌入到前端設(shè)備,拿安防攝像機(jī)舉例,就是攝像機(jī)采集的視頻內(nèi)容立即進(jìn)行分析,提取出畫(huà)面中關(guān)鍵的、感興趣的、有效的信息,形成結(jié)構(gòu)化的數(shù)據(jù)。前端智能因受各種資源限制,需要對(duì)算法復(fù)雜度、網(wǎng)絡(luò)模型大小等有限制。
云端智能是將前端傳感器采集的數(shù)據(jù)通過(guò)云端來(lái)完成智能分析,一般通過(guò)大型的GPU服務(wù)器來(lái)完成。因此相對(duì)于前端智能,計(jì)算資源、內(nèi)存資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源等都較大,因此對(duì)算法模型的限制比較小,可以部署很大的很復(fù)雜網(wǎng)絡(luò)模型。
-
中星微
+關(guān)注
關(guān)注
0文章
26瀏覽量
11216 -
人工智能
+關(guān)注
關(guān)注
1791文章
46701瀏覽量
237219 -
計(jì)算機(jī)視覺(jué)
+關(guān)注
關(guān)注
8文章
1695瀏覽量
45910
原文標(biāo)題:目標(biāo)檢測(cè)競(jìng)賽利器:中星微一步法模型獲國(guó)際算法競(jìng)賽第一名!
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論