近日,世界最權(quán)威的人臉檢測(cè)公開(kāi)評(píng)測(cè)集WIDER FACE公布最新評(píng)測(cè)結(jié)果,滴滴AI Labs團(tuán)隊(duì)聯(lián)合北京郵電大學(xué)PRIS團(tuán)隊(duì)提出的人臉檢測(cè)DFS算法,在WIDER FACE的Easy、Medium和Hard三個(gè)評(píng)測(cè)子集的六項(xiàng)評(píng)估結(jié)果中, 超過(guò)了國(guó)內(nèi)外眾多科技公司和高校院所,取得了五項(xiàng)第一、一項(xiàng)第二的好成績(jī),充分彰顯了滴滴在人臉檢測(cè)領(lǐng)域的創(chuàng)新能力。
WIDER FACE是目前業(yè)界公開(kāi)的數(shù)據(jù)規(guī)模最大、檢測(cè)難度最高的人臉檢測(cè)數(shù)據(jù)集之一,由香港中文大學(xué)于2016年建立,共包含32,203張圖像和393,703個(gè)人臉標(biāo)注。其中40%的數(shù)據(jù)為訓(xùn)練集(Training),10%的數(shù)據(jù)為驗(yàn)證集(Validation),50%的數(shù)據(jù)為測(cè)試集(Testing)。每個(gè)集合中的數(shù)據(jù)根據(jù)人臉檢測(cè)的難易程度分為“Easy”、“Medium”、“Hard”。
由于匯集了人臉尺寸大小變化、拍照角度引起的人臉姿態(tài)變化、不同程度的人臉遮擋、表情變化、光照強(qiáng)弱差異以及化妝等多種影響因素,該數(shù)據(jù)集在全球人臉檢測(cè)領(lǐng)域極具挑戰(zhàn)性,每次評(píng)測(cè)均會(huì)吸引多家國(guó)內(nèi)外科技巨頭及高校院所(包含卡耐基梅隆大學(xué)、加州大學(xué)圣地亞哥分校、北航、浙大、京東、騰訊優(yōu)圖、百度、華為云、IBM沃森研究院等)在這個(gè)數(shù)據(jù)集上驗(yàn)證了自己的算法效果。
最新評(píng)測(cè)結(jié)果顯示, AI Labs團(tuán)隊(duì)提出的DFS算法在WIDER FACE人臉檢測(cè)平臺(tái)中,在官方驗(yàn)證集和測(cè)試集的六項(xiàng)評(píng)估結(jié)果中取得五項(xiàng)第一、一項(xiàng)第二。其中在“Easy”、“Medium”和“Hard”三個(gè)測(cè)試子集中,DFS算法性能分別達(dá)到96.3% AP,95.4% AP,90.7% AP。
圖1 驗(yàn)證集性能曲線圖
圖2 測(cè)試集性能曲線圖
DFS算法以卷積神經(jīng)網(wǎng)絡(luò)中的特征融合為切入點(diǎn),為了防止高層特征圖上的語(yǔ)義信息覆蓋低層特征圖上的細(xì)節(jié)信息,提出了特征融合金字塔(Feature Fusion Pyramid)結(jié)構(gòu),其以空間和通道注意力機(jī)制的方式融合高低層特征,在不失細(xì)節(jié)信息的同時(shí)將語(yǔ)義信息作為上下文線索(contextual cues)增強(qiáng)低層特征;另外,DFS算法提出了一種輔助訓(xùn)練單階段檢測(cè)器的語(yǔ)義分割分支(Semantic Segmentation branch),促使檢測(cè)網(wǎng)絡(luò)以一種自監(jiān)督的方式實(shí)現(xiàn)注意力機(jī)制以及學(xué)到更好的特征。具體地說(shuō),DFS算法獨(dú)特的語(yǔ)義分割分支分層地利用更強(qiáng)的語(yǔ)義分割監(jiān)督信息監(jiān)督訓(xùn)練網(wǎng)絡(luò),使得用于預(yù)測(cè)人臉的各級(jí)特征圖專(zhuān)注于各自最適宜檢測(cè)到的不同尺寸的人臉。
圖3 DFS算法網(wǎng)絡(luò)框架圖
目前人臉檢測(cè)和識(shí)別技術(shù)已經(jīng)在滴滴平臺(tái)廣泛使用,用于司機(jī)人不符檢測(cè)、行程中車(chē)內(nèi)錄像時(shí)的乘客隱私保護(hù)等場(chǎng)景,并已形成成熟的技術(shù)解決方案,幫助外部合作伙伴進(jìn)一步提高效率。
實(shí)際上,滴滴已經(jīng)多次在圖像視頻領(lǐng)域相關(guān)競(jìng)賽或評(píng)測(cè)中獲得世界級(jí)第一。在去年7月的CVPR 2018 WAD自動(dòng)駕駛挑戰(zhàn)賽中,攬獲了二、三、四名的好成績(jī);而在去年9月ECCV 2018 COCO & Mapillary挑戰(zhàn)賽中,滴滴技術(shù)團(tuán)隊(duì)首次參賽即獲得Mapillary街景檢測(cè)單項(xiàng)世界第一。
此次人臉檢測(cè)技術(shù)再破世界紀(jì)錄,也充分體現(xiàn)了滴滴在計(jì)算機(jī)視覺(jué)領(lǐng)域強(qiáng)大技術(shù)實(shí)力,滴滴將持續(xù)進(jìn)行更多探索,不斷優(yōu)化出行交通感知理解、智能交互等技術(shù),用先進(jìn)的AI技術(shù)提升用戶體驗(yàn)、助力行業(yè)轉(zhuǎn)型升級(jí),進(jìn)而構(gòu)建智能出行新生態(tài)。
-
算法
+關(guān)注
關(guān)注
23文章
4587瀏覽量
92500 -
人臉檢測(cè)
+關(guān)注
關(guān)注
0文章
80瀏覽量
16436 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1200瀏覽量
24619
原文標(biāo)題:滴滴提出人臉檢測(cè)DFS算法,在WIDER FACE評(píng)測(cè)中獲得世界第一
文章出處:【微信號(hào):MEMSensor,微信公眾號(hào):MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論