0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌公布亞毫秒級的人臉檢測算法BlazeFace

DPVg_AI_era ? 來源:lq ? 2019-07-18 09:41 ? 次閱讀

谷歌近日公布亞毫秒級的人臉檢測算法BlazeFace,這是一款專為移動GPU推理量身定制的輕量級人臉檢測器,能夠以200~1000+ FPS的速度運(yùn)行,且性能非常卓越!

近年來,深度神經(jīng)網(wǎng)絡(luò)的各種架構(gòu)改進(jìn)使得實(shí)時目標(biāo)檢測成為可能。實(shí)驗室可以不計一切地開發(fā)各種算法追求逼近極限的精度,而實(shí)際應(yīng)用中,響應(yīng)速度、能耗和精度都重要。這就要求算法的復(fù)雜度要低、適合硬件加速。

在移動應(yīng)用中,實(shí)時目標(biāo)檢測往往只是視頻處理流程的第一步,接下來是各種特定的任務(wù),如分割、跟蹤或幾何推理。

因此,運(yùn)行對象檢測模型推理的算法要盡可能快,最好還具有比標(biāo)準(zhǔn)實(shí)時基準(zhǔn)更高的性能。

谷歌剛剛上傳到arXiv的一篇論文BlazeFace: Sub-millisecond Neural Face Detection on Mobile GPUs,推出了BlazeFace算法,這是一款專為移動GPU推理量身定制的輕量級人臉檢測器,且性能非常卓越!

有多卓越呢?谷歌在其旗艦設(shè)備測試,結(jié)果發(fā)現(xiàn)BlazeFace能夠以200~1000+ FPS的速度運(yùn)行。

這種超實(shí)時性能使其能夠應(yīng)用于任何需要準(zhǔn)確的面部區(qū)域,作為特定模型輸入的增強(qiáng)現(xiàn)實(shí)應(yīng)用中,例如2D/3D面部關(guān)鍵點(diǎn)或幾何估計、面部特征或表情分類、以及面部區(qū)域分割等。

谷歌已經(jīng)把該算法應(yīng)用在工業(yè)中。

兩大算法創(chuàng)新,一切為了又快又好

BlazeFace包括一個輕量級的特征提取網(wǎng)絡(luò),其靈感來自于MobileNetV1/V2,但又有所不同。還采取了一種修改過的SSD目標(biāo)檢測算法,使其對GPU更加友好。然后用改進(jìn)的聯(lián)合分辨率(tie resolution)策略來替代非極大抑制(Non-maximum suppression)。

BlazeFace可用于檢測智能手機(jī)前置攝像頭捕捉到的圖像中的一個或多個人臉。返回的是一個邊界框和每個人臉的6個關(guān)鍵點(diǎn)(從觀察者的角度看左眼、右眼、鼻尖、嘴、左眼角下方和右眼角下方)。

算法創(chuàng)新包括:

1、與推理速度相關(guān)的創(chuàng)新:

提出一種在結(jié)構(gòu)上與MobileNetV1/V2相關(guān)的非常緊湊的特征提取器卷積神經(jīng)網(wǎng)絡(luò),專為輕量級對象檢測而設(shè)計。

提出了一種基于SSD的GPU-friendly anchor機(jī)制,旨在提高GPU的利用率。Anchors是預(yù)定義的靜態(tài)邊界框,作為網(wǎng)絡(luò)預(yù)測調(diào)整的基礎(chǔ),并確定預(yù)測粒度。

2、與預(yù)測性能相關(guān)的創(chuàng)新:

提出一種替代非極大抑制的聯(lián)合分辨率策略,在重疊預(yù)測之間實(shí)現(xiàn)更穩(wěn)定、更平滑的tie resolution。

BlazeBlock (左) 和 double BlazeBlock

BlazeFace的模型架構(gòu)如上圖所示,在設(shè)計方面考慮了以下4個因素:

擴(kuò)大感受野(receptive field)的大?。?/p>

雖然大多數(shù)現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)(包括MobileNet)都傾向于在模型圖中使用3×3的卷積核,但我們注意到深度可分離卷積計算主要由它們的點(diǎn)態(tài)部分控制。

本研究發(fā)現(xiàn),增加深度部分的內(nèi)核大小成本并不會增加很多。因此,我們在模型架構(gòu)中使用了5×5的卷積核,用kernel size的增加來交換達(dá)到特定receptive field大小所需的bottlenecks總數(shù)的減少。

深度卷積的低開銷還允許我們在這兩個點(diǎn)卷積之間引入另一個這樣的層,從而進(jìn)一步加速達(dá)到所需receptive field。這形成了一個double BlazeBlock,如上圖右邊所示。

特征提取器(Feature extractor):

在實(shí)驗中,我們將重點(diǎn)放在前置相機(jī)模型的特征提取器上。它必須考慮更小的對象范圍,因此具有更低的計算需求。提取器采用128×128像素的RGB輸入,包含一個2D卷積,以及5個BlazeBlock和6個 double BlazeBlock,如下表所示:

改進(jìn)的Anchor 機(jī)制:

類似于SSD的對象檢測模型依賴于預(yù)定義的固定大小的基本邊界框,稱為priors,或者Faster-R-CNN中提出的術(shù)語“Anchor”。

我們將 8×8,4×4 和 2×2 分辨率中的每個像素的 2 個 anchor 替換為 8×8 的 6 個 anchor。由于人臉長寬比的變化有限,因此將 anchor 固定為 1:1 縱橫比足以進(jìn)行精確的面部檢測。

pipeline示例。紅色:BlazeFace的輸出。綠色:特定于任務(wù)的模型輸出。

后處理機(jī)制(Post-processing):

由于我們的feature extractor并沒有將分辨率降低到8×8以下,所以與給定對象重疊的anchor的數(shù)量會隨著對象的大小而顯著增加。在典型的非極大抑制場景中,只有一個anchor“勝出”,并被用作最終的算法結(jié)果。當(dāng)這樣的模型應(yīng)用于隨后的視頻幀時,預(yù)測往往會在不同的anchor點(diǎn)之間波動,并表現(xiàn)出明顯的人臉框抖動。

為了最小化這個問題,我們用一種混合策略代替了抑制算法,該策略將一個邊界框的回歸參數(shù)估計為重疊預(yù)測之間的加權(quán)平均值。它實(shí)際上不會給原始的NMS算法帶來額外的成本。對于我們的人臉檢測任務(wù),這個調(diào)整使準(zhǔn)確率提高了10%。

專為GPU設(shè)計,準(zhǔn)確度超越MobileNetV2

超實(shí)時性能。解鎖需要面部區(qū)域作為輸入的“任務(wù)特定”模型的實(shí)時AR pipeline:

準(zhǔn)確的3D面部幾何

通過Blendshapes進(jìn)行Puppeteering

面部分割

AR化妝試穿/美化

頭發(fā)/嘴唇/虹膜重新著色

磨皮

專為移動GPU設(shè)計

專為移動GPU和CPU設(shè)計

輕量級特征提取網(wǎng)絡(luò)

更適合GPU的anchor方案

改進(jìn)了tie resolution策略

GPU上的快速推理

精度

眼間距離的平均絕對誤差為10%左右就足夠精確了

后續(xù)模型的面對齊

生成6個面部關(guān)鍵點(diǎn)坐標(biāo)

在低端設(shè)備上僅使用此模型,實(shí)現(xiàn)耳朵等簡單特效

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6080

    瀏覽量

    104358
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100009
  • 人臉識別
    +關(guān)注

    關(guān)注

    76

    文章

    3998

    瀏覽量

    81359

原文標(biāo)題:亞毫秒級手機(jī)人臉識別!谷歌BlazeFace算法重大突破, 面向移動GPU

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人臉檢測算法及新的快速算法

    最近幾年的人臉檢測算法和一種新的快速算法,與大家探討特征、弱分類器、收斂準(zhǔn)則、樣本選擇等對人臉檢測性能的影響,并嘗試分析
    發(fā)表于 09-26 15:13

    基于openCV的人臉檢測系統(tǒng)的設(shè)計

    通過對基于Adaboost人臉檢測算法的研究,利用該算法與計算機(jī)視覺類庫openCV進(jìn)行人臉檢測系統(tǒng)的設(shè)計,實(shí)現(xiàn)了對出現(xiàn)在視頻或圖像中
    發(fā)表于 12-23 14:19

    ARM嵌入式環(huán)境中FDDB第一的人臉檢測算法的運(yùn)行

    YSQ(于仕琪)人臉檢測介紹:YSQ人臉檢測算法實(shí)現(xiàn)快速從視頻幀中檢測人臉并提取關(guān)鍵信息,支持多
    發(fā)表于 07-29 06:49

    基于ToF的3D活體檢測算法研究

    什么是活體檢測?什么又是3D活體檢測?以及怎么實(shí)現(xiàn)惡劣環(huán)境(如人臉遮擋、惡劣光照等)與人臉多姿態(tài)變化(如側(cè)臉、表情等)應(yīng)用場景下的活體檢測
    發(fā)表于 01-06 07:30

    分享一款高速人臉檢測算法

    目前優(yōu)化了一款高速人臉檢測算法,在 ARM設(shè)備的A73單核CPU(圖像大小:860*540最小人臉大?。?0*60)速度可以高達(dá)10-15ms每幀,真正的實(shí)時人臉
    發(fā)表于 12-15 07:01

    RK3399Pro是怎樣去移植Tencent的mtcnn人臉檢測算法

    RK3399Pro是怎樣去移植Tencent的mtcnn人臉檢測算法的?有哪些移植步驟?
    發(fā)表于 02-15 06:15

    基于層疊支持向量機(jī)的人臉檢測研究

    提出一種基于層疊支持向量機(jī)的人臉檢測算法,用于復(fù)雜背景灰度圖像的人臉檢測。算法首先用線性支持向量機(jī)進(jìn)行粗篩選,濾去大量非
    發(fā)表于 06-04 10:22 ?9次下載

    基于膚色的實(shí)時人臉檢測算法研究

    研究了一種基于膚色的人臉檢測算法的設(shè)計與實(shí)現(xiàn)過程。在YIQ顏色空間中,進(jìn)行了有效的膚色提取,把提取到的膚色與背景圖像信息轉(zhuǎn)為二值圖像進(jìn)行形態(tài)學(xué)降噪處理,再采用質(zhì)心定位
    發(fā)表于 05-05 16:54 ?25次下載
    基于膚色的實(shí)時<b class='flag-5'>人臉</b><b class='flag-5'>檢測算法</b>研究

    基于openCV的人臉檢測識別系統(tǒng)的設(shè)計

    通過對基于Adaboost人臉檢測算法的研究,利用該算法與計算機(jī)視覺類庫openCV進(jìn)行人臉檢測系統(tǒng)的設(shè)計,實(shí)現(xiàn)了對出現(xiàn)在視頻或圖像中
    發(fā)表于 06-15 10:53 ?477次下載
    基于openCV<b class='flag-5'>的人臉</b><b class='flag-5'>檢測</b>識別系統(tǒng)的設(shè)計

    基于幾何特征與新Haar特征的人臉檢測算法_糜元根

    基于幾何特征與新Haar特征的人臉檢測算法_糜元根
    發(fā)表于 03-19 19:25 ?2次下載

    一種復(fù)雜環(huán)境下魯棒的精確人臉檢測算法(結(jié)合VIOLA-JONES和CLM模型)

    的人臉檢測算法成為人臉識別技術(shù)中一個重點(diǎn)關(guān)注的問題和研究熱點(diǎn)。伴隨著自動人臉識別技術(shù)的發(fā)展,人臉檢測
    發(fā)表于 10-30 14:09 ?4次下載
    一種復(fù)雜環(huán)境下魯棒的精確<b class='flag-5'>人臉</b><b class='flag-5'>檢測算法</b>(結(jié)合VIOLA-JONES和CLM模型)

    支持向量機(jī)的人臉快速檢測

    對自然狀態(tài)下(多姿態(tài)、遮擋和光照等苛刻條件)人臉進(jìn)行檢測依然是具有挑戰(zhàn)性問題。 為提高傳統(tǒng)支持向量機(jī)無約束人臉檢測算法檢測精度,基于可變形
    發(fā)表于 01-23 13:54 ?1次下載

    人臉圖像質(zhì)量檢測算法的原理及在小區(qū)人臉識別閘機(jī)中的應(yīng)用

    人臉識別一樣,圖像質(zhì)量檢測算法(FQ)也是基于特征提取原理,通過神經(jīng)網(wǎng)絡(luò)從海量數(shù)據(jù)中學(xué)習(xí)獲取人臉質(zhì)量檢測關(guān)注的特征(主要包括光線、模糊、角度、遮擋、表情、噪聲等)并進(jìn)行質(zhì)量判斷。每個
    發(fā)表于 10-09 10:45 ?1256次閱讀

    基于tensorflow的BlazeFace-lite人臉檢測

    之前的知乎專欄中給大家介紹過BlazeFace人臉檢測BlazeFace: 毫秒
    發(fā)表于 02-07 11:39 ?0次下載
    基于tensorflow的<b class='flag-5'>BlazeFace</b>-lite<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>器

    BlazeFace: 毫秒的人臉檢測器(含代碼)

    人臉檢測是一個很常用的算法,可應(yīng)用在許多業(yè)務(wù)中,可為應(yīng)用提供人臉所在圖片區(qū)域的坐標(biāo)信息,一般用(xmin, ymin, xmax, ymax)的坐標(biāo)格...
    發(fā)表于 02-07 12:27 ?0次下載
    <b class='flag-5'>BlazeFace</b>: <b class='flag-5'>亞</b><b class='flag-5'>毫秒</b><b class='flag-5'>級</b><b class='flag-5'>的人臉</b><b class='flag-5'>檢測</b>器(含代碼)