国产欧美成人一区二区三区,亚洲欧美日韩中文综合在线不卡 ,囯产精品一区二区在线播放

人臉識別技術(shù)不但吸引了Google、Facebook、阿里、騰訊、百度等國內(nèi)外互聯(lián)網(wǎng)巨頭的大量研發(fā)投入，也催生了Face++、商湯科技、Linkface、中科云從、依圖等一大波明星創(chuàng)業(yè)公司，在視頻監(jiān)控、刑事偵破、互聯(lián)網(wǎng)金融身份核驗(yàn)、自助通關(guān)系統(tǒng)等方向創(chuàng)造了諸多成功應(yīng)用案例。本文試圖梳理人臉識別技術(shù)發(fā)展，并根據(jù)作者在相關(guān)領(lǐng)域的實(shí)踐給出一些實(shí)用方案設(shè)計(jì)，期待能對感興趣的讀者有所裨益。

概述

通俗地講，任何一個(gè)的機(jī)器學(xué)習(xí)問題都可以等價(jià)于一個(gè)尋找合適變換函數(shù)的問題。例如語音識別，就是在求取合適的變換函數(shù)，將輸入的一維時(shí)序語音信號變換到語義空間；而近來引發(fā)全民關(guān)注的圍棋人工智能AlphaGo則是將輸入的二維布局圖像變換到?jīng)Q策空間以決定下一步的最優(yōu)走法；相應(yīng)的，人臉識別也是在求取合適的變換函數(shù)，將輸入的二維人臉圖像變換到特征空間，從而唯一確定對應(yīng)人的身份。

一直以來，人們都認(rèn)為圍棋的難度要遠(yuǎn)大于人臉識別，因此，當(dāng)AlphaGo以絕對優(yōu)勢輕易打敗世界冠軍李世乭九段和柯潔九段時(shí)，人們更驚嘆于人工智能的強(qiáng)大。實(shí)際上，這一結(jié)論只是人們的基于“常識”的誤解，因?yàn)閺拇蠖鄶?shù)人的切身體驗(yàn)來講，即使經(jīng)過嚴(yán)格訓(xùn)練，打敗圍棋世界冠軍的幾率也是微乎其微；相反，絕大多數(shù)普通人，即便未經(jīng)過嚴(yán)格訓(xùn)練，也能輕松完成人臉識別的任務(wù)。然而，我們不妨仔細(xì)分析一下這兩者之間的難易程度：在計(jì)算機(jī)的“眼里”，圍棋的棋盤不過是個(gè)19x19的矩陣，矩陣的每一個(gè)元素可能的取值都來自于一個(gè)三元組{0,1,2}，分別代表無子，白子及黑子，因此輸入向量可能的取值數(shù)為3361；而對于人臉識別來講，以一幅512x512的輸入圖像為例，它在計(jì)算機(jī)的“眼中”是一個(gè)512x512x3維的矩陣，矩陣的每一個(gè)元素可能的取值范圍為0~255，因此輸入向量可能的取值數(shù)為256786432。雖然，圍棋AI和人臉識別都是尋求合適的變換函數(shù)f，但后者輸入空間的復(fù)雜度顯然遠(yuǎn)遠(yuǎn)大于前者。

對于一個(gè)理想的變換函數(shù)f而言，為了達(dá)到最優(yōu)的分類效果，在變換后的特征空間上，我們希望同類樣本的類內(nèi)差盡可能小，同時(shí)不同類樣本的類間差盡可能大。但是，理想是豐滿的，現(xiàn)實(shí)卻是骨感的。由于光照、表情、遮擋、姿態(tài)等諸多因素（如圖1）的影響，往往導(dǎo)致不同人之間的差距比相同人之間差距更小，如圖2。人臉識別算法發(fā)展的歷史就是與這些識別影響因子斗爭的歷史。

圖1 人臉識別的影響因素

圖2 姿態(tài)導(dǎo)致不同人相似度比同人更高

人臉識別技術(shù)發(fā)展

早在20世紀(jì)50年代，認(rèn)知科學(xué)家就已著手對人臉識別展開研究。20世紀(jì)60年代，人臉識別工程化應(yīng)用研究正式開啟。當(dāng)時(shí)的方法主要利用了人臉的幾何結(jié)構(gòu)，通過分析人臉器官特征點(diǎn)及其之間的拓?fù)潢P(guān)系進(jìn)行辨識。這種方法簡單直觀，但是一旦人臉姿態(tài)、表情發(fā)生變化，則精度嚴(yán)重下降。

1991年，著名的“特征臉”方法[1]第一次將主成分分析和統(tǒng)計(jì)特征技術(shù)引入人臉識別，在實(shí)用效果上取得了長足的進(jìn)步。這一思路也在后續(xù)研究中得到進(jìn)一步發(fā)揚(yáng)光大，例如，Belhumer成功將Fisher判別準(zhǔn)則應(yīng)用于人臉分類，提出了基于線性判別分析的Fisherf ace方法[2]。

21世紀(jì)的前十年，隨著機(jī)器學(xué)習(xí)理論的發(fā)展，學(xué)者們相繼探索出了基于遺傳算法、支持向量機(jī)（Support Vector Machine， SVM）、boosting、流形學(xué)習(xí)以及核方法等進(jìn)行人臉識別。 2009年至2012年，稀疏表達(dá)（Sparse Representation）[3]因?yàn)槠鋬?yōu)美的理論和對遮擋因素的魯棒性成為當(dāng)時(shí)的研究熱點(diǎn)。

與此同時(shí)，業(yè)界也基本達(dá)成共識：基于人工精心設(shè)計(jì)的局部描述子進(jìn)行特征提取和子空間方法進(jìn)行特征選擇能夠取得最好的識別效果。Gabor[4]及LBP[5]特征描述子是迄今為止在人臉識別領(lǐng)域最為成功的兩種人工設(shè)計(jì)局部描述子。這期間，對各種人臉識別影響因子的針對性處理也是那一階段的研究熱點(diǎn)，比如人臉光照歸一化、人臉姿態(tài)校正、人臉超分辨以及遮擋處理等。也是在這一階段，研究者的關(guān)注點(diǎn)開始從受限場景下的人臉識別轉(zhuǎn)移到非受限環(huán)境下的人臉識別。LFW人臉識別公開競賽在此背景下開始流行，當(dāng)時(shí)最好的識別系統(tǒng)盡管在受限的FRGC測試集上能取得99%以上的識別精度，但是在LFW上的最高精度僅僅在80%左右，距離實(shí)用看起來距離頗遠(yuǎn)。

2013年，MSRA的研究者首度嘗試了10萬規(guī)模的大訓(xùn)練數(shù)據(jù)，并基于高維LBP特征和Joint Bayesian方法[6]在LFW上獲得了95.17%的精度。這一結(jié)果表明：大訓(xùn)練數(shù)據(jù)集對于有效提升非受限環(huán)境下的人臉識別很重要。然而，以上所有這些經(jīng)典方法，都難以處理大規(guī)模數(shù)據(jù)集的訓(xùn)練場景。

2014年前后，隨著大數(shù)據(jù)和深度學(xué)習(xí)的發(fā)展，神經(jīng)網(wǎng)絡(luò)重受矚目，并在圖像分類、手寫體識別、語音識別等應(yīng)用中獲得了遠(yuǎn)超經(jīng)典方法的結(jié)果。香港中文大學(xué)的Sun Yi等人提出將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到人臉識別上[7]，采用20萬訓(xùn)練數(shù)據(jù)，在LFW上第一次得到超過人類水平的識別精度，這是人臉識別發(fā)展歷史上的一座里程碑。自此之后，研究者們不斷改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)，同時(shí)擴(kuò)大訓(xùn)練樣本規(guī)模，將LFW上的識別精度推到99.5%以上。如表1所示，我們給出了人臉識別發(fā)展過程中一些經(jīng)典的方法及其在LFW上的精度，一個(gè)基本的趨勢是：訓(xùn)練數(shù)據(jù)規(guī)模越來越大，識別精度越來越高。如果讀者閱讀有興趣了解人臉識別更細(xì)節(jié)的發(fā)展歷史，可以參考文獻(xiàn)[8][9]。

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考

表1 人臉識別經(jīng)典方法及其在LFW上精度對比

技術(shù)方案

要在實(shí)用中實(shí)現(xiàn)高精度的人臉識別，就必須針對人臉識別的挑戰(zhàn)因素如光照、姿態(tài)、遮擋等進(jìn)行針對性的設(shè)計(jì)。例如，針對光照和姿態(tài)因素，要么在收集訓(xùn)練樣本時(shí)力求做到每個(gè)個(gè)體覆蓋足夠多的光照和姿態(tài)變化，要么設(shè)計(jì)出行之有效的預(yù)處理方法以補(bǔ)償光照和姿態(tài)帶來的人臉身份信息變化。圖3給出了作者在相關(guān)領(lǐng)域的一些研究成果[10][11]。

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考

表2 較為正常的人臉識別訓(xùn)練集

表2給出了本文用到的訓(xùn)練數(shù)據(jù)集，其中前3個(gè)是當(dāng)前最主流的公開訓(xùn)練數(shù)據(jù)集，最后一個(gè)為私有業(yè)務(wù)數(shù)據(jù)集。表3出給了性能驗(yàn)證的兩個(gè)數(shù)據(jù)集及測試協(xié)議，其中LFW是目前最主流的非受限人臉識別公開競賽。我們注意到，大多數(shù)訓(xùn)練集都有較大噪聲，如果不進(jìn)行相應(yīng)清洗操作，則訓(xùn)練會較難收斂。本文給出了一種快速可靠的數(shù)據(jù)清洗方法，如表4所示。

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考

表3 本文用到的測試集

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考

表4 一種快速可靠的訓(xùn)練數(shù)據(jù)清洗方法

圖4給出了一套行之有效的人臉識別技術(shù)方案，主要包括多patch劃分、CNN特征抽取、多任務(wù)學(xué)習(xí)/多l(xiāng)oss融合，以及特征融合模塊。

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考

圖4 人臉識別技術(shù)方案

多patch劃分主要是利用人臉不同patch之間的互補(bǔ)信息增強(qiáng)識別性能。尤其是多個(gè)patch之間的融合能有效提升遮擋情況下的識別性能。當(dāng)前，在LFW評測中超過99.50%的結(jié)果大多數(shù)是由多個(gè)patch融合得到。

經(jīng)過驗(yàn)證較優(yōu)秀的人臉特征抽取卷積神經(jīng)網(wǎng)絡(luò)包括：Deep-ID系列、VGG-Net、ResNet、Google Inception結(jié)構(gòu)。讀者可以根據(jù)自己對精度及效率的需求選擇合適的網(wǎng)絡(luò)。本文以19層resnet舉例。

多任務(wù)學(xué)習(xí)主要是利用其他相關(guān)信息提升人臉識別性能。本文以性別和種族識別為例，這兩種屬性都是和具體人的身份強(qiáng)相關(guān)的，而其他的屬性如表情、年齡都沒有這個(gè)特點(diǎn)。我們在resnet的中間層引出分支進(jìn)行種族和性別的多任務(wù)學(xué)習(xí)，這樣CNN網(wǎng)絡(luò)的前幾層相當(dāng)于具有了種族、性別鑒別力的高層語義信息，在CNN網(wǎng)絡(luò)的后幾層我們進(jìn)一步學(xué)習(xí)了身份的細(xì)化鑒別信息。同時(shí)，訓(xùn)練集中樣本的性別和種族屬性可以通過一個(gè)baseline分類器進(jìn)行多數(shù)投票得到。

多l(xiāng)oss融合主要是利用不同loss之間的互補(bǔ)特性學(xué)習(xí)出適當(dāng)?shù)娜四樚卣飨蛄?，使得類?nèi)差盡可能小，類間差盡可能大。當(dāng)前人臉識別領(lǐng)域較為常用的集中l(wèi)oss包括：pair-wise loss、triplet loss、softmax loss、center loss等。其中triplet loss直接定義了增大類內(nèi)類間差gap的優(yōu)化目標(biāo)，但是在具體工程實(shí)踐中，其trick較多，不容易把握。而最近提出的center loss，結(jié)合softmax loss，能較好地度量特征空間中的類內(nèi)、類間差，訓(xùn)練配置也較為方便，因此使用較為廣泛。

通過多個(gè)patch訓(xùn)練得到的模型將產(chǎn)生多個(gè)特征向量，如何融合多特征向量進(jìn)行最終的身份識別也是一個(gè)重要的技術(shù)問題。較為常用的方案包括：特征向量拼接、分?jǐn)?shù)級加權(quán)融合以及決策級融合（如投票）等。

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考

表5 數(shù)據(jù)清洗前后識別模型性能對比

表5給出了訓(xùn)練數(shù)據(jù)清洗前后在測試集上的性能對比結(jié)果。據(jù)此可以得到以下結(jié)論：

數(shù)據(jù)的清洗不但能加快模型訓(xùn)練，也能有效提升識別精度；

在西方人為主的訓(xùn)練集MSCeleb1M上訓(xùn)練得到的模型，在同樣以西方人為主的測試集LFW上達(dá)到了完美的泛化性能；但是在以東方人為主的業(yè)務(wù)測試集的泛化性能則有較大的下滑；

在以東方人為主的業(yè)務(wù)訓(xùn)練集訓(xùn)練得到的模型，在東方人為主的業(yè)務(wù)測試集上性能非常好，但是在西方人為主的測試集LFW上相對MSCeleb1M有一定差距；

將業(yè)務(wù)訓(xùn)練集和MSCeleb1M進(jìn)行合并，訓(xùn)練得到的模型在LFW和業(yè)務(wù)數(shù)據(jù)上都有近乎完美的性能。其中，基于三個(gè)patch融合的模型在LFW上得到了99.58%的識別精度。

由此，我們可以知道，為了達(dá)到盡可能高的實(shí)用識別性能，我們應(yīng)該盡可能采用與使用環(huán)境相同的訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練。同樣的結(jié)論也出現(xiàn)在論文[12]中。

實(shí)際上，一個(gè)完整的人臉識別實(shí)用系統(tǒng)除了包括上述識別算法以外，還應(yīng)該包括人臉檢測，人臉關(guān)鍵點(diǎn)定位，人臉對齊等模塊，在某些安全級別要求較高的應(yīng)用中，為了防止照片、視頻回放、3D打印模型等對識別系統(tǒng)的假冒攻擊，還需要引入活體檢測模塊；為了在視頻輸入中取得最優(yōu)的識別效果，還需要引入圖像質(zhì)量評估模塊選擇最合適的視頻幀進(jìn)行識別，以盡可能排除不均勻光照、大姿態(tài)、低分辨和運(yùn)動(dòng)模糊等因素對識別的影響。另外，也有不少研究者和公司試圖通過主動(dòng)的方式規(guī)避這些因素的影響：引入紅外/3D攝像頭。典型的實(shí)用人臉識別方案如圖5所示。

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考

圖5 實(shí)用人臉識別方案流程圖

總結(jié)

本文簡單總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考。雖然人臉識別技術(shù)在LFW公開競賽中取得了99%以上的精度，但是在視頻監(jiān)控等實(shí)用場景下的1:N識別距離真正實(shí)用還有一段路要走，尤其是在N很大的情況下。未來，我們還需要在訓(xùn)練數(shù)據(jù)擴(kuò)充、新模型設(shè)計(jì)及度量學(xué)習(xí)等方面投入更多的精力，讓大規(guī)模人臉識別早日走入實(shí)用。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1790

文章
46670

瀏覽量
237111
人臉識別

人臉識別

+關(guān)注

關(guān)注
76

文章
4002

瀏覽量
81678

原文標(biāo)題：人臉識別技術(shù)發(fā)展及實(shí)用方案設(shè)計(jì)

文章出處：【微信號：AI_Thinker，微信公眾號：人工智能頭條】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

人臉識別技術(shù)最新發(fā)展與研究

人臉識別技術(shù)最新發(fā)展與研究 2013年全國圖形圖像技術(shù)應(yīng)用大會將在十一月初召開，本次大會大會將邀請國內(nèi)圖像圖形處理

發(fā)表于 09-25 16:08

機(jī)器視覺技術(shù)應(yīng)用之人臉識別

這兩種技術(shù)還遠(yuǎn)不成熟，識別效果不盡人意。最新發(fā)展起來的一種解決方案是基于主動(dòng)近紅外圖像的多光源人臉識別

發(fā)表于 01-14 11:05

【TL6748 DSP申請】基于DSP的人臉識別技術(shù)

申請理由：隨著社會的發(fā)展，人們對身份鑒別的準(zhǔn)確性、安全性和實(shí)時(shí)性提出了更高的要求，傳統(tǒng)的識別方法已經(jīng)不能滿足這種需求，而生物識別技術(shù)以其自身的有點(diǎn)和有事正在得到飛速的

發(fā)表于 09-10 11:17

你周圍有人臉識別嗎？

`繼支付寶、淘寶。Ofo共享單車的陸續(xù)出現(xiàn)，科技圈忍不住了，在這個(gè)經(jīng)濟(jì)發(fā)展迅速的社會，依據(jù)生物識別技術(shù)的發(fā)展，研究出了人臉

發(fā)表于 06-30 13:54

人臉識別技術(shù)在安防領(lǐng)域的發(fā)展狀況

`在這個(gè)移動(dòng)互聯(lián)網(wǎng)智能化時(shí)代，人臉識別檢測技術(shù)已經(jīng)成熟并使用在了常見的電子數(shù)碼設(shè)備中，現(xiàn)在檢測技術(shù)進(jìn)入了產(chǎn)業(yè)化的

發(fā)表于 07-28 13:57

人臉識別技術(shù)推進(jìn)智慧交通的發(fā)展

`人臉識別技術(shù)推進(jìn)智慧交通的發(fā)展 隨著科技的發(fā)展，現(xiàn)在坐地鐵都可以刷臉進(jìn)站了！據(jù)報(bào)道，武漢火車刷臉進(jìn)站只需要2秒鐘就能通過，目前，90%的旅

發(fā)表于 08-24 14:25

人臉識別技術(shù)的60年發(fā)展史

密碼鎖經(jīng)歷了從數(shù)字密碼、手勢解鎖到指紋識別的升級，發(fā)展到如今的虹膜識別和人臉識別。可以預(yù)料的是，由于全面屏幕的普及和更為安全、便捷的 Fac

發(fā)表于 06-20 13:29

企業(yè)安防中的人臉識別技術(shù)應(yīng)用解決方案，八達(dá)馬人臉技術(shù)剖析

實(shí)現(xiàn)快速身份識別，實(shí)現(xiàn)智能預(yù)警。動(dòng)態(tài)人臉技術(shù)優(yōu)選解決方案：采用狀辨識機(jī)理減少復(fù)雜背景的干擾可檢測左右旋轉(zhuǎn)小于等于30度，上下旋轉(zhuǎn)小于等于15度的人

發(fā)表于 08-01 15:53

人臉識別技術(shù)在安防領(lǐng)域有哪些應(yīng)用？

日志（并開啟電子鎖、閘機(jī)等），多用于各單位門禁考勤系統(tǒng)。動(dòng)態(tài)人臉監(jiān)控經(jīng)過幾十年的發(fā)展，人臉識別技術(shù)

發(fā)表于 06-28 11:42

人臉識別技術(shù)的優(yōu)缺點(diǎn)

通過三個(gè)步驟執(zhí)行：檢測面部，掃描并創(chuàng)建特征/目標(biāo)，最后進(jìn)行匹配和驗(yàn)證。就像視覺搜索引擎工具一樣，該技術(shù)能夠在非常復(fù)雜的視覺環(huán)境中識別關(guān)鍵因素，因此即使在擁擠的地方也可以用來識別個(gè)人。但

發(fā)表于 12-24 16:34

什么是人臉識別技術(shù)

什么是人臉識別技術(shù)人臉識別技術(shù)特點(diǎn)人臉

發(fā)表于 03-03 06:17

基于瑞芯微高性能核心板的人臉識別方案

本帖最后由我愛方案網(wǎng) 于 2023-1-5 14:16 編輯人臉識別，是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。用攝像

發(fā)表于 01-05 14:15

人臉識別幾種解決方案的對比_人臉識別技術(shù)原理介紹

本文主要介紹人臉識別特點(diǎn)、對人臉識別技術(shù)的原理進(jìn)行了詳細(xì)的分析，其次說明了人臉

發(fā)表于 01-02 16:38 ?8w次閱讀

人臉識別技術(shù),推動(dòng)面部識別行業(yè)發(fā)展新升級

人臉識別技術(shù)擁有一個(gè)不算漫長的歷史，該技術(shù)研究最早可追溯到 19 世紀(jì)法國人Galton的工作?，F(xiàn)代研究始于20世紀(jì)60年代末70年代初，

發(fā)表于 06-25 17:55 ?1367次閱讀

人臉識別技術(shù)的發(fā)展及應(yīng)用領(lǐng)域

在這人工智能技術(shù)時(shí)代，生物識別檢測技術(shù)已經(jīng)成熟并被用于普通的電子數(shù)字設(shè)備中。現(xiàn)在檢測技術(shù)已經(jīng)進(jìn)入了工業(yè)化的

發(fā)表于 10-14 15:42 ?6263次閱讀

搜索歷史

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考

評論

人臉識別技術(shù)最新發(fā)展與研究

機(jī)器視覺技術(shù)應(yīng)用之人臉識別

【TL6748 DSP申請】基于DSP的人臉識別技術(shù)

你周圍有人臉識別嗎？

人臉識別技術(shù)在安防領(lǐng)域的發(fā)展狀況

人臉識別技術(shù)推進(jìn)智慧交通的發(fā)展

人臉識別技術(shù)的60年發(fā)展史

企業(yè)安防中的人臉識別技術(shù)應(yīng)用解決方案，八達(dá)馬人臉技術(shù)剖析

人臉識別技術(shù)在安防領(lǐng)域有哪些應(yīng)用？

人臉識別技術(shù)的優(yōu)缺點(diǎn)

什么是人臉識別技術(shù)

基于瑞芯微高性能核心板的人臉識別方案

人臉識別幾種解決方案的對比_人臉識別技術(shù)原理介紹

人臉識別技術(shù),推動(dòng)面部識別行業(yè)發(fā)展新升級

人臉識別技術(shù)的發(fā)展及應(yīng)用領(lǐng)域

搜索歷史

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考

評論

總結(jié)了人臉識別技術(shù)的發(fā)展歷史，并給出了實(shí)用方案設(shè)計(jì)的參考