0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用Go語言實現(xiàn)人臉識別,怎么做到的

8g3K_AI_Thinker ? 來源:未知 ? 作者:工程師曾玲 ? 2018-08-26 09:56 ? 次閱讀

做人臉識別用 Python 比較多,但是今天碰上一個另類,他就跟別人不一樣,就不用 Python 用 Go。其實不管是 P 還是 G,能認出臉來就是好樣的。

光說不練假把式,我們來看看這哥們到底是怎么做到的。

這篇文章將教會你如何運用 Go 語言實現(xiàn)人臉識別

▌前言

如今,神經(jīng)網(wǎng)絡(luò)已經(jīng)非常流行,人們將它用于各種任務(wù),特別是人臉識別應(yīng)用。

最近,我用一個以 Go 語言為后端的軟件,實現(xiàn)了一個人臉識別項目。它能夠識別出上傳照片中的人像 (如流行歌手)是誰。這聽起來不錯,我決定試一下也給你們介紹一下項目的整個過程。

需要說明的是,我盡可能地將所需的系統(tǒng)配置控制在較低水平,以便更多用戶可以通過使用便宜的服務(wù)器來進行安裝,而這也是為什么實現(xiàn)過程不使用 CUDA 或 GPU 的原因——雖然你現(xiàn)在可以很容易地租用這樣的服務(wù)器,但它需要很高的成本,從而也會將很多潛在的使用者拒之門外。如果它只需要 CPU 而不需要外部依賴就能工作,情況會好很多。

▌選擇合適的語言

如果你詢問數(shù)據(jù)科學(xué)家或者那些有神經(jīng)網(wǎng)絡(luò)實踐經(jīng)驗的工作者,幾乎所有人都會建議你使用 Python 語言來解決機器學(xué)習(xí)任務(wù)??紤]到語言社區(qū),可用庫的數(shù)量,語言的簡單性等,Python 語言確實是一個明智的選擇。此外,在 Python 中,你還可以通過一些精彩的實例說明和文檔來找到一些受歡迎的人臉識別庫。

然而,這一次,我決定選用 Go 語言,主要有幾以下幾個原因:

我的論壇是用 Go 語言編寫的,我個人也真的很喜歡以 single-binary 為后端所帶來的便捷性。因此,在后端部署并整合人臉識別過程,而不需要 Python 實現(xiàn)的一些依賴和 IPC,這是很棒的。

Go 語言通常比 Python 更快,消耗的內(nèi)存更少。任何高性能 Python 庫的關(guān)鍵部分都是用 C / C++ 語言編寫的,因此,無論如何你都會有 Python VM 的開銷。我偏愛于更快的語言,除非這種語言會嚴重影響開發(fā)時間。我不會用 C或C++ 作為 Web 應(yīng)用程序編寫的主要語言,但 Go語言很好,它幾乎和 Python 一樣簡單。

我沒有在 Go 語言中找到人臉識別的有關(guān)庫,因此用 Go 語言實現(xiàn)這樣一個應(yīng)用,對于整個社區(qū)而言,都是一件有趣又有幫助的事。

▌選擇合適的框架

如前所述,神經(jīng)網(wǎng)絡(luò)以及相應(yīng)的實現(xiàn)框架如今正被廣泛地使用。僅在計算機視覺領(lǐng)域,可用的框架就有 Caffe,Torch,TensorFlow 等。

但是,有一個非??岬臋C器學(xué)習(xí)庫 —— dlib 庫,一下就吸引了我的注意力。首先,它是用 C ++ 語言編寫的,因此你可以使用 cgo 輕松地創(chuàng)建 Go 語言綁定。其次,在 Wild benchmarks 基準(zhǔn)的人臉識別任務(wù)上,據(jù)說它能實現(xiàn) 99.38% 的準(zhǔn)確性,這聽起來是很不可思議的。再者,現(xiàn)在一些流行的人臉識別庫 face_recognition 和 openface 在底層都使用 dlib 庫,因此它在該任務(wù)上會是一個非常好的選擇。

▌安裝依賴項

一旦框架確定下來,那么我們要如何在機器上開發(fā)并部署這個項目呢?首先,C++ 依賴項的安裝將會有很大的困難,因為你無法通過簡便的“go get”或“pip install”命令來實現(xiàn)。要么只能希望你的操作系統(tǒng)存儲庫中提供這些依賴庫,要么你只能通過繁瑣的編譯過程來安裝,這樣的話,這個問題就更加令人討厭,因為有許多人都在 dlib 編譯過程碰到問題。

如果你不得不通過編譯過程來安裝,那么可以參考一下下面的教程,也許會有幫助

https://gist.github.com/ageitgey/629d75c1baac34dfa5ca2a1928a7aeaf

幸運的是,我們有更好的選擇:如果用戶的目標(biāo)系統(tǒng)已知,我們可以構(gòu)建 dlib 庫的二進制安裝包來大大簡化整個過程。說到服務(wù)器軟件,Ubuntu 幾乎是系統(tǒng)標(biāo)配,因此首先要保證你能支持這個系統(tǒng)。

Ubuntu的標(biāo)準(zhǔn)倉庫中自帶有 dlib庫,但其版本太舊了:人臉識別僅支持 dlib19.3 版本,所以我們需要構(gòu)建自己的包。我為 Ubuntu 16.04 和 18.04 創(chuàng)建了 PPA (自定義存儲庫),安裝過程非常簡單,如下:

sudoadd-apt-repositoryppa:kagamih/dlibsudoapt-getupdatesudoapt-getinstalllibdlib-dev

以上命令將安裝最新的 dlib19.15 版本及 Intel 的數(shù)學(xué)核心庫,對于 Intel 處理器而言,這似乎是標(biāo)準(zhǔn) BLAS 和 LAPACK 接口的最快實現(xiàn)。

對于 Debian sid 和 Ubuntu 18.10 (尚未發(fā)布) 而言,標(biāo)準(zhǔn)倉庫中同樣提供了 dlib 的安裝過程,你只需要如下命令:

sudoapt-getinstalllibdlib-devlibopenblas-dev

這將使用 OpenBLAS 來代替 MKL,實現(xiàn)的速度同樣非??臁;蛘?,你也可以通過 enable non-free package 并安裝 libmkl-dev 來實現(xiàn)。

我們還需要 libjpeg 來加載 JPEG 圖像:在 Ubuntu 上安裝 libjpeg-turbo8-dev 包,或在 Debian 上安裝 libjpeg62-turbo-dev。

到目前為止,我沒有給出其他系統(tǒng)的安裝說明,如果你在安裝 dlib 過程中碰到問題,可以訪問我的 github 希望能為你提供合理有效的安裝建議。

GitHub 地址:

https://github.com/Kagami/go-face

此外,我還考慮為 dlib 庫提供 Docker 鏡像 (其中有少部分內(nèi)容已存在),許多具有復(fù)雜依賴關(guān)系的項目都傾向于使用這種分布式方法。但在我看來,一個本機包能夠為用戶提供更好的體驗,你不需要在控制臺編寫長命令,也不需要處理 sandbox 環(huán)境中的內(nèi)容。

▌寫入依賴庫

當(dāng)前人臉識別庫地工作原理通常是:通過為照片上的每張人臉返回一組數(shù)字 (矢量嵌入或描述符) 來比較區(qū)分它們,并通過比較這些數(shù)字來找到圖像中人的名字 (通常是通過計算歐幾里德距離向量,得到屬于同一個人的兩張人臉的最小距離)。這個概念這次就不在這里贅述了。

創(chuàng)建圖像中人臉的原始代碼并不是個重要的問題,這個過程幾乎是遵循官方的例子就可以了。你可以查看 facerec.cc 及其相應(yīng)的頭文件 facerec.h,其中定義了 5 個函數(shù)和幾個在 Go 語言和 dlib 庫之間的交互結(jié)構(gòu)。

在這里,雖然 dlib 庫支持所有流行的圖像格式,但它只能從文件中加載它們。這將導(dǎo)致混亂,因為我們通常只會將圖像保存在內(nèi)存中并將其寫入臨時文件。因此,在這里我使用 libjpeg 來編寫自己的圖像加載器。由于大多數(shù)照片都以該格式存儲的,因此這種格式的加載器足以勝任大部分的需要,以后有需要我還會添加其他格式的圖像加載器。

我把 C++ 和 Go 語言的連接層放在 face.go 中。它提供了 Face 結(jié)構(gòu),用于保存圖像中人臉的坐標(biāo)及其描述符,并通過 Recognizer 為所有操作提供接口,如初始化和實際識別。

一旦我們有了描述符,我們能做什么呢?在最簡單的情況下,你可以通過比較未知描述符與所有已知描述符之間的歐幾里德距離。但這并不完美,即使是當(dāng)前最先進的人臉識別技術(shù)也會得到錯誤的答案。如果想稍微改善一下結(jié)果,我們需要使用每個人的許多圖像,并檢查這些圖像中是否有非常接近于所提供的人臉。

這也正是分類器 classify.cc 所做的工作。首先,計算距離,然后對這些距離進行排序,計算同一個人在前 10 個最小距離中的點擊數(shù)。)

諸如支持向量機,將會在這個任務(wù)上提供更好的算法性能。 dlib 甚至為訓(xùn)練此類模型提供了便捷的 API。很少有文章會提到 SVM 在大型數(shù)據(jù)集上的性能,因此我打算先在大型集合上測試它。

▌使用

下面得到的結(jié)果你可以在 github 中查看:

import"github.com/Kagami/go-face"

GitHub 地址:

https://github.com/Kagami/go-face

相關(guān)的所有結(jié)構(gòu)和方法概述,請參閱 GoDoc 文檔,主要包括以下幾個內(nèi)容:

初始化識別器

識別所有的已知圖像并收集描述符

將具有相應(yīng)類別的已知描述符傳遞給識別器

獲取未知圖像的描述符

對其類別進行分類

以下是一個工作示例,來說明了上述的所有步驟:

packagemainimport("fmt""log""path/filepath""github.com/Kagami/go-face")//Pathtodirectorywithmodelsandtestimages.Hereit's//assumeditpointstothe//clone.constdataDir="testdata"http://Thisexampleshowsthebasicusageofthepackage:createan//recognizer,recognizefaces,classifythemusingfewknown//ones.funcmain(){//Inittherecognizer.rec,err:=face.NewRecognizer(dataDir)iferr!=nil{log.Fatalf("Can'tinitfacerecognizer:%v",err)}//Freetheresourceswhenyou'refinished.deferrec.Close()//Testimagewith10faces.testImagePristin:=filepath.Join(dataDir,"pristin.jpg")//Recognizefacesonthatimage.faces,err:=rec.RecognizeFile(testImagePristin)iferr!=nil{log.Fatalf("Can'trecognize:%v",err)}iflen(faces)!=10{log.Fatalf("Wrongnumberoffaces")}//Fillknownsamples.Intherealworldyouwouldusealotof//imagesforeachpersontogetbetterclassificationresults//butinourexamplewejustgetthemfromonebigimage.varsamples[]face.Descriptorvarcats[]int32fori,f:=rangefaces{samples=append(samples,f.Descriptor)//Eachfaceisuniqueonthatimagesogoestoitsown//category.cats=append(cats,int32(i))}//Namethecategories,i.e.peopleontheimage.labels:=[]string{"Sungyeon","Yehana","Roa","Eunwoo","Xiyeon","Kyulkyung","Nayoung","Rena","Kyla","Yuha",}//Passsamplestotherecognizer.rec.SetSamples(samples,cats)//Nowlet'strytoclassifysomenotyetknownimage.testImageNayoung:=filepath.Join(dataDir,"nayoung.jpg")nayoungFace,err:=rec.RecognizeSingleFile(testImageNayoung)iferr!=nil{log.Fatalf("Can'trecognize:%v",err)}ifnayoungFace==nil{log.Fatalf("Notasinglefaceontheimage")}catID:=rec.Classify(nayoungFace.Descriptor)ifcatID

運行下面命令:

mkdir-p~/go&&cd~/go#Orcdtoyour$GOPATHmkdir-psrc/go-face-example&&cdsrc/go-face-examplegitclonehttps://github.com/Kagami/go-face-testdatatestdataeditmain.go#Pasteexamplecodegoget.../../bin/go-face-example

由于在 dlib 的代碼中大量使用了 C++ 模板,因此需要一些時間來編譯 go-face (在我的 i7 上大約需要運行 1 分鐘)。 幸運的是,Go 語言能夠構(gòu)建輸出緩存,這樣可以在今后構(gòu)建的時候速度更快。

上面的示例輸出應(yīng)打印“Nayoung”,表示能夠正確識別出未知圖像。

▌模型

go-face 需要 shape_predictor_5_face_landmarks.dat 和

dlib_face_recognition_resnet_model_v1.dat 模型才能開始工作。你可以從 dlib-models 倉庫中下載它們:

mkdirmodels&&cdmodelswgethttps://github.com/davisking/dlib-models/raw/master/shape_predictor_5_face_landmarks.dat.bz2bunzip2shape_predictor_5_face_landmarks.dat.bz2wgethttps://github.com/davisking/dlib-models/raw/master/dlib_face_recognition_resnet_model_v1.dat.bz2bunzip2dlib_face_recognition_resnet_model_v1.dat.bz2

此外,當(dāng)你要運行示例代碼時,還可以通過 go-face-testdata 倉庫來訪問這些模型。

▌未來的工作

我對結(jié)果非常滿意,通過簡單的 API,得到不錯的識別結(jié)果,還可以輕松嵌入到 Go 的應(yīng)用程序中。當(dāng)然,還有需要改進的地方:

為了追求簡單性和速度,在創(chuàng)建描述符時,go-face 無法對圖像進行一些預(yù)處理,如抖動。但是,增加圖像預(yù)處理操作是很有必要的,因為它可能會提高識別的性能。

Dlib 庫支持很多圖像格式 (如 JPEG,PNG,GIF,BMP,DNG),但是 go-face 目前只能實現(xiàn) JPEG 格式,未來的工作我們希望可以支持更多的格式。

正如 dlib 的作者 Davis 所建議的,相比于搜索最小距離,采用多類 SVM 可能會得到更好的分類結(jié)果,因此還需要進行額外的測試驗證。

在 go-face 中,除非真的需要,不然我盡量不復(fù)制值,但實際上它還測試過大樣本 (10,000+人臉數(shù)據(jù)集) 的測試性能,可能存在一些瓶頸,有待日后完善。

從人臉提取特征向量是一個強大的概念,因為你不需要收集自己的訓(xùn)練數(shù)據(jù),這也是一項非常艱巨的任務(wù) (Davis 曾提到創(chuàng)建 dlib 中 ResNet 模型所用到的 300 萬張人臉數(shù)據(jù)集),但為了獲得更高的識別性能這可能也是無法避免的,因此值得為自己模型的訓(xùn)練提供相應(yīng)的工具。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人臉識別
    +關(guān)注

    關(guān)注

    76

    文章

    4002

    瀏覽量

    81678
  • python
    +關(guān)注

    關(guān)注

    55

    文章

    4768

    瀏覽量

    84376

原文標(biāo)題:你們都用 Python 做人臉識別,我就偏要用 Go!

文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    如何運用Go語言實現(xiàn)人臉識別

    但是,有一個非??岬臋C器學(xué)習(xí)庫 —— dlib 庫,一下就吸引了我的注意力。首先,它是 C ++ 語言編寫的,因此你可以使用 cgo 輕松地創(chuàng)建 Go 語言綁定。其次,在 Wild
    的頭像 發(fā)表于 08-23 09:41 ?1.3w次閱讀

    C語言實現(xiàn):見縫插針游戲!代碼思路+源碼分享

    見縫插圓我們昨天已經(jīng)C語言實現(xiàn)了,今天將實現(xiàn)一個見縫插針的游戲。
    發(fā)表于 12-05 11:02 ?693次閱讀

    verilog語言實現(xiàn)電子鐘

    各位大神求救啊verilog語言實現(xiàn)電子鐘
    發(fā)表于 05-04 16:37

    基于FPGA的圖像邊緣檢測系統(tǒng)設(shè)計,VHDL語言實現(xiàn)怎么做?

    不知道有沒有大神做過:基于FPGA的圖像邊緣檢測系統(tǒng)設(shè)計,VHDL語言實現(xiàn)
    發(fā)表于 05-10 00:22

    如何用C語言實現(xiàn)OOP編程?

    老大看到OOP編程很好,就讓我學(xué),怎么C語言實現(xiàn)OOP編程的,請大俠指點
    發(fā)表于 10-30 03:45

    【AI技能解析】人臉識別怎么做到的?

    識別支付場景】人臉識別這么火,那么它到底是怎么實現(xiàn)的呢?看大牛為您解鎖人臉識別技術(shù)中的黑科技!中
    發(fā)表于 03-16 11:25

    JAVA語言實現(xiàn)RSA公鑰密碼算法

    JAVA語言實現(xiàn)RSA公鑰密碼算法:本文闡述了公開密鑰密碼體制RSA算法的原理及實現(xiàn)技術(shù)。并在此基礎(chǔ)上,給出了JAVA語言實現(xiàn)的RSA算法源代碼。關(guān)鍵詞:ILSA體制;公鑰;密鑰
    發(fā)表于 02-10 10:27 ?58次下載

    VHDL語言實現(xiàn)3分頻電路

    VHDL語言實現(xiàn)3分頻電路 標(biāo)簽/分類: 眾所周知,分頻器是FPGA設(shè)計中使用頻率非常高的基本設(shè)計之一,盡管在目前大部分設(shè)計中,廣泛使用芯片廠家集成的鎖相
    發(fā)表于 08-21 15:28 ?5678次閱讀

    C語言實現(xiàn)DES算法

    C語言實現(xiàn)DES算法 本DES算法,使用了效率很高的C完成。目前,國內(nèi)知名企業(yè)的POS終端中,單DES算法,均是采用這個函數(shù)完成。函數(shù)經(jīng)本站驗證過,可以
    發(fā)表于 01-16 10:09 ?3258次閱讀

    C語言實現(xiàn)FFT算法

    C語言實現(xiàn)FFT算法 /*****************fft programe*********************/#include "typedef.h" #include "math.h" struct compx EE(struct compx
    發(fā)表于 10-30 13:39 ?6322次閱讀

    C語言實現(xiàn)數(shù)字濾波

    C語言實現(xiàn)數(shù)字濾波 。對數(shù)值進行精度調(diào)整,下面給出幾種常用的數(shù)字濾波方法的C語言函數(shù),這些函數(shù)有一定的通用性,Turbo C 2.0編制而成,在研華IPC-610/386機上均編譯
    發(fā)表于 07-26 15:44 ?10次下載

    go語言枚舉類型怎么

    go 語言枚舉類型是這么的?在什么場景下會用到枚舉?本文對 go 語言枚舉做了詳細講解。 枚舉,是一種重要的數(shù)據(jù)類型,由一組鍵值對組成,通
    的頭像 發(fā)表于 09-02 09:43 ?5133次閱讀

    go語言實現(xiàn)的簡單im即時通信系統(tǒng)

    ? 本文介紹了一個 go 語言實現(xiàn)的簡單 im 即時通信系統(tǒng)。 簡介 純go實現(xiàn)的im即時通訊系統(tǒng),各層可單獨部署,之間通過rpc通訊,支持集群,github地址 https
    的頭像 發(fā)表于 10-20 16:02 ?3604次閱讀

    累加校驗和C語言實現(xiàn)

    累加校驗和C語言實現(xiàn)
    發(fā)表于 11-29 18:06 ?10次下載
    累加校驗和C<b class='flag-5'>語言實現(xiàn)</b>

    怎么C語言實現(xiàn)多態(tài)

    這里我想主要介紹下在C語言中是如何實現(xiàn)的面向?qū)ο?。知道了C語言實現(xiàn)面向?qū)ο蟮姆绞?,我們再?lián)想下,C++中的class的運行原理是什么?
    的頭像 發(fā)表于 10-12 09:12 ?1988次閱讀