上海交通大學的武筱林教授和他的博士生張熙近期完成了一項研究,他們發(fā)現(xiàn),通過學習,機器可以通過照片分辨出誰是罪犯,誰是守法公民,識別準確率在86%以上。
這篇論文題為《基于面部圖像的自動犯罪概率推斷》(Automated Inference on Criminality using Face Images),目前上傳在預印本網(wǎng)站arXiv上。他們運用計算機視覺和機器學習技術檢測1856張中國成年男子面部照片,其中將近一半是已經(jīng)定罪的罪犯。實驗結(jié)果顯示,通過機器學習,分類器可以以較高概率區(qū)分罪犯與非罪犯這兩個群體的照片。特別是在內(nèi)眼角間距、上唇曲率和鼻唇角角度這三個測度上,罪犯和非罪犯存在較為顯著的差距。平均來講,罪犯的內(nèi)眼角間距要比普通人短5.6%,上唇曲率大23.4%,鼻唇角角度小19.6%。同時,他們發(fā)現(xiàn)罪犯間的面部特征差異要比非罪犯大。
從古至今,從西方到東方,我們都能看到類似于“相由心生”的說法。但不論是相士或是從事相應研究的心理學家,都始終擺脫不了“迷信”或“歧視”的帽子。武筱林和張熙出于好奇,試圖利用數(shù)據(jù)分析推翻這門古老的“偽科學”,但研究出來的結(jié)果令他們大吃一驚。更令他們始料未及的是,文章一經(jīng)公開,就招來了漫天爭議。
武筱林11月30日告訴澎湃新聞,他收到了很多郵件,雖然絕大部分是國際上的研究者來信索取數(shù)據(jù)和實驗細節(jié),進行學術層面的交流,但也有不少不友好的評論,甚至指責他的研究是對社會“不負責任”。
武筱林
“我們的運氣也不好,文章剛出來的時候正好是特朗普當選前后。有來自美國的郵件說,‘美國現(xiàn)在已經(jīng)一團糟了,你們就別添亂了’。 ”也有人直接建議武筱林撤稿。對于被貼上“歧視”的標簽,武筱林有些惱火,他強調(diào),他個人的價值觀絕對是反歧視的,而他做這個研究的原本目的是證偽。
此外,他也收到了一些令人哭笑不得的評論,比如有的網(wǎng)友想讓他把這個東西交給紀檢委使用。
武筱林告訴澎湃新聞,他目前還是打算專心把這個工作進一步做得更嚴謹、更充分,這項研究的成熟程度離應用還很遙遠,他們目前也沒有任何走向應用的打算。
“從另一個角度講,我們的研究也可能為反歧視提供依據(jù)”。但他也坦言, 人工智能研究應如何劃定價值倫理的禁區(qū),是個很嚴肅的問題,光憑他個人難以回答。
“現(xiàn)在世界范圍里都存在這樣的爭論,人工智能已經(jīng)發(fā)展到這一步了?!?/p>
那么,武筱林和張熙的這項研究,到底是怎么進行的呢?
通過學習,機器辨認出罪犯照片的準確率在86%以上
實驗選取了1856張中國18到55歲男性的照片,面部無毛發(fā)遮擋、無傷疤或其他標記,并將它們歸為罪犯組和非罪犯組。非罪犯組包含1126張用“網(wǎng)頁蜘蛛”從互聯(lián)網(wǎng)上抓取的照片,人群來自社會各行各業(yè):服務員、建筑工人、司機、醫(yī)生、律師、教授等。罪犯組共730張照片,其中330張來自公安部或省級公安廳的通緝令,400張由一所與實驗組達成保密協(xié)議的公安局提供。在這730名罪犯中,235名涉及暴力犯罪,包括謀殺、強奸、人身侵犯、綁架和搶劫,其余則犯下了偷竊、欺詐、貪污等非暴力罪行。所有照片都被調(diào)整為80cmX80cm大小,并對亮度和灰比都進行了控制,盡量避免對結(jié)果造成影響。
研究使用的照片樣本。a組為罪犯,b組為非罪犯。
實驗用4種分類器(邏輯回歸,KNN,SVM,CNN)對樣本進行檢測,發(fā)現(xiàn)它們都能較成功地對罪犯和非罪犯組進行分類,準確率在86%以上。
4種分類器的準確率。
武筱林和張熙進一步發(fā)現(xiàn),罪犯和非罪犯在面部特征方面最顯著的差別在內(nèi)眼角間距、上唇曲率和鼻唇角角度這三個測度上。平均來講,罪犯的內(nèi)眼角間距要比普通人短5.6%,上唇曲率大23.4%,鼻唇角角度小19.6%。
圖b標注了存在差異性的3個特征點。表4為罪犯組和非罪犯組在3個特征點上的平均值和偏離值。
最后,他們發(fā)現(xiàn)計算機模擬出來的罪犯和非罪犯的“平均臉”比較相似,但罪犯間的面部特征差異要比非罪犯大。也就是,非罪犯群體間彼此長得更為相似,變化幅度更小。
圖c為模擬出來的罪犯“平均臉”。圖d為非罪犯“平均臉”。
“顱相學”、“天生犯罪人”:沉睡2個世紀的研究
許多研究者一看到武筱林的研究成果,就立馬聯(lián)想到了西方18、19世紀一度盛行的“顱相學”和“天生犯罪人”理論。
1870年,意大利監(jiān)獄醫(yī)生龍勃羅梭打開了意大利著名土匪頭子維萊拉尸體的頭顱,發(fā)現(xiàn)其頭顱枕骨部位有一個明顯的凹陷處,它的位置如同低等動物一樣。這一發(fā)現(xiàn)觸發(fā)了他的靈感,他由此提出“天生犯罪人”理論,認為犯罪人在體格方面異于非犯罪人,并認為犯罪人是一種返祖現(xiàn)象,具有許多低級原始人的特性。同時,他認為犯罪具有遺傳性。
龍勃羅梭的理論帶有很大的歧視性色彩,一經(jīng)發(fā)表就遭到各方抨擊。此外,由于龍勃羅梭的研究缺乏數(shù)據(jù)支持,也一直被當作偽科學對待。
龍勃羅梭《犯罪人論》。
此后,反歧視的價值倫理在西方社會得到了進一步發(fā)展,關于外表和犯罪性的研究也逐漸沉寂。直到2011年,美國康奈爾大學的一個心理學研究團隊發(fā)現(xiàn)人們僅通過觀察一個人的照片判斷他是不是罪犯的成功率相當高。
“我也認真讀過2011年他們的研究”,武筱林說道,“但他們采取的是傳統(tǒng)心理學的試驗方法。MIT Technology Review說,我們是在這個研究方向走出了新的一步,用數(shù)據(jù)說話?!?/p>
原本打算證偽,第一反應很吃驚
關于“顱相學”和“天生犯罪人”理論,武筱林坦言,“不管是從主流科學界的觀點,還是從我個人的價值觀、個人的直覺,我一開始都覺得這是不靠譜的?!倍J為,像康奈爾大學的心理學家們那樣采用傳統(tǒng)實驗方法,以人為試驗者,不可避免帶有主觀偏見,也會出現(xiàn)生理上的疲勞,因此他想到運用計算機進行數(shù)據(jù)分析,在定量層面上進行證偽。
但出來這樣的結(jié)果,武筱林感到很吃驚。他們早在一年前就取得了結(jié)果,但遲遲不肯發(fā)表,而是反復交叉驗證,但始終沒有推翻原始的結(jié)論。
比如,在他們11月21日上傳的第二版論文里,他們就作了一些修改。由于有人提出,罪犯的照片是由警察提供的,而警察使用的照相機可能在信號上與其它相機不同,他們故意在照片的光學信號上加了很多噪音,以淹沒不同相機信號上的差異。但之前的結(jié)論依然成立,分類器仍有75%以上的準確率。此外,他們特地重新核實了犯罪者照片的拍攝情況,證實都是普通證件照片,而非被捕后拍攝的。
“所有算法出來的結(jié)果都相當一致,從技術層面來講可靠性很高。”
“我是來敦促你撤稿的”
外表與犯罪性的關聯(lián)研究似乎是個潘多拉魔盒,在沉睡了200多年后打開,一樣會遭受紛至沓來的批評。
此前,武筱林也曾向媒體展示了幾封他收到的措辭強硬的郵件。
一名留學在外的上海交大校友寫到,“我建議你撤銷這篇論文,并且上傳一封公告,為不恰當?shù)难芯糠椒ㄖ虑??!崩碛墒恰斑@篇論文充滿了極度的歧視和強烈的誤導。我們?nèi)斯ぶ悄茴I域的研究者不應當濫用技術,去做一些違反倫理的事情”。
這名來信者還特別強調(diào):“這篇論文給上海交大的聲譽帶來了很糟糕的影響。這對那些申請美國高校的上海交大學子來說,將會是一場災難?!?/p>
另一封信則來自美國康奈爾大學的科研同行:“我是來敦促你撤稿的,因為這是一項可恥的工作。我們無法選擇自己的唇部弧度、眼間距和所謂的鼻唇角角度。但犯罪者的問題在于行為,而不是長相。”
外網(wǎng)上也有一些不友好的聲音。Hacker News的一位用戶說道,“我看摘要的時候還以為這是在開玩笑,讀下去竟然是篇認真的論文。不過這種研究需要犯罪學、心理學和機器學習方面的專家,而不是隨便兩個懂Keras的人?!?/p>
有些數(shù)據(jù)隱私方面的專家也指出,“從這么小的數(shù)據(jù)樣本里得到這么普遍性的結(jié)論,會給廣大無辜群眾帶來大麻煩的?!?/p>
國際隱私保護組織的Richard Tynan博士認為,“作為一個個體,你不可能知道機器是怎么給你下定論的。在小數(shù)據(jù)集上,算法、人工智能和機器學習可能會建立起專斷荒唐的相關性。這不是機器的錯,把復雜系統(tǒng)運用在不合適的地方是很危險的。”
“我們的研究也可以是反相貌歧視的依據(jù)”
對于被貼上各種不友好的標簽,武筱林感到有些惱火。他講道,“我個人價值觀其實是反歧視的。比如有些招工廣告公開要求容貌姣好,我是非常反對的?!?/p>
同時,他強調(diào)在科學上相關和因果是兩回事?!白锓岗呄蛴羞@些臉部特征,也只能說兩者之間有相關性,并沒有說明里面存在因果關系。不是說長得一樣就是犯罪,不是說天生一張犯罪臉?!?/p>
“我們只是發(fā)現(xiàn)了統(tǒng)計上容貌和有些社會行為之間存在相關性。我們不關心也不可能去討論里面的因果邏輯——也許有,也許沒有——但我們不是這方面的專家,沒有這方面的知識、訓練、經(jīng)驗去做這個事情。”
從因果上來講,也可能有這樣一種解釋:因為有些人長得異樣,可能受到歧視和排擠,更容易走上犯罪道路?!八晕覀兊难芯恳部梢允欠聪嗝财缫暤囊罁?jù)”。
“核物理學家該為原子彈造成的傷害負責嗎?”
但當澎湃新聞問及該如何看待社會倫理價值和科研之間的關系時,武筱林坦言這個問題很嚴肅也很復雜,他個人也難以回答。
“為了人類社會更高的利益,是不是科學家要自律一點,而不是說求知求真者無罪,這個爭議在世界范圍內(nèi)已經(jīng)開始了,人工智能已經(jīng)到這一步了。是不是就會有一些禁區(qū),研究者不能去碰它,坦白講我不知道。”
“核物理學家該為原子彈造成的傷害負責嗎?”這是武筱林拋回給澎湃新聞的疑問。
目前,武筱林不想受到一些非理性的討論的干擾。他還在緊張地完善這個實驗,因為批評者主要指出他們的樣本量不夠?!拔覀冇玫氖?a target="_blank">深度學習,深度學習現(xiàn)在也很時髦,比如谷歌(微博)的阿爾法GO,它需要大量的樣本數(shù)據(jù)。由于隱私問題,我們的數(shù)據(jù)還是不夠大,盡管在已經(jīng)發(fā)表的文章里已經(jīng)算很大了,但對深度學習來講還是不夠的?!?/p>
在經(jīng)過完善后,他們計劃將文章投到計算機視覺領域的頂級國際會議上去,并投向《自然》、《科學》這樣的頂級學術期刊。但現(xiàn)在武筱林也在擔心,公眾輿論是否會影響到學術界對他們研究成果的接受程度。
他期待能有更多在學術上理性交流的聲音,哪怕是用數(shù)據(jù)推翻他們的結(jié)論。武筱林透露,這個領域有很大的拓展空間,目前有一些國際上的同行在做類似的題目,這也是他們提前將文章放上arXiv的原因,以保護優(yōu)先權。
“大眾積極的關注對我們的方向是好事,但不能誤判誤讀。我們的研究沒有得到任何私人或者司法部門的支持,也沒有任何的商業(yè)目的?!?/p>
評論
查看更多