回首人工智能的發(fā)展,深度學(xué)習(xí)無疑是過去十年的最大亮點(diǎn),它在計算機(jī)視覺方面的突破性進(jìn)展,使其幾乎等同于人工智能。那么,未來十年,人工智能將朝著哪個方向前進(jìn)?通用人工智能會在何時以什么樣的形式出現(xiàn)?
在2020北京智源大會上,北京智源人工智能研究院理事長張宏江同康奈爾大學(xué)計算機(jī)教授 Bart Selman、圖靈獎得主 John Hopcroft 就以上問題作出了回答。
人工智能技術(shù)的出現(xiàn)可以追溯到二十世紀(jì)上半葉計算機(jī)學(xué)科創(chuàng)立之時,阿蘭圖靈提出 “圖靈測試”,討論可計算性的邊界。1956年達(dá)特茅斯會議上,AI 作為一個學(xué)科正式宣布誕生。
但很長時間以來,人工智能都未能成功走出象牙塔,在產(chǎn)業(yè)和公共部門得到廣泛使用,或成為人們?nèi)粘I畹囊徊糠帧?960年代的符號推理系統(tǒng),到1980年代的專家系統(tǒng),人工智能出現(xiàn)過幾次破殼而出的跡象,但都未能成功變成產(chǎn)業(yè)級應(yīng)用。
在過去十年,一切都改變了。
在北京智源大會上,北京智源人工智能研究院理事長張宏江作為主持人,同康奈爾大學(xué)計算機(jī)教授 Bart Selman、圖靈獎得主 John Hopcroft 探討了近年來 AI 的飛速發(fā)展和 AI 研究的未來:過去十年 AI 領(lǐng)域發(fā)生了什么?接下來十年 AI 又將如何發(fā)展?
追溯這場革命,一個繞不開的時間點(diǎn),是 2012年深度神經(jīng)網(wǎng)絡(luò) AlexNet 在 ImageNet 大規(guī)模圖像識別挑戰(zhàn)競賽中取得的驚人成就。
彼時,使用8層神經(jīng)元的 AlexNet 把圖像識別的錯誤率從 25% 的水平大幅降到了 15%。自此,僅僅3年之后,人們就學(xué)會了訓(xùn)練多達(dá)100層神經(jīng)元的深度神經(jīng)網(wǎng)絡(luò) ResNet,將圖像識別的錯誤率降到了3.6%。這個水平已然超越人類的水平 (5%) 。截至2020年6月,AlexNet 的論文被引用次數(shù)已經(jīng)超過6萬4千次。這是深度學(xué)習(xí)技術(shù)的驚人首秀。
如今,深度學(xué)習(xí)幾乎可以和 AI 劃等號。深度學(xué)習(xí)的基礎(chǔ):人工神經(jīng)網(wǎng)絡(luò),在1950年代已經(jīng)出現(xiàn),用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的反向傳播算法 (backpropagation) 出現(xiàn)在1986年,用于自然語言處理領(lǐng)域的長短期記憶算法 (LSTM) 出現(xiàn)在1997年。但在過去的許多年里,訓(xùn)練數(shù)據(jù)和計算能力都十分匱乏。那時的研究者縱使有許多思路,也很難去驗證。
“在我獲得博士學(xué)位的60年代初,我曾經(jīng)參與手工制作了上千幅100x100 像素的符號圖像,這在當(dāng)時看來就已經(jīng)是巨量數(shù)據(jù)了?!?Hopcroft 說。
但摩爾定律和互聯(lián)網(wǎng)時代的出現(xiàn)終于改變了一切。到了2010年代,基于高性能 GPU 的計算和互聯(lián)網(wǎng)上產(chǎn)生的大量數(shù)據(jù),人們終于能大量訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),去驗證自己的想法。這是過去10年 AI 飛速進(jìn)步的主要原因。
不過,因為深度學(xué)習(xí)技術(shù)的革命性成功,其他 AI 技術(shù)的應(yīng)用被某種程度上忽略了。經(jīng)典的 AI 技術(shù),例如機(jī)器推理、規(guī)劃、搜索等,在過去十年同樣取得了很大進(jìn)步。
Selman 說, “一個很好的例子是 AlphaGo。它除了使用了基于深度學(xué)習(xí)的強(qiáng)化學(xué)習(xí)技術(shù),也使用了2006年左右發(fā)明的蒙特卡洛樹搜索技術(shù)。這是一個經(jīng)典的、純粹的符號邏輯算法?!?另一個例子是自動駕駛系統(tǒng)。雖然對街道上物體的識別技術(shù)來源于深度學(xué)習(xí),但在設(shè)計交通路線的時候,還是需要依靠傳統(tǒng)搜索、規(guī)劃、推理等 AI 技術(shù)。
Selman 認(rèn)為,忽略非數(shù)據(jù)驅(qū)動的 AI 技術(shù),可能會成為 AI 技術(shù)在未來十年取得更大突破的障礙。
“如果說數(shù)據(jù)是大量標(biāo)注好的圖片,或者語音和文字的對應(yīng)關(guān)系,那么知識就好比是牛頓定律,往往只需少數(shù)幾條,就能解釋大量數(shù)據(jù)?!?Selman 說。數(shù)據(jù)驅(qū)動的 AI 技術(shù)雖然在許多應(yīng)用領(lǐng)域非常有效,但仍然比不上人類學(xué)習(xí)的效率。人類學(xué)習(xí)過程是基于 “小樣本” 的,Selman 說,“只需要幾個例子,外加一些老師的指導(dǎo),人類就能理解某個知識?!?/p>
2019年8月,Selman 和現(xiàn)任國際人工智能學(xué)會 (AAAI) 主席 Yolanda Gil 共同起草了《美國未來20年人工智能研究路線圖》 ( A 20-Year Community Roadmap for Artificial Intelligence Research in the US) 。該白皮書強(qiáng)調(diào)未來的一個研究重點(diǎn)是 “有自我意識的學(xué)習(xí)” (self-aware learning) 。 “某個人在學(xué)習(xí)某個科目,比如說微積分時,他對自己的知識掌握情況會有一個評估,他會主動提問,或者針對自己的弱項進(jìn)行更多的練習(xí)。” Selman 解釋道。這些是目前 AI 欠缺的能力。
僅僅靠數(shù)據(jù)驅(qū)動的路徑,雖然能讓 AI 在一些領(lǐng)域達(dá)到接近或者超過人類的水平,例如人臉識別。但在另一些領(lǐng)域,比如自動駕駛,我們需要的是接近100%的安全性。Selman 認(rèn)為,這最后的10%、5%的提升,可能不是深度學(xué)習(xí)本身的進(jìn)展能夠解決的,我們需要不同的思路。
Selman 指出,深度學(xué)習(xí)技術(shù)除了在效率上的不足外,還有更多的問題。
例如黑箱問題。深度學(xué)習(xí)算法通常只能給出判斷,卻不能給出判斷的理由。假如基于深度學(xué)習(xí)技術(shù)的 AI 是考試的閱卷官,它雖然能夠評分,卻不能給出評分的理由,被評分的學(xué)生可能會非常不滿。假如這樣的 AI 系統(tǒng)要負(fù)責(zé)給出醫(yī)療診斷的方案,卻不能讓醫(yī)生理解這個方案的道理,那么醫(yī)生們可能會拒絕執(zhí)行這樣的治療方案,病人也很難獲得充分的溝通。此外,端到端 (end-to-end) 訓(xùn)練的深度學(xué)習(xí)系統(tǒng),可能會過于復(fù)雜,使得工程師無法分別針對其組成部分進(jìn)行質(zhì)量測試。這對于需要極高安全性的自動駕駛系統(tǒng)而言就會成為一個問題。
另外,數(shù)據(jù)驅(qū)動的 AI 技術(shù)還面臨著數(shù)據(jù)偏見的問題。例如當(dāng)前科技領(lǐng)域的從業(yè)者主要是男性,如果 AI 作為招聘官,可能會認(rèn)為男性更適合從事高科技職業(yè),從而拒絕合格的女性應(yīng)聘者。這些偏見存在于數(shù)據(jù)之中,人類能夠憑借自己對歷史和社會的認(rèn)識,去避免過分地看重某些經(jīng)驗數(shù)據(jù)。但目前的 AI 系統(tǒng)仍然大多處于 “偏見進(jìn),偏見出” (bias in,bias out) 的狀態(tài),無法糾正訓(xùn)練數(shù)據(jù)中的偏見。
事實上,在《美國未來20年人工智能研究路線圖》中,Selman 對以上問題進(jìn)行了更全面的回應(yīng)。該白皮書確定了三個需要重點(diǎn)關(guān)注的研究方向:分別是(1)集成化的智能 (Intergrated Intelligence) ,強(qiáng)調(diào)要將各種解決特定問題的 AI 技術(shù)模塊組合起來,同時要建立 AI 能理解的人類知識庫;(2)有意義的交互 (Meaningful interaction) 強(qiáng)調(diào)人機(jī)交互時的隱私問題,以及用戶對系統(tǒng)的理解、信任和控制能力;(3)有自我意識的學(xué)習(xí) (Self-aware learning) ,強(qiáng)調(diào)小樣本學(xué)習(xí)、因果推斷、高穩(wěn)定性的學(xué)習(xí)算法,有意圖 (intentional) 的感知和行動。這三個方面均對目前深度學(xué)習(xí)之外的 AI 技術(shù),或者深度學(xué)習(xí)的弱點(diǎn)進(jìn)行了補(bǔ)充。
在會議上,Selman談到,現(xiàn)在 Google,F(xiàn)acebook,Apple 等大公司吸收了大量的 AI 資源,包括有天賦的學(xué)生和教授 ,但商業(yè)利益導(dǎo)向的研究可能會忽略掉一些重要領(lǐng)域的需求,比如教育和醫(yī)療系統(tǒng)。他提議,美國在未來需要更多地支持學(xué)術(shù)界和非 IT 商業(yè)領(lǐng)域的 AI 研究,建立一個 AI 的國家基礎(chǔ)設(shè)施,包括共享的數(shù)據(jù)集、軟件庫、計算資源等等,以便那些因為資金和影響力的原因而無法獲得足夠資源的行業(yè)也能為 AI 的發(fā)展做貢獻(xiàn)。
不過,這些努力是否能讓我們在未來十年看到能夠靈活解決各種問題、而非局限于具體任務(wù)的通用人工智能出現(xiàn)呢?
在 Selman 看來,通用人工智能可能還需要20年以上的時間才可以實現(xiàn)。
“不過如果我們在未來五到十年能在真正的自然語言理解上獲得突破,使得 AI 可以去閱讀圖書,從互聯(lián)網(wǎng)獲得知識,那么這個進(jìn)程可能會被大大加速?!?Selman 解釋道。
同時,他表示對未來 AI 從數(shù)據(jù)到知識、從大樣本數(shù)據(jù)訓(xùn)練到小樣本知識獲取的進(jìn)步感到樂觀。Selman 認(rèn)為,技術(shù)是加速發(fā)展的。人類發(fā)展農(nóng)業(yè)技術(shù)用了幾千年,發(fā)展工業(yè)技術(shù)用了幾百年,發(fā)展 AI 技術(shù)只用了幾十年。我們現(xiàn)在有了更高效的編程語言,更方便的計算設(shè)備,大量的數(shù)據(jù),基于互聯(lián)網(wǎng)的高效知識共享,以及產(chǎn)業(yè)界的大量投資,技術(shù)的進(jìn)步將會越來越快。
我們無法在短期內(nèi)達(dá)到通用人工智能的原因,Hopcroft 補(bǔ)充說,是因為目前的 AI 研究普遍是具體工程指標(biāo)驅(qū)動的,人們花了很多精力,在特定的領(lǐng)域去改善算法的表現(xiàn)。他認(rèn)為,我們需要更多好奇心驅(qū)動的研究,需要更多地回到基礎(chǔ)科學(xué)問題上來?!拔磥砣斯ぶ悄茴I(lǐng)域重要的突破,可能并非來自計算機(jī)科學(xué)專家,而是生物學(xué)研究者。” Hopcroft 說,畢竟人類現(xiàn)在對于人類大腦進(jìn)化歷程和兒童大腦發(fā)育機(jī)制知道得仍然非常有限。
這也提醒了我們?nèi)斯ぶ悄苓@一學(xué)科成立的初衷。我們并非只是為了獲得工程上有效的算法。我們希望能理解人類的心靈。如費(fèi)曼所言, “我造不出來的東西,我就沒有真的弄懂?!?br /> 責(zé)任編輯:tzh
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
54文章
11077瀏覽量
102631 -
AI
+關(guān)注
關(guān)注
87文章
29852瀏覽量
268151 -
人工智能
+關(guān)注
關(guān)注
1791文章
46691瀏覽量
237179
發(fā)布評論請先 登錄
相關(guān)推薦
評論