2. 技術(shù):從無法工作到神經(jīng)網(wǎng)絡(luò)
人工智能的繁榮基于傳統(tǒng)與現(xiàn)代想法的結(jié)合。
人工智能如何從剛開始的傲慢與失望,突然成為科技界最熱門的領(lǐng)域呢?人工智能(artificial intelligence)這個術(shù)語最早被寫在 1956 年的一份研究計劃中,該計劃聲稱「如果一個精心挑選的科學(xué)家小組花一個夏天一起研究,就能使機(jī)器解決各種人類無法解決的問題……」,從而實(shí)現(xiàn)重大的進(jìn)步。那被證明只是瘋狂過度地樂觀,人工智能雖然偶有突破,但其承諾的遠(yuǎn)比其所能提供的多得多。最終,大多研究者都避免使用這個術(shù)語,而更喜歡用「專家系統(tǒng)」或「神經(jīng)網(wǎng)絡(luò)」?,F(xiàn)在「人工智能」的名譽(yù)恢復(fù)和重新興起要追溯到 2012 年被稱為 ImageNet 挑戰(zhàn)賽的在線競賽。
ImageNet 是一個擁有數(shù)百萬張圖片的在線數(shù)據(jù)庫,所有圖片都有人工做的標(biāo)簽。對于任何給定詞,例如「氣球」或「草莓」,ImageNet 里都能找到上百張對應(yīng)的圖片。每年的 ImageNet 競賽鼓勵該領(lǐng)域的人在計算機(jī)識別和自動標(biāo)記圖片上進(jìn)行比賽,并衡量他們的進(jìn)展。這些系統(tǒng)首先使用被正確標(biāo)記的圖片集進(jìn)行訓(xùn)練,然后挑戰(zhàn)標(biāo)記之前沒見過的測試圖片。在后續(xù)的研討會上,優(yōu)勝者會分享并討論他們的技術(shù)。2010 年獲勝的系統(tǒng)可以正確標(biāo)記 72% 的圖片(人類平均有 95% 的準(zhǔn)確率)。2012 年,多倫多大學(xué)的 Geoff Hinton 帶領(lǐng)的團(tuán)隊(duì)實(shí)現(xiàn)了 85% 的準(zhǔn)確率,這要?dú)w功于一項(xiàng)叫「深度學(xué)習(xí)」的新技術(shù)。這帶來了一種長遠(yuǎn)快速的改進(jìn),在2015 年的 ImageNet 競賽上,一個深度學(xué)習(xí)系統(tǒng)以 96% 的準(zhǔn)確率第一次超過了人類。
2012 年的成果被認(rèn)為是一項(xiàng)突破,但 Yoshua Bengio 說,他們依靠的是「結(jié)合以前已經(jīng)有了的東西?!筜oshua Bengio 是蒙特利爾大學(xué)的計算機(jī)科學(xué)家,他與 Hinto 以及另外幾個人被稱為深度學(xué)習(xí)的先驅(qū)。大體上,這項(xiàng)技術(shù)使用了大量的計算和訓(xùn)練數(shù)據(jù),對來自人工智能發(fā)展初期的一個舊思路進(jìn)行改進(jìn),這個舊思路也就是人工神經(jīng)網(wǎng)絡(luò)(ANN)——這是生物學(xué)啟發(fā)的人工神經(jīng)元(腦細(xì)胞)網(wǎng)絡(luò)。
在生物大腦中,每個神經(jīng)元都能被其它神經(jīng)元觸發(fā),將輸出的信號饋送給另一個神經(jīng)元,而且此神經(jīng)元的輸出也能繼續(xù)觸發(fā)其它神經(jīng)元。一個簡單的 ANN 網(wǎng)絡(luò)有一個輸入神經(jīng)元層,在這里數(shù)據(jù)被饋送進(jìn)網(wǎng)絡(luò)中;還有一個輸出層輸出結(jié)果,中間可能還會有三兩個隱藏層對信息進(jìn)行處理。(實(shí)際中,ANN 網(wǎng)絡(luò)全部在軟件中模擬。)網(wǎng)絡(luò)中的每一個神經(jīng)元都有一系列的「權(quán)重」和一個「激活函數(shù)」控制著輸出的信號發(fā)射。訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)涉及到對神經(jīng)元權(quán)重的調(diào)整,以便一個給定的輸入產(chǎn)生期望的輸出。ANN 在 20 世紀(jì) 90 年代早些時候就已經(jīng)實(shí)現(xiàn)了一些有用的結(jié)果,例如識別手寫數(shù)字。但在完成更為復(fù)雜的任務(wù)上,ANN 陷入了困境。
在過去的十幾年中,新技術(shù)的出現(xiàn)和對激活函數(shù)的一種簡單調(diào)整使得訓(xùn)練深度網(wǎng)絡(luò)變得可行。同時,互聯(lián)網(wǎng)的興起產(chǎn)生了數(shù)十億可用于目標(biāo)訓(xùn)練的文檔、圖片、視頻數(shù)據(jù)。這所有的一切都需要大量的數(shù)字操作能力,而 2009 年左右當(dāng)幾個人工智能研究團(tuán)體意識到個人計算機(jī)和視頻游戲機(jī)上用于生成精致畫面的 GPU 也同樣適用于運(yùn)行深度學(xué)習(xí)算法之后,計算能力也不再是個問題了。斯坦福大學(xué)由吳恩達(dá)帶領(lǐng)的一個人工智能團(tuán)隊(duì)發(fā)現(xiàn) GPU 能夠幾百倍地加速深度學(xué)習(xí)系統(tǒng)。然后,訓(xùn)練一個四層的神經(jīng)網(wǎng)絡(luò)突然就變得很快了,由之前需要花費(fèi)幾周的時間變成了不到一天時間。GPU 生產(chǎn)商 NVIDIA 的老總黃仁勛說這是一個令人高興的對稱:GPU 這一游戲工作者用于為游戲玩家構(gòu)建幻想世界的芯片也能用于幫助計算機(jī)通過深度學(xué)習(xí)理解真實(shí)世界。
ImageNet 的結(jié)果顯示了深度學(xué)習(xí)的能力。突然間,深度學(xué)習(xí)就獲得了關(guān)注——不只是在人工智能界,而是在整個科技產(chǎn)業(yè)界內(nèi)!深度學(xué)習(xí)系統(tǒng)因此變得更加的強(qiáng)大:20 或 30層的網(wǎng)絡(luò)變得很常見,微軟的研究人員曾建立過 152 層的網(wǎng)絡(luò)。更深層的網(wǎng)絡(luò)能進(jìn)行更高水平的抽象并產(chǎn)生更好的結(jié)果,事實(shí)證明這些網(wǎng)絡(luò)擅長解決眾多領(lǐng)域的難題。
「讓人們激動的是這一領(lǐng)域的一種學(xué)習(xí)方法:深度學(xué)習(xí),能夠應(yīng)用于眾多不同的領(lǐng)域,」谷歌機(jī)器智能研究部門負(fù)責(zé)人、如今負(fù)責(zé)搜索引擎的 John Giannandrea 表示,谷歌正在使用深度學(xué)習(xí)提升其網(wǎng)頁搜索結(jié)果的質(zhì)量、理解智能手機(jī)端的口語指令、幫助人們在他們的照片中搜索特定的圖片、推薦電子郵件的自動回復(fù)、改善網(wǎng)頁的翻譯服務(wù),并且?guī)椭鼈兊?a href="http://ttokpm.com/tags/自動駕駛/" target="_blank">自動駕駛汽車?yán)斫庵車h(huán)境。
學(xué)習(xí)如何學(xué)習(xí)
深度學(xué)習(xí)有很多不同的方式。最普遍使用的是「監(jiān)督學(xué)習(xí)(supervised learning)」,這項(xiàng)技術(shù)能使用標(biāo)記樣本集訓(xùn)練系統(tǒng)。例如,過濾垃圾郵件:收集出郵件信息樣本的大數(shù)據(jù)集,每一個都標(biāo)上「垃圾郵件」或者「非垃圾郵件」。一個深度學(xué)習(xí)系統(tǒng)能夠使用這些數(shù)據(jù)集進(jìn)行訓(xùn)練,重復(fù)的進(jìn)行樣本訓(xùn)練進(jìn)而調(diào)整神經(jīng)網(wǎng)絡(luò)內(nèi)的權(quán)重,提高評定垃圾郵件的準(zhǔn)確率。這一方法的巨大優(yōu)點(diǎn)是不需要人類專家寫出規(guī)則列表,也不需要程序員用代碼編寫這些規(guī)則,系統(tǒng)能直接從有標(biāo)簽的數(shù)據(jù)中進(jìn)行學(xué)習(xí)。
使用有標(biāo)簽數(shù)據(jù)訓(xùn)練系統(tǒng)也被用于圖片分類、語音識別、信用卡交易欺詐偵測、垃圾和惡意軟件識別以及廣告定位,所有這些應(yīng)用領(lǐng)域中的正確答案都可通過之前的大量案例獲得。Facebook 能在你上傳一張照片后識別、標(biāo)記照片里你的朋友和家人,它們近期還發(fā)布了一個能夠?yàn)槊と嗣枋稣掌械膬?nèi)容(比如兩個人、微笑、太陽眼鏡、戶外、水等)的系統(tǒng)。有大量的數(shù)據(jù)可用于監(jiān)督學(xué)習(xí),吳恩達(dá)先生說,這一科技的應(yīng)用已經(jīng)使現(xiàn)在的金融服務(wù)領(lǐng)域、計算安全領(lǐng)域和銷售領(lǐng)域的公司將自己重新標(biāo)記為了人工智能公司。
另一項(xiàng)技術(shù)是無監(jiān)督學(xué)習(xí)(unsupervised learning),其通過將網(wǎng)絡(luò)暴露在大量樣本中來對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,但不會告訴它要尋求什么模式。相反,該網(wǎng)絡(luò)學(xué)習(xí)識別相似樣本的特征和聚類,從而揭示數(shù)據(jù)中的隱藏分組、連接和模式。
無監(jiān)督學(xué)習(xí)能在你不知道會是什么樣的情況下被用于事物搜索:例如,監(jiān)控網(wǎng)絡(luò)中反常的通信模式,那可能代表著網(wǎng)絡(luò)攻擊;或檢查大量的保險聲明以檢測新類型的詐騙方式。一個經(jīng)典的案例:2011 年當(dāng)吳恩達(dá)在谷歌工作時,他領(lǐng)導(dǎo)的一個名為谷歌大腦(Google Brain)項(xiàng)目中的一個大型的無監(jiān)督學(xué)習(xí)系統(tǒng)本是用于在千部無標(biāo)記 YouTube 視頻中發(fā)現(xiàn)共同模式。一天,吳恩達(dá)的一個博士生給了他一個驚喜。吳恩達(dá)回憶說「我記得他把我叫道他的電腦前說,『看這個』」,電腦屏幕上是一個毛茸茸的面孔,從數(shù)千的樣本中發(fā)現(xiàn)的模式。系統(tǒng)發(fā)現(xiàn)了貓。
強(qiáng)化學(xué)習(xí)位于監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間,它涉及到訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)與只以獎勵作為偶然的反饋的環(huán)境進(jìn)行交互。本質(zhì)上,訓(xùn)練涉及到調(diào)整網(wǎng)絡(luò)的權(quán)重,從而獲得能帶來更高獎勵的搜索策略。DeepMind 是這個領(lǐng)域的專家。2015 年 2 月,它們在 Nature 上發(fā)表的一篇論文描述了一個能夠?qū)W習(xí)玩 49 種經(jīng)典的 Atari 視頻游戲的強(qiáng)化學(xué)習(xí)系統(tǒng),它只使用屏幕上的像素和游戲分?jǐn)?shù)作為輸入,輸出則連接到一個虛擬的控制器上。這個系統(tǒng)從頭學(xué)起玩游戲,最終在其中 29 種游戲中達(dá)到或超過了人類水平。
把系統(tǒng)游戲化
電子游戲是人工智能研究的理想訓(xùn)練場,DeepMind 的 Demis Hassabis 說,因?yàn)椤杆鼈兪钦鎸?shí)世界的縮影,但更純凈和約束化?!?游戲引擎也可以輕松生成大量訓(xùn)練數(shù)據(jù)。Hassabis 先生以前從事過電子游戲行業(yè)的工作,后來取得了認(rèn)知神經(jīng)學(xué)的博士學(xué)位并創(chuàng)立了 DeepMind。這家公司現(xiàn)位于倫敦國王十字車站附近,相當(dāng)于谷歌的人工智能研究分部。
今年三月,AlphaGo 于首爾的五輪比賽中打敗了世界頂尖圍棋選手李世石,作為開發(fā)公司的 DeepMind 因此登上頭條。AlphaGo 是一個有著獨(dú)特特性的強(qiáng)化學(xué)習(xí)系統(tǒng)。它由幾個相互連通的模塊組成,包括兩個深度神經(jīng)網(wǎng)絡(luò),它們各有所長——像人腦中模塊一樣。其中一個通過大量的棋局分析訓(xùn)練提出一些可能的走法,另一個網(wǎng)絡(luò)則負(fù)責(zé)根據(jù)隨機(jī)采樣技術(shù)來評估這些走法。這個系統(tǒng)把生物啟發(fā)的技術(shù)與純機(jī)器化的技術(shù)結(jié)合了起來。人工智能研究者們就哪種技術(shù)更優(yōu)越這個問題已經(jīng)爭論了幾十年,而 AlphaGo 卻另辟蹊徑兩者都用?!高@是一個復(fù)合型系統(tǒng),因?yàn)槲覀冋J(rèn)為解決智能問題只有深度學(xué)習(xí)是不夠的」,Hassabis說。
他和其他研究者們已經(jīng)開始探尋一種叫做遷移學(xué)習(xí)(transfer learning)的新技術(shù)了。這種技術(shù)能讓強(qiáng)化學(xué)習(xí)系統(tǒng)把基礎(chǔ)建立在已習(xí)得的知識上,而不用每一次都從頭開始訓(xùn)練。Hassabis 先生解釋道,人類可以毫不費(fèi)力地做到這一點(diǎn)。Giannandrea 先生回憶起他四歲的女兒已經(jīng)能辨別出 penny-farthing(一種前輪大后輪小的腳踏車)就是一種自行車,即使她之前從沒見過這樣的東西?!傅嬎銠C(jī)無法做到,」他說。
一家最近被 Salesforce 收購的初創(chuàng)公司 MetaMind 也在研發(fā)一種相關(guān)的技術(shù)——多任務(wù)學(xué)習(xí)(multitask learning),這種系統(tǒng)用同樣的神經(jīng)網(wǎng)絡(luò)架構(gòu)解決多種不同的問題,在一件事情上獲得的經(jīng)驗(yàn)?zāi)苡脕砀玫亟鉀Q其它事情。跟 DeepMind 類似,它也在探尋模塊化的架構(gòu);其中一個被稱為「動態(tài)記憶網(wǎng)絡(luò)(dynamic memory network)」的系統(tǒng)能消化一系列陳述,然后回答相關(guān)問題,并且推斷出其中的邏輯聯(lián)系(Kermit 是一只青蛙;青蛙是綠色的;所以 Kermit 是綠色的)。MetaMind 還把自然語言網(wǎng)絡(luò)和圖像識別網(wǎng)絡(luò)融合到一個系統(tǒng)中,它可以回答有關(guān)圖像的問題(「這里面的汽車是什么顏色的?」)。這種技術(shù)可以用到智能客服聊天機(jī)器人中,或者用于 Salesforce 的客戶呼叫中心。
過去,很多有前景的人工智能技術(shù)發(fā)展都會逐漸疲軟。但深度學(xué)習(xí)卻不同。「這東西真的能起作用,」 MetaMind 的 Richard Socher 說。人們每天都會用到它,雖然他們并未意識到。Hassabis、Socher和其他人的長遠(yuǎn)目標(biāo)是開發(fā)出「通用人工智能(AGI )」—一種能完成各種各樣任務(wù)的系統(tǒng),有了它就不必再為每個特定問題都專門開發(fā)出一個系統(tǒng)了。人工智能多年來的研究方向都集中在解決專業(yè)化的特定問題上,Socher先生說,但現(xiàn)在研究人員們「正努力用更先進(jìn)的樂高積木塊拼出不一樣的東西」。即使他們中最樂觀的人也認(rèn)為還需至少十年才能做出人類智力水平的 AGI 。但 Hassabis 說,「我們認(rèn)為我們已經(jīng)知道實(shí)現(xiàn)接近 AGI 的系統(tǒng)所需的幾十種關(guān)鍵元素了」。
同時人工智能已經(jīng)在發(fā)揮作用了,而且很快會更有用。例如谷歌的智能回復(fù)系統(tǒng),它通過兩個神經(jīng)網(wǎng)絡(luò)推薦郵件回復(fù),從研究項(xiàng)目到產(chǎn)品上線只用了四個月(雖然剛開始它因?yàn)閷γ織l信息建議回復(fù)的有「我愛你」而令人失望)?!冈诳蒲衅诳习l(fā)表文章剛一個月,就有某個公司正確使用你的系統(tǒng)了,」Socher 說。人工智能公司,不論規(guī)模大小都能都能定期發(fā)表學(xué)術(shù)文章;人工智能研究者即使在轉(zhuǎn)行進(jìn)入公司后也能繼續(xù)在同行評議期刊上發(fā)表研究成果。很多人都是邊為公司工作邊發(fā)表科研文章?!溉绻悴辉试S他們發(fā)表,他們就不會為你工作了,」Andreessen Horowitz 的 Chris Dixon 解釋說。
谷歌,F(xiàn)acebook,微軟,IBM,亞馬遜,百度以及其他公司都開源了某些深度學(xué)習(xí)軟件。部分原因是這些公司中的研究人員想要發(fā)表自己的成果,因?yàn)檫@有利于公司招募更多人才。從更現(xiàn)實(shí)的角度來看,這也是因?yàn)榇笮突ヂ?lián)網(wǎng)公司不在乎把自己的人工智能軟件公之于眾,因?yàn)樗麄冋嬲膬?yōu)勢在于能獲取大量用于訓(xùn)練的用戶數(shù)據(jù)。一家投資基金公司 Bloomberg Beta的Shivon Zilis說,這使得他們能在某些方面占盡優(yōu)勢,但初創(chuàng)公司也在尋求打入市場的獨(dú)特途徑。比如無人機(jī)初創(chuàng)公司能在人群密集的地方通過模擬數(shù)據(jù)進(jìn)行飛行訓(xùn)練。而且很多訓(xùn)練數(shù)據(jù)都能從網(wǎng)上找到,孵化器公司 Y Combinator 的董事長 Sam Altman 說道。他注意到人類可以用有限的數(shù)據(jù)進(jìn)行學(xué)習(xí),「這意味著大量訓(xùn)練數(shù)據(jù)并不是實(shí)現(xiàn)智能的必要條件」。像 Numenta 和 Geometric Intelligence 這樣的初創(chuàng)公司正在探索低數(shù)據(jù)依賴性的新智能系統(tǒng)。
在這股人工智能淘金熱中,公司們排著隊(duì)為參與者提供鐵鍬。出現(xiàn)最為頻繁的名字是英偉達(dá),Dixon 先生說;似乎每一家人工智能創(chuàng)業(yè)公司都在使用它的 GPU 芯片來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。GPU 能力也可從亞馬遜和微軟的云中租用。與此同時,IBM 和谷歌則正為更快更高效地運(yùn)行人工智能軟件而設(shè)計專門的新芯片。谷歌、微軟和 IBM 也正使其語音識別、句子解析和圖像分析等人工智能服務(wù)免費(fèi)在線提供,讓創(chuàng)業(yè)公司可以結(jié)合這些開發(fā)模塊來構(gòu)建新的人工智能產(chǎn)品和服務(wù)。IBM 的 Guru Banavar 說:來自多個行業(yè)的 300 多家公司已經(jīng)使用 IBM 的 Watson 平臺開發(fā)出了人工智能驅(qū)動的應(yīng)用,其中包括篩選應(yīng)聘者和挑選葡萄酒。
對大多數(shù)人而言,所有這些人工智能領(lǐng)域的進(jìn)步都將體現(xiàn)為他們每天都在使用的互聯(lián)網(wǎng)服務(wù)的不斷進(jìn)步。搜索引擎將得到更相關(guān)的結(jié)果;推薦將會更加準(zhǔn)確。Hassabis 預(yù)測說:幾年之內(nèi),所有東西都將會嵌入某種程度上的智能。人工智能技術(shù)將讓計算機(jī)接口變成對話式和有預(yù)測力的,而不只是簡單的菜單和按鈕。而且對話式的交互讓不能閱讀書寫和目前不能使用互聯(lián)網(wǎng)的人也能使用計算機(jī),Bengio 說。
厚積多年,一朝薄發(fā);機(jī)器將能夠執(zhí)行之前只有人類才能完成的任務(wù)。自動駕駛汽車正快速變得越來越好,到某個點(diǎn)時它們也許能夠取代出租車司機(jī),至少在市中心等受控環(huán)境中可以做到。送貨無人機(jī),不管是地上跑的還是天上飛的,類似地可以與人類送貨員競爭。改進(jìn)后的視覺系統(tǒng)和機(jī)器人技術(shù)讓機(jī)器人可以碼放超市貨架和在倉庫中移動物體。而且還給意想不到的突破留下了很多余地,Dixon 說。
其他人卻很擔(dān)心,擔(dān)憂人工智能技術(shù)會增壓特定任務(wù)中現(xiàn)有的計算機(jī)化和自動化;就像 200 年前的蒸汽動力一樣,讓很多工人成了多余。英國詩人 Robert Southey 宣稱 :「蒸汽可怕地加劇著已經(jīng)正在進(jìn)行的過程,但太快了?!顾麚?dān)心「這強(qiáng)大之力的發(fā)現(xiàn)」已經(jīng)在「我們知道如何正確使用它」之前到來。許多人對今天的人工智能也這么想。
評論
查看更多