今天,DeepMind在Nature上發(fā)表的一篇論文引起AI領(lǐng)域和神經(jīng)科學領(lǐng)域的極大震撼:AI展現(xiàn)出與人腦“網(wǎng)格細胞”高度一致的空間導(dǎo)航能力。這項發(fā)現(xiàn)有助于AI的可解釋性和把神經(jīng)科學作為新算法的靈感來源的重要意義。
大多數(shù)動物,包括人類,都能夠靈活地駕馭他們生活的世界——在新的地方探索,迅速返回到記憶中的地方,同時能夠“抄近路”。這些能力如此簡單和自然,以至于很少人在意其底層流程究竟有多復(fù)雜。相比之下,雖然AI在圍棋等許多任務(wù)超過了人類,空間導(dǎo)航能力對于人工智能體來說仍然是一個巨大的挑戰(zhàn)。
2005年,一項驚人的研究發(fā)現(xiàn)揭示了空間行為中神經(jīng)回路一個關(guān)鍵部分:當動物在探索它們所處的環(huán)境時,神經(jīng)元的激發(fā)呈現(xiàn)出一種非常規(guī)則的六邊形網(wǎng)格。
這些網(wǎng)格被認為有利于空間導(dǎo)航,類似于地圖上的網(wǎng)格線。
除了作為動物的內(nèi)部坐標系之外,這些神經(jīng)元——被稱為網(wǎng)格細胞(grid cell)——最近也被假設(shè)為支持基于矢量的導(dǎo)航。即:讓大腦計算出到達目的地的距離和方向,“像烏鴉飛行一樣”,即使以前沒有走過確切的路線,動物也可以在不同地點之間直接旅行。
首次發(fā)現(xiàn)網(wǎng)格細胞的研究團隊共同獲得2014年的諾貝爾生理學或醫(yī)學獎,他們的研究揭示了空間的認知表征工作的方式。但從網(wǎng)格細胞被發(fā)現(xiàn)以來,經(jīng)過10多年的理論論證,網(wǎng)格細胞的計算功能,以及它們是否支持基于矢量的導(dǎo)航,在很大程度上仍然是一個謎。
DeepMind今天發(fā)表在Nature上的論文“Vector-based navigation using grid-like representations in artificial agents”中,研究人員開發(fā)了一種人工智能體(artificial agent)來測試“網(wǎng)格細胞支持基于矢量的導(dǎo)航”這一理論。
研究人員首先訓(xùn)練了一個循環(huán)網(wǎng)絡(luò)來執(zhí)行在虛擬環(huán)境中定位自身的任務(wù),主要使用與運動相關(guān)的速度信號。哺乳動物處于不熟悉的地方或不容易發(fā)現(xiàn)地表的地方(如在黑暗中行走)時,這種能力會自然地激發(fā)。
研究人員發(fā)現(xiàn),類似網(wǎng)格般的表示(grid-like representation,以下稱“網(wǎng)格單元”)自發(fā)地出現(xiàn)在網(wǎng)絡(luò)中,這與在哺乳動物中觀察到的神經(jīng)活動模式驚人的一致,也與網(wǎng)格單元為空間提供高效代碼的觀點一致。
圖:用agent進行的實驗產(chǎn)生了類似網(wǎng)格的表示(“網(wǎng)格單元”),它們與哺乳動物中的生物網(wǎng)格細胞非常相似。
接下來,研究人員試圖通過創(chuàng)建一個artificial agent來作為實驗小白鼠,要測試的理論是:網(wǎng)格細胞支持基于矢量的導(dǎo)航。
這是通過將最初的“網(wǎng)格網(wǎng)絡(luò)”與一個更大的網(wǎng)絡(luò)架構(gòu)相結(jié)合,形成了一個agent,可以使用深度強化學習在具有挑戰(zhàn)性的虛擬現(xiàn)實游戲環(huán)境中導(dǎo)航進行訓(xùn)練。
這個agent的表現(xiàn)超過了專業(yè)游戲玩家的能力,展現(xiàn)出動物一般的靈活導(dǎo)航方式,當游戲環(huán)境中可以有捷徑時,agent會“抄近路”。
通過一系列實驗操作,研究人員發(fā)現(xiàn)網(wǎng)格單元對于基于矢量的導(dǎo)航至關(guān)重要。例如,當網(wǎng)絡(luò)中的網(wǎng)格單元被掐斷時,agent的導(dǎo)航能力就會受損,而且對目標的距離和方向的判斷等關(guān)鍵指標的表示變得不那么準確。
圖:具有網(wǎng)格單元的基于矢量的導(dǎo)航的圖示。底部的圓圈表示3個不同尺度的網(wǎng)格單元類群,有顏色的細胞是活躍的。當agent移動時,網(wǎng)格單元(表示“當前的網(wǎng)格代碼”)會發(fā)生變化,以反映agent進入了不同的觸發(fā)區(qū)域。網(wǎng)格單元用于計算目標的最短路徑。
DeepMind認為,這一研究是理解大腦中網(wǎng)格細胞的基本計算目的的重要一步,同時也突出了它們對人工智能agent的好處。這些證據(jù)為“網(wǎng)格細胞提供歐幾里德空間框架,支持基于矢量的導(dǎo)航”的理論提供了有利的支持。
此前研究人員對網(wǎng)格細胞進行的廣泛的神經(jīng)科學研究提供了在試圖理解其內(nèi)部表示的線索,有助于agent的可解釋性——這本身就是人工智能研究中的一個主要話題。
這項工作還展示了在虛擬現(xiàn)實環(huán)境中使用人工agent積極參與復(fù)雜行為,以測試大腦工作原理的潛力。
更進一步,類似的方法可以用來測試那些對感知聲音或控制肢體有重要意義的大腦區(qū)域的理論。未來,這樣的網(wǎng)絡(luò)很可能為科學家們提供一種新的方法來進行“實驗”,提出新的理論,甚至對目前在動物身上進行的研究提供補充。
DeepMind的聯(lián)合創(chuàng)始人兼CEO、該研究的聯(lián)合作者Demis Hassabis說:“要證明我們現(xiàn)在致力于構(gòu)建的通用智能是可行的,人類的大腦是我們現(xiàn)有的唯一證據(jù),因此,把神經(jīng)科學作為新算法的靈感來源是有意義的?!?/p>
針對DeepMind這項研究,國內(nèi)外眾多專家給與評價
杜克大學陳怡然教授:
春鵬同學評論道:論文中提到的兩個細節(jié)值得注意。第一,如果神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中不包括正則項,那么神經(jīng)網(wǎng)絡(luò)無法表現(xiàn)出網(wǎng)格細胞功能。這一發(fā)現(xiàn)給了我們一個全新的角度去思考正則項的作用。第二,論文指出深度神經(jīng)網(wǎng)絡(luò)的“黑盒”特點阻礙了進一步分析網(wǎng)格細胞活動特性對路徑整合的作用。這一點再次印證了當前研究神經(jīng)網(wǎng)絡(luò)可解釋性的必要。
中科院自動化所何暉光:
在這項工作中,研究人員首先訓(xùn)練循環(huán)神經(jīng)網(wǎng)絡(luò)基于運動速度信息在虛擬環(huán)境中定位。這與哺乳動物在不熟悉環(huán)境中運動定位所用到的信息非常類似。令人震驚的是,類似網(wǎng)格細胞的模式,研究人員稱之為網(wǎng)格單元,在神經(jīng)網(wǎng)絡(luò)中自然出現(xiàn),如上圖所示!人工智能的定位方案,與大自然億萬年進化所得到的答案,高度一致。
中科院計算所研究員、中科視拓創(chuàng)始人、董事長兼 CTO 山世光:
基于數(shù)據(jù)進行學習后得到的人工神經(jīng)網(wǎng)絡(luò)中的規(guī)律和模式與長期進化而來的生物神經(jīng)系統(tǒng)有相似之處——出現(xiàn)這樣的可能性是偶然還是必然,這確實是很有趣,很值得探索的方向。
新加坡南洋理工大學黃廣斌教授:
這也再次說明AI發(fā)展突飛猛進,國內(nèi)和國外在AI算法上的差距越來越大。國內(nèi)許多AI公司還處在重復(fù)使用開源算法階段。除了講故事、描繪理想,專家們也需要帶頭低調(diào)踏實做研究。
-
Agent
+關(guān)注
關(guān)注
0文章
103瀏覽量
26664 -
神經(jīng)元
+關(guān)注
關(guān)注
1文章
363瀏覽量
18431
原文標題:Nature再發(fā)DeepMind研究:AI復(fù)現(xiàn)大腦網(wǎng)格細胞模擬導(dǎo)航!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論