人類識別物體的能力非常卓越。假如你在特殊光線下看一個杯子,或者從一個意想不到的方向去看杯子,你的大腦仍然很有可能認(rèn)出這是一個杯子。這種精確的物體識別能力對人工智能開發(fā)者來說是一個難以實(shí)現(xiàn)的夢想,例如那些改進(jìn)自動駕駛汽車導(dǎo)航的開發(fā)者。
雖然在視覺皮層中建立靈長類動物物體識別模型已經(jīng)徹底改變了人工視覺識別系統(tǒng),但是目前的深度學(xué)習(xí)系統(tǒng)相比生物系統(tǒng)已經(jīng)被簡化,并且還是難以識別一些物體,。
近日,麻省理工學(xué)院麥戈文研究所的研究員 James DiCarlo 和他的同事在 Nature Neuroscience 上發(fā)表的研究成果中提到,有證據(jù)表明,反饋可以提高靈長類動物大腦識別難識別物體的能力,添加反饋回路可以改進(jìn)視覺應(yīng)用中所用到的人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)的性能。
圖丨人工智能和深度學(xué)習(xí)視覺識別系統(tǒng)的藝術(shù)渲染圖(來源:Christine Daniloff)
深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)是目前在快速時間尺度(小于 100 毫秒)上精確識別物體最成功的模型。它具有大體上與靈長類動物腹側(cè)視覺流、皮質(zhì)區(qū)域類似的結(jié)構(gòu),這一結(jié)構(gòu)用來逐步建立所觀察的物體的精確圖像。然而,跟靈長類動物的腹側(cè)神經(jīng)系統(tǒng)相比,大多數(shù)的 DCNN 都很簡單。
“在很長一段時間里,我們都沒有獲得一個基于模型的理解。因此,這一領(lǐng)域是通過將視覺識別建模作為前饋過程而開始的,”麻省理工學(xué)院大腦和認(rèn)知科學(xué)系的系主任DiCarlo 解釋道,“但是,我們知道,在跟物體識別相關(guān)的大腦區(qū)域中,存在著重復(fù)性解剖學(xué)連接。”
試想一下,前饋 DCNN 和視覺系統(tǒng)中首次嘗試捕捉物體信息的部分,就像一條穿過一系列車站的地鐵線,而反復(fù)出現(xiàn)的大腦網(wǎng)絡(luò)就像街道,相互連接,但又不是單向的。大腦精確識別物體只需 200 毫秒,所以這些反復(fù)出現(xiàn)的聯(lián)結(jié)是否在物體識別的關(guān)鍵步驟上起作用,目前仍不清楚。也許這些反復(fù)出現(xiàn)的聯(lián)結(jié)只是為了長時間保持視覺系統(tǒng)協(xié)調(diào)。例如,街道上的排水溝緩慢地排出水和垃圾,但是并不需要很快地將人從小鎮(zhèn)的一邊轉(zhuǎn)到另一邊。
DiCarlo 和本研究的主要作者、CBMM 的博士后 Kohitij Kar 一起,開始驗證快速識別物體過程中這些多次出現(xiàn)的結(jié)構(gòu)的微妙作用是否被忽略了。
首先,作者需要確認(rèn)靈長類動物大腦能詳細(xì)解碼的物體。識別物體這一過程對人工系統(tǒng)來說,充滿了挑戰(zhàn),結(jié)果證明這很關(guān)鍵。
Kar 進(jìn)一步解釋道,“我們意識到,人工智能模型實(shí)際上并不是對處理每一幅或被遮擋、或處于混亂狀態(tài)的圖像都有問題?!?/p>
作者分別讓深度學(xué)習(xí)系統(tǒng),還有猴子和人類識別一些“有挑戰(zhàn)性的”圖片,結(jié)果靈長類動物可以很輕易地識別物體,但是前饋 DCNN 就不行。但是,當(dāng)他們將合適的循環(huán)處理加入到這些 DCNN 中后,上述物體的識別突然變得輕而易舉了。
Kar 采用了空間和時間精度極高的神經(jīng)記錄方法,來確定這些圖片的處理對靈長類動物來說,是否真的如此瑣碎。值得注意的是,他們發(fā)現(xiàn),雖然對人類大腦來說,高難度圖片的識別似乎很簡單,但是它們實(shí)際上涉及到了額外的神經(jīng)處理時間(大概是 30 毫秒),這表明循環(huán)在我們的大腦中也存在。
“計算機(jī)視覺界最近在人工神經(jīng)網(wǎng)絡(luò)上成功堆疊了越來越多的層次,并且具有循環(huán)連接的大腦結(jié)構(gòu)也已經(jīng)出現(xiàn)?!盞ar 說。
心理學(xué)教授、貝克曼研究所智能系統(tǒng)主題的聯(lián)合主席、非本研究作者 Diane Beck 進(jìn)一步解釋道:“由于完全前饋的深度卷積神經(jīng)系統(tǒng)現(xiàn)在非常擅長預(yù)測靈長類動物的大腦活動,這引起了人們對于反饋連接在靈長類大腦中所起到的作用的疑問。這項研究表明,反饋連接很可能在物體識別中發(fā)揮作用。”
“這對自動駕駛汽車意味著什么呢?研究表明,假如深度學(xué)習(xí)想要類比靈長類大腦,那么深度學(xué)習(xí)中物體識別所涉及的結(jié)構(gòu)就需要循環(huán)組件,并且研究指出如何在下一代智能機(jī)器中使用這一程序?!?/p>
“隨著時間的變化,循環(huán)模型提供了對神經(jīng)活動和行為的預(yù)測,”Kar 說。“我們現(xiàn)在可以模擬更復(fù)雜的任務(wù)。也許有一天,這個系統(tǒng)不僅可以識別物體,比如人,還可以執(zhí)行人類大腦能夠輕松進(jìn)行的認(rèn)知任務(wù),比如體會他人的情緒?!?/p>
-
AI
+關(guān)注
關(guān)注
87文章
29862瀏覽量
268157 -
MIT
+關(guān)注
關(guān)注
3文章
253瀏覽量
23350
原文標(biāo)題:MIT最新研究:加上“反饋”,AI算法可以看得更清楚
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論