選擇分輕重,更分難易。簡單選擇只需根據(jù)目標(biāo)做出判斷,但對于兩難選擇來說,則是一種更復(fù)雜的思考和抉擇。同時(shí),兩難選擇,也是生活的必經(jīng)之路,是生物所具有的本能。探究生物在兩難選擇里的大腦機(jī)制,將為人工智能的學(xué)習(xí)提供研究的進(jìn)路。
近日,中國科學(xué)院自動(dòng)化研究所類腦智能研究中心的研究人員就借鑒果蠅腦自主決策的神經(jīng)機(jī)制,提出了類果蠅決策的脈沖神經(jīng)網(wǎng)絡(luò)模型,模型能夠?qū)崿F(xiàn)趨利避害的行為,并在兩難抉擇下快速做出清晰的選擇。在無人機(jī)強(qiáng)化學(xué)習(xí)、反轉(zhuǎn)學(xué)習(xí)和多難決策的任務(wù)上均得到了有效地驗(yàn)證。
具體來說,果蠅進(jìn)行抉擇存在基于經(jīng)驗(yàn)的線性抉擇和非經(jīng)驗(yàn)的非線性抉擇兩大通路。在面臨抉擇任務(wù)時(shí),果蠅會自適應(yīng)地選擇合適的通路進(jìn)行不同復(fù)雜度的抉擇。
此前研究中,研究人員曾令果蠅學(xué)會喜歡綠色正T的圖案,而藍(lán)色倒T的圖案伴隨熱刺激懲罰。在選擇階段,轉(zhuǎn)換了懲罰與視覺線索的搭配,讓果蠅在綠色倒T和藍(lán)色正T之間進(jìn)行選擇,以此測試果蠅在沖突視覺線索下的兩難抉擇行為。
實(shí)驗(yàn)發(fā)現(xiàn),在不同的顏色強(qiáng)度下,通過統(tǒng)計(jì)果蠅在飛行過程中??吭诿總€(gè)圖案面前的時(shí)間分布,來了解果蠅連續(xù)的抉擇行為,最終會得到一條呈“S”型的抉擇曲線。
通過單細(xì)胞測序發(fā)現(xiàn)支持兩難抉擇下非線性曲線的神經(jīng)機(jī)制是由多巴胺能神經(jīng)元- GABA能神經(jīng)元-蘑菇體環(huán)路負(fù)責(zé)的“增益-門控”抉擇機(jī)制,這是一條基于價(jià)值的非線性抉擇通路。而蘑菇體受損的果蠅只能執(zhí)行簡單的感知抉擇,得到線性的抉擇曲線。
在此次研究中,研究人員基于果蠅簡單感知抉擇(線性通路)和價(jià)值抉擇(非線性通路)的神經(jīng)機(jī)制,使用脈沖神經(jīng)網(wǎng)絡(luò)來構(gòu)建多腦區(qū)協(xié)同的抉擇模型。其中,線性通路建模了中央復(fù)合體的記憶功能來做出快速的抉擇。非線性通路模擬了DA-GABA-MB環(huán)路實(shí)現(xiàn)增益-門控機(jī)制。
隨后,將類果蠅抉擇的脈沖神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到無人機(jī)抉擇任務(wù)上,使用小拳頭打擊無人機(jī)來模擬懲罰信號,無人機(jī)可以學(xué)會飛向安全的視覺圖形,并對視覺圖形所包含的線索具有趨利避害的行為。此外,無人機(jī)能夠靈活地適應(yīng)任務(wù)的反轉(zhuǎn),僅經(jīng)過4次錯(cuò)誤選擇就可以學(xué)會反轉(zhuǎn)后的規(guī)則。
人工智能趨近人類智能是其未來所趨,不僅僅是在對確定目標(biāo)的問題(有限游戲)上,更是在自我進(jìn)化能力和對生物直覺的模仿上,在享受著人工智能帶來的便捷時(shí),也有更多的關(guān)涉投向人與智能的關(guān)系。為機(jī)器立心,將成為人工智能時(shí)代下一個(gè)不可回避的問題。
責(zé)任編輯:PSY
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4734瀏覽量
100420 -
人工智能
+關(guān)注
關(guān)注
1791文章
46671瀏覽量
237118 -
無人機(jī)
+關(guān)注
關(guān)注
226文章
10304瀏覽量
179166
發(fā)布評論請先 登錄
相關(guān)推薦
評論