過(guò)去幾十年來(lái),擁有自我意識(shí)的機(jī)器人一直是科幻小說(shuō)最喜歡的題材之一,現(xiàn)在,這個(gè)過(guò)去只存在于科幻小說(shuō)中的事物離我們?cè)絹?lái)越近了。
哥倫比亞大學(xué)工程學(xué)專(zhuān)業(yè)的研究人員打造了一種“從零開(kāi)始”認(rèn)識(shí)自己的機(jī)器人,這個(gè)機(jī)器人在物理學(xué)、幾何學(xué)或運(yùn)動(dòng)動(dòng)力學(xué)方面沒(méi)有先驗(yàn)知識(shí),甚至并不知道自己長(zhǎng)什么樣子。然而,在經(jīng)過(guò)35個(gè)小時(shí)的“初步學(xué)習(xí)”之后,機(jī)器人創(chuàng)建了一套自我模擬。然后利用自模擬器來(lái)考慮和適應(yīng)不同的情況,處理新任務(wù),甚至能檢測(cè)并修復(fù)機(jī)體損傷,繼續(xù)處理任務(wù)。
成功率100%,堪比人類(lèi)閉眼睛拿一杯水
雖然人類(lèi)和動(dòng)物都可以通過(guò)思考來(lái)進(jìn)行自我調(diào)節(jié),但目前對(duì)大多數(shù)機(jī)器人來(lái)說(shuō),仍在學(xué)習(xí)使用人類(lèi)提供的模擬器和模型,或者通過(guò)費(fèi)力耗時(shí)的試驗(yàn)來(lái)糾正錯(cuò)誤。機(jī)器人還沒(méi)有學(xué)會(huì)像人類(lèi)那樣模擬自己。
哥倫比亞大學(xué)機(jī)械工程學(xué)教授、創(chuàng)意機(jī)器實(shí)驗(yàn)室主任Hod Lipson和他的博士生讓一個(gè)四自由度的鉸接式機(jī)械臂能夠思考,具體過(guò)程如下:
最初,機(jī)器人會(huì)進(jìn)行隨機(jī)移動(dòng),收集大約1000個(gè)移動(dòng)軌跡,每個(gè)軌跡中包括100個(gè)點(diǎn)。然后利用深度學(xué)習(xí),來(lái)創(chuàng)建一個(gè)自我模型。
不過(guò),創(chuàng)建出的第一個(gè)模型是非常不準(zhǔn)確的,機(jī)器人并不知道自己是什么,也不知道自己的關(guān)節(jié)是如何連接的。但經(jīng)過(guò)不到35小時(shí)的訓(xùn)練,自我模型已經(jīng)和機(jī)器人的真實(shí)情況高度相符。
這個(gè)模型會(huì)在閉環(huán)系統(tǒng)中執(zhí)行“拾取和放置”任務(wù),使機(jī)器人能夠完全基于內(nèi)部自我模型,在移動(dòng)軌跡的每一步上相對(duì)原始位置進(jìn)行重新校準(zhǔn)。通過(guò)閉環(huán)控制,機(jī)器人能夠抓取地面上特定位置的物體,并將它們放入指定容器中,成功率高達(dá)100%。
即使在開(kāi)環(huán)系統(tǒng)中,機(jī)器人也是完全基于內(nèi)部自我模型來(lái)執(zhí)行任務(wù),沒(méi)有任何外部反饋,機(jī)器人完成拾取任務(wù)的成功率為44%。
看上去很簡(jiǎn)單,但機(jī)器臂跟流水線上的機(jī)器臂不同,后者是設(shè)定好的固定程序,而前者完全是自主學(xué)習(xí)。
檢測(cè)自我損傷,再次模擬自我
這個(gè)機(jī)器人的強(qiáng)大之處還在于,它可以檢測(cè)到自身的損傷。
研究人員利用3D打印打造了一個(gè)變形的部件(下圖紅色部件)來(lái)模擬機(jī)體損傷,結(jié)果機(jī)器人能夠檢測(cè)到這一變化,并重新訓(xùn)練自我模型。新模型能夠以很少的性能損失為代價(jià),重新成功執(zhí)行拾取和放置任務(wù)。
此外,自我建模機(jī)器人還可以用于完成其他任務(wù),比如使用標(biāo)記筆書(shū)寫(xiě)文本。未來(lái),可能會(huì)自己寫(xiě)對(duì)聯(lián)?
Hod Lipson說(shuō),迄今為止,機(jī)器人需要通過(guò)人類(lèi)明確地模擬指令來(lái)實(shí)現(xiàn)操作。 “但是,如果我們希望機(jī)器人能夠獨(dú)立、快速適應(yīng)無(wú)法預(yù)見(jiàn)的情景,那么它們就必須學(xué)會(huì)模擬自我。”
無(wú)模型可擴(kuò)展的第一步
自建模(self-modeling)并非新技術(shù),很多機(jī)器人系統(tǒng)都采用端到端訓(xùn)練的方式,在完全無(wú)模型的情況下學(xué)會(huì)一項(xiàng)任務(wù)。但是,通過(guò)這種方式學(xué)會(huì)的任務(wù),往往無(wú)法擴(kuò)展,也即機(jī)器人只能完成被訓(xùn)練好的那一項(xiàng)任務(wù)。
因此,如何實(shí)現(xiàn)無(wú)模型的擴(kuò)展,即通用端到端,就成了一個(gè)需要被解決的問(wèn)題。
考慮到這臺(tái)機(jī)器人本身(從設(shè)計(jì)上)是可以用來(lái)完成多項(xiàng)任務(wù)的,研究人員便想,何不從中抽象出一個(gè)的“自我模型”(self-model),然后以此為基礎(chǔ),讓機(jī)器人學(xué)習(xí)各種新的任務(wù),在此過(guò)程中不斷調(diào)整原有的自我模型。這樣一來(lái),不就能夠?qū)崿F(xiàn)持續(xù)的自監(jiān)督學(xué)習(xí)了嗎?
于是,他們讓機(jī)器人(或者準(zhǔn)確說(shuō),機(jī)械臂)自行隨機(jī)運(yùn)轉(zhuǎn),就像嬰兒自己亂動(dòng)手腳一樣,得到的數(shù)據(jù)集用于訓(xùn)練一個(gè)專(zhuān)門(mén)設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò),也即生成一個(gè)原始的“自我模型”。
接下來(lái),機(jī)器人使用自我模型,開(kāi)始完成不同的任務(wù)(上圖步驟3),即“抓取并放置”(Pick-and-place)和“寫(xiě)字”(Handwriting)。無(wú)論從機(jī)械臂運(yùn)行的軌跡和下手輕重,這都是兩個(gè)完全不同的任務(wù)。
作者解釋說(shuō),閉環(huán)控制讓機(jī)器人能通過(guò)從位置傳感器接收到的反饋重新校準(zhǔn)沿軌跡上每個(gè)步驟的實(shí)際位置。相比之下,開(kāi)環(huán)控制則完全基于內(nèi)部的自我模型,沒(méi)有任何外部反饋。
由上圖可見(jiàn),從“抓取并放置”改為“寫(xiě)字”時(shí),機(jī)器人發(fā)現(xiàn)前后不一致,為了模擬全新的任務(wù),形態(tài)發(fā)生了突然改變(上圖步驟4),并使用新數(shù)據(jù)更新了最初的自我模型(步驟5)。更新自我模型后,機(jī)器人迅速轉(zhuǎn)變狀態(tài),開(kāi)始繼續(xù)執(zhí)行“寫(xiě)字”任務(wù)。
作者特別強(qiáng)調(diào),他們提出的這種新方法能夠讓機(jī)器人自動(dòng)完成多兩種不同的任務(wù),并且不需要進(jìn)行額外的物理實(shí)驗(yàn)。從某種意義上說(shuō),做到了“無(wú)模型可擴(kuò)展的第一步”。
突破狹義AI,邁向自我意識(shí)機(jī)器的重要一步
Lipson教授同時(shí)也是哥倫比亞大學(xué)數(shù)據(jù)科學(xué)研究所的一員,他的研究傳播最廣的應(yīng)該屬2007年的TED演講,當(dāng)時(shí)也展示了自我感知機(jī)器人。
Lipson指出,對(duì)自我的想象,是讓機(jī)器人突破所謂的“狹義AI”的限制,具備更普遍的能力的關(guān)鍵。
“機(jī)器人會(huì)逐步認(rèn)識(shí)自我,這可能和新生兒在嬰兒床上所做的事情差不多?!彼f(shuō),“我們猜測(cè),這種優(yōu)勢(shì)也可能是人類(lèi)自我意識(shí)的進(jìn)化起源。雖然我們的機(jī)器人這種能力與人類(lèi)相比仍然很粗糙,但我們相信,這種能力正在為具備自我意識(shí)的機(jī)器的誕生鋪平道路。”
Lipson認(rèn)為,機(jī)器人和人工智能可以為我們理解這個(gè)古老的意識(shí)之謎提供一個(gè)新的窗口。
“幾千年以來(lái),哲學(xué)家、心理學(xué)家和認(rèn)知科學(xué)家一直在思考自然意識(shí)的問(wèn)題,但一直進(jìn)展不大。我們現(xiàn)在仍然在使用'現(xiàn)實(shí)畫(huà)布'之類(lèi)的主觀詞匯,來(lái)掩蓋我們對(duì)這個(gè)問(wèn)題理解不足的現(xiàn)實(shí),但現(xiàn)在機(jī)器人技術(shù)的發(fā)展,迫使我們將這些模糊的概念轉(zhuǎn)化為具體的算法和機(jī)制?!?/p>
Lipson教授
不過(guò),Lipson教授和Kwiatkowski博士也認(rèn)識(shí)到這其中可能帶來(lái)的道德問(wèn)題。他們警告說(shuō):“自我意識(shí)將導(dǎo)致彈性和適應(yīng)性更高的系統(tǒng),但也意味著失控的可能性更大了。這確實(shí)是一項(xiàng)強(qiáng)大的技術(shù),但我們應(yīng)謹(jǐn)慎行事?!?/p>
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
28109瀏覽量
205863 -
人工智能
+關(guān)注
關(guān)注
1791文章
46671瀏覽量
237118
原文標(biāo)題:機(jī)器人真的有意識(shí)了!突破狹義AI的自我學(xué)習(xí)機(jī)器人問(wèn)世
文章出處:【微信號(hào):htyunwang,微信公眾號(hào):工業(yè)互聯(lián)網(wǎng)觀察】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論