(文章來(lái)源:網(wǎng)絡(luò)整理)
在一篇預(yù)印的論文中,微軟的研究人員描述了一個(gè)機(jī)器學(xué)習(xí)系統(tǒng),該系統(tǒng)可以從照相機(jī)圖像中推理出正確的動(dòng)作。 它通過(guò)模擬訓(xùn)練,學(xué)會(huì)在真實(shí)世界中獨(dú)立駕馭環(huán)境和條件,包括看不見(jiàn)的情況,這使得它非常適合部署在搜索和救援任務(wù)中的機(jī)器人。 有朝一日,它可以幫助這些機(jī)器人更快地識(shí)別需要幫助的人。
研究人員在本周發(fā)表的一篇博文中寫(xiě)道: “我們希望推動(dòng)當(dāng)前的技術(shù),使其更接近于人類,擁有暗示、適應(yīng)困難條件和自主操作的能力?!薄?“我們有興趣探索這樣一個(gè)問(wèn)題: 如何才能構(gòu)建出性能水平相當(dāng)?shù)淖詣?dòng)化系統(tǒng)?!眻F(tuán)隊(duì)的框架明確地將感知組件(即,使它所看到的有意義)與控制策略(根據(jù)它所看到的決定做什么)分離開(kāi)來(lái)。 它受到人類大腦的啟發(fā),將視覺(jué)信息直接映射到正確的控制動(dòng)作上,即通過(guò)將高維視頻幀序列轉(zhuǎn)換為低維表示來(lái)概括世界的狀態(tài)。 根據(jù)研究人員的說(shuō)法,這種兩階段的方法使模型更容易解釋和調(diào)試。
研究小組將他們的框架應(yīng)用到一個(gè)帶有前置攝像頭的小型四軸飛行器上,試圖“教”人工智能一種策略,即只用攝像頭拍攝的圖像在賽車場(chǎng)上導(dǎo)航。 他們使用一種叫做 AirSim 的高保真模擬器對(duì)人工智能進(jìn)行模擬訓(xùn)練,之后他們不加修改地將人工智能部署到一架真實(shí)的無(wú)人機(jī)上,使用一種叫做跨模態(tài)變分自動(dòng)編碼器(CM-VAE)的框架來(lái)生成密切連接模擬與現(xiàn)實(shí)差距的表示。
該系統(tǒng)的感知模塊將輸入圖像壓縮到上述低維表示中,從27,648個(gè)變量減少到最基本的10個(gè)變量。 解碼后的圖像描述了無(wú)人機(jī)可以看到的前景,包括所有可能的大小和位置,以及不同的背景信息。研究人員在一個(gè)45米長(zhǎng)的 s 形軌道上測(cè)試了他們的系統(tǒng)的性能,這個(gè) s 形軌道帶有閘門,40米長(zhǎng)的圓形軌道帶有一組不同的閘門。 他們說(shuō)使用 CM-VAE 的策略明顯優(yōu)于端到端策略和直接編碼下一個(gè)門的位置的 AI。 盡管背景條件“強(qiáng)烈”的視覺(jué)干擾,無(wú)人機(jī)還是通過(guò)使用跨模態(tài)感知模塊完成了課程。
研究結(jié)果顯示了該系統(tǒng)在現(xiàn)實(shí)世界中幫助人類的“巨大潛力”。 例如,這個(gè)系統(tǒng)可以幫助一個(gè)自主搜救機(jī)器人更好地識(shí)別人類,不管他們的年齡、體型、性別和種族有多大差異,這樣機(jī)器人就有更好的機(jī)會(huì)識(shí)別和找到需要幫助的人。研究人員寫(xiě)道: “通過(guò)將感知-動(dòng)作循環(huán)分成兩個(gè)模塊,并將多種數(shù)據(jù)模式納入感知訓(xùn)練階段,我們可以避免將我們的網(wǎng)絡(luò)過(guò)度適應(yīng)于傳入數(shù)據(jù)的非相關(guān)特征?!?。 例如,即使在模擬實(shí)驗(yàn)和物理實(shí)驗(yàn)中,方形閘門的大小是相同的,但它們的寬度、顏色,甚至內(nèi)在的攝像機(jī)參數(shù)都不完全匹配
這項(xiàng)研究是在微軟發(fā)起的無(wú)人機(jī)游戲挑戰(zhàn)之后進(jìn)行的,該游戲在 AirSim 模擬中讓四翼直升機(jī)競(jìng)賽人工智能系統(tǒng)互相競(jìng)爭(zhēng)。
(責(zé)任編輯:fqj)
-
微軟
+關(guān)注
關(guān)注
4文章
6554瀏覽量
103896 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8349瀏覽量
132315
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論