據(jù)悉,谷歌希望通過發(fā)布人工智能學(xué)習(xí)模型機(jī)器人轉(zhuǎn)換器(Robotic Transformer,RT-2)使其機(jī)器人更智能。
RT-2是該公司所稱的視覺語言動作(VLA)模型的新版本。該模型教導(dǎo)機(jī)器人更好地識別視覺和語言模式,以解釋指令并推斷哪些對象最適合請求。
研究人員在廚房辦公室的環(huán)境中用機(jī)械臂測試了RT-2。結(jié)合思維鏈推理,RT-2可以執(zhí)行多階段語義推理。即便是一些抽象概念,RT-2也能理解并指揮機(jī)械臂做出正確的動作。比如讓它找一把臨時用的簡易錘子,它會抓起石頭;讓它給疲憊的人選一款飲料,它會選擇紅牛;讓它把可樂罐移到泰勒·斯威夫特的照片上,它也能順利完成。
該公司在一篇論文中表示,新模型基于網(wǎng)絡(luò)和機(jī)器人數(shù)據(jù)進(jìn)行訓(xùn)練,利用谷歌自己的Bard等大型語言模型的研究進(jìn)展,并將其與機(jī)器人數(shù)據(jù)(如移動哪些關(guān)節(jié))相結(jié)合。它還可以理解除英語以外的其他語言的指示。
多年來,研究人員一直試圖給機(jī)器人灌輸更好的推理能力,以解決如何在現(xiàn)實生活中生存的問題。The Verge的James Vincent指出,現(xiàn)實生活中存在著無法妥協(xié)的“混亂”。機(jī)器人需要更多的指導(dǎo)來為人類做一些簡單的事情。
以前,教機(jī)器人需要很長時間。研究人員必須單獨(dú)規(guī)劃方向。但有了RT-2等VLA模型的強(qiáng)大功能,機(jī)器人可以通過訪問更大的信息集來判斷下一步該做什么。
谷歌首次進(jìn)軍智能機(jī)器人始于去年,當(dāng)時谷歌宣布將在機(jī)器人領(lǐng)域使用其LLM-PaLM,創(chuàng)建了名為PaLM-SayCan的系統(tǒng),將LLM與物理機(jī)器人相集成。
責(zé)任編輯:彭菁
-
轉(zhuǎn)換器
+關(guān)注
關(guān)注
27文章
8601瀏覽量
146711 -
機(jī)器人
+關(guān)注
關(guān)注
210文章
28103瀏覽量
205852 -
谷歌
+關(guān)注
關(guān)注
27文章
6128瀏覽量
104948 -
人工智能
+關(guān)注
關(guān)注
1789文章
46652瀏覽量
237090 -
模型
+關(guān)注
關(guān)注
1文章
3112瀏覽量
48660
原文標(biāo)題:谷歌正在像訓(xùn)練人工智能聊天機(jī)器人一樣訓(xùn)練機(jī)器人
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論