0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

UC伯克利新機(jī)器人成果:靈活自由地使用工具

jmiy_worldofai ? 來(lái)源:YXQ ? 2019-04-15 09:03 ? 次閱讀

之前我們剛剛介紹了加州大學(xué)伯克利分校 Pieter Abbeel 教授領(lǐng)導(dǎo)伯克利機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室(UC Berkeley's Robot Learning Lab)開(kāi)發(fā)的會(huì)疊衣服的家務(wù)向機(jī)器人 BLUE,今天伯克利人工智能實(shí)驗(yàn)室(BAIR)這邊也帶來(lái)了一項(xiàng)新的機(jī)器人科研成果——教會(huì)機(jī)器人使用工具完成任務(wù)。這篇論文的作者之一是知名青年機(jī)器學(xué)習(xí)研究員、谷歌大腦研究科學(xué)家ChelseaFinn,她目前正在BAIR做博士后。論文成果的介紹博客編譯如下。

一個(gè)有難度的目標(biāo):學(xué)習(xí)使用工具

在許多動(dòng)物身上,使用工具的能力都來(lái)自于觀察學(xué)習(xí)和動(dòng)手嘗試兩者的共同作用。比如,大猩猩可以通過(guò)觀察自己已經(jīng)掌握了技能的同伴學(xué)會(huì)如何用樹(shù)枝從白蟻窩里“釣”白蟻吃,人類(lèi)也觀察到卷尾猴能夠把樹(shù)枝作為掃和撥的工具,把較遠(yuǎn)的食物弄到他們身邊。有人也許會(huì)提出這只不過(guò)是猴子們依葫蘆畫(huà)瓢,但這篇論文的作者們認(rèn)為使用工具的能力顯然體現(xiàn)了更為高級(jí)的智慧。

大猩猩釣白蟻

在這項(xiàng)新研究中作者們探索的問(wèn)題是:我們能否讓機(jī)器人也擁有相似的使用工具的能力——通過(guò)觀察和自己動(dòng)手實(shí)驗(yàn)學(xué)會(huì)使用工具。

在執(zhí)行復(fù)雜的多物體控制任務(wù)時(shí),有一項(xiàng)必須的要素是理解物理層面的因果關(guān)系,所以預(yù)測(cè)不同的物體之間會(huì)如何相互作用就非常關(guān)鍵。在之前的視覺(jué)深度強(qiáng)化學(xué)習(xí)研究(https://arxiv.org/abs/1812.00568)中,作者們已經(jīng)探究了如何在機(jī)器人與世界的無(wú)監(jiān)督交互過(guò)程中學(xué)習(xí)包含因果關(guān)系的視覺(jué)預(yù)測(cè)模型。在學(xué)習(xí)到這樣的模型之后,機(jī)器人就可以開(kāi)始規(guī)劃并完成一系列簡(jiǎn)單的任務(wù),包括疊衣服、整理物品。不過(guò),如果考慮到使用工具的任務(wù)中更為復(fù)雜的物理交互,比如用掃帚把塵土掃進(jìn)簸箕里,非指向性的動(dòng)手實(shí)驗(yàn)就不夠了。

因此,考慮到動(dòng)物們是如何學(xué)習(xí)的,作者們?cè)O(shè)計(jì)了一個(gè)新的算法,它可以讓機(jī)器人通過(guò)類(lèi)似的模仿、互動(dòng)的范式學(xué)習(xí)如何使用工具。具體來(lái)說(shuō)作者們展示了,借助一組演示數(shù)據(jù)以及無(wú)監(jiān)督的動(dòng)手實(shí)驗(yàn),機(jī)器人可以學(xué)會(huì)把新的物體作為工具使用,甚至可以在傳統(tǒng)工具缺失的情況下靈活使用現(xiàn)有的工具完成任務(wù)。更進(jìn)一步地,根據(jù)任務(wù)要求的不同,作者們的方法還讓機(jī)器人有能力決定是否使用當(dāng)前給定的工具。


作者們提出的方法讓機(jī)器人有能力學(xué)習(xí)如何把不同的物體當(dāng)作工具以完成用戶給定的任務(wù)(第一行圖中用黃色箭頭標(biāo)出)。任務(wù)中并沒(méi)有指定機(jī)器人必須使用給定的工具,但機(jī)器人決定使用它們。

在指導(dǎo)中學(xué)習(xí)視覺(jué)預(yù)測(cè)

從演示中學(xué)習(xí)

首先,作者們需要使用一個(gè)演示動(dòng)作數(shù)據(jù)集,其中展示了各種不同的工具是如何使用的。由于最終的目標(biāo)是希望學(xué)習(xí)到一個(gè)具有多種多樣的工具使用能力的模型,作者們采集的演示動(dòng)作數(shù)據(jù)也就包含了多種不同的工具和多種不同的任務(wù)。對(duì)于每一個(gè)演示,作者們都讓機(jī)器人自己的攝像頭錄制了圖像序列和動(dòng)作指令。

幾個(gè)引導(dǎo)運(yùn)動(dòng)的例子

通過(guò)這些數(shù)據(jù),作者們得到了一個(gè)模型,它可以提出把當(dāng)前場(chǎng)景內(nèi)存在的物體作為工具的運(yùn)動(dòng)序列。并且,為了能夠從演示中捕捉更為豐富的行為,這個(gè)模型的輸出形式是不同動(dòng)作序列的分布。

為視覺(jué)預(yù)測(cè)模型的學(xué)習(xí)收集無(wú)監(jiān)督數(shù)據(jù)

由于作者們希望機(jī)器人的行為不要局限于演示數(shù)據(jù)中出現(xiàn)的那些動(dòng)作,并最終泛化到新的物體和新的情境中,他們就還需要很多不同的數(shù)據(jù)。最理想的來(lái)源當(dāng)然是由機(jī)器人自己采集,而且是通過(guò)大規(guī)模可拓展的方式。比如,作者們希望機(jī)器人能夠理解抓取姿態(tài)不好之類(lèi)的小錯(cuò)誤對(duì)后續(xù)的動(dòng)作會(huì)有什么影響,所以他們就讓機(jī)器人從現(xiàn)有的經(jīng)驗(yàn)基礎(chǔ)上繼續(xù)動(dòng)手實(shí)驗(yàn)、繼續(xù)收集更多的數(shù)據(jù)。

具體來(lái)說(shuō),論文作者們?cè)O(shè)計(jì)了兩種不同的數(shù)據(jù)自動(dòng)采集方式:一種方式是執(zhí)行隨機(jī)的動(dòng)作序列,另一種是從上一節(jié)中提到的動(dòng)作序列提出模型中采樣。后一種方式中,機(jī)器人可以把工具拿起來(lái)然后在空間中隨機(jī)移動(dòng)它。對(duì)于學(xué)習(xí)多物體的交互方式來(lái)說(shuō),在這一環(huán)節(jié)中學(xué)習(xí)到的經(jīng)驗(yàn)非常重要。

根據(jù)日常物體和工具進(jìn)行無(wú)監(jiān)督交互學(xué)習(xí)

最終,作者們使用的數(shù)據(jù)集一共由這幾部分構(gòu)成:專(zhuān)家演示、機(jī)器人使用多種不同工具的無(wú)監(jiān)督實(shí)驗(yàn)、以及BAIR機(jī)器人交互數(shù)據(jù)集中的數(shù)據(jù)。作者們用這些數(shù)據(jù)訓(xùn)練了一個(gè)動(dòng)態(tài)模型。模型的實(shí)現(xiàn)方式是循環(huán)卷積神經(jīng)網(wǎng)絡(luò),它在每個(gè)時(shí)間步驟的輸入是前一副圖像和一個(gè)動(dòng)作,輸出是一副生成的圖像。

在指導(dǎo)中學(xué)習(xí)規(guī)劃

在測(cè)試時(shí),機(jī)器人可以使用模仿學(xué)習(xí)訓(xùn)練的模型來(lái)指導(dǎo)規(guī)劃過(guò)程,然后用預(yù)測(cè)模型來(lái)覺(jué)得哪些動(dòng)作可以讓它完成目前的任務(wù)。

新任務(wù)的創(chuàng)建需要用戶給定關(guān)鍵點(diǎn)的移動(dòng)。比如下圖中,我們希望機(jī)器人把地上的垃圾掃到簸箕中,就在圖中選中垃圾的中心點(diǎn),然后畫(huà)出希望的最終位置。用這種方式指定任務(wù)并不會(huì)告訴機(jī)器人如何使用工具,在有多種工具可以選的環(huán)境下甚至都沒(méi)有指明要用哪一種工具,機(jī)器人需要自己思考并規(guī)劃。

作者們使用了一個(gè)簡(jiǎn)單的基于采樣的規(guī)劃過(guò)程,它會(huì)使用動(dòng)作提議模型和圖像預(yù)測(cè)模型的輸出,并讓機(jī)器人有能力用多種不同的工具和物品完成多種不同的任務(wù)。具體來(lái)說(shuō),動(dòng)作序列最初是從隨機(jī)采樣的,然后,根據(jù)圖像預(yù)測(cè)模型可以預(yù)測(cè)出每一種動(dòng)作序列規(guī)劃的結(jié)果。

同一個(gè)初始場(chǎng)景中,針對(duì)不同動(dòng)作序列的預(yù)測(cè)結(jié)果

通過(guò)選出當(dāng)前最佳的規(guī)劃并根據(jù)它生成一個(gè)分布,系統(tǒng)可以進(jìn)行反復(fù)的迭代采樣,在當(dāng)前最佳的規(guī)劃的基礎(chǔ)上一直優(yōu)化改進(jìn),最后在機(jī)器人上執(zhí)行。

系統(tǒng)運(yùn)行框圖

實(shí)驗(yàn)

作者們對(duì)這種方法進(jìn)行了實(shí)驗(yàn),讓它使用新的工具執(zhí)行用戶設(shè)定的目標(biāo)。

從左到右:初始場(chǎng)景和任務(wù)目標(biāo);根據(jù)最佳運(yùn)動(dòng)規(guī)劃的預(yù)測(cè)結(jié)果;機(jī)器人的實(shí)際執(zhí)行結(jié)果

在前面提到過(guò)的清掃任務(wù)中,機(jī)器人可以抓起附近的掃帚,高效地完成任務(wù)。

在另一個(gè)場(chǎng)景中,雖然機(jī)器人從未見(jiàn)過(guò)海綿,但它能夠思考如何用它把盤(pán)子中的碎渣掃走。

在下面的例子中,作者們?cè)O(shè)定只允許機(jī)器人在綠色陰影范圍內(nèi)移動(dòng),目標(biāo)是把藍(lán)色圓柱體向自己的方向移動(dòng)。顯然,這個(gè)任務(wù)的關(guān)鍵就是機(jī)器人想到了如何使用L型的木塊把圓柱體鉤過(guò)來(lái)。

以及,即便只給機(jī)器人提供礦泉水瓶之類(lèi)的日常物體,它也能推理出如何把它作為工具完成任務(wù)。

最后,在最好不使用工具的環(huán)境中,機(jī)器人也會(huì)選擇直接用自己的夾鉗完成任務(wù)。

左:任務(wù)目標(biāo)是把兩個(gè)物體都移向左邊,機(jī)器人選擇用工具高效地完成;右:任務(wù)目標(biāo)只需移動(dòng)一個(gè)物體,機(jī)器人用自己的夾鉗把它移過(guò)去

除了這些例子之外,論文中的量化實(shí)驗(yàn)結(jié)果表明他們的方法比單獨(dú)使用從演示學(xué)習(xí)有更好的泛化通用性,也比單獨(dú)從經(jīng)驗(yàn)學(xué)習(xí)有更強(qiáng)的完成任務(wù)能力。

關(guān)于其他機(jī)器人使用工具研究的對(duì)比討論

論文《A Relational Approach to Tool-Use Learning in Robots》研究了如何在任務(wù)和運(yùn)動(dòng)規(guī)劃框架下通過(guò)邏輯編程和已知模型控制工具。然而,基于邏輯的系統(tǒng)和基于解析模型的系統(tǒng)都容易受到建模誤差的影響,這會(huì)在測(cè)試執(zhí)行時(shí)累積并影響表現(xiàn)。

其它的研究中把工具看作了面向任務(wù)的抓取動(dòng)作控制,并根據(jù)規(guī)劃或者策略學(xué)習(xí)來(lái)使用工具。這些方法都限制了涉及到工具的運(yùn)用的范圍,而這篇論文中的方法不論場(chǎng)景中有沒(méi)有工具都可以完成運(yùn)動(dòng)規(guī)劃。

也有一些別的方法(1,2)提出在使用工具中學(xué)習(xí)動(dòng)態(tài)模型。然而,這些方法需要額外使用手工設(shè)計(jì)的感知流水線,或者完全忽略感知,這篇論文中的方法就可以直接從原始圖像像素中學(xué)習(xí)物體間的交互。

結(jié)論

會(huì)出現(xiàn)從未見(jiàn)過(guò)的物體的多樣、復(fù)雜任務(wù)是機(jī)器人領(lǐng)域正在嘗試攻克的問(wèn)題。為了研究這個(gè)問(wèn)題,這篇論文的作者們研究了需要把物體作為工具的多種任務(wù)。作者們提出了結(jié)合模仿學(xué)習(xí)和自我監(jiān)督交互學(xué)習(xí)的新方法,并展示了這種方法可以讓機(jī)器人完成復(fù)雜的多物體交互任務(wù),其中可以含有多種多樣的物體,甚至可以在新的環(huán)境中靈活運(yùn)用物體作為工具。作者們希望這項(xiàng)研究展示了讓機(jī)器人同時(shí)變得更通用和更能干的新方法,以便未來(lái)機(jī)器人可以在日常生活環(huán)境中執(zhí)行有用的任務(wù)。

論文原文:

《ImprovisationthroughPhysicalUnderstanding:UsingNovelObjectsasToolswithVisualForesight》

論文地址:https://arxiv.org/abs/1904.05538

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27838

    瀏覽量

    204582
  • UC
    UC
    +關(guān)注

    關(guān)注

    1

    文章

    57

    瀏覽量

    60805
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Al大模型機(jī)器人

    豐富的知識(shí)儲(chǔ)備。它們可以涵蓋各種領(lǐng)域的知識(shí),并能夠回答相關(guān)問(wèn)題。靈活性與通用性: AI大模型機(jī)器人具有很強(qiáng)的靈活性和通用性,能夠處理各種類(lèi)型的任務(wù)和問(wèn)題。持續(xù)學(xué)習(xí)和改進(jìn): 這些模型可以通過(guò)持續(xù)的訓(xùn)練
    發(fā)表于 07-05 08:52

    abb工業(yè)機(jī)器人的編程語(yǔ)言是什么

    編程而設(shè)計(jì)。RAPID語(yǔ)言具有易學(xué)易用、功能強(qiáng)大、靈活性高等特點(diǎn),廣泛應(yīng)用于ABB工業(yè)機(jī)器人的編程和應(yīng)用開(kāi)發(fā)。 ABB工業(yè)機(jī)器人編程語(yǔ)言RAPID概述 RAPID語(yǔ)言簡(jiǎn)介 RAPID是一種專(zhuān)門(mén)為工業(yè)
    的頭像 發(fā)表于 06-16 16:49 ?1669次閱讀

    基于FPGA EtherCAT的六自由機(jī)器人視覺(jué)伺服控制設(shè)計(jì)

    和增強(qiáng)系統(tǒng)處理圖像的實(shí)時(shí)性,本文提出了一種伊瑟特的六自由機(jī)器人視覺(jué)伺服控制系統(tǒng),將攝像頭集成到基于 Zynq的伊瑟特主站上,提高了視覺(jué)伺服的實(shí)時(shí)性.經(jīng)測(cè)試,該平臺(tái)能夠?qū)σ曈X(jué)檢測(cè)目標(biāo)的變化做出及時(shí)的反應(yīng)
    發(fā)表于 05-29 16:17

    大象機(jī)器人完成Pre-B輪融資,致力打造全新機(jī)器人生態(tài)!

    近日,深圳市大象機(jī)器人科技有限公司(以下簡(jiǎn)稱(chēng)「大象機(jī)器人」)近日完成Pre-B輪融資,本輪融資由清輝投資領(lǐng)投、云卓資本跟投,資金將用于人形機(jī)器人產(chǎn)線升級(jí)及持續(xù)研發(fā)迭代。義柏資本擔(dān)任長(zhǎng)期獨(dú)家財(cái)務(wù)顧問(wèn)。
    的頭像 發(fā)表于 05-22 14:46 ?733次閱讀

    斯坦福、伯克利大神教授創(chuàng)業(yè)給機(jī)器人造大腦,OpenAI紅杉搶著投5億

    還記得曾火遍全網(wǎng)的ALOHA家務(wù)機(jī)器人嗎?最近該項(xiàng)目導(dǎo)師,斯坦福計(jì)算機(jī)科學(xué)與電氣工程系教授ChelseaFinn在X宣布,正式與其他幾位伯克利大牛學(xué)者、谷歌DeepMind科學(xué)家共同創(chuàng)業(yè),全力為
    的頭像 發(fā)表于 04-14 08:04 ?135次閱讀
    斯坦福、<b class='flag-5'>伯克利</b>大神教授創(chuàng)業(yè)給<b class='flag-5'>機(jī)器人</b>造大腦,OpenAI紅杉搶著投5億

    機(jī)器人焊接與人工焊接對(duì)比分析

    。本文創(chuàng)想焊縫跟蹤器小編將對(duì)這兩種焊接方式進(jìn)行對(duì)比分析。 一、成本 在成本方面,機(jī)器人焊接需要較大的初期投入。機(jī)器人本身的購(gòu)置費(fèi)用以及安裝、調(diào)試等費(fèi)用都相當(dāng)可觀。此外,維護(hù)和更新機(jī)器人所需的費(fèi)用也不容忽視。相比
    的頭像 發(fā)表于 04-11 14:30 ?389次閱讀
    <b class='flag-5'>機(jī)器人</b>焊接與人工焊接對(duì)比分析

    常見(jiàn)的多關(guān)節(jié)機(jī)器人有哪些?具有什么特點(diǎn)?

    系統(tǒng) 多關(guān)節(jié)機(jī)器人具有以下一些特點(diǎn): 靈活性:多關(guān)節(jié)機(jī)器人由多個(gè)可動(dòng)關(guān)節(jié)構(gòu)成,能夠?qū)崿F(xiàn)復(fù)雜的運(yùn)動(dòng)和姿態(tài)調(diào)整,適應(yīng)不同的工作環(huán)境和任務(wù)需求。 自由度高:多關(guān)節(jié)
    的頭像 發(fā)表于 03-07 08:42 ?872次閱讀
    常見(jiàn)的多關(guān)節(jié)<b class='flag-5'>機(jī)器人</b>有哪些?具有什么特點(diǎn)?

    2024年工智能在職場(chǎng)發(fā)展的五大趨勢(shì)

    首先,許多為殘疾工作者開(kāi)發(fā)的機(jī)器學(xué)習(xí)工具可能會(huì)越來(lái)越普及,這是美國(guó)加州大學(xué)伯克利分校包容城市實(shí)驗(yàn)室主任 Victor Santiago Pineda 的看法。例如,基于算法的語(yǔ)音轉(zhuǎn)文字和文字轉(zhuǎn)語(yǔ)音
    的頭像 發(fā)表于 01-09 16:50 ?677次閱讀

    【開(kāi)源項(xiàng)目】Emo:基于樹(shù)莓派 4B DIY 能笑會(huì)動(dòng)的桌面機(jī)器人

    使用 Autodesk Fusion 360 來(lái)設(shè)計(jì) Emo 機(jī)器人,其中融合了實(shí)體和自由形式的建模技術(shù)。 為了簡(jiǎn)化打印過(guò)程,我們將機(jī)器人的主體分成幾個(gè)部分,方便用螺釘組裝。 我們精心考慮了電源的位置,將它
    發(fā)表于 12-26 15:18

    LabVIEW的六軸工業(yè)機(jī)器人運(yùn)動(dòng)控制系統(tǒng)

    空間的軌跡構(gòu)造方法,包括直線、圓弧、NURBS自由曲線等軌跡的構(gòu)造方程。 模型機(jī)器人測(cè)試與仿真:通過(guò)LabVIEW編程,項(xiàng)目在PC端實(shí)現(xiàn)了算法和運(yùn)動(dòng)仿真。六軸模型機(jī)器人被用作實(shí)體測(cè)試對(duì)象,通過(guò)模塊化方法
    發(fā)表于 12-21 20:03

    機(jī)器人實(shí)現(xiàn)開(kāi)發(fā)自由,探索精密工藝的機(jī)器人關(guān)節(jié)模組

    機(jī)器人關(guān)節(jié)是作為機(jī)器人各個(gè)部件之間相互連接的節(jié)點(diǎn),提供了必要的運(yùn)動(dòng)自由度。關(guān)節(jié)模組用其精確度和可靠性,確保了機(jī)器人在各個(gè)領(lǐng)域的高效率和高質(zhì)量表現(xiàn)。一體化關(guān)節(jié)使得
    的頭像 發(fā)表于 12-08 15:35 ?389次閱讀

    國(guó)內(nèi)首款開(kāi)源鴻蒙人形機(jī)器人發(fā)布

     樂(lè)聚機(jī)器人在12月5日發(fā)布了一款名為“夸父”的全新機(jī)器人產(chǎn)品??涓?b class='flag-5'>機(jī)器人被譽(yù)為國(guó)內(nèi)首款開(kāi)源鴻蒙人形機(jī)器人,具備跳躍能力且適應(yīng)多種地形。
    的頭像 發(fā)表于 12-05 16:38 ?1468次閱讀

    如何在新機(jī)器中設(shè)置默認(rèn)的defconifg?

    我忽略了這段話的方式是讓我的新機(jī)器使用舊的“UBOOT_CONFIG_BASEMAME ” = “IMx93_11x11_evk ”而不是“UBOT_CONFIG_BASEMA
    發(fā)表于 11-13 07:14

    基于PC的機(jī)器人控制解決方案

    新機(jī)器的設(shè)計(jì)包括多個(gè)基于PC的控制解決方案、運(yùn)動(dòng)控制硬件和具有運(yùn)動(dòng)功能的通用自動(dòng)化軟件。Labplas在15條生產(chǎn)線上配置了機(jī)器人。拾放機(jī)器人和其它運(yùn)動(dòng)軸配備了由EtherCAT伺服驅(qū)動(dòng)器控制的伺服電機(jī)。
    發(fā)表于 10-25 10:38 ?685次閱讀

    Arduino教學(xué)機(jī)器人的使用教程

    本文檔的主要內(nèi)容詳細(xì)介紹的是Arduino教學(xué)機(jī)器人的使用教程
    發(fā)表于 09-27 06:53