0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于端到端可操作性學(xué)習(xí)的機(jī)器人操縱框架

CVer ? 來源:北京大學(xué)前沿計算研究中 ? 2023-01-30 09:55 ? 次閱讀

導(dǎo) 讀

本文是國際機(jī)器人和自動化頂級會議 ICRA 2023入選論文 RLAfford:End-to-end Affordance Learning for Robotic Manipulation 的解讀。這項研究通過使用強(qiáng)化學(xué)習(xí)訓(xùn)練過程中產(chǎn)生的接觸信息來預(yù)測物體可操作性信息,更好地實現(xiàn)機(jī)器人***任務(wù),并對各種算法以及環(huán)境具有即插即用的能力。

01

研究背景

隨著生活逐漸智能化,通過機(jī)器人與物體交互變得越來越重要。如何讓機(jī)器人學(xué)會***不同形狀的物體并且學(xué)會穩(wěn)定有效的交互策略成為了當(dāng)前的研究熱點。近年來,強(qiáng)化學(xué)習(xí)(RL)為這一問題提供了解決方案。然而,在互動環(huán)境中學(xué)習(xí)***不同形狀、不同結(jié)構(gòu)、不同功能的三維物體一直是強(qiáng)化學(xué)習(xí)的挑戰(zhàn)。特別是,我們往往很難訓(xùn)練出一個能夠處理不同語義類別、不同幾何形狀和多樣功能的物體的策略。

最近,視覺可操作性(Visual Affordance)學(xué)習(xí)技術(shù)在提供以物體為中心的信息先驗和有效的可操作語義方面展現(xiàn)出巨大的潛力。例如,一個理想的策略可以通過了解到把手的可操作性來打開一扇門。然而,學(xué)習(xí)視覺可操作性往往需要人類定義的原子動作(抓、握、推、拉等動作),這限制了適用任務(wù)的范圍。

在本文中,我們提出了 RLAfford。在研究中,我們抓住了智能體與世界交互的最本質(zhì)信息:接觸點信息,來預(yù)測 RL 系統(tǒng)感興趣的物體上的接觸位置(也即物體的可操作性),預(yù)測的信息又反過來指導(dǎo) RL 進(jìn)一步訓(xùn)練。這樣的接觸預(yù)測系統(tǒng)實現(xiàn)了端到端(End-to-end)的 Visual Affordance 學(xué)習(xí)框架,它可以廣泛地適用于不同類型的***任務(wù)中。

令人興奮的是,我們的框架甚至在多階段(Multi-stage)和多智能體(Multi-agent)的任務(wù)中也能保持有效性。我們在八種類型的***任務(wù)上測試了我們的方法。結(jié)果顯示,我們的方法在成功率上遠(yuǎn)遠(yuǎn)超過了基線(Baseline)算法,同時,我們的方法成功地在現(xiàn)實世界中成功完成了這八種***任務(wù)。部分VisualAffordance 學(xué)習(xí)結(jié)果如圖1所示。

00a8e546-9fce-11ed-bfe3-dac502259ad0.png

圖1. 輸入一個物體的點云信息,我們利用 RL 交互過程中的接觸信息來預(yù)測以物體為中心的可操作性信息。圖中顏色越深意味著可操作性越強(qiáng)??梢钥闯?,這樣的信息對于完成物體操作非常有意義。

02

方 法

00b9c15e-9fce-11ed-bfe3-dac502259ad0.png

圖2. 框架結(jié)構(gòu)。

如圖2所示,我們的方案包含兩個主要模塊。其中 1)操作模塊(Manipulation Module)生成交互軌跡,2)視覺可操作性模塊(Visual Affordance Module)用來學(xué)習(xí)生成基于實時點云的可操作性信息(Affordance)。接觸預(yù)測器(Contact Predictor)在兩個模塊***享,作為它們之間的橋梁。

操作模塊使用接觸預(yù)測器的預(yù)測結(jié)果作為輸入觀察的一部分,同時預(yù)測的最大值點參與操作模塊的獎勵函數(shù)計算(MPR),以激勵 RL 算法去探索最感興趣的點附近的區(qū)域;

操作模塊通過收集交互中的碰撞信息實時生成動態(tài)的 Visual Affordance 學(xué)習(xí)目標(biāo)(Dynamic Ground Truth)來訓(xùn)練視覺可操作性模塊。

具體算法結(jié)構(gòu)如圖3所示。

00c6f018-9fce-11ed-bfe3-dac502259ad0.png

圖3. 算法結(jié)構(gòu)。

03

實 驗

00d7ffb6-9fce-11ed-bfe3-dac502259ad0.png

圖4. 頂部:模擬器中的任務(wù)設(shè)置。中間:在端到端訓(xùn)練期間,Visual Affordance Map 的變化以及部分 Visual Affordance 學(xué)習(xí)結(jié)果。底部:真實世界實驗示意圖。

如圖4所示,我們設(shè)計了三種類型的***任務(wù):單階段、多階段和多智能體。在所有的任務(wù)中,都要求一個或兩個機(jī)械臂來完成對不同物體的特定***任務(wù)。我們使用了 Isaac Gym 物理模擬器、PartNet-Mobility 數(shù)據(jù)集和 VAPO 數(shù)據(jù)集來完成虛擬環(huán)境的實驗。我們也利用了數(shù)字孿生方法在真實世界中完成了我們設(shè)計的任務(wù)。最終,我們進(jìn)行了一些消融實驗,實驗結(jié)果表明我們的方法在成功率上遠(yuǎn)遠(yuǎn)超過了基線算法,包括基于 Visual Affordance 的方法和 RL 方法。

04

總 結(jié)

據(jù)我們所知,這是第一項將 Visual Affordance 與 RL 完成端到端的結(jié)合的工作。在 RL 訓(xùn)練中,VisualAffordance可以通過提供額外的觀測和獎勵信號來提高策略學(xué)習(xí)的效果。我們的框架通過 RL 訓(xùn)練自動學(xué)習(xí)VisualAffordance語義,而不需要額外的演示或人工標(biāo)注。我們方法的簡單性、比所有基線更出色的性能以及廣泛靈活的適用場景,證明了我們的方案的有效性以及對各種算法、環(huán)境具有即插即用的能力,同時也為解決更多復(fù)雜任務(wù)打開了一種新的思路。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28127

    瀏覽量

    205889
  • 模擬器
    +關(guān)注

    關(guān)注

    2

    文章

    863

    瀏覽量

    43132
  • MPR
    MPR
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    8704

原文標(biāo)題:ICRA 2023 | RLAfford:基于端到端可操作性學(xué)習(xí)的機(jī)器人操縱框架

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    #機(jī)器人基礎(chǔ)原理 奇異及可操作性第1部分

    機(jī)器人
    電子技術(shù)那些事兒
    發(fā)布于 :2022年09月21日 22:52:33

    #機(jī)器人基礎(chǔ)原理 奇異及可操作性第2部分

    機(jī)器人
    電子技術(shù)那些事兒
    發(fā)布于 :2022年09月21日 22:54:43

    水下機(jī)器人便攜式遙控單元設(shè)計

    進(jìn)行復(fù)雜的坐標(biāo)變換,并將變換結(jié)果和載體狀態(tài)以圖形化的界面生動、直觀的顯示出來。這大大提高了水下機(jī)器人在水面上的可操作性,方便每次的水上試驗與載體回收。以下我們以AVR系列單片機(jī)ATmega1280和步科
    發(fā)表于 03-08 14:21

    藍(lán)牙控制機(jī)器人

    藍(lán)牙控制機(jī)器人藍(lán)牙控制機(jī)器人(android版,支持2.2及2.2以上系列手機(jī)),內(nèi)有hex文件資料及詳細(xì)說明attach://147401.rar
    發(fā)表于 07-20 09:35

    什么是工業(yè)機(jī)器人

    ,完成對人體有害物料的搬運或工藝操作。20世紀(jì)50年代末,美國在機(jī)械手和操作機(jī)的基礎(chǔ)上,采用伺服機(jī)構(gòu)和自動控制等技術(shù),研制出有通用的獨立的工業(yè)用自動操作裝置,并將其稱為工業(yè)
    發(fā)表于 01-19 10:58

    智能小車機(jī)器人控制V2.02

    智能小車機(jī)器人控制V2.02
    發(fā)表于 04-12 13:04

    【orangepi zero申請】畫圖機(jī)器人控制

    項目名稱:畫圖機(jī)器人控制試用計劃:目前做了一個畫圖機(jī)器人,使用電腦處理圖片和控制的,但是為了增加這個項目的集成度,打算將控制的軟件安裝在這個板子上,低廉的成本實現(xiàn)整個項目功能。我玩
    發(fā)表于 12-09 09:31

    機(jī)器寵物解決方案開源資料(原理圖+源碼+視頻演示)

    手掌大小的機(jī)器人,它有四只腳而不是輪子。腿式運動賦予其在非結(jié)構(gòu)化地形上導(dǎo)航的更多自由,并在運動時表達(dá)生活的歡樂。這種動態(tài)的可操作性以前只能在最好的實驗室或大亨公司的一些豪華機(jī)器人上看到。于是提出了一
    發(fā)表于 10-12 14:38

    深圳視覺對位雕刻機(jī)系統(tǒng),軟件可操作性

    。8、光學(xué)玻璃行業(yè)。視覺對位雕刻機(jī)系統(tǒng)特點:1、高精度、高效率、高穩(wěn)定性的視覺對位算法2、使用網(wǎng)口相機(jī)和集成工控機(jī),性能穩(wěn)定可靠3、軟件可操作性好,觸摸屏方便、簡潔4、可根據(jù)客戶具體機(jī)型進(jìn)行定制化的高效
    發(fā)表于 07-22 09:52

    深圳CCD點鉆系統(tǒng),視覺對位算法,可操作性

    、高精度、高效率、高穩(wěn)定性的視覺對位算法2、使用網(wǎng)口相機(jī)和集成工控機(jī),性能穩(wěn)定可靠3、軟件可操作性好,觸摸屏方便、簡潔4、可根據(jù)客戶具體機(jī)型進(jìn)行定制化的高效方案四元數(shù)致力于運動控制、圖像與視覺傳感等工業(yè)
    發(fā)表于 07-27 09:36

    淺談兒童陪護(hù)機(jī)器人

    、高電流的步進(jìn)電機(jī)驅(qū)動芯片,可以提供可靠、高效的控制性能,擁有電流細(xì)分、過流保護(hù)、過熱保護(hù)等特點,適用于需要高速、高精度轉(zhuǎn)動的機(jī)器人應(yīng)用。 在實際應(yīng)用中,兒童陪護(hù)機(jī)器人的轉(zhuǎn)動控制也需要考慮安全
    發(fā)表于 05-11 15:12

    TD-LTE完成全球首個操作性試驗

    TD-LTE完成全球首個操作性試驗 近日,愛立信在瑞典進(jìn)行了TD-LTE
    發(fā)表于 04-25 13:55 ?632次閱讀

    高通、諾基亞完成基于全球5G NR標(biāo)準(zhǔn)的操作性連接測試

    高通公司總裁Cristiano Amon表示:“高通與諾基亞成功完成的這一項基于全球5G NR標(biāo)準(zhǔn)的操作性連接測試,為在2019年順利推出5G NR商用網(wǎng)絡(luò)和終端設(shè)備奠定了堅實
    的頭像 發(fā)表于 02-08 16:11 ?5024次閱讀

    HPC應(yīng)用程序高性能分析及如何使用系統(tǒng)資源的可操作性洞察

    探索HPC性能表征分析,以獲得有效計算密集型應(yīng)用程序如何使用系統(tǒng)資源的可操作性洞察。
    的頭像 發(fā)表于 11-08 06:11 ?3435次閱讀

    雙臂協(xié)作機(jī)器人的應(yīng)用場景

    雙臂協(xié)作機(jī)器人的核心是雙臂多關(guān)節(jié)結(jié)構(gòu)和機(jī)器人操作系統(tǒng),每條臂都有高靈活性的七個自由度,比單臂協(xié)作機(jī)器人有更高的靈活性和可操作性,通過雙臂配合
    的頭像 發(fā)表于 06-27 09:08 ?1332次閱讀
    雙臂協(xié)作<b class='flag-5'>機(jī)器人</b>的應(yīng)用場景