0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)機(jī)器人操縱系統(tǒng)的框架—— DiffSkill

傳感器技術(shù) ? 來源:傳感器技術(shù) ? 作者:Robospeak ? 2022-06-21 10:13 ? 次閱讀

對(duì)于人類來說,把面團(tuán)放到砧板上,然后用搟面杖把它壓平成圓形。這看起來很容易,對(duì)吧?

那如果是由機(jī)器人來操作,會(huì)是怎樣的效果?

對(duì)于機(jī)器人來說,面對(duì)像面團(tuán)這樣的可變形物體是很棘手的,因?yàn)槊鎴F(tuán)的形狀可以以多種方式變化,而這些變化很難用方程式來表示。

此外,從面團(tuán)中創(chuàng)建新形狀需要多個(gè)步驟并使用不同的工具。這就意味著機(jī)器人需要學(xué)習(xí)一系列長(zhǎng)長(zhǎng)的操作任務(wù),然后還需要通過反復(fù)試驗(yàn)更多可能的選擇。

現(xiàn)在,來自,麻省理工學(xué)院、卡內(nèi)基梅隆大學(xué)和加州大學(xué)圣地亞哥分校的研究人員創(chuàng)建了一個(gè)框架,可以讓機(jī)器人快速有效地完成復(fù)雜的操作任務(wù),例如揉面皮包餃子、做披薩。

▍一個(gè)機(jī)器人操縱系統(tǒng)的框架—— DiffSkill

研究人員為使用兩階段學(xué)習(xí)過程的機(jī)器人操作系統(tǒng)創(chuàng)建了一個(gè)框架,這可以使機(jī)器人能夠在很長(zhǎng)一段時(shí)間內(nèi)執(zhí)行復(fù)雜的面團(tuán)操作任務(wù)。

這個(gè)算法會(huì)像“老師”一樣解決機(jī)器人完成任務(wù)必須采取的每一步。然后訓(xùn)練一個(gè)“學(xué)生”機(jī)器學(xué)習(xí)在什么時(shí)間段以及如何執(zhí)行任務(wù)期間所需的每項(xiàng)技能的抽象概念,例如使用搟面杖。

e241bcec-f0ee-11ec-ba43-dac502259ad0.gif

有了這些知識(shí),系統(tǒng)就會(huì)推理出如何執(zhí)行技能來完成整個(gè)任務(wù)。

一系列操作,堪稱“手把手教學(xué)”。

研究人員表明,這種他們稱之為 DiffSkill 的方法可以在模擬中執(zhí)行復(fù)雜的操作任務(wù),例如切割和攤開面團(tuán),或從砧板周圍收集面團(tuán),同時(shí)優(yōu)于其他機(jī)器學(xué)習(xí)方法。

e32c7a66-f0ee-11ec-ba43-dac502259ad0.gif

當(dāng)然,除了包餃子、做披薩之外,這種方法還可以應(yīng)用于其他需要機(jī)器人操縱的可變形物體的環(huán)境。

例如為老年人或運(yùn)動(dòng)障礙者喂食、洗澡或穿衣的護(hù)理機(jī)器人。

“這種方法更接近我們?nèi)祟愑?jì)劃行動(dòng)的方式。當(dāng)一個(gè)人執(zhí)行一項(xiàng)長(zhǎng)期任務(wù)時(shí),我們并沒有寫下所有的細(xì)節(jié)。我們有一個(gè)更高級(jí)別的計(jì)劃者,它大致告訴我們?cè)诖诉^程中需要實(shí)現(xiàn)哪些階段以及一些中間目標(biāo),然后我們執(zhí)行它們,”計(jì)算機(jī)科學(xué)與人工智能專業(yè)的研究生Li表示。

▍“學(xué)生”&“老師” 的工作流程

DiffSkill 框架中的“老師”是一種軌跡優(yōu)化算法,可以解決物體初始狀態(tài)和目標(biāo)位置靠得很近的短視界任務(wù)。

軌跡優(yōu)化器在模擬現(xiàn)實(shí)世界物理的模擬器中工作(稱為可微物理模擬器,它將“Diff”放入“DiffSkill”中)。然后,“老師”算法使用模擬器中的信息來學(xué)習(xí)面團(tuán)在每個(gè)階段必須如何移動(dòng),一次一個(gè),然后輸出這些軌跡。

然后“學(xué)生”神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)模仿老師的動(dòng)作。作為輸入,它使用兩個(gè)攝像頭圖像,一個(gè)顯示當(dāng)前狀態(tài)的面團(tuán),另一個(gè)顯示任務(wù)結(jié)束時(shí)的面團(tuán)。神經(jīng)網(wǎng)絡(luò)生成一個(gè)高級(jí)計(jì)劃,以確定如何將不同的技能聯(lián)系起來以達(dá)到目標(biāo)。然后,它為每個(gè)技能生成特定的、短視界的軌跡,并將命令直接發(fā)送到工具。

e3953830-f0ee-11ec-ba43-dac502259ad0.png

接著,研究人員使用這種技術(shù)對(duì)三種不同的模擬面團(tuán)操作任務(wù)進(jìn)行了實(shí)驗(yàn)。

在一項(xiàng)任務(wù)中,機(jī)器人使用抹刀將面團(tuán)舉到砧板上,然后使用搟面杖將其壓平。在另一個(gè)例子中,機(jī)器人使用抓手從柜臺(tái)上收集面團(tuán),將其放在抹刀上,然后將其轉(zhuǎn)移到砧板上。

在第三個(gè)任務(wù)中,機(jī)器人用刀將一堆面團(tuán)切成兩半,然后用夾具將每一塊面團(tuán)運(yùn)送到不同的位置。

e3d74c66-f0ee-11ec-ba43-dac502259ad0.png

同時(shí),研究人員開發(fā)了一種機(jī)器人操縱系統(tǒng),可以在模擬中使用工具執(zhí)行復(fù)雜的面團(tuán)操作任務(wù)。

e4072526-f0ee-11ec-ba43-dac502259ad0.gif

例如收集面團(tuán)并將其放在砧板上(左),將一塊面團(tuán)切成兩半并將兩半分開(中),以及將面團(tuán)抬到一塊砧板,然后用搟面杖將其壓平(右)。

實(shí)驗(yàn)結(jié)果證明,DiffSkill 框架能夠勝過依賴強(qiáng)化學(xué)習(xí)的流行技術(shù)。在強(qiáng)化學(xué)習(xí)中,機(jī)器人通過反復(fù)試驗(yàn)來學(xué)習(xí)任務(wù)。

事實(shí)上,DiffSkill 是唯一能夠成功完成所有三個(gè)面團(tuán)操作任務(wù)的方法。有趣的是,研究人員發(fā)現(xiàn)“學(xué)生”神經(jīng)網(wǎng)絡(luò)甚至能夠勝過“教師”算法,Lin 說。

“我們的框架為機(jī)器人獲得新技能提供了一種新穎的方式。然后可以將這些技能鏈接起來,以解決更復(fù)雜的任務(wù),這些任務(wù)超出了以前的機(jī)器人系統(tǒng)的能力,”Li說。

因?yàn)樗麄兊姆椒▊?cè)重于控制工具(抹刀、刀、搟面杖等),所以它可以應(yīng)用于不同的機(jī)器人,但前提是它們使用研究人員定義的特定工具。

未來,他們計(jì)劃將工具的形狀集成到“學(xué)生”網(wǎng)絡(luò)的推理中,以便將其應(yīng)用于其他設(shè)備。

該團(tuán)隊(duì)的研究人員們打算通過使用 3D 數(shù)據(jù)作為輸入來提高 DiffSkill 的性能,同時(shí),他們還希望使神經(jīng)網(wǎng)絡(luò)規(guī)劃過程更高效,并收集更多樣的訓(xùn)練數(shù)據(jù),以增強(qiáng) DiffSkill 對(duì)新情況的泛化能力。

從長(zhǎng)遠(yuǎn)來看,他們希望將 DiffSkill 應(yīng)用到更多樣化的任務(wù)中,包括布料操作。

這項(xiàng)研究得到了美國(guó)國(guó)家科學(xué)基金會(huì)、LG電子、麻省理工學(xué)院-IBM 沃森人工智能實(shí)驗(yàn)室、美國(guó)海軍研究辦公室和國(guó)防高級(jí)研究計(jì)劃局的部分支持。

文章及論文地址:

https://news.mit.edu/2022/robotic-deformable-object-0331

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27839

    瀏覽量

    204618
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    253

    瀏覽量

    23312
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131848

原文標(biāo)題:搟面皮包餃子做披薩,MIT、CMU等的研究員讓機(jī)器人自己學(xué)會(huì)了!

文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    開源項(xiàng)目!用ESP32做一個(gè)可愛的無(wú)用機(jī)器人

    簡(jiǎn)介 作者在完成碩士論文答辯后,利用空閑時(shí)間制作了個(gè)直想做的機(jī)器人——可愛無(wú)用機(jī)器人。 無(wú)用機(jī)
    發(fā)表于 09-03 09:34

    開源項(xiàng)目!用ESP32做一個(gè)可愛的無(wú)用機(jī)器人

    簡(jiǎn)介 作者在完成碩士論文答辯后,利用空閑時(shí)間制作了個(gè)直想做的機(jī)器人——可愛無(wú)用機(jī)器人。 無(wú)用
    發(fā)表于 08-30 14:50

    ROS讓機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    本帖最后由 Tronlong創(chuàng)龍科技 于 2024-7-19 17:18 編輯 ROS系統(tǒng)是什么 ROS(Robot Operating System)是個(gè)適用于機(jī)器人的開源的
    發(fā)表于 07-09 11:38

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說,薩科微Al大模型機(jī)器人有哪些的優(yōu)勢(shì)?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開發(fā),與同行相比具有許多優(yōu)勢(shì):語(yǔ)言
    發(fā)表于 07-05 08:52

    abb機(jī)器人系統(tǒng)密鑰在哪

    ABB機(jī)器人系統(tǒng)密鑰是ABB機(jī)器人系統(tǒng)中用于保護(hù)其知識(shí)產(chǎn)權(quán)和確保系統(tǒng)安全性的種技術(shù)手段。本文將
    的頭像 發(fā)表于 06-17 09:45 ?892次閱讀

    星動(dòng)紀(jì)元開源人形機(jī)器人訓(xùn)練框架Humanoid-Gym

    星動(dòng)紀(jì)元,這家專注于人形機(jī)器人技術(shù)的創(chuàng)新公司,近日宣布計(jì)劃將其訓(xùn)練框架Humanoid-Gym進(jìn)行開源。Humanoid-Gym是個(gè)為人形機(jī)器人
    的頭像 發(fā)表于 03-06 18:13 ?1640次閱讀

    LabVIEW的六軸工業(yè)機(jī)器人運(yùn)動(dòng)控制系統(tǒng)

    LabVIEW開發(fā)六軸工業(yè)機(jī)器人運(yùn)動(dòng)控制系統(tǒng) 本項(xiàng)目開發(fā)了個(gè)高效的工業(yè)機(jī)器人控制系統(tǒng),重點(diǎn)關(guān)注
    發(fā)表于 12-21 20:03

    ROS讓機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    個(gè)開源免費(fèi),架構(gòu)精簡(jiǎn)的機(jī)器人操作系統(tǒng)。ROS被設(shè)計(jì)為盡可能精簡(jiǎn),以便為ROS編寫的代碼可與其他機(jī)器人軟件
    發(fā)表于 11-30 16:01

    機(jī)器人建模方法和組成

    URDF:機(jī)器人建模方法 ROS是機(jī)器人操作系統(tǒng),當(dāng)然要給機(jī)器人使用啦,不過在使用之前,還得讓ROS認(rèn)識(shí)下我們使用的機(jī)器人,如何把
    的頭像 發(fā)表于 11-22 16:30 ?756次閱讀
    <b class='flag-5'>機(jī)器人</b>建模方法和組成

    力控機(jī)器人導(dǎo)納控制框架

    導(dǎo)納控制框架: 力/力矩傳感器:用于測(cè)量機(jī)器人與環(huán)境之間的力和力矩。 導(dǎo)納控制器:根據(jù)傳感器測(cè)量值和期望的力/力矩指令,生成控制指令以實(shí)現(xiàn)期望的導(dǎo)納互動(dòng)。 運(yùn)動(dòng)控制器:用于控制機(jī)器人的關(guān)節(jié)或末端
    的頭像 發(fā)表于 11-09 16:12 ?834次閱讀
    力控<b class='flag-5'>機(jī)器人</b>導(dǎo)納控制<b class='flag-5'>框架</b>

    力控機(jī)器人控制方法的框架及其性能分析

    力控機(jī)器人常采用柔順控制算法與人/環(huán)境/機(jī)器人之間進(jìn)行直接或間接的物理交互,那么,柔順控制能夠操縱被控系統(tǒng)的柔性特性和動(dòng)態(tài)行為,實(shí)現(xiàn)方式可以分為被動(dòng)柔順和主動(dòng)柔順,具體分類如下圖所示:
    的頭像 發(fā)表于 11-09 15:59 ?907次閱讀
    力控<b class='flag-5'>機(jī)器人</b>控制方法的<b class='flag-5'>框架</b>及其性能分析

    力控機(jī)器人的控制框架和性能評(píng)估

    力控機(jī)器人種能夠基于外部力量進(jìn)行控制和交互的機(jī)器人系統(tǒng)。與傳統(tǒng)的位置控制機(jī)器人相比,力控機(jī)器人
    的頭像 發(fā)表于 11-09 15:54 ?415次閱讀

    搬運(yùn)機(jī)器人總體設(shè)計(jì)的思路及原理

    搬運(yùn)機(jī)器人種用于工業(yè)運(yùn)動(dòng)控制的設(shè)備,般由執(zhí)行系統(tǒng)、驅(qū)動(dòng)系統(tǒng)和控制系統(tǒng)組成。搬運(yùn)
    的頭像 發(fā)表于 10-27 08:07 ?1462次閱讀
    搬運(yùn)<b class='flag-5'>機(jī)器人</b>總體設(shè)計(jì)的思路及原理

    全面解讀工業(yè)機(jī)器人基本主要構(gòu)成部分

    機(jī)器人控制系統(tǒng)機(jī)器人的大腦,是決定機(jī)器人功用和功能的主要要素。控制系統(tǒng)是按照輸入的程序?qū)︱?qū)動(dòng)系統(tǒng)
    發(fā)表于 10-23 14:54 ?1573次閱讀
    全面解讀工業(yè)<b class='flag-5'>機(jī)器人</b>基本主要構(gòu)成部分

    Arduino教學(xué)機(jī)器人的使用教程

    本文檔的主要內(nèi)容詳細(xì)介紹的是Arduino教學(xué)機(jī)器人的使用教程
    發(fā)表于 09-27 06:53