在 日前舉行的 IEEE 國際機(jī)器人和自動化大會(ICRA)上,幾何織物(geometric fabrics)成為一個熱門的討論話題。幾何織物是 NVIDIA 機(jī)器人研究實驗室成員與合作者共同提交的七篇論文的主題之一,并于 ICRA 上發(fā)表。
什么是幾何織物?
在機(jī)器人領(lǐng)域,經(jīng)過訓(xùn)練的策略本質(zhì)上是近似的。它們通常會正確行事,但有時也會使機(jī)器人移動得太快、與物體發(fā)生碰撞或使機(jī)器人左右搖晃,所以無法保證會發(fā)生什么。
因此,每當(dāng)有人在物理機(jī)器人上部署經(jīng)過訓(xùn)練的策略,尤其是經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的策略時,他們都會使用一級低級控制器來攔截來自策略的命令,然后,他們會根據(jù)硬件的限制來轉(zhuǎn)換這些命令。
在訓(xùn)練 RL 策略時,應(yīng)在訓(xùn)練過程中使用該策略運行這些控制器。研究人員認(rèn)為,他們的 GPU 加速 RL 訓(xùn)練工具可以提供的一個獨特價值是將這些控制器矢量化,使其在訓(xùn)練和部署過程中都能使用,這正是這項研究的目的所在。
例如,研發(fā)人形機(jī)器人的公司可能會展示帶有低級控制器的演示,這些控制器不僅能平衡機(jī)器人,還能防止機(jī)器人的手臂撞到自己的身體。
研究人員用于矢量化的控制器來自于過去對幾何織物的研究。這篇題為《幾何織物:概括經(jīng)典力學(xué)以捕捉行為物理學(xué)》的文章在去年 ICRA 上獲得了最佳論文獎。
DeXtreme 策略
研究人員在今年的論文中提到的手部操縱任務(wù)也來自著名的 DeXtreme 研究。
在這項新工作中,研究人員將這兩項研究合二為一,在將幾何織物控制器矢量化的基礎(chǔ)上訓(xùn)練 DeXtreme 策略,這將使機(jī)器人更加安全,能通過名義上的織物行為來指導(dǎo)策略學(xué)習(xí),并實現(xiàn)仿真到現(xiàn)實訓(xùn)練和部署的系統(tǒng)化,從而離在生產(chǎn)環(huán)境中使用 RL 工具更近一步。
該工作所創(chuàng)建的基礎(chǔ)架構(gòu),使研究人員能夠在訓(xùn)練期間通過快速迭代來獲得正確的域隨機(jī)化,從而成功進(jìn)行仿真到現(xiàn)實的部署。例如,通過在訓(xùn)練和部署之間快速迭代,研究人員可以調(diào)整織物結(jié)構(gòu)并在訓(xùn)練期間添加大量隨機(jī)擾動力,實現(xiàn)遠(yuǎn)超先前工作的魯棒性水平。
在之前的 DeXtreme 工作中,現(xiàn)實世界的實驗證明對物理機(jī)器人來說非常困難。機(jī)器人在實驗過程中會發(fā)生電機(jī)和傳感器磨損情況,并改變底層控制行為。曾經(jīng)有一次,機(jī)器人甚至出現(xiàn)損壞并開始冒煙!
有了幾何織物控制器作為策略基礎(chǔ)并保護(hù)機(jī)器人,研究人員發(fā)現(xiàn)他們可以更自由地部署和測試策略,不必?fù)?dān)心機(jī)器人出現(xiàn)自毀現(xiàn)象。
如要了解更多信息,請參見幾何織物:策略學(xué)習(xí)的安全指導(dǎo)媒介或觀看DeXtreme 示例視頻。
ICRA 上的其他機(jī)器人研究
今年提交的其他值得關(guān)注的論文如下:
SynH2R
看不見但記得住
點云世界模型
SKT-Hang
SynH2R
SynH2R 的作者提出了一個框架,用于生成適合訓(xùn)練機(jī)器人的真實人類抓取動作。如要了解更多信息,請參見:SynH2R:合成用于學(xué)習(xí)人機(jī)交接的手 - 對象運動。
看不見但記得住
RDMemory 的作者測試了機(jī)械臂對之前看到但后來被遮住的對象的反應(yīng),以確保它能夠在各種環(huán)境中做出可靠的反應(yīng)。這項工作同時用到了仿真和現(xiàn)實實驗。
如要了解更多信息,請參見看不見但記得?。豪镁哂幸曨l追蹤功能的記憶模型對未觀測到的對象進(jìn)行推理和規(guī)劃或觀看RDMemory 示例視頻。
點云世界模型
點云世界模型研究人員建立了一個新穎的點云世界模型(PCWM)和基于點云的控制策略。結(jié)果表明,這些策略可以提高機(jī)器人學(xué)習(xí)器的性能、縮短學(xué)習(xí)時間和增強(qiáng)魯棒性。
如要了解更多信息,請參見點云模型提高機(jī)器人學(xué)習(xí)器的視覺魯棒性。
SKT-Hang
SKT-Hang 作者研究的問題是如何使用機(jī)器人將各種物體掛到不同的支撐結(jié)構(gòu)上。雖然這個問題看似很容易解決,但物體形狀和支撐結(jié)構(gòu)的變化會給機(jī)器人帶來多重挑戰(zhàn)。
如要了解更多信息,請參見SKT-Hang:通過對象識別語義關(guān)鍵點軌跡生成技術(shù)來懸掛日常物體和/HCIS-Lab/SKT-Hang GitHub repo。
通過對象識別語義關(guān)鍵點軌跡生成技術(shù)來懸掛日常物體
具有手術(shù)精度的機(jī)器人
幾篇新的研究論文介紹了機(jī)器人在醫(yī)院手術(shù)環(huán)境中的應(yīng)用。
ORBIT-Surgical
ORBIT-Surgical 是一個基于物理學(xué)的手術(shù)機(jī)器人仿真框架,借助NVIDIA Omniverse平臺上的NVIDIA Isaac Sim實現(xiàn)逼真渲染。
它利用 GPU 并行化來訓(xùn)練強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí)算法,這些算法有助于研究機(jī)器人學(xué)習(xí),增強(qiáng)人類手術(shù)技能。它還能生成適用于主動感知任務(wù)的逼真合成數(shù)據(jù)。研究人員演示了使用 ORBIT-Surgical 仿真轉(zhuǎn)現(xiàn)實功能將學(xué)習(xí)到的策略轉(zhuǎn)移到 dVRK 實體機(jī)器人上。
ORBIT-Surgical 的基礎(chǔ)機(jī)器人仿真應(yīng)用將以免費開源軟件包的形式發(fā)布。
如要了解更多信息,請參見ORBIT-Surgical:一個用于學(xué)習(xí)如何提高手術(shù)靈巧性的開放仿真框架。
一個用于學(xué)習(xí)如何提高手術(shù)靈巧性的的開放仿真框架
DefGoalNet
DefGoalNet 論文重點介紹了形狀伺服控制,這是一項專門控制對象以創(chuàng)建特定目標(biāo)形狀的機(jī)器人任務(wù)。如要了解更多信息,請參見DefGoalNet:從可變形對象操縱演示中學(xué)習(xí)上下文目標(biāo)。
NVIDIA 機(jī)器人技術(shù)合作伙伴在 ICRA
NVIDIA 機(jī)器人技術(shù)合作伙伴在 ICRA 上展示了他們的最新開發(fā)成果。
總部位于蘇黎世的 ANYbotics 展示了其 ANYmal Research 項目,該項目提供一個讓用戶能夠訪問 ROS 系統(tǒng)底層控制的完整軟件包。ANYmal Research 是一個由數(shù)百名在頂尖機(jī)器人研究中心工作的研究人員組成的社區(qū),包括波士頓動力 AI 研究所、蘇黎世聯(lián)邦理工學(xué)院和牛津大學(xué)等。
總部位于慕尼黑的 Franka Robotics 重點展示了與NVIDIA Isaac Manipulator的合作成果。這個基于NVIDIA Jetson的 AI 伴侶能夠為機(jī)器人控制和適用于 Matlab 的 Franka 工具箱提供助力。
Enchanted Tools 展示了其由 Jetson 驅(qū)動的 Miroka? 機(jī)器人。
NVIDIA 機(jī)器人研究實驗室位于西雅圖,重點研究機(jī)器人操縱、感知和基于物理學(xué)的仿真。該實驗室隸屬于 NVIDIA 研究部門。NVIDIA 研究部門在全球擁有 300 多名頂尖研究人員,主要研究領(lǐng)域包括 AI、計算機(jī)圖形學(xué)、計算機(jī)視覺和自動駕駛汽車等。
-
控制器
+關(guān)注
關(guān)注
112文章
16084瀏覽量
176998 -
機(jī)器人
+關(guān)注
關(guān)注
210文章
28078瀏覽量
205776 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4846瀏覽量
102699
原文標(biāo)題:NVIDIA 在 ICRA 上展示幾何織物、手術(shù)機(jī)器人等最新機(jī)器人研究
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論