0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Eureka!NVIDIA 研究突破為機(jī)器人學(xué)習(xí)注入新動(dòng)力

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-10-25 15:55 ? 次閱讀

AI 智能體利用 LLM 自動(dòng)生成獎(jiǎng)勵(lì)算法,訓(xùn)練機(jī)器人完成復(fù)雜任務(wù)。

NVIDIA Research 開發(fā)的一款名為 Eureka 的新型 AI 智能體可以教機(jī)器人復(fù)雜的技能,它教會(huì)了機(jī)器人手快速轉(zhuǎn)筆,并且第一次轉(zhuǎn)得像人類一樣好。

上面視頻中所展示的令人驚嘆的“魔術(shù)”是機(jī)器人通過 Eureka 學(xué)會(huì)熟練完成的近 30 項(xiàng)任務(wù)之一,Eureka 可以自動(dòng)編寫?yīng)剟?lì)算法來訓(xùn)練機(jī)器人。

Eureka 還教會(huì)了機(jī)器人完成打開抽屜和柜子、拋接球、操作剪刀等任務(wù)。

于 10 月 20 日發(fā)布的這一 Eureka 研究包含一篇論文和該項(xiàng)目的 AI 算法,開發(fā)者可以使用 NVIDIA Isaac Gym(一款用于強(qiáng)化學(xué)習(xí)研究的物理模擬參考應(yīng)用)進(jìn)行實(shí)驗(yàn)。Isaac Gym 基于 NVIDIA Omniverse 而構(gòu)建,后者是一個(gè)用于基于 OpenUSD 框架構(gòu)建 3D 工具和應(yīng)用的開發(fā)平臺(tái)。Eureka 自身是由 GPT-4 大型語(yǔ)言模型驅(qū)動(dòng)的。

NVIDIA AI 研究高級(jí)總監(jiān)、Eureka 論文作者之一的 Anima Anandkumar 表示:“在過去十年,強(qiáng)化學(xué)習(xí)取得了空前成功,但依然面臨許多挑戰(zhàn),比如獎(jiǎng)勵(lì)設(shè)計(jì)需要不斷試錯(cuò)才能完成。Eureka 是朝著開發(fā)將生成式和強(qiáng)化學(xué)習(xí)方法結(jié)合以解決這些艱巨的任務(wù)的新算法邁出的第一步?!?/p>

點(diǎn)擊視頻,觀看 Eureka 用 LLM 訓(xùn)練機(jī)器人靈巧操作

AI訓(xùn)練機(jī)器人

據(jù)該論文介紹,Eureka 生成的獎(jiǎng)勵(lì)程序(可讓機(jī)器人進(jìn)行試錯(cuò)學(xué)習(xí))在超過 80% 的任務(wù)上優(yōu)于人類專家編寫的程序,這使得機(jī)器人的平均性能提高了 50% 以上。

Eureka 教機(jī)械臂打開一個(gè)抽屜。

該 AI 智能體使用 GPT-4 LLM 和生成式 AI 編寫軟件代碼,為機(jī)器人進(jìn)行強(qiáng)化學(xué)習(xí)提供獎(jiǎng)勵(lì)。它不需要任何特定任務(wù)提示或預(yù)定義的獎(jiǎng)勵(lì)模板,并且能夠隨時(shí)結(jié)合人類的反饋改進(jìn)其獎(jiǎng)勵(lì),使結(jié)果更加精準(zhǔn)地符合開發(fā)者的愿望。

利用 Isaac Gym 中的 GPU 加速模擬,Eureka 能夠快速評(píng)估大批獎(jiǎng)勵(lì)候選者的質(zhì)量,從而提高訓(xùn)練效率。

Eureka 隨后會(huì)基于訓(xùn)練結(jié)果匯總關(guān)鍵統(tǒng)計(jì)數(shù)據(jù),并指導(dǎo) LLM 改進(jìn)其獎(jiǎng)勵(lì)函數(shù)的生成。通過這種方式,AI 可以自我完善。Eureka 教會(huì)了各類機(jī)器人,包括四足機(jī)器人、雙足機(jī)器人、四旋翼機(jī)器人、靈巧手、協(xié)作機(jī)器人臂等,來完成不同類型的任務(wù)。

該研究論文對(duì) 20 個(gè) Eureka 訓(xùn)練任務(wù)進(jìn)行了深入評(píng)估,這些任務(wù)基于開源的靈巧性基準(zhǔn),要求機(jī)器人手展示一系列復(fù)雜的雙手任務(wù)。

這些來自九個(gè) Isaac Gym 環(huán)境的測(cè)試結(jié)果通過使用 NVIDIA Omniverse 生成的可視化進(jìn)行了展示。

類人型機(jī)器人通過 Eureka 學(xué)習(xí)跑步步態(tài)。

該項(xiàng)目的貢獻(xiàn)者之一、NVIDIA 高級(jí)研究科學(xué)家 Linxi “Jim” Fan 表示:“Eureka 是一個(gè)獨(dú)特的組合,將大型語(yǔ)言模型與 NVIDIA GPU 加速的模擬技術(shù)相結(jié)合,可以實(shí)現(xiàn)靈巧的機(jī)器人控制,并且為藝術(shù)家提供了一種制作物理逼真動(dòng)畫的新方法?!?/p>

除了 NVIDIA Research 最近取得的進(jìn)展(比如使用 GPT-4 構(gòu)建的能夠自主玩 《我的世界》的 AI 智能體 Voyager)之外,這項(xiàng)突破性的研究成果也必將讓開發(fā)者們腦洞大開。

NVIDIA Research 由全球數(shù)百名科學(xué)家和工程師組成,團(tuán)隊(duì)專注于 AI、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺、自動(dòng)駕駛汽車、機(jī)器人學(xué)等領(lǐng)域的研究。

了解 Eureka 與 NVIDIA Research 的更多信息,請(qǐng)查看:

  • Eureka:

https://eureka-research.github.io/

  • NVIDIA Research:

https://www.nvidia.com/en-us/research/

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開放。點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,關(guān)注更多會(huì)議及活動(dòng)信息。

wKgZomU4ywaAW1PmAAFtccdApf0157.jpg


原文標(biāo)題:Eureka!NVIDIA 研究突破為機(jī)器人學(xué)習(xí)注入新動(dòng)力

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3720

    瀏覽量

    90690

原文標(biāo)題:Eureka!NVIDIA 研究突破為機(jī)器人學(xué)習(xí)注入新動(dòng)力

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    使用NVIDIA Jetson打造機(jī)器人導(dǎo)盲犬

    Selin Alara Ornek 是一名富有遠(yuǎn)見的高中生。她使用機(jī)器學(xué)習(xí)NVIDIA Jetson邊緣 AI 和機(jī)器人平臺(tái),視障人士
    的頭像 發(fā)表于 11-09 13:51 ?115次閱讀

    NVIDIA發(fā)布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德國(guó)慕尼黑舉行的機(jī)器人學(xué)習(xí)大會(huì)(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機(jī)器人開發(fā)者可以使用這些工具和工作流,大大加快 AI 機(jī)器人(包括人形
    的頭像 發(fā)表于 11-09 11:52 ?106次閱讀

    使用機(jī)器學(xué)習(xí)NVIDIA Jetson邊緣AI和機(jī)器人平臺(tái)打造機(jī)器人導(dǎo)盲犬

    Selin Alara Ornek 是一名富有遠(yuǎn)見的高中生。她使用機(jī)器學(xué)習(xí)NVIDIA Jetson 邊緣 AI 和機(jī)器人平臺(tái),視障人
    的頭像 發(fā)表于 11-08 10:05 ?178次閱讀

    麻省理工學(xué)院推出新型機(jī)器人訓(xùn)練模型

    近日,據(jù)TechCrunch報(bào)道,麻省理工學(xué)院的研究團(tuán)隊(duì)展示了一種創(chuàng)新的機(jī)器人訓(xùn)練模型,該模型突破了傳統(tǒng)模仿學(xué)習(xí)方法的局限,不再依賴標(biāo)準(zhǔn)數(shù)據(jù)集,而是借鑒了大型語(yǔ)言模型(LLM)如GPT
    的頭像 發(fā)表于 11-04 14:56 ?286次閱讀

    NVIDIA在ICRA展示最新機(jī)器人研究

    在 日前舉行的 IEEE 國(guó)際機(jī)器人和自動(dòng)化大會(huì)(ICRA)上,幾何織物(geometric fabrics)成為一個(gè)熱門的討論話題。幾何織物是 NVIDIA 機(jī)器人研究實(shí)驗(yàn)室成員與合
    的頭像 發(fā)表于 10-10 09:55 ?295次閱讀

    NVIDIA 加速人形機(jī)器人發(fā)展

    —SIGGRAPH— 當(dāng)?shù)貢r(shí)間 2024 年 7 月 29 日— 加速全球人形機(jī)器人的發(fā)展,NVIDIA 于今日宣布,全球領(lǐng)先的機(jī)器人
    發(fā)表于 07-30 09:15 ?705次閱讀
    <b class='flag-5'>NVIDIA</b> 加速人形<b class='flag-5'>機(jī)器人</b>發(fā)展

    NVIDIA Isaac 機(jī)器人平臺(tái)利用最新的生成式 AI 和先進(jìn)的仿真技術(shù),加速 AI 機(jī)器人技術(shù)的發(fā)展

    觀眾展示了用于人形機(jī)器人學(xué)習(xí)的通用基礎(chǔ)模型 Project GR00T(代表通用機(jī)器人 00 技術(shù))。Project GR00T 利用 NVIDIA Isaac 機(jī)器人平臺(tái)的各種工具來
    的頭像 發(fā)表于 06-04 18:00 ?7611次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac <b class='flag-5'>機(jī)器人</b>平臺(tái)利用最新的生成式 AI 和先進(jìn)的仿真技術(shù),加速 AI <b class='flag-5'>機(jī)器人</b>技術(shù)的發(fā)展

    它人機(jī)器人明星產(chǎn)品行業(yè)發(fā)展注入了新的活力和動(dòng)力

    近日,它人機(jī)器人應(yīng)邀參加 2024年中國(guó)(綿陽(yáng))科技城科技創(chuàng)新大會(huì)。大會(huì)為它人機(jī)器人提供了一個(gè)廣闊的展示平臺(tái),也行業(yè)的發(fā)展注入了新的活力和動(dòng)力
    的頭像 發(fā)表于 06-04 14:15 ?482次閱讀

    全球機(jī)器人開發(fā)領(lǐng)域采用NVIDIA 機(jī)器人開發(fā)和生產(chǎn)

    機(jī)器人開發(fā)領(lǐng)域的領(lǐng)先企業(yè)正在采用NVIDIA Isaac機(jī)器人平臺(tái)來研究、開發(fā)和生產(chǎn)下一代 AI 賦能的自主機(jī)器
    的頭像 發(fā)表于 06-03 18:25 ?1161次閱讀

    使用NVIDIA Isaac Manipulator生成抓取姿勢(shì)和機(jī)器人運(yùn)動(dòng)

    NVIDIA 宣布與 Intrinsic.ai 就工業(yè)機(jī)器人任務(wù)的基礎(chǔ)技能模型學(xué)習(xí)展開合作。
    的頭像 發(fā)表于 05-17 10:33 ?1025次閱讀
    使用<b class='flag-5'>NVIDIA</b> Isaac Manipulator生成抓取姿勢(shì)和<b class='flag-5'>機(jī)器人</b>運(yùn)動(dòng)

    NVIDIA Isaac機(jī)器人平臺(tái)升級(jí),加速AI機(jī)器人技術(shù)革新

    NVIDIA Isaac機(jī)器人平臺(tái)近期實(shí)現(xiàn)重大升級(jí),通過引入最新的生成式AI技術(shù)和先進(jìn)的仿真技術(shù),顯著加速了AI機(jī)器人技術(shù)的發(fā)展步伐。該平臺(tái)正不斷擴(kuò)展其基礎(chǔ)模型、機(jī)器人學(xué)習(xí)框架、AI工
    的頭像 發(fā)表于 03-27 10:36 ?609次閱讀

    機(jī)器人學(xué)習(xí)中主流智能抓取方案

    RGB顏色空間由紅綠藍(lán)三種基本色組成,疊加成任意色彩,同樣地,任意一種顏色也可以拆解三種基本色的組合,機(jī)器人通過顏色坐標(biāo)值來理解“顏色”。
    發(fā)表于 03-13 10:07 ?271次閱讀
    <b class='flag-5'>機(jī)器人學(xué)習(xí)</b>中主流智能抓取方案

    使用 NVIDIA Isaac 仿真并定位 Husky 機(jī)器人

    由 Clearpath Robotics 公司開發(fā)的 Husky 機(jī)器人是一個(gè)多功能的四輪平臺(tái),可用于室內(nèi)和室外研究。其改裝非常簡(jiǎn)單,只需添加其他傳感器和更改高級(jí)電路板即可。本文將介紹
    的頭像 發(fā)表于 12-26 18:05 ?1196次閱讀
    使用 <b class='flag-5'>NVIDIA</b> Isaac 仿真并定位 Husky <b class='flag-5'>機(jī)器人</b>

    智能高效的轉(zhuǎn)運(yùn)機(jī)器人,物流行業(yè)注入動(dòng)力

    轉(zhuǎn)運(yùn)機(jī)器人作為物流行業(yè)的新秀,具有高度自主性、高精度物品識(shí)別能力、高度靈活性和適應(yīng)性等特點(diǎn),已在倉(cāng)儲(chǔ)物流、生產(chǎn)制造、醫(yī)療等領(lǐng)域得到廣泛應(yīng)用,并有望在零售、餐飲等行業(yè)得到擴(kuò)展。隨著人工智能和機(jī)器學(xué)習(xí)等技術(shù)的不斷發(fā)展,轉(zhuǎn)運(yùn)
    的頭像 發(fā)表于 11-21 14:08 ?498次閱讀
    智能高效的轉(zhuǎn)運(yùn)<b class='flag-5'>機(jī)器人</b>,<b class='flag-5'>為</b>物流行業(yè)<b class='flag-5'>注入</b>新<b class='flag-5'>動(dòng)力</b>

    目前幾種主流的機(jī)器人智能抓取系統(tǒng)方案

    機(jī)器人學(xué)習(xí)中的經(jīng)典問題之一便是分揀:在一堆無序擺放的物品堆中,取出目標(biāo)物品。
    的頭像 發(fā)表于 11-14 14:20 ?1529次閱讀
    目前幾種主流的<b class='flag-5'>機(jī)器人</b>智能抓取系統(tǒng)方案