0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)新研究使用合成訓(xùn)練數(shù)據(jù)進(jìn)行機(jī)器人操縱

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-05-23 15:12 ? 次閱讀

NVIDIA的研究人員開發(fā)了第一個可以教機(jī)器人僅通過觀察人類的行為來完成任務(wù)的深度學(xué)習(xí)系統(tǒng)。該方法利用合成數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò),是第一次在機(jī)器人上使用以圖像為中心的域隨機(jī)化方法。

來自NVIDIA的研究人員開發(fā)了一個基于深度學(xué)習(xí)的系統(tǒng),該系統(tǒng)可以教機(jī)器人僅通過觀察人類的行為來完成任務(wù)。該方法旨在加強(qiáng)人與機(jī)器人之間的交流,同時進(jìn)一步研究如何使人類無縫地與機(jī)器人一起工作。這是第一個這樣的系統(tǒng),研究由Stan Birchfield和Jonathan Tremblay領(lǐng)導(dǎo)。

“要想讓機(jī)器人在現(xiàn)實世界中執(zhí)行有用的任務(wù),必須要能很容易地將任務(wù)傳達(dá)給機(jī)器人。這包括預(yù)期的結(jié)果以及任何關(guān)于達(dá)到該結(jié)果的最佳方法的提示?!毖芯咳藛T在他們的研究報告中指出?!巴ㄟ^演示,用戶可以將任務(wù)傳達(dá)給機(jī)器人,并向機(jī)器人提供如何以最佳的方式執(zhí)行任務(wù)的線索?!?/p>

研究人員使用NVIDIA TITAN X GPU訓(xùn)練了一系列神經(jīng)網(wǎng)絡(luò)來執(zhí)行與感知、程序生成和程序執(zhí)行相關(guān)的任務(wù)。結(jié)果顯示,機(jī)器人能夠通過觀察現(xiàn)實世界的單個演示來學(xué)習(xí)任務(wù)。

該方法的工作方式:一個攝像機(jī)被用來捕獲場景的實時視頻流,并且通過兩個神經(jīng)網(wǎng)絡(luò)實時地對場景中對象的位置和關(guān)系進(jìn)行推斷。由此產(chǎn)生的知覺被輸入到另一個網(wǎng)絡(luò)中,該網(wǎng)絡(luò)生成一個解釋如何重建這些感知的計劃。 最后,一個執(zhí)行網(wǎng)絡(luò)讀取該計劃并為機(jī)器人生成動作,同時考慮到當(dāng)前場景的狀態(tài),以確保對外部干擾的穩(wěn)健性。

一旦機(jī)器人得到一個任務(wù),它就會生成一個人類可讀取的關(guān)于重新執(zhí)行該任務(wù)所需步驟的描述。該描述讓用戶能夠在機(jī)器人執(zhí)行之前快速識別和糾正機(jī)器人對人類演示的解釋中的問題。

實現(xiàn)這種能力的關(guān)鍵是利用合成數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。目前訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法需要大量有標(biāo)記的訓(xùn)練數(shù)據(jù),這對這類系統(tǒng)來說是一個瓶頸。通過合成數(shù)據(jù)生成,不用太費力就可以生成幾乎無限的標(biāo)記訓(xùn)練數(shù)據(jù)。

這也是第一次在機(jī)器人上使用以圖像為中心的域隨機(jī)化方法。域隨機(jī)化(domain randomization)是一種產(chǎn)生大量多樣性的合成數(shù)據(jù)的技術(shù),然后愚弄感知網(wǎng)絡(luò)將真實世界的數(shù)據(jù)看作是其訓(xùn)練數(shù)據(jù)的另一種變體。研究人員選擇以圖像為中心的方式處理數(shù)據(jù),以確保網(wǎng)絡(luò)不依賴于攝像機(jī)或環(huán)境。

研究人員說:“如描述所示,這個感知網(wǎng)絡(luò)適用于任何固態(tài)的現(xiàn)實世界物體,這些物體可以通過其3D邊界立方體(bounding cuboid)來模擬?!薄氨M管訓(xùn)練過程中從未觀察到真實的圖像,但感知網(wǎng)絡(luò)能夠在真實圖像中可靠地檢測到物體的bounding cuboid,即使在有嚴(yán)重的遮擋的情況下也是如此?!?/p>

在他們的演示中,研究團(tuán)隊用幾個彩色積木和一輛玩具汽車訓(xùn)練目標(biāo)檢測器。系統(tǒng)被教授“塊”(blocks)的物理關(guān)系,不管這些“塊”是堆疊在一起還是彼此相鄰放置。

在上面的演示視頻中,人類操作員向機(jī)器人展示了一組立方塊。系統(tǒng)然后推斷一個適當(dāng)?shù)某绦虿凑_的順序?qū)⒘⒎綁K正確地放置好。因為它在執(zhí)行過程中會考慮當(dāng)前世界的狀態(tài),因此系統(tǒng)能夠?qū)崟r地從錯誤中恢復(fù)過來。

研究人員將在本周于澳大利亞布里斯班舉行的機(jī)器人與自動化國際會議(ICRA)上發(fā)表他們的研究論文和工作。

該團(tuán)隊表示,他們將繼續(xù)探索使用合成訓(xùn)練數(shù)據(jù)進(jìn)行機(jī)器人操縱,以將他們的方法擴(kuò)展到其他場景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28129

    瀏覽量

    205894
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4862

    瀏覽量

    102723
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5471

    瀏覽量

    120904

原文標(biāo)題:一看就會!英偉達(dá)新研究教機(jī)器人僅通過觀察人類行為完成任務(wù)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    英偉達(dá)預(yù)測機(jī)器人領(lǐng)域或迎“GPT-3時刻”

    英偉達(dá),作為全球圖形處理器與人工智能領(lǐng)域的佼佼者,正引領(lǐng)著科技界對機(jī)器人未來的無限遐想。近日,英偉達(dá)高級科學(xué)家Jim Fan在科技媒體The
    的頭像 發(fā)表于 09-20 17:05 ?740次閱讀

    英偉達(dá)利用人工智能和Omniverse加速人形機(jī)器人開發(fā)

    8月6日,英偉達(dá)揭曉了一項創(chuàng)新工作流程,該流程深度融合了人工智能技術(shù)與其Omniverse平臺,旨在為人形機(jī)器人的研發(fā)按下加速鍵。通過巧妙結(jié)合蘋果Vision Pro的先進(jìn)功能與英偉
    的頭像 發(fā)表于 08-06 17:29 ?658次閱讀

    英偉達(dá)打造人形機(jī)器人訓(xùn)練平臺,引領(lǐng)AI新紀(jì)元

    英偉達(dá)近日宣布了一項重大舉措,為全球機(jī)器人制造業(yè)與AI領(lǐng)域注入強(qiáng)勁動力。公司推出了專為人形機(jī)器人設(shè)計的訓(xùn)練平臺,旨在為行業(yè)領(lǐng)先的制造商、AI
    的頭像 發(fā)表于 08-05 11:45 ?658次閱讀

    奧比中光與英偉達(dá)深化機(jī)器人場景合作

    奧比中光在最新互動平臺動態(tài)中宣布,公司與全球領(lǐng)先的圖形處理器(GPU)制造商英偉達(dá)機(jī)器人領(lǐng)域展開了深度合作,標(biāo)志著雙方在推動3D視覺技術(shù)在機(jī)器人行業(yè)應(yīng)用上的又一重要里程碑。
    的頭像 發(fā)表于 08-01 17:17 ?895次閱讀

    阿爾特攜手英偉達(dá),將Omniverse融入機(jī)器人研發(fā)

     近日,阿爾特公司在其機(jī)構(gòu)調(diào)研活動中透露,公司正攜手英偉達(dá)技術(shù)團(tuán)隊,將Omniverse平臺深度融入機(jī)器人研發(fā)領(lǐng)域,旨在打通英偉達(dá)全面的
    的頭像 發(fā)表于 07-25 12:40 ?661次閱讀

    Al大模型機(jī)器人

    理解能力強(qiáng)大: AI大模型機(jī)器人可以理解和生成自然語言,能夠進(jìn)行復(fù)雜的對話和語言任務(wù)。它們能夠識別語言中的語義、語境和情感,并據(jù)此作出適當(dāng)?shù)幕貞?yīng)。廣泛的知識儲備: 這些模型基于大規(guī)模的數(shù)據(jù)進(jìn)
    發(fā)表于 07-05 08:52

    人形機(jī)器人的未來:從英偉達(dá)到特斯拉的機(jī)器人革命

    在科技飛速發(fā)展的今天,機(jī)器人技術(shù)正逐步從科幻走向現(xiàn)實。近日,英偉達(dá)CEO黃仁勛在一次采訪中大膽預(yù)測,機(jī)器人技術(shù)將在未來2-3年內(nèi)取得重大突破,并預(yù)言人形
    的頭像 發(fā)表于 06-18 14:56 ?438次閱讀

    英偉達(dá)CEO黃仁勛展望AI與機(jī)器人新時代

    在COMPUTEX 2024大會上,英偉達(dá)CEO黃仁勛發(fā)表了激動人心的演講,他看好機(jī)器人即將跨入擁有更強(qiáng)感知能力和系統(tǒng)的全新時代。黃仁勛強(qiáng)調(diào)了自家人工智能(AI)Omniverse技術(shù)在這一領(lǐng)域的巨大潛力,該技術(shù)將助力
    的頭像 發(fā)表于 06-03 11:30 ?699次閱讀

    英偉達(dá)發(fā)布人形機(jī)器人基礎(chǔ)模型

    英偉達(dá)在一年一度的GTC開發(fā)者大會上,由創(chuàng)始黃仁勛親自揭曉了令人矚目的Project GR00T人形機(jī)器人項目,其中引人注目的是一款全新的人形機(jī)器
    的頭像 發(fā)表于 03-21 11:43 ?694次閱讀

    英偉達(dá)GTC大會丨宇樹通用人形機(jī)器人H1與全球共同擁抱AI

    2024年3月19日,英偉達(dá)CEO黃仁勛在美國加州圣何塞SAP中心發(fā)表主題演講《見證AI的變革時刻》,正式拉開了2024年英偉達(dá)GTC大會的序幕。 宇樹(Unitree)通用人形
    的頭像 發(fā)表于 03-20 14:55 ?590次閱讀

    人形機(jī)器人火熱 OpenAI入局人形機(jī)器人 英偉達(dá)等巨頭入局機(jī)器人行業(yè)

    人形機(jī)器人火熱 OpenAI入局人形機(jī)器人 英偉達(dá)等巨頭入局機(jī)器人行業(yè) 人形機(jī)器人在AI的帶動下
    的頭像 發(fā)表于 02-26 17:21 ?737次閱讀

    英偉達(dá)、微軟、OpenAI紛紛下注人形機(jī)器人初創(chuàng)公司FigureAI

    2024年初,機(jī)器人領(lǐng)域迎來了一場科技巨頭的投資熱潮。英偉達(dá)、微軟、OpenAI和亞馬遜創(chuàng)始貝索斯等重量級玩家紛紛向初創(chuàng)公司FigureAI注資,總額高達(dá)6.75億美元。這一動作不僅
    的頭像 發(fā)表于 02-26 11:27 ?872次閱讀

    人形機(jī)器人爆發(fā)前夜?英偉達(dá)和OpenAI等巨頭紛紛押注

    新近消息顯示,一家開發(fā)類人機(jī)器人的初創(chuàng)公司新近融資云集包括英偉達(dá)和OpenAI在內(nèi)的硅谷大廠和風(fēng)投基金,顯示類人機(jī)器人正在成為科技巨頭押注人工智能(AI)應(yīng)用的新風(fēng)口。
    的頭像 發(fā)表于 02-26 09:36 ?1004次閱讀

    曝貝佐斯和英偉達(dá)投資Figure人形機(jī)器人 超大手筆投資

    曝貝佐斯和英偉達(dá)投資Figure人形機(jī)器人 就在AI之后,大家還在關(guān)注人形機(jī)器人,有外媒報道貝佐斯和科技巨頭英偉
    的頭像 發(fā)表于 02-25 14:37 ?834次閱讀

    英偉達(dá)推出全新AI聊天機(jī)器人

    近日,英偉達(dá)(Nvidia)宣布推出其全新的AI聊天機(jī)器人——“Chat With RTX”。這款聊天機(jī)器人被視為英偉
    的頭像 發(fā)表于 02-19 11:09 ?846次閱讀