0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Google的AI教會機器人學會了新的技能

獨愛72H ? 來源:教育新聞網 ? 作者:教育新聞網 ? 2020-05-07 22:37 ? 次閱讀

(文章來源:教育新聞網)
谷歌和加州大學伯克利分校的研究人員在本周在預印本服務器Arxiv.org上發(fā)表的兩篇論文中描述了新的AI機器學習技術,這些技術使機器人能夠適應從未見過的任務并抓住被遮擋的物體。第一項研究詳細介紹了X射線,該算法在部署到機器人上時可以搜索對象的堆以掌握目標對象,而第二項研究則提出了一種策略適應技術,可以“教”機器人技能,而無需從頭開始進行模型訓練。

抓機器人是一個非常困難的挑戰(zhàn)。例如,機器人努力執(zhí)行所謂的“機械搜索”,即當他們不得不從一堆其他對象中識別并拾取一個對象時。大多數(shù)機器人不是特別適應性強,并且缺乏足夠功能強大的AI模型來指導機械手進行機械搜索。X射線和策略調整步驟可以構成產品包裝系統(tǒng)的基礎,該產品包裝系統(tǒng)可以在無需人工監(jiān)督的情況下發(fā)現(xiàn),拾取和放下各種物體。

有關X射線的研究的合著者指出,由于缺乏合適的模型,機械搜索(在大量對象中找到對象)仍然具有挑戰(zhàn)性。X射線結合了遮擋推斷和假設預測來解決該問題,它可用來估計與對象最相似的邊界框(對象周圍矩形邊框的坐標)的占用率分布,同時考慮各種平移和旋轉。

X-Ray假定堆中至少有一個完全或部分被未知對象遮擋的目標對象,并且每個時間步最多可以抓取一個對象。以RGB圖像和目標對象為輸入,它可以預測場景的占用率分布和分割蒙版,并計算幾種潛在的抓握動作,以最高的成功概率執(zhí)行該動作。為了訓練和驗證X射線,研究人員生成了10,000個增強深度圖像的語料庫,這些圖像標記有矩形框目標對象的對象占用分布。他們從Thingiverse上的1296個3D CAD模型的開放源數(shù)據(jù)集中進行采樣,選擇了10個大小相同,體積較小但厚度較小的盒子目標,因此它們更有可能被遮擋。這使他們總共獲得了100,000張圖像。

在這10,000張圖片中,約有8,000張被保留用于培訓,其余的則留作測試。使用一千個包含模擬對象(蓋子,多米諾骨牌和長笛)的其他圖像來評估X射線對看不見的形狀,對象,長寬比和比例尺的概括。在涉及帶有吸盤和平行顎式抓爪的真實ABB YuMi機器人的物理實驗中,研究人員要求X射線將物體裝滿垃圾箱,然后將垃圾箱傾倒在目標物體的頂部。在最初包含25個對象的堆中,系統(tǒng)在20次試驗中以5個動作的中位數(shù)提取了目標對象,成功率為100%。

合著者將精力放在未來的工作上,以提高X射線的訓練效率,并分析數(shù)據(jù)集大小以及用于生成訓練分布的平移和旋轉次數(shù)的影響。他們還計劃根據(jù)目標對象可見性的獎勵來探索強化學習策略。

在這兩篇論文的最新文章中,合著者試圖開發(fā)一種能夠不斷適應新的現(xiàn)實環(huán)境,物體和條件的系統(tǒng)。與大多數(shù)機器人相反,后者僅需訓練一次即可部署,而適應能力卻很少。研究人員對機器學習模型進行了預訓練,以在608,000次嘗試抓取的語料庫中抓取一系列對象,然后他們執(zhí)行的任務是使用向其起始位置右移10厘米的抓手抓取對象。系統(tǒng)練習了一段時間(經過800次嘗試)并將這些嘗試記錄到新數(shù)據(jù)集(目標數(shù)據(jù)集)中之后,新嘗試在50%的時間內與原始數(shù)據(jù)集進行了混合,調整模型。

在五個不同的場景中重復了這些步驟-預訓練,嘗試新任務和微調。一方面,刺眼的光線阻礙了機器人的攝像頭。在另一種情況下,棋盤圖案的背景使模型難以識別對象。最后,實驗人員讓機器人抓住訓練中看不到的透明瓶子(眾所周知,透明物體很難抓住機器人,因為它們有時會混淆深度傳感器),并撿拾坐在高反射金屬板上的物體。

研究人員報告說,在實驗中,該模型成功地在苛刻的燈光下63%的時間,透明瓶子的74%的時間,棋盤墊板的時間的86%的時間,抓手擴展的88%的時間成功地捕獲了物體,和91%的時間使用偏置夾持器。而且,他們說,機器人適應新情況只需要花費1-4個小時的練習時間(相比之下,學習如何掌握的時間大約為6,000個小時),并且性能不會隨著所適應的模型而降低。
(責任編輯:fqj)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6128

    瀏覽量

    104979
  • AI
    AI
    +關注

    關注

    87

    文章

    29852

    瀏覽量

    268151
收藏 人收藏

    評論

    相關推薦

    【書籍評測活動NO.51】具身智能機器人系統(tǒng) | 了解AI的下一個浪潮!

    的。 這種理論強調,智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務的能力。 具身智能的實現(xiàn)涵蓋了機器學習、人工智能、機器人學、計算機視覺、自然語言處理和強化學習等領域
    發(fā)表于 11-11 10:20

    NVIDIA發(fā)布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德國慕尼黑舉行的機器人學習大會(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機器人開發(fā)者可以使用這些工具和工作流,大大加快 AI
    的頭像 發(fā)表于 11-09 11:52 ?138次閱讀

    麻省理工學院推出新型機器人訓練模型

    近日,據(jù)TechCrunch報道,麻省理工學院的研究團隊展示了一種創(chuàng)新的機器人訓練模型,該模型突破了傳統(tǒng)模仿學習方法的局限,不再依賴標準數(shù)據(jù)集,而是借鑒了大型語言模型(LLM)如GPT-4等所使用的大規(guī)模信息處理方式,為機器人學習新技能開辟了全新的道路。
    的頭像 發(fā)表于 11-04 14:56 ?303次閱讀

    Google Cloud AI助力衛(wèi)安智能推出機器人解決方案

    Google Cloud 基于神經網絡的語音識別技術讓衛(wèi)安智能得以滿足小語種地區(qū)用戶對機器人交互的需求,為其節(jié)省約60%與第三方溝通協(xié)作的人力成本,并運用高性能的計算資源將產品的開發(fā)周期縮短了一半。
    的頭像 發(fā)表于 10-16 11:11 ?428次閱讀

    機器人的三大矩陣是什么及關系式

    機器人學中,三大矩陣主要指的是與機器人位移、速度和力相關的矩陣,它們分別揭示了機器人在不同空間(如關節(jié)空間和作業(yè)空間)之間的映射關系。這三大矩陣及其關系式可以概括如下: 1. T矩陣(變換矩陣
    的頭像 發(fā)表于 09-04 09:37 ?720次閱讀

    “卷不動了”?OTA來救場!智能機器人“永葆青春”的秘訣

    的掃地機器人突然學會了拖地,是不是很酷?OTA就是讓這種“逆天改命”成為可能的魔法! 1、智能機器人的發(fā)展趨勢與OTA機遇 智能機器人3.0時代,用戶需求日益多樣化,模塊化、定制化成為
    的頭像 發(fā)表于 08-06 16:01 ?340次閱讀
    “卷不動了”?OTA來救場!智能<b class='flag-5'>機器人</b>“永葆青春”的秘訣

    Al大模型機器人

    金航標kinghelm薩科微slkor總經理宋仕強介紹說,薩科微Al大模型機器人有哪些的優(yōu)勢?薩科微AI大模型機器人由清華大學畢業(yè)的天才少年N博士和王博士團隊開發(fā),與同行相比具有許多優(yōu)勢:語言
    發(fā)表于 07-05 08:52

    NVIDIA Isaac 機器人平臺利用最新的生成式 AI 和先進的仿真技術,加速 AI 機器人技術的發(fā)展

    觀眾展示了用于人形機器人學習的通用基礎模型 Project GR00T(代表通用機器人 00 技術)。Project GR00T 利用 NVIDIA Isaac 機器人平臺的各種工具來創(chuàng)建用于人形
    的頭像 發(fā)表于 06-04 18:00 ?7617次閱讀
    NVIDIA Isaac <b class='flag-5'>機器人</b>平臺利用最新的生成式 <b class='flag-5'>AI</b> 和先進的仿真技術,加速 <b class='flag-5'>AI</b> <b class='flag-5'>機器人</b>技術的發(fā)展

    使用NVIDIA Isaac Manipulator生成抓取姿勢和機器人運動

    NVIDIA 宣布與 Intrinsic.ai 就工業(yè)機器人任務的基礎技能模型學習展開合作。
    的頭像 發(fā)表于 05-17 10:33 ?1026次閱讀
    使用NVIDIA Isaac Manipulator生成抓取姿勢和<b class='flag-5'>機器人</b>運動

    NVIDIA Isaac機器人平臺升級,加速AI機器人技術革新

    NVIDIA Isaac機器人平臺近期實現(xiàn)重大升級,通過引入最新的生成式AI技術和先進的仿真技術,顯著加速了AI機器人技術的發(fā)展步伐。該平臺正不斷擴展其基礎模型、
    的頭像 發(fā)表于 03-27 10:36 ?611次閱讀

    機器人學習中主流智能抓取方案

    RGB顏色空間由紅綠藍三種基本色組成,疊加成任意色彩,同樣地,任意一種顏色也可以拆解為三種基本色的組合,機器人通過顏色坐標值來理解“顏色”。
    發(fā)表于 03-13 10:07 ?275次閱讀
    <b class='flag-5'>機器人學</b>習中主流智能抓取方案

    谷歌AI聊天機器人改名為Gemini

    谷歌(Google)近日宣布,旗下備受矚目的AI聊天機器人Bard正式更名為Gemini,并推出了一款功能更加強大的付費版本——Gemini Advanced。這一戰(zhàn)略調整旨在與微軟、OpenAI等科技巨頭在
    的頭像 發(fā)表于 02-18 11:28 ?1028次閱讀

    機器人擁抱AI大模型已成共識!

    目前普遍的共識是,機器人擁抱AI大模型的過程就是具身智能機器人的實現(xiàn)過程,融合AI大模型的具身智能機器人將是未來
    發(fā)表于 12-22 17:08 ?360次閱讀

    機器人中都有哪些坐標系

    坐標系是我們非常熟悉的一個概念,也是機器人學中的重要基礎,在一個完整的機器人系統(tǒng)中,會存在很多坐標系,這些坐標系之間的位置關系該如何管理? ROS給我們提供了一個坐標系的管理神器——TF。 機器人
    的頭像 發(fā)表于 11-22 17:20 ?1399次閱讀
    <b class='flag-5'>機器人</b>中都有哪些坐標系

    目前幾種主流的機器人智能抓取系統(tǒng)方案

    機器人學習中的經典問題之一便是分揀:在一堆無序擺放的物品堆中,取出目標物品。
    的頭像 發(fā)表于 11-14 14:20 ?1532次閱讀
    目前幾種主流的<b class='flag-5'>機器人</b>智能抓取系統(tǒng)方案