0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI研究人員開發(fā)出新的機(jī)械臂

姚小熊27 ? 來源:人工智能實(shí)驗(yàn)室 ? 作者:人工智能實(shí)驗(yàn)室 ? 2021-02-23 10:40 ? 次閱讀

近日,兩個(gè)由 OpenAI 的研究人員開發(fā)的一模一樣的機(jī)械臂愛麗絲和鮑勃,可以在模擬情景中通過對(duì)弈互相學(xué)習(xí),而不需要人為輸入文本。

其中一個(gè)虛擬機(jī)械臂已經(jīng)學(xué)會(huì)解決各種不同的難題堆積木、擺放桌子、排列國際象棋棋子,并且每項(xiàng)任務(wù)不需要進(jìn)行再訓(xùn)練。這一切通過與另一個(gè)機(jī)械臂對(duì)弈得以實(shí)現(xiàn)。據(jù)了解,另一個(gè)機(jī)械臂經(jīng)過訓(xùn)練后,會(huì)給原本的機(jī)械臂臂帶來越來越難的挑戰(zhàn)。

這些機(jī)器人采用的是強(qiáng)化學(xué)習(xí)算法,即在不同情況下,通過試錯(cuò)來訓(xùn)練人工智能,并采取不同行動(dòng)來實(shí)現(xiàn)目標(biāo)。游戲包括在虛擬桌面上移動(dòng)物體。例如,通過以特定的方式排列物體,愛麗絲試圖設(shè)置對(duì)鮑勃來說很難解決的謎題,而鮑勃會(huì)試圖解決愛麗絲的謎題。隨著它們的學(xué)習(xí),愛麗絲會(huì)設(shè)置更復(fù)雜的謎題,而鮑勃也會(huì)越來越會(huì)解謎。

經(jīng)過愛麗絲設(shè)置的積木謎題的訓(xùn)練后,鮑勃便可以通用于一系列任務(wù),包括擺放桌子和排列象棋棋子。

通常在多重任務(wù)處理中,深度學(xué)習(xí)模型必須在任務(wù)間進(jìn)行再訓(xùn)練。例如,AlphaZero (一款棋類 AI,可以通過自我博弈來學(xué)習(xí))會(huì)使用單一算法教自己下國際象棋、將棋和圍棋但每次只能下一盤棋。例如,下國際象棋的時(shí) AlphaZero 不能下圍棋,下圍棋時(shí)的 AlphaZero 不能下將棋。因此,造出真正能同時(shí)處理多任務(wù)的機(jī)器,是走向更通用的人工智能道路上的一大未解難題。

訓(xùn)練 AI 同時(shí)執(zhí)行多重任務(wù)時(shí)會(huì)遇到一個(gè)問題,即需要大量的例子。OpenAI 則通過訓(xùn)練愛麗絲為鮑勃生成例子,用一個(gè) AI 訓(xùn)練另一個(gè) AI 來避免這個(gè)問題。經(jīng)過訓(xùn)練,愛麗絲學(xué)會(huì)了設(shè)定目標(biāo),比如建造一座積木塔,然后把它撿起來并加以平衡。鮑勃學(xué)會(huì)了利用虛擬環(huán)境的屬性,如通過摩擦力來抓取和旋轉(zhuǎn)物體。

截至目前,虛擬現(xiàn)實(shí)的訓(xùn)練只在虛擬環(huán)境中進(jìn)行,但 OpenAI 和其他機(jī)構(gòu)的研究人員正在將虛擬環(huán)境中訓(xùn)練的模型轉(zhuǎn)移到物理環(huán)境中,且越來越有起色。據(jù)悉,模擬環(huán)境可以讓 AI 在短時(shí)間內(nèi)處理大型數(shù)據(jù)集,然后研究人員會(huì)根據(jù)現(xiàn)實(shí)世界的環(huán)境再對(duì)其進(jìn)行微調(diào)。

該團(tuán)隊(duì)的研究人員表示,他們的最終目標(biāo)是訓(xùn)練這些機(jī)械臂去解決人類可能要求它做的任何任務(wù)。與 GPT-3 一樣(GPT-3 是一個(gè)能以各種不同方式使用語言的語言模型),這些機(jī)器人手臂是 OpenAI 打造多任務(wù)人工智能整體目標(biāo)的一部分,而使用一個(gè) AI 來訓(xùn)練另一個(gè) AI 也許是其中的關(guān)鍵所在。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28876

    瀏覽量

    266218
  • 機(jī)械臂
    +關(guān)注

    關(guān)注

    12

    文章

    502

    瀏覽量

    24296
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    988

    瀏覽量

    6252
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    OrangePi AIpro應(yīng)用:機(jī)械應(yīng)用開發(fā)指南

    2024世界人工智能大會(huì)上,香橙派攜OrangePiAIpro20T在世博展覽館H1-A301展區(qū)亮相,給大家?guī)鞟I+互動(dòng)的沉浸式體驗(yàn)。其中,搭載OrangePiAIpro開發(fā)板的智能機(jī)械吸引了
    的頭像 發(fā)表于 08-19 16:42 ?391次閱讀
    OrangePi AIpro應(yīng)用:<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>應(yīng)用<b class='flag-5'>開發(fā)</b>指南

    大象機(jī)器人開源協(xié)作機(jī)械機(jī)械接入GPT4o大模型!

    本文已經(jīng)或者同濟(jì)子豪兄作者授權(quán)對(duì)文章進(jìn)行編輯和轉(zhuǎn)載 引言 隨著人工智能和機(jī)器人技術(shù)的快速發(fā)展,機(jī)械在工業(yè)、醫(yī)療和服務(wù)業(yè)等領(lǐng)域的應(yīng)用越來越廣泛。通過結(jié)合大模型和多模態(tài)AI,機(jī)械能夠?qū)?/div>
    的頭像 發(fā)表于 07-03 14:09 ?541次閱讀
    大象機(jī)器人開源協(xié)作<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b><b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>接入GPT4o大模型!

    OpenAI發(fā)出警告信:多國開發(fā)者面臨API封鎖 OpenAI API解決方案

    發(fā)出的警告信明確指出,如果開發(fā)者繼續(xù)在OpenAI不允許的國家使用其API,他們的訪問權(quán)限將被封鎖。信中強(qiáng)調(diào)了公司政策的嚴(yán)肅性,并呼吁開發(fā)者遵守相關(guān)規(guī)定。信中具體提到: 違規(guī)行為 :
    的頭像 發(fā)表于 06-26 11:29 ?661次閱讀
    <b class='flag-5'>OpenAI</b><b class='flag-5'>發(fā)出</b>警告信:多國<b class='flag-5'>開發(fā)</b>者面臨API封鎖 <b class='flag-5'>OpenAI</b> API解決方案

    OpenAI推出ChatGPT Edu,助力教育及學(xué)術(shù)領(lǐng)域AI應(yīng)用普及

    OpenAI近日宣布推出全新服務(wù)——ChatGPT Edu,旨在推動(dòng)教育機(jī)構(gòu)與學(xué)術(shù)單位在人工智能領(lǐng)域的深入應(yīng)用與發(fā)展。此舉不僅彰顯了OpenAI在普及AI技術(shù)方面的決心,也為廣大師生及研究人員提供了強(qiáng)有力的技術(shù)支撐。
    的頭像 發(fā)表于 06-04 09:17 ?411次閱讀

    研究人員開發(fā)出高性能p型非晶氧化物半導(dǎo)體

    和 107 的開/關(guān)電流比,與早期 n 型氧化物薄膜晶體管的關(guān)鍵電氣屬性非常相似。此外,薄膜晶體管在長時(shí)間偏置應(yīng)力下表現(xiàn)出顯著的穩(wěn)定性以及大面積薄膜的均勻性。 圖源:浦項(xiàng)工科大學(xué) 研究人員合作開發(fā)了碲硒復(fù)合氧化物半導(dǎo)體材料。他們成功創(chuàng)造了高性能和高穩(wěn)定性的p型薄膜晶體管(
    的頭像 發(fā)表于 04-30 14:58 ?372次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>開發(fā)出</b>高性能p型非晶氧化物半導(dǎo)體

    如何去提升機(jī)械的位置控制性能?

    1.背景介紹 機(jī)械的位置控制是機(jī)械最重要的功能。機(jī)械的位置控制精度也是
    的頭像 發(fā)表于 03-05 08:43 ?597次閱讀
    如何去提升<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>的位置控制性能?

    OpenAI發(fā)布首個(gè)文生視頻模型Sora

    開發(fā)出熱門聊天機(jī)器人ChatGPT后,OpenAI繼續(xù)在生成式人工智能上玩出新花樣。
    的頭像 發(fā)表于 02-19 13:56 ?893次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))2.手把手玩轉(zhuǎn)游戲機(jī)械

    。但由于篇幅限制,下面是一個(gè)簡化的項(xiàng)目方案和步驟: (我會(huì)盡量逐行解釋關(guān)鍵部分的代碼。謝謝?。?1. 硬件連接與配置 首先,需要將TI OMAP-L138 FPGA處理器開發(fā)板、三組四自由度機(jī)械以及紅外
    發(fā)表于 02-01 20:18

    【開源獲獎(jiǎng)案例】四軸機(jī)械控制系統(tǒng)

    ——來自迪文開發(fā)者論壇本期為大家推送迪文開發(fā)者論壇獲獎(jiǎng)開源案例——四軸機(jī)械控制系統(tǒng)。工程師采用T5L智能屏,基于DGUS軟件“旋轉(zhuǎn)指示”控件實(shí)現(xiàn)機(jī)
    的頭像 發(fā)表于 12-23 08:13 ?898次閱讀
    【開源獲獎(jiǎng)案例】四軸<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>控制系統(tǒng)

    開源六軸協(xié)作機(jī)械MechArm案例演示!

    一些危險(xiǎn)環(huán)境中,我們可以用機(jī)械來代替人工進(jìn)行作業(yè),從而避免人員的生命安全受到威脅。 你可能會(huì)問,為什么不直接使用遠(yuǎn)程的鍵盤控制、手柄控制或者APP控制,而要選擇手動(dòng)拖拽的方式呢?我覺得只有手動(dòng)操作,才能最大程度上
    的頭像 發(fā)表于 11-28 15:58 ?742次閱讀
    開源六軸協(xié)作<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>MechArm案例演示!

    如何解決柔性機(jī)械建模過程問題

    柔性機(jī)械 剛性機(jī)械建模方法已經(jīng)可以有效地求解出機(jī)械各部分之間的耦合情況,但是對(duì)于柔性
    的頭像 發(fā)表于 11-17 17:12 ?704次閱讀

    剛性機(jī)械的動(dòng)力學(xué)建模

    剛性機(jī)械 機(jī)械建模是機(jī)械控制的基礎(chǔ),控制效果的好壞很大程度上決定于所建立的動(dòng)力學(xué)模型的準(zhǔn)確
    的頭像 發(fā)表于 11-17 17:03 ?660次閱讀

    研究人員開發(fā)出定制薄膜的新方法

    爾層沉積工藝示意圖。 德國耶拿萊布尼茨光子技術(shù)研究所(Leibniz IPHT)領(lǐng)導(dǎo)的一個(gè)德美科學(xué)家團(tuán)隊(duì)開發(fā)出一種新方法,可自動(dòng)沉積具有明確特性的有機(jī)半導(dǎo)體薄膜。 這一方法發(fā)表在《先進(jìn)材料》(Advanced Materials)期刊上,利用該方法,有可能生產(chǎn)出具有相
    的頭像 發(fā)表于 11-17 16:09 ?318次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>開發(fā)出</b>定制薄膜的新方法

    機(jī)械結(jié)構(gòu)是什么樣的

    機(jī)械 6 個(gè)關(guān)節(jié)都是轉(zhuǎn)動(dòng)關(guān)節(jié),前 3 個(gè)關(guān)節(jié)確定手腕參考點(diǎn)的位置,后 3個(gè)關(guān)節(jié)確定手腕的方位。和大多數(shù)工業(yè)機(jī)器人一樣,后 3個(gè)關(guān)節(jié)軸線交于一點(diǎn)。因此將該點(diǎn)作為手腕的參考點(diǎn),也選作為連桿坐標(biāo)系{4
    的頭像 發(fā)表于 11-17 15:48 ?2512次閱讀
    <b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>結(jié)構(gòu)是什么樣的

    小到一個(gè)分子!研究人員開發(fā)一種微小的壓電電阻器

    使用壓阻的電子傳感器在許多設(shè)備中都很常見,包括汽車、醫(yī)療可穿戴設(shè)備和智能手機(jī)?,F(xiàn)在,澳大利亞的研究人員開發(fā)了一種微小的壓電電阻器,小到一個(gè)分子,可以實(shí)現(xiàn)一系列全新的應(yīng)用。 該研究的作者之一、澳大利亞
    的頭像 發(fā)表于 10-31 16:52 ?750次閱讀