0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

美國陸軍研發(fā)了一種高效的地面機(jī)器人學(xué)習(xí)模型

姚小熊27 ? 來源:人工智能實(shí)驗(yàn)室 ? 作者:人工智能實(shí)驗(yàn)室 ? 2021-01-06 09:20 ? 次閱讀

美國陸軍面向未來多域作戰(zhàn)概念研發(fā)了一種高效的地面機(jī)器人學(xué)習(xí)模型,該模型提出基于強(qiáng)化學(xué)習(xí)的策略,可有效減少當(dāng)前訓(xùn)練強(qiáng)化學(xué)習(xí)策略的不可預(yù)測性,使自主智能體能夠推理并適應(yīng)不斷變化的戰(zhàn)場條件。

強(qiáng)化學(xué)習(xí)是智能體(Agent)以“試錯(cuò)”的方式進(jìn)行學(xué)習(xí),通過與環(huán)境進(jìn)行交互獲得的獎(jiǎng)賞指導(dǎo)行為,目標(biāo)是使智能體獲得最大的獎(jiǎng)賞。強(qiáng)化學(xué)習(xí)技術(shù)具備解決復(fù)雜問題的能力,近年來在如圍棋、象棋和電子游戲等領(lǐng)域有較為長足的發(fā)展。美國陸軍將這種強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用在地面機(jī)器人面臨著兩個(gè)巨大挑戰(zhàn)。首先是算法的限制。在強(qiáng)化學(xué)習(xí)中,策略梯度方法(Policy Gradient Methods)是連續(xù)空間可伸縮算法的基礎(chǔ),但是現(xiàn)有技術(shù)無法支持更廣泛的決策目標(biāo),例如風(fēng)險(xiǎn)敏感性、安全約束、對先驗(yàn)知識的探索和發(fā)散。其次就是數(shù)據(jù)量的問題。強(qiáng)化學(xué)習(xí)需要大量的樣本復(fù)雜性,而美國陸軍多域作戰(zhàn)概念和下一代戰(zhàn)斗車輛(NGCV)項(xiàng)目目前數(shù)據(jù)匱乏并不支持現(xiàn)有訓(xùn)練機(jī)制。

在陸軍多域作戰(zhàn)概念和NGCV項(xiàng)目中應(yīng)用強(qiáng)化學(xué)習(xí),訓(xùn)練機(jī)制必須提高連續(xù)空間中的樣本效率和可靠性,ARL通過將現(xiàn)有的策略搜索方案推廣到通用工具,取得了重要突破。研究人員為通用程序開發(fā)了新的策略搜索方案,并且還確定了其樣本復(fù)雜度。由此產(chǎn)生的策略搜索方案減少了獎(jiǎng)勵(lì)積累的波動性,形成了對未知領(lǐng)域的有效探索和先驗(yàn)的機(jī)制。值得注意的是,地面機(jī)器人獲取數(shù)據(jù)的成本很高。減少獎(jiǎng)勵(lì)積累的波動性,確保以有效的方式探索未知領(lǐng)域,或者吸收以前的經(jīng)驗(yàn),都將有助于打破強(qiáng)化學(xué)習(xí)中現(xiàn)行實(shí)踐的樣本效率壁壘。通過減少隨機(jī)抽樣的數(shù)量,可以實(shí)現(xiàn)策略優(yōu)化。

這項(xiàng)研究為強(qiáng)化學(xué)習(xí)中的經(jīng)典策略梯度定理做出了貢獻(xiàn)。裝備有強(qiáng)化學(xué)習(xí)功能的自主機(jī)器人將能夠協(xié)助戰(zhàn)士在未來戰(zhàn)場上進(jìn)行偵察探索和風(fēng)險(xiǎn)評估。研究人員下一步計(jì)劃在強(qiáng)化學(xué)習(xí)中將更廣泛的決策目標(biāo)納入多主體設(shè)置,并研究強(qiáng)化學(xué)習(xí)主體之間的交互設(shè)置如何在團(tuán)隊(duì)之間產(chǎn)生協(xié)同和對抗性推理。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27839

    瀏覽量

    204600
收藏 人收藏

    評論

    相關(guān)推薦

    FMEA在焊接機(jī)器人研發(fā)中的應(yīng)用

    在現(xiàn)代工業(yè)制造領(lǐng)域,焊接機(jī)器人的應(yīng)用越來越廣泛,它們的高效、精確和可靠性已成為提升制造業(yè)競爭力的關(guān)鍵。然而,隨著焊接機(jī)器人技術(shù)的不斷進(jìn)步,其研發(fā)過程中也面臨著諸多挑戰(zhàn)。今天,我們將探討
    的頭像 發(fā)表于 07-23 11:33 ?309次閱讀

    Al大模型機(jī)器人

    豐富的知識儲備。它們可以涵蓋各種領(lǐng)域的知識,并能夠回答相關(guān)問題。靈活性與通用性: AI大模型機(jī)器人具有很強(qiáng)的靈活性和通用性,能夠處理各種類型的任務(wù)和問題。持續(xù)學(xué)習(xí)和改進(jìn): 這些模型可以
    發(fā)表于 07-05 08:52

    NVIDIA Isaac 機(jī)器人平臺利用最新的生成式 AI 和先進(jìn)的仿真技術(shù),加速 AI 機(jī)器人技術(shù)的發(fā)展

    觀眾展示了用于人形機(jī)器人學(xué)習(xí)的通用基礎(chǔ)模型 Project GR00T(代表通用機(jī)器人 00 技術(shù))。Project GR00T 利用 NVIDIA Isaac 機(jī)器人平臺的各種工具來
    的頭像 發(fā)表于 06-04 18:00 ?3129次閱讀
    NVIDIA Isaac <b class='flag-5'>機(jī)器人</b>平臺利用最新的生成式 AI 和先進(jìn)的仿真技術(shù),加速 AI <b class='flag-5'>機(jī)器人</b>技術(shù)的發(fā)展

    現(xiàn)代戰(zhàn)場中地面機(jī)器人的應(yīng)用與影響

    人工智能(AI)可以不斷提升自主機(jī)器人的能力,這意味著地面機(jī)器人越來越有能力與人類并肩執(zhí)行任務(wù)。到2030年,預(yù)計(jì)全球無人地面車輛的數(shù)量將從目前的1.5萬輛增長到4萬輛。
    發(fā)表于 04-20 09:19 ?278次閱讀

    NVIDIA Isaac機(jī)器人平臺升級,加速AI機(jī)器人技術(shù)革新

    NVIDIA Isaac機(jī)器人平臺近期實(shí)現(xiàn)重大升級,通過引入最新的生成式AI技術(shù)和先進(jìn)的仿真技術(shù),顯著加速了AI機(jī)器人技術(shù)的發(fā)展步伐。該平臺正不斷擴(kuò)展其基礎(chǔ)模型機(jī)器人學(xué)習(xí)框架、AI工
    的頭像 發(fā)表于 03-27 10:36 ?502次閱讀

    機(jī)器人學(xué)習(xí)中主流智能抓取方案

    RGB顏色空間由紅綠藍(lán)三基本色組成,疊加成任意色彩,同樣地,任意一種顏色也可以拆解為三基本色的組合,機(jī)器人通過顏色坐標(biāo)值來理解“顏色”。
    發(fā)表于 03-13 10:07 ?233次閱讀
    <b class='flag-5'>機(jī)器人學(xué)習(xí)</b>中主流智能抓取方案

    機(jī)器人基于開源的多模態(tài)語言視覺大模型

    ByteDance Research 基于開源的多模態(tài)語言視覺大模型 OpenFlamingo 開發(fā)了開源、易用的 RoboFlamingo 機(jī)器人操作模型,只用單機(jī)就可以訓(xùn)練。
    發(fā)表于 01-19 11:43 ?289次閱讀
    <b class='flag-5'>機(jī)器人</b>基于開源的多模態(tài)語言視覺大<b class='flag-5'>模型</b>

    人形機(jī)器人領(lǐng)企業(yè)優(yōu)必選登港交所

    在歷史的長河中,技術(shù)革新總是個(gè)不斷推動人類社會向前發(fā)展的動力源泉。近日,中國的人形機(jī)器人研發(fā)與制造商優(yōu)必選正式登港交所,這重大事件不僅
    的頭像 發(fā)表于 01-03 18:26 ?970次閱讀

    陸軍2024年完成IVAS頭顯測試,單兵AR頭顯項(xiàng)目加速發(fā)展

    自2022年起,美陸軍分階段購買了初期的IVAS 1.0和1.1版本,以供軍事訓(xùn)練使用。據(jù)悉,2022年美陸軍購買了5000套IVAS 1.0,2023年再購入5000套IVAS 1.1。這些設(shè)備被廣泛運(yùn)用于士兵培訓(xùn),以提升他們對于新技術(shù)的理解與操作。
    的頭像 發(fā)表于 01-02 10:38 ?753次閱讀

    LabVIEW的六軸工業(yè)機(jī)器人運(yùn)動控制系統(tǒng)

    LabVIEW開發(fā)六軸工業(yè)機(jī)器人運(yùn)動控制系統(tǒng) 本項(xiàng)目開發(fā)了個(gè)高效的工業(yè)機(jī)器人控制系統(tǒng),重點(diǎn)關(guān)注于運(yùn)動學(xué)算法和軌跡規(guī)劃算法的實(shí)現(xiàn)和測試。La
    發(fā)表于 12-21 20:03

    如何創(chuàng)建機(jī)器人模型

    完整機(jī)器人模型 所有的link和joint標(biāo)簽完成了對機(jī)器人每個(gè)部分的描述和組合,全都放在個(gè)robot標(biāo)簽中,就形成了完整的機(jī)器人
    的頭像 發(fā)表于 11-22 17:09 ?742次閱讀
    如何創(chuàng)建<b class='flag-5'>機(jī)器人</b><b class='flag-5'>模型</b>

    目前幾種主流的機(jī)器人智能抓取系統(tǒng)方案

    機(jī)器人學(xué)習(xí)中的經(jīng)典問題之便是分揀:在堆無序擺放的物品堆中,取出目標(biāo)物品。
    的頭像 發(fā)表于 11-14 14:20 ?1402次閱讀
    目前幾種主流的<b class='flag-5'>機(jī)器人</b>智能抓取系統(tǒng)方案

    Eureka!NVIDIA 研究突破為機(jī)器人學(xué)習(xí)注入新動力

    AI 智能體利用 LLM 自動生成獎(jiǎng)勵(lì)算法,訓(xùn)練機(jī)器人完成復(fù)雜任務(wù)。 NVIDIA Research 開發(fā)的款名為 Eureka 的新型 AI 智能體可以教機(jī)器人復(fù)雜的技能,它教會了機(jī)器人
    的頭像 發(fā)表于 10-25 15:55 ?200次閱讀
    Eureka!NVIDIA 研究突破為<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>注入新動力

    Eureka!NVIDIA 研究突破為機(jī)器人學(xué)習(xí)注入新動力

    AI 智能體利用 LLM 自動生成獎(jiǎng)勵(lì)算法,訓(xùn)練機(jī)器人完成復(fù)雜任務(wù)。 ? ? NVIDIA Research 開發(fā)的款名為 Eureka 的新型 AI 智能體可以教機(jī)器人復(fù)雜的技能,它教會了
    發(fā)表于 10-24 09:48 ?192次閱讀
    Eureka!NVIDIA 研究突破為<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>注入新動力

    利用Arduino讓機(jī)器人學(xué)會識別標(biāo)識并作出行為

    教你用Arduino讓機(jī)器人學(xué)會識別標(biāo)識并作出行為。你的人工智能小車從此有了眼睛!材料單:跟蹤機(jī)器人底盤視覺傳感器Arduino Uno電動機(jī)驅(qū)動板18650 Li-離子電池
    發(fā)表于 09-27 07:36