0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook提出通過(guò)聽自然語(yǔ)言訓(xùn)練自主機(jī)器人

汽車玩家 ? 來(lái)源:雷鋒網(wǎng) ? 作者:雷鋒網(wǎng) ? 2020-04-11 15:43 ? 次閱讀

雷鋒網(wǎng)消息,據(jù)外媒Venturebeat報(bào)道,F(xiàn)acebook、喬治亞理工學(xué)院和俄勒岡州立大學(xué)的研究人員在本周發(fā)表的一篇預(yù)印本論文中,描述了人工智能的一項(xiàng)新任務(wù)——通過(guò)聽自然語(yǔ)言的指令,在3D環(huán)境中導(dǎo)航(例如,“走下大廳,在木桌旁左轉(zhuǎn)”)。他們說(shuō),這可以為遵循自然語(yǔ)言指令的機(jī)器人助手奠定基礎(chǔ)。

研究人員的任務(wù),被稱之為在連續(xù)環(huán)境中的視覺和語(yǔ)言導(dǎo)航(VLN-CE),是在Facebook的模擬器Habitat中進(jìn)行的,該模擬器可以訓(xùn)練機(jī)器人助手在模擬真實(shí)環(huán)境的環(huán)境中操作。直徑為0.2米、1.5米高的助手被放置在來(lái)自Matterport3D數(shù)據(jù)集的內(nèi)部,該數(shù)據(jù)集是通過(guò)10800多個(gè)全景圖和相應(yīng)的3D網(wǎng)格捕獲的90個(gè)環(huán)境的集合。

機(jī)器人助手必須在一條路徑上做四個(gè)動(dòng)作(向前移動(dòng)0.25米,左轉(zhuǎn)或右轉(zhuǎn)15度,或停在目標(biāo)位置)中的一個(gè),并學(xué)會(huì)避免被困在障礙物上,比如椅子和桌子上。

研究小組將這些環(huán)境提煉成4475條由4到6個(gè)節(jié)點(diǎn)組成的軌跡,這些軌跡對(duì)應(yīng)于在各個(gè)位置拍攝的360度全景圖像,顯示了導(dǎo)航能力。

他們用這個(gè)訓(xùn)練兩個(gè)人工智能模型:一個(gè)sequence-to-sequence模型,該模型由采取視覺觀察和指令表示的策略組成,并使用它們預(yù)測(cè)一個(gè)動(dòng)作;另一個(gè)是兩個(gè)網(wǎng)絡(luò)交叉模式注意模型,該模型跟蹤觀察結(jié)果,并根據(jù)指令和特征做出決策。

研究人員表示,在實(shí)驗(yàn)中,表現(xiàn)最好的機(jī)器人可以遵循“向左拐,進(jìn)入走廊”之類的指令,盡管這些指令要求機(jī)器人在發(fā)現(xiàn)視覺路標(biāo)之前轉(zhuǎn)動(dòng)未知的次數(shù)。事實(shí)上,機(jī)器人在看不見的環(huán)境,大約三分之一的場(chǎng)景中導(dǎo)航到目標(biāo)位置,平均采取了88次行動(dòng)。

這些機(jī)器人偶爾也會(huì)失敗,根據(jù)合著者的說(shuō)法,這些失敗通常是由于機(jī)器人在視覺上丟失了指令中提到的對(duì)象。

“至關(guān)重要的是,VLN-CE為(研究)社區(qū)提供了一個(gè)測(cè)試平臺(tái),在這里可以進(jìn)行研究高級(jí)和低級(jí)控制界面的這類集成實(shí)驗(yàn),”合著者寫道。

Facebook投入了大量資源來(lái)解決自主機(jī)器人導(dǎo)航的問(wèn)題。

雷鋒網(wǎng)了解到,今年6月,在公布了一項(xiàng)訓(xùn)練六足機(jī)器人走路的計(jì)劃后,F(xiàn)acebook首次推出了PyRobot,一種用于PyTorch機(jī)器學(xué)習(xí)框架的機(jī)器人框架。2018年,F(xiàn)acebook推出了開源人工智能,可以通過(guò)360度圖像在紐約市街道上導(dǎo)航。最近,F(xiàn)acebook的一個(gè)團(tuán)隊(duì)發(fā)表了一篇論文,描述了一個(gè)通過(guò)觀看視頻學(xué)習(xí)如何在辦公室里走動(dòng)的系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27847

    瀏覽量

    204655
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54479
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    圖像識(shí)別技術(shù)包括自然語(yǔ)言處理嗎

    計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行處理、分析和理解,從而實(shí)現(xiàn)對(duì)圖像中的目標(biāo)、場(chǎng)景、行為等信息的識(shí)別和理解。圖像識(shí)別技術(shù)包括圖像預(yù)處理、特征提取、分類器設(shè)計(jì)、模型訓(xùn)練等多個(gè)環(huán)節(jié)。 1.2 自然語(yǔ)言處理的定義 自然語(yǔ)言處理(Natural L
    的頭像 發(fā)表于 07-16 10:54 ?397次閱讀

    谷歌借助Gemini AI系統(tǒng)深化對(duì)機(jī)器人訓(xùn)練

    了如何利用Gemini 1.5 Pro的強(qiáng)化長(zhǎng)上下文窗口功能,極大地優(yōu)化了用戶通過(guò)自然語(yǔ)言指令與RT-2機(jī)器人交互的體驗(yàn)。
    的頭像 發(fā)表于 07-12 16:29 ?513次閱讀

    Al大模型機(jī)器人

    理解能力強(qiáng)大: AI大模型機(jī)器人可以理解和生成自然語(yǔ)言,能夠進(jìn)行復(fù)雜的對(duì)話和語(yǔ)言任務(wù)。它們能夠識(shí)別語(yǔ)言中的語(yǔ)義、語(yǔ)境和情感,并據(jù)此作出適當(dāng)?shù)幕貞?yīng)。廣泛的知識(shí)儲(chǔ)備: 這些模型基于大規(guī)模的
    發(fā)表于 07-05 08:52

    自然語(yǔ)言處理技術(shù)有哪些

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語(yǔ)言。自然語(yǔ)言處理技術(shù)的發(fā)展已經(jīng)取得了顯著的進(jìn)展
    的頭像 發(fā)表于 07-03 14:30 ?610次閱讀

    自然語(yǔ)言處理模式的優(yōu)點(diǎn)

    得到了廣泛的應(yīng)用,如搜索引擎、語(yǔ)音助手、機(jī)器翻譯、情感分析等。 1. 提高信息獲取效率 自然語(yǔ)言處理技術(shù)能夠快速地從大量文本數(shù)據(jù)中提取關(guān)鍵信息,幫助用戶節(jié)省查找和篩選信息的時(shí)間。例如,搜索引擎通過(guò)NLP技術(shù)理解用戶的查詢意圖,提
    的頭像 發(fā)表于 07-03 14:24 ?409次閱讀

    自然語(yǔ)言處理技術(shù)的核心是什么

    ,廣泛應(yīng)用于機(jī)器翻譯、情感分析、語(yǔ)音識(shí)別、智能問(wèn)答、文本摘要等眾多領(lǐng)域。 自然語(yǔ)言處理技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代。1950年,圖靈提出了著名的圖靈測(cè)試,標(biāo)志著自然語(yǔ)言處理技術(shù)
    的頭像 發(fā)表于 07-03 14:20 ?341次閱讀

    自然語(yǔ)言處理是什么技術(shù)的一種應(yīng)用

    廣泛,包括機(jī)器翻譯、語(yǔ)音識(shí)別、情感分析、信息檢索、問(wèn)答系統(tǒng)、文本摘要、聊天機(jī)器人等。 一、自然語(yǔ)言處理的基本概念 自然語(yǔ)言自然語(yǔ)言是人類用
    的頭像 發(fā)表于 07-03 14:18 ?313次閱讀

    自然語(yǔ)言處理包括哪些內(nèi)容

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到計(jì)算機(jī)與人類語(yǔ)言之間的交互。NLP的目標(biāo)是讓計(jì)算機(jī)能夠理解、生成和處理人類語(yǔ)言
    的頭像 發(fā)表于 07-03 14:15 ?525次閱讀

    什么是自然語(yǔ)言處理 (NLP)

    自然語(yǔ)言處理(Natural Language Processing, NLP)是人工智能領(lǐng)域中的一個(gè)重要分支,它專注于構(gòu)建能夠理解和生成人類語(yǔ)言的計(jì)算機(jī)系統(tǒng)。NLP的目標(biāo)是使計(jì)算機(jī)能夠像人類一樣
    的頭像 發(fā)表于 07-02 18:16 ?599次閱讀

    自然語(yǔ)言處理技術(shù)的原理的應(yīng)用

    自然語(yǔ)言處理(Natural Language Processing, NLP)作為人工智能(AI)領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠理解和處理人類自然語(yǔ)言。隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)技術(shù)的發(fā)展
    的頭像 發(fā)表于 07-02 12:50 ?243次閱讀

    神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理中的應(yīng)用

    自然語(yǔ)言處理(NLP)是人工智能領(lǐng)域中的一個(gè)重要分支,它研究的是如何使計(jì)算機(jī)能夠理解和生成人類自然語(yǔ)言。隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理中的應(yīng)用逐漸展現(xiàn)出其強(qiáng)大的潛力和優(yōu)勢(shì)。本文
    的頭像 發(fā)表于 07-01 14:09 ?293次閱讀

    自然語(yǔ)言控制機(jī)械臂:ChatGPT與機(jī)器人技術(shù)的融合創(chuàng)新(下)

    和Google的Speech-to-text服務(wù),以及我們是如何通過(guò)pymycobot模塊來(lái)控制機(jī)械臂的。通過(guò)自然語(yǔ)言處理和機(jī)械臂控制相結(jié)合,我們的項(xiàng)目旨在降低機(jī)器人編程的門檻,使得
    的頭像 發(fā)表于 04-11 15:54 ?626次閱讀
    <b class='flag-5'>自然語(yǔ)言</b>控制機(jī)械臂:ChatGPT與<b class='flag-5'>機(jī)器人</b>技術(shù)的融合創(chuàng)新(下)

    自然語(yǔ)言控制機(jī)械臂:ChatGPT與機(jī)器人技術(shù)的融合創(chuàng)新(上)

    廣泛。隨著AI技術(shù)的進(jìn)步,機(jī)械手臂不僅能執(zhí)行復(fù)雜的操作任務(wù),還能通過(guò)自然語(yǔ)言處理技術(shù)進(jìn)行更加直觀的交互,極大提高了靈活性和用戶友好性。 就比如說(shuō)微軟的一個(gè)人工智能研究中心,研究如何用自然語(yǔ)言來(lái)控制
    的頭像 發(fā)表于 04-11 14:36 ?514次閱讀
    <b class='flag-5'>自然語(yǔ)言</b>控制機(jī)械臂:ChatGPT與<b class='flag-5'>機(jī)器人</b>技術(shù)的融合創(chuàng)新(上)

    一種基于自然語(yǔ)言的軌跡修正方法

    本研究提出了ExTraCT框架,利用自然語(yǔ)言進(jìn)行軌跡校正。該框架結(jié)合了大型語(yǔ)言模型(LLMs)用于自然語(yǔ)言理解和軌跡變形函數(shù)。ExTraCT能夠根據(jù)場(chǎng)景在線生成軌跡修改特征及其
    的頭像 發(fā)表于 01-19 10:45 ?337次閱讀
    一種基于<b class='flag-5'>自然語(yǔ)言</b>的軌跡修正方法

    自然語(yǔ)言處理的研究?jī)?nèi)容

    自然語(yǔ)言處理(NLP)的最新發(fā)展改變了我們與AI系統(tǒng)的交互方式: 1. 預(yù)訓(xùn)練模型:像 GPT-3 這樣的模型已經(jīng)進(jìn)步,使人工智能能夠在聊天機(jī)器人和虛擬助手中生成更連貫的上下文感知響應(yīng)。 2. 多
    的頭像 發(fā)表于 01-18 16:39 ?350次閱讀