0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI的研究人員開發(fā)了一套基于能量的神經(jīng)網(wǎng)絡(luò)模型

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-10 10:34 ? 次閱讀

OpenAI的研究人員開發(fā)了一套基于能量的神經(jīng)網(wǎng)絡(luò)模型,可以快速學(xué)會識別并生成關(guān)于概念的實(shí)例,比如附近、上方、之間、最近、最遠(yuǎn)等,并將這些概念用2D點(diǎn)集來表示。模型可以僅在5次演示之后就學(xué)會這類概念,并實(shí)現(xiàn)了跨領(lǐng)域的概念遷移。

衡量是否達(dá)到人類智能,涉及由有限的經(jīng)驗(yàn),通過抽象推理和規(guī)劃、類比推理、創(chuàng)造性問題解決和語言能力的概括,從而將經(jīng)驗(yàn)整合到概念中,將概念作為理解和推理的基本架構(gòu)。

這款基于能量的新模型,讓智能體能夠從任務(wù)中學(xué)習(xí)和提取概念,并使用這些概念來解決多個領(lǐng)域中的其他任務(wù)。比如可以在2D粒子環(huán)境中應(yīng)用的學(xué)習(xí)概念,然后在基于3D的機(jī)器人環(huán)境中執(zhí)行相同的任務(wù),無需在新環(huán)境中重新訓(xùn)練。

通過基于能量的模型訓(xùn)練的模擬機(jī)器人,利用不同2D域中學(xué)習(xí)到的概念,將手臂導(dǎo)航至兩點(diǎn)之間

本研究利用能量函數(shù),讓智能體學(xué)習(xí)分類和生成簡單的概念,來解決在不同環(huán)境中的兩點(diǎn)之間導(dǎo)航等任務(wù)。這些概念包括視覺概念(“紅色”、“正方形”)、空間概念(“內(nèi)部”、“在...之上”)、時間概念(“慢”、“之后”),社會概念(“積極”、“有用”)等等。

一旦智能體學(xué)會了這些概念,就會成為其理解和推理的基本模塊,最近DeepMind和 Vicarious的一些其他研究也表明了這一點(diǎn)。

能量函數(shù)讓系統(tǒng)可以生成(左)并識別(右)基本概念,比如“正方形”的概念。

構(gòu)建能量函數(shù):基于關(guān)系網(wǎng)絡(luò)體系結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)

為了創(chuàng)建能量函數(shù),需要在數(shù)學(xué)上將概念表示為能量模型。

我們根據(jù)以下要素來定義每個概念的能量函數(shù) E(x,a,w):

模型觀察到的世界狀態(tài)(x)

該狀態(tài)下該實(shí)體的注意力掩膜(a)。

作為條件的連續(xù)值向量(w),用于指定計(jì)算能量的概念

世界上的眾多狀態(tài)由多組實(shí)體及其屬性和位置組成(比如下面的點(diǎn),就具有位置和顏色屬性)。用于“識別”的注意力掩膜表示模型對某些實(shí)體集的關(guān)注。

能量模型輸出單個正數(shù),表示滿足相應(yīng)概念(零能量)或不滿足概念(高能量)。當(dāng)注意力掩模集中在表示概念的一組實(shí)體上時,該概念即被滿足,這需要實(shí)體處于正確的位置(修改x、生成概念),而且注意力掩膜關(guān)注的是正確的實(shí)體(修改a、識別概念)。

我們將能量函數(shù)構(gòu)建為基于關(guān)系網(wǎng)絡(luò)體系結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),允許其將任意數(shù)量的實(shí)體作為輸入。這個能量函數(shù)的參數(shù)是由我們的訓(xùn)練程序進(jìn)行優(yōu)化的,其他函數(shù)是從能量函數(shù)中隱式導(dǎo)出的。

這樣,我們能夠使用能量函數(shù)來學(xué)習(xí)可以執(zhí)行生成和識別的單個網(wǎng)絡(luò),并可以交叉使用從生成到識別的學(xué)習(xí)概念,反之亦然。(目前已經(jīng)通過鏡像神經(jīng)元在動物身上觀察到了這種效應(yīng)。)

單一網(wǎng)絡(luò)的訓(xùn)練

訓(xùn)練數(shù)據(jù)由(注意掩膜、狀態(tài))的軌跡組成,提前生成的軌跡用于確認(rèn)我們希望模型學(xué)習(xí)的特定概念。我們?yōu)榻o定概念集提供一組演示(通常為5次)來訓(xùn)練模型,然后將模型置于一個新的環(huán)境(X0),并要求其預(yù)測下一個狀態(tài)(X1)和下一個注意力掩膜(a)。

優(yōu)化能量函數(shù),向訓(xùn)練數(shù)據(jù)中找到的下一個狀態(tài)和下一個注意力掩模分配低能量值。與變分自動編碼器等生成模型類似,激勵模型去學(xué)習(xí)那些對于壓縮任務(wù)方面的有用值。我們使用各種概念來訓(xùn)練模型,包括視覺,空間,遠(yuǎn)近和時間關(guān)系,以及二維粒子環(huán)境中的量化。

空間區(qū)域概念:給出2D示例點(diǎn)(左),推斷該點(diǎn)上的能量函數(shù)(中間),然后使用能量上的隨機(jī)梯度下降來生成新的點(diǎn)(右)

模型在概念生成和識別訓(xùn)練中分享經(jīng)驗(yàn),實(shí)現(xiàn)遷移學(xué)習(xí)

我們在一系列任務(wù)中對模型進(jìn)行了評估,旨在測試單一系統(tǒng)識別和生成相同概念下的目標(biāo)的能力,我們的系統(tǒng)可以學(xué)習(xí)分類,可以生成特定的空間關(guān)系集,還可以以特定方式通過場景對實(shí)體進(jìn)行導(dǎo)航,或者可以對數(shù)量(比如一個、兩個、三個或三個以上)或接近度等概念進(jìn)行比較準(zhǔn)確的判斷。

數(shù)量概念:示例注意力掩膜在一個、兩個、三個或三個以上的目標(biāo)上的表現(xiàn),可推斷用于生成類似數(shù)量概念的注意力掩模

模型在學(xué)習(xí)概念的生成(通過在狀態(tài)向量x中移動目標(biāo)實(shí)現(xiàn))和識別(通過在固定狀態(tài)向量上更改注意力掩膜實(shí)現(xiàn))之間分享經(jīng)驗(yàn)時的表現(xiàn)更好:在我們對共同執(zhí)行這兩類任務(wù)的模型進(jìn)行評估時發(fā)現(xiàn),它們的表現(xiàn)都比僅在各自執(zhí)行單一任務(wù)訓(xùn)練的模型更好。

此外,我們還發(fā)現(xiàn)了遷移學(xué)習(xí)的跡象。只在概念識別環(huán)境中訓(xùn)練過的能量函數(shù),也能很好地執(zhí)行概念生成任務(wù),即使其沒有經(jīng)過明確的訓(xùn)練。

未來方向:進(jìn)一步探索概念和語言理解的關(guān)系

我們很高興能夠在更豐富的三維環(huán)境中學(xué)到的更廣泛的概念,將概念與智能體決策策略相結(jié)合(因?yàn)榈侥壳盀橹?,我們只是將概念視為從被動體驗(yàn)中學(xué)到的東西),并探索概念和語言理解之間的聯(lián)系。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27842

    瀏覽量

    204627
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100020
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    119

    瀏覽量

    10537

原文標(biāo)題:OpenAI概念學(xué)習(xí)新模型:學(xué)會概念僅需5次示范,實(shí)現(xiàn)跨領(lǐng)域概念遷移

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    神經(jīng)網(wǎng)絡(luò)教程(李亞非)

      第1章 概述  1.1 人工神經(jīng)網(wǎng)絡(luò)研究與發(fā)展  1.2 生物神經(jīng)元  1.3 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成  第2章人工神經(jīng)網(wǎng)絡(luò)基本
    發(fā)表于 03-20 11:32

    如何構(gòu)建神經(jīng)網(wǎng)絡(luò)?

    原文鏈接:http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡(luò)種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預(yù)測的計(jì)算系統(tǒng)。如何構(gòu)建神經(jīng)網(wǎng)絡(luò)?神經(jīng)網(wǎng)絡(luò)包括:輸入層:根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層:使用反
    發(fā)表于 07-12 08:02

    隱藏技術(shù): 種基于前沿神經(jīng)網(wǎng)絡(luò)理論的新型人工智能處理器

    隱藏技術(shù): 種基于前沿神經(jīng)網(wǎng)絡(luò)理論的新型人工智能處理器 Copy東京理工大學(xué)的研究人員開發(fā)了種名為“ Hiddenite”的新型加速器芯
    發(fā)表于 03-17 19:15

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    network,DBN)[24], 從此拉開了深度學(xué)習(xí)大幕。隨著深度學(xué)習(xí)理論的研究和發(fā)展,研究人員提 出了系列卷積神經(jīng)網(wǎng)絡(luò)模型。為了比較
    發(fā)表于 08-02 10:39

    OpenAI發(fā)布工具庫 可在GPU上建立更快、更高效、占內(nèi)存更少的神經(jīng)網(wǎng)絡(luò)

    OpenAI研究人員日前發(fā)布了個工具庫,該工具庫可以幫助研究人員在圖形處理器(graphics-processor-unit,GPU)上建立更快、更高效、占內(nèi)存更少的
    的頭像 發(fā)表于 01-27 00:34 ?3976次閱讀
    <b class='flag-5'>OpenAI</b>發(fā)布工具庫 可在GPU上建立更快、更高效、占內(nèi)存更少的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    深度神經(jīng)決策樹:深度神經(jīng)網(wǎng)絡(luò)和樹模型結(jié)合的新模型

    近日,來自愛丁堡大學(xué)的研究人員提出了種結(jié)合深度神經(jīng)網(wǎng)絡(luò)和樹模型的新型模型——深度神經(jīng)決策樹(D
    的頭像 發(fā)表于 08-19 09:14 ?1.2w次閱讀

    研究人員開發(fā)解釋多義詞的神經(jīng)網(wǎng)絡(luò)

    艾倫人工智能研究所和華盛頓大學(xué)的研究人員正在使用可以根據(jù)上下文來確定英文單詞含義的神經(jīng)網(wǎng)絡(luò)。
    的頭像 發(fā)表于 09-12 15:52 ?2156次閱讀

    研究人員開發(fā)了種新穎的機(jī)器學(xué)習(xí)管道

    研究人員通過種特殊的神經(jīng)網(wǎng)絡(luò)模型,它以“基本塊”(計(jì)算指令的基本摘要)形式訓(xùn)練標(biāo)記的數(shù)據(jù),以自動預(yù)測其持續(xù)時間使用給定的芯片執(zhí)行以前看不見的基本塊。結(jié)果表明,這種
    的頭像 發(fā)表于 04-15 16:42 ?1768次閱讀

    基于內(nèi)存的人工智能神經(jīng)網(wǎng)絡(luò)架構(gòu)

    在過去十年左右的時間里,研究人員已經(jīng)開發(fā)了多種基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的計(jì)算模型。盡管已發(fā)現(xiàn)許多這些模型在特定任務(wù)上表現(xiàn)良好,但它們并不總
    的頭像 發(fā)表于 12-18 13:40 ?1568次閱讀

    研究人員開發(fā)“液態(tài)”神經(jīng)網(wǎng)絡(luò) 可適應(yīng)快速變化的訓(xùn)練環(huán)境

    設(shè)計(jì)出了種具有重大改進(jìn)的“液態(tài)”神經(jīng)網(wǎng)絡(luò)。其特點(diǎn)是能夠在投入訓(xùn)練階段之后,極大地?cái)U(kuò)展 AI 技術(shù)的靈活性。 通常情況下,研究人員會在訓(xùn)練階段向神經(jīng)網(wǎng)絡(luò)算法提供大量相關(guān)的目標(biāo)數(shù)據(jù),來磨
    的頭像 發(fā)表于 01-29 10:46 ?1452次閱讀

    OpenAI研究人員開發(fā)出新的機(jī)械臂

    近日,兩個由 OpenAI研究人員開發(fā)一模一樣的機(jī)械臂愛麗絲和鮑勃,可以在模擬情景中通過對弈互相學(xué)習(xí),而不需要人為輸入文本。
    的頭像 發(fā)表于 02-23 10:40 ?1808次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)模型 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型 生成卷積神經(jīng)網(wǎng)絡(luò)模型

    cnn卷積神經(jīng)網(wǎng)絡(luò)模型 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型 生成卷積神經(jīng)網(wǎng)絡(luò)模型? 卷積
    的頭像 發(fā)表于 08-21 17:11 ?1054次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)模型搭建

    卷積神經(jīng)網(wǎng)絡(luò)模型搭建 卷積神經(jīng)網(wǎng)絡(luò)模型種深度學(xué)習(xí)算法。它已經(jīng)成為了計(jì)算機(jī)視覺和自然語言處理等各種領(lǐng)域的主流算法,具有很大的應(yīng)用前景。本篇
    的頭像 發(fā)表于 08-21 17:11 ?838次閱讀

    PyTorch神經(jīng)網(wǎng)絡(luò)模型構(gòu)建過程

    PyTorch,作為個廣泛使用的開源深度學(xué)習(xí)庫,提供了豐富的工具和模塊,幫助開發(fā)者構(gòu)建、訓(xùn)練和部署神經(jīng)網(wǎng)絡(luò)模型。在神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-10 14:57 ?304次閱讀

    pytorch中有神經(jīng)網(wǎng)絡(luò)模型

    處理、語音識別等領(lǐng)域取得了顯著的成果。PyTorch是個開源的深度學(xué)習(xí)框架,由Facebook的AI研究團(tuán)隊(duì)開發(fā)。它以其易用性、靈活性和高效性而受到廣泛歡迎。在PyTorch中,有許多預(yù)訓(xùn)練的
    的頭像 發(fā)表于 07-11 09:59 ?527次閱讀