0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook的AI通過(guò)看視頻自學(xué)成才

nlfO_thejiangme ? 來(lái)源:fqj ? 2019-06-05 10:49 ? 次閱讀

人類(lèi)每天都在進(jìn)行高層次的規(guī)劃來(lái)指導(dǎo)自己的各種活動(dòng),但對(duì)于機(jī)器人來(lái)說(shuō)這并不容易。幸運(yùn)的是,越來(lái)越多的工作表明,層級(jí)抽象(即視覺(jué)運(yùn)動(dòng)子程序)可以提高強(qiáng)化學(xué)習(xí)中的樣本效率,這是一種人工智能訓(xùn)練技術(shù),它利用獎(jiǎng)勵(lì)來(lái)推動(dòng)智能體實(shí)現(xiàn)目標(biāo)。

傳統(tǒng)上,這些層次結(jié)構(gòu)必須通過(guò)端到端訓(xùn)練進(jìn)行手動(dòng)編程或者獲取,這需要大量的時(shí)間、持續(xù)的注意力和足夠的耐心。但是在 Arxiv.org 上新發(fā)布的論文「通過(guò)觀看視頻學(xué)習(xí)導(dǎo)航子程序」中,F(xiàn)acebookAI Research、加州大學(xué)伯克利分校和伊利諾伊大學(xué)厄巴納 - 香檳分校的科學(xué)家描述了一個(gè)通過(guò)使用逆機(jī)器學(xué)習(xí)模型攝取視頻“偽標(biāo)記”來(lái)學(xué)習(xí)層次結(jié)構(gòu)。

這讓人想起去年 Facebook 開(kāi)源的一對(duì)模型Talk the Walk。該模型可以使用 360 度圖像、自然語(yǔ)言以及具有標(biāo)志性地標(biāo)(如銀行、餐廳等)的地圖來(lái)指導(dǎo)紐約市的街道,能夠在不知道用戶位置的情況下提供步行路線。

早上來(lái)杯咖啡成為很多都市白領(lǐng)每天必不可少的“自我喚醒”環(huán)節(jié)。坐在辦公室的人類(lèi)如果想去茶水間倒杯咖啡,你會(huì)從門(mén)廳走到底,拐向左邊的走廊,然后再進(jìn)入右邊的房間。當(dāng)人類(lèi)在做這一系列思考與動(dòng)作的時(shí)候,我們不是決定具體需要調(diào)動(dòng)哪塊肌肉,而是通過(guò)組合這些可重復(fù)使用的低級(jí)視覺(jué)運(yùn)動(dòng)子程序來(lái)達(dá)到目標(biāo),從而達(dá)成更高抽象水平的規(guī)劃。

研究人員表示,這些視覺(jué)運(yùn)動(dòng)子程序,使規(guī)劃能夠減輕傳統(tǒng)規(guī)劃中的高計(jì)算成本和強(qiáng)化學(xué)習(xí)中的高樣本復(fù)雜性等已知問(wèn)題。

Facebook的系統(tǒng)包含兩個(gè)階段。第一階段,研究人員通過(guò)運(yùn)行訓(xùn)練模型,使用隨機(jī)勘探數(shù)據(jù)的自我監(jiān)督來(lái)生成偽標(biāo)簽。模型學(xué)習(xí)了分布在四個(gè)不同環(huán)境中的1500個(gè)位置點(diǎn),然后隨機(jī)執(zhí)行30個(gè)步驟的動(dòng)作,產(chǎn)生45,000個(gè)交互樣本。

在第二階段,大約217,000個(gè)偽標(biāo)記視頻被切成220萬(wàn)個(gè)互相獨(dú)立的剪輯片段然后被輸入一個(gè)模型,這個(gè)模型預(yù)測(cè)參考視頻中采取的相應(yīng)動(dòng)作的模型,而一個(gè)單獨(dú)的網(wǎng)絡(luò)檢查參考視頻中的動(dòng)作序列并將行為編碼為矢量(例如數(shù)學(xué)表示)。另一個(gè)模型通過(guò)預(yù)測(cè)來(lái)自第一幀的軌跡的推斷編碼,針對(duì)任何給定視頻幀選擇調(diào)用哪些學(xué)習(xí)子例程。

在一個(gè)實(shí)驗(yàn)中,機(jī)器人被部署在真實(shí)的辦公環(huán)境中。研究表明,學(xué)習(xí)視頻(比如如何最有效的方式前往目標(biāo)位置)能夠讓機(jī)器人的表現(xiàn)比用純交互方法學(xué)習(xí)達(dá)到更好的效果,至少能夠顧及到以前看不見(jiàn)的環(huán)境。

也許最令人印象深刻的是,這個(gè)訓(xùn)練有素的模型學(xué)會(huì)了有利于前進(jìn)導(dǎo)航并避免障礙物,導(dǎo)航任務(wù)比曾經(jīng)的最佳基準(zhǔn)快4倍,這使得它能夠完全自主地進(jìn)行長(zhǎng)距離行進(jìn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28902

    瀏覽量

    266280
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54479

原文標(biāo)題:如何在辦公室不動(dòng)聲色地繞過(guò)老板視線?Facebook的AI通過(guò)看視頻自學(xué)成才

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門(mén)創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ai智能視頻監(jiān)控系統(tǒng) OpenCV

    ai智能視頻監(jiān)控系統(tǒng)選用數(shù)字圖像處理、計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)技術(shù)性,利用軟件強(qiáng)勁的數(shù)據(jù)處理方法工作能力。ai智能視頻監(jiān)控系統(tǒng)是一種集防盜報(bào)警系統(tǒng)作用和
    的頭像 發(fā)表于 07-08 08:46 ?202次閱讀
    <b class='flag-5'>ai</b>智能<b class='flag-5'>視頻</b>監(jiān)控系統(tǒng) OpenCV

    視頻AI行為監(jiān)測(cè)系統(tǒng)在高速公路中應(yīng)用

    在高速公路的監(jiān)控中,視頻AI行為監(jiān)測(cè)系統(tǒng)扮演著至關(guān)重要的角色。它利用先進(jìn)的AI技術(shù),對(duì)高速公路上的監(jiān)控視頻進(jìn)行實(shí)時(shí)分析,為交通管理部門(mén)提供準(zhǔn)確、及時(shí)的信息,從而提升道路的通行效率,保障
    的頭像 發(fā)表于 06-05 18:06 ?665次閱讀

    【AIBOX快速入門(mén)】2步玩轉(zhuǎn)AI對(duì)話

    隨著目前AI的高速發(fā)展,大批量AI硬件應(yīng)運(yùn)而生,但使用門(mén)檻普遍較高。為了解決這類(lèi)問(wèn)題,F(xiàn)irefly開(kāi)源團(tuán)隊(duì)推出了基于Web的AI對(duì)話應(yīng)用:FireflyChat,讓AI的使用變得更加
    的頭像 發(fā)表于 05-30 08:02 ?364次閱讀
    【AIBOX快速入門(mén)】2步玩轉(zhuǎn)<b class='flag-5'>AI</b>對(duì)話

    智譜AI正研發(fā)對(duì)標(biāo)Sora的國(guó)產(chǎn)文生視頻模型

    智譜AI,這家國(guó)內(nèi)估值超過(guò)200億的AI大模型獨(dú)角獸企業(yè),正全力投入研發(fā)一款與OpenAI的Sora相媲美的國(guó)產(chǎn)文生視頻模型。據(jù)公司內(nèi)部人士透露,該模型預(yù)計(jì)最快將在今年內(nèi)發(fā)布,將成為AI
    的頭像 發(fā)表于 05-07 09:22 ?451次閱讀

    迪思與百度智能云聯(lián)手發(fā)布AI視頻創(chuàng)作模型

    迪思傳媒與百度智能云聯(lián)手研發(fā)的AI視頻創(chuàng)作模型D&S-AI Video于3月25日正式亮相,并成功集成至迪思AI智鏈平臺(tái)。這一創(chuàng)新模型將傳統(tǒng)繁瑣的
    的頭像 發(fā)表于 03-26 11:46 ?608次閱讀

    新火種AI|圍攻光明頂:Sora效應(yīng)下的AI視頻生成競(jìng)賽

    Sora的出現(xiàn),讓AI視頻生成領(lǐng)域真正“活”了起來(lái)
    的頭像 發(fā)表于 03-16 11:12 ?511次閱讀

    Stability AI與Morph AI共同推出一體化AI視頻創(chuàng)作工具

    近日,業(yè)界領(lǐng)先的AI技術(shù)公司Stability AI與中國(guó)AI創(chuàng)業(yè)公司Morph AI達(dá)成重要合作。雙方宣布共同推出一款革新性的all-in-one(一體式)
    的頭像 發(fā)表于 03-05 10:44 ?709次閱讀

    探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

    OpenAI的Sora現(xiàn)已擴(kuò)展其能力范圍,進(jìn)入視頻生成領(lǐng)域,標(biāo)志著人工智能技術(shù)在多媒體內(nèi)容創(chuàng)作上的一個(gè)重大突破。Sora的視頻AI功能使得用戶能夠根據(jù)文本描述自動(dòng)生成高質(zhì)量的視頻內(nèi)容,
    的頭像 發(fā)表于 02-20 12:01 ?1310次閱讀

    AI視頻年大爆發(fā)!2023年AI視頻生成領(lǐng)域的現(xiàn)狀全盤(pán)點(diǎn)

    2023年,也是AI視頻元年。過(guò)去一年究竟有哪些爆款應(yīng)用誕生,未來(lái)視頻生成領(lǐng)域面臨的難題還有哪些?
    的頭像 發(fā)表于 02-20 10:40 ?999次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>視頻</b>年大爆發(fā)!2023年<b class='flag-5'>AI</b><b class='flag-5'>視頻</b>生成領(lǐng)域的現(xiàn)狀全盤(pán)點(diǎn)

    《新能源車(chē)維修技術(shù)自學(xué),鏈接匯總AI智能分類(lèi)》超4000案例

    收藏欄鏈接共享-新能源車(chē)維修自學(xué)-超4000案例 -html文件 詳細(xì)見(jiàn)附件 [*附件:收藏欄鏈接共享-新能源車(chē)維修自學(xué)-超4000案例.zip] (注:可導(dǎo)入瀏覽器,在瀏覽器的收藏欄里方便查看)
    發(fā)表于 02-18 03:30

    智慧水庫(kù)灌區(qū)視頻AI識(shí)別監(jiān)控系統(tǒng)

    灌區(qū)監(jiān)控系統(tǒng)通過(guò)實(shí)時(shí)畫(huà)面獲取,保障灌溉工程、防洪安全等,實(shí)現(xiàn)無(wú)人值班、少人值守原則。視頻AI監(jiān)控系統(tǒng)可自動(dòng)識(shí)別人員入侵、水面漂浮物、水體流動(dòng)等,并可通過(guò)水尺識(shí)別水位。禁漁禁泳區(qū)域監(jiān)控違
    的頭像 發(fā)表于 12-08 10:29 ?563次閱讀
    智慧水庫(kù)灌區(qū)<b class='flag-5'>視頻</b><b class='flag-5'>AI</b>識(shí)別監(jiān)控系統(tǒng)

    計(jì)算光學(xué)成像如何突破傳統(tǒng)光學(xué)成像極限

    傳統(tǒng)光學(xué)成像建立在幾何光學(xué)基礎(chǔ)上,借鑒人眼視覺(jué)“所見(jiàn)即所得”的原理,而忽略了諸多光學(xué)高維信息。當(dāng)前傳統(tǒng)光學(xué)成像在硬件功能、成像性能方面接近物理極限,在眾多領(lǐng)域已無(wú)法滿足應(yīng)用需求。
    發(fā)表于 11-17 17:08 ?723次閱讀
    計(jì)算光<b class='flag-5'>學(xué)成</b>像如何突破傳統(tǒng)光<b class='flag-5'>學(xué)成</b>像極限

    釣魚(yú)識(shí)別視頻AI算法,讓水質(zhì)監(jiān)控更精準(zhǔn)、更高效!

    智慧水務(wù)技術(shù)升級(jí)和釣魚(yú)識(shí)別視頻AI算法在提升水資源管理效率和保護(hù)水域安全方面的重要作用。智慧水務(wù)通過(guò)實(shí)時(shí)監(jiān)測(cè)、智能調(diào)度和智能化管理實(shí)現(xiàn)高效管理,而釣魚(yú)識(shí)別視頻
    的頭像 發(fā)表于 11-07 21:47 ?378次閱讀

    基于紫光同創(chuàng)FPGA的多路視頻采集與AI輕量化加速的實(shí)時(shí)目標(biāo)檢測(cè)系統(tǒng)

    基于紫光同創(chuàng)FPGA的多路視頻采集與AI輕量化加速的實(shí)時(shí)目標(biāo)檢測(cè)系統(tǒng)#2023集創(chuàng)賽#紫光同創(chuàng)#小眼睛科技助力紫光同創(chuàng)高校生態(tài)建設(shè)@小眼睛科技 獲獎(jiǎng)作品展示:華南理工大學(xué)+CR8_Pro隊(duì)
    發(fā)表于 11-02 17:51

    【KV260視覺(jué)入門(mén)套件試用體驗(yàn)】Vitis-AI加速的YOLOX視頻目標(biāo)檢測(cè)示例體驗(yàn)和原理解析

    本文將介紹如何使用Vitis-AI加速YOLOX模型實(shí)現(xiàn)視頻中的目標(biāo)檢測(cè),并對(duì)相關(guān)源碼進(jìn)行解讀。由于演示的示例程序源碼是Vitis-AI開(kāi)源項(xiàng)目提供的,本文演示之前會(huì)介紹所需要的準(zhǔn)備工作。演示之后
    發(fā)表于 10-06 23:32