0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種無需監(jiān)督的目標(biāo)追蹤新方法——給視頻上色

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-02 14:35 ? 次閱讀

追蹤視頻中的對象目標(biāo)是計(jì)算機(jī)視覺的基本問題,這對于動作辨識、目標(biāo)對象交互或者視頻風(fēng)格化等應(yīng)用非常重要。然而,教機(jī)器在視覺上追蹤物體是非常有挑戰(zhàn)性的,因?yàn)樗枰笮偷摹⒈粯?biāo)記的數(shù)據(jù)集進(jìn)行訓(xùn)練,但是這些跟蹤數(shù)據(jù)無法大規(guī)模標(biāo)記。論智君昨天在六種人體姿態(tài)估計(jì)的深度學(xué)習(xí)模型和代碼總結(jié)一文中談到了對人體姿態(tài)估計(jì)的方法,感興趣的讀者可以閱讀一下。

今天,谷歌AI博客發(fā)表文章,稱他們找到了一種無需監(jiān)督的目標(biāo)追蹤新方法——給視頻上色。在之前的Tracking Emerges by Colorizing Videos一文中,谷歌研究者介紹了一種卷積神經(jīng)網(wǎng)絡(luò),它可以給灰度視頻上色,但是無法從單個參照系中復(fù)制顏色。為了達(dá)到這一目的,這次提出的的網(wǎng)絡(luò)學(xué)會了如何在沒有監(jiān)督的情況下自動對目標(biāo)物體進(jìn)行視覺追蹤。重要的是,雖然模型不能直接訓(xùn)練用于追蹤,但它可以跟蹤多個物體,同時在圖形變換上能保持較高的魯棒性,并且不需要任何標(biāo)記過的訓(xùn)練數(shù)據(jù)。以下是論智對原文的編譯。

上圖是在DAVIS 2017數(shù)據(jù)集上的追蹤預(yù)測示例。學(xué)會給視頻上色后,一種用于追蹤的機(jī)制就自動出現(xiàn),不需要監(jiān)督。我們在第一幀用不同顏色標(biāo)出了需要識別的對象,之后模型不需要學(xué)習(xí)或監(jiān)督就可以在接下來的視頻中自動延續(xù)需要上色的部分。

學(xué)習(xí)對視頻重新上色

我們假設(shè),只在第一幀顯示出的顏色可以提供大量訓(xùn)練數(shù)據(jù),能讓機(jī)器學(xué)習(xí)在視頻中追蹤所選定的區(qū)域。顯然,有些情況下,顏色會暫時變得不連貫,比如光線突然改變,但是總體來說,顏色是穩(wěn)定的。另外,大多數(shù)視頻帶有顏色,同時還有大量的自監(jiān)督學(xué)習(xí)信號。我們對視頻去顏色化,在給它們上色,是因?yàn)榭赡芏鄠€物體的顏色都相同,但是通過上色,我們可以教機(jī)器追蹤具體的物體或區(qū)域。

為了訓(xùn)練我們的系統(tǒng),我們用的是Kinestics數(shù)據(jù)集中的視頻,該數(shù)據(jù)集中的視頻記錄的大多是日?;顒?。我們把視頻中除了第一幀之外的所有幀都轉(zhuǎn)換成了灰調(diào),并訓(xùn)練一個卷積網(wǎng)絡(luò)預(yù)測原本的顏色。我們希望模型學(xué)習(xí)如何追蹤區(qū)域,從而能準(zhǔn)確地復(fù)原顏色。我們主要的關(guān)注點(diǎn)在于,跟蹤物體將會讓模型自動學(xué)習(xí)。

我們用DAVIS 2017數(shù)據(jù)集中的視頻說明這一過程,在模型中輸入灰度視頻和一幀帶有顏色的視頻,讓其判斷剩下視頻的顏色。模型學(xué)會從第一幀中復(fù)制顏色,即它可以不在人類監(jiān)督下學(xué)會追蹤目標(biāo)物體。

想從單一參照視頻中復(fù)制顏色,模型需要在內(nèi)部學(xué)會如何找到正確的區(qū)域,這樣才能填充正確的顏色。這就迫使它學(xué)習(xí)一種可以用來追蹤的機(jī)制。下面是模型上色的過程:

左:第一幀上色;中:輸入視頻;右:輸出視頻

雖然網(wǎng)絡(luò)在訓(xùn)練時沒有標(biāo)準(zhǔn)參照,我們的模型學(xué)會了以第一幀為參照對任意區(qū)域進(jìn)行上色。我們可以跟蹤任一物體甚至視頻中的某個點(diǎn)。唯一的不同是,我們不是改變顏色,而是添加代表這一區(qū)域的標(biāo)簽。

分析跟蹤器

由于模型在大量未標(biāo)記的視頻上訓(xùn)練,我們想掌握模型到底學(xué)到了什么。下面的動圖展現(xiàn)了如何用模型學(xué)習(xí)來的可視化方法將嵌入映射到三維空間中,這一過程用到了主成分分析(PCA)并將其變成RGB格式的圖像。結(jié)果顯示,在與學(xué)到的嵌入空間最近的區(qū)域似乎更對應(yīng)目標(biāo)物體的識別,即使變了形或改變了視角。

第一行:DAVIS 2017數(shù)據(jù)集中的視頻;第二行:上色模型內(nèi)部的嵌入。相似的嵌入會在視覺表示中有相似的顏色,這說明目標(biāo)識別將學(xué)習(xí)到的嵌入進(jìn)行像素劃分

姿態(tài)跟蹤

我們發(fā)現(xiàn),如果在開頭幀中給定幾個關(guān)鍵點(diǎn),模型還可以跟蹤人類的姿態(tài)。我們展示了JHMDB數(shù)據(jù)集中的幾個結(jié)果,其中我們追蹤了人類的關(guān)節(jié)骨架。

在這個例子中,輸入的是第一幀人類的動作,接下來的動作模型會自動追蹤。即使之前沒有訓(xùn)練過此種場景,模型也能追蹤到人類動作

雖然我們的模型還不足以超越監(jiān)督模型,但是與最近基于光流的模型相比,它所學(xué)到的視頻分割和人類姿勢追蹤表現(xiàn)已經(jīng)勝出了。我們的模型比光流追蹤方面更穩(wěn)定,尤其在復(fù)雜的情況下,例如動態(tài)背景、快速運(yùn)動和障礙物面前。想了解更多細(xì)節(jié),請閱讀原論文。

結(jié)語

我們的工作表示,給視頻上色可以用作在無監(jiān)督情況下學(xué)習(xí)追蹤視頻中的目標(biāo)物體。另外,我們發(fā)現(xiàn)系統(tǒng)的失敗會導(dǎo)致給視頻上色時出現(xiàn)錯誤,這也說明,未來改善視頻的上色模型可以提高姿態(tài)追蹤系統(tǒng)的表現(xiàn)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6080

    瀏覽量

    104378
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100018
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24538

原文標(biāo)題:另辟蹊徑!谷歌通過給視頻上色實(shí)現(xiàn)無監(jiān)督姿態(tài)追蹤

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    一種標(biāo)定陀螺儀的新方法

    一種標(biāo)定陀螺儀的新方法
    發(fā)表于 08-17 12:17

    一種在金上生成硫醇封端的SAM的新方法

    一種在金上生成硫醇封端的SAM的新方法 - 應(yīng)用簡報(bào)
    發(fā)表于 10-30 11:05

    一種求解非線性約束優(yōu)化全局最優(yōu)的新方法

    本文提出了一種求解非線性約束優(yōu)化的全局最優(yōu)的新方法—它是基于利用非線性互補(bǔ)函數(shù)和不斷增加新的約束來重復(fù)解庫恩-塔克條件的非線性方程組的新方法。因?yàn)閹於?塔克條
    發(fā)表于 08-11 10:53 ?16次下載

    一種繞線轉(zhuǎn)子感應(yīng)電機(jī)控制的新方法

    介紹感應(yīng)電機(jī)特點(diǎn)的基礎(chǔ)上,提出一種基于轉(zhuǎn)子電磁場考慮的無位置傳感器的繞線轉(zhuǎn)子感應(yīng)電機(jī)控制的新方法.該控制方法基于軸坐標(biāo)變換,可以從任意點(diǎn)開始,無需知道電機(jī)的起
    發(fā)表于 03-01 18:15 ?27次下載

    機(jī)場場面監(jiān)視雷達(dá)目標(biāo)檢測新方法

    機(jī)場場面監(jiān)視雷達(dá)目標(biāo)檢測新方法_陳建軍
    發(fā)表于 01-07 16:06 ?0次下載

    一種級數(shù)混合運(yùn)算產(chǎn)生SPWM波新方法

    一種級數(shù)混合運(yùn)算產(chǎn)生SPWM波新方法_耿衛(wèi)東
    發(fā)表于 01-07 18:39 ?0次下載

    一種求解動態(tài)及不確定性優(yōu)化問題的新方法

    一種求解動態(tài)及不確定性優(yōu)化問題的新方法_劉曉
    發(fā)表于 01-07 18:56 ?0次下載

    一種設(shè)計(jì)同步時序邏輯電路的新方法

    一種設(shè)計(jì)同步時序邏輯電路的新方法
    發(fā)表于 02-07 15:05 ?29次下載

    PC機(jī)與單片機(jī)串行通信的一種新方法

    PC機(jī)與單片機(jī)串行通信的一種新方法
    發(fā)表于 09-04 14:20 ?4次下載
    PC機(jī)與單片機(jī)串行通信的<b class='flag-5'>一種</b><b class='flag-5'>新方法</b>

    一種新方法來檢測這些被操縱的換臉視頻的“跡象”

    利用深度學(xué)習(xí)“換臉”合成假視頻的技術(shù)發(fā)展之快令人驚嘆,也令人深感不安。研究人員已經(jīng)研究出一種新方法來檢測這些被操縱的換臉視頻,通過有效地預(yù)測眼睛的狀態(tài),準(zhǔn)確率達(dá)到99%。
    的頭像 發(fā)表于 07-03 09:48 ?5656次閱讀

    一種復(fù)制和粘貼URL的新方法

    它也存在于瀏覽器中,Microsoft Edge也不例外。但是,雷蒙德(Redmond)的用戶啟用了一種復(fù)制和粘貼URL的新方法,該方法有些簡單,但并非所有用戶都知道如何利用它。這是最合乎邏輯的,因?yàn)樵跒g覽器中處理地址的
    的頭像 發(fā)表于 12-21 16:55 ?3890次閱讀

    一種改善微波模塊增益指標(biāo)溫度特性的新方法

    電子發(fā)燒友網(wǎng)站提供《一種改善微波模塊增益指標(biāo)溫度特性的新方法.pdf》資料免費(fèi)下載
    發(fā)表于 10-25 10:05 ?0次下載
    <b class='flag-5'>一種</b>改善微波模塊增益指標(biāo)溫度特性的<b class='flag-5'>新方法</b>

    一種產(chǎn)生激光脈沖的新方法

    英國和韓國的科學(xué)家提出了一種產(chǎn)生激光脈沖的新方法,其功率是現(xiàn)有激光脈沖的1000多倍。
    的頭像 發(fā)表于 11-20 16:56 ?463次閱讀
    <b class='flag-5'>一種</b>產(chǎn)生激光脈沖的<b class='flag-5'>新方法</b>

    一種產(chǎn)生激光脈沖新方法

    等離子體中脈沖壓縮的概念 英國和韓國的科學(xué)家提出了一種產(chǎn)生激光脈沖的新方法,其功率是現(xiàn)有激光脈沖的1000多倍。 科學(xué)家們使用計(jì)算機(jī)模擬聯(lián)合研究,展示了一種壓縮光的新方法,以充分提高光
    的頭像 發(fā)表于 12-07 06:32 ?395次閱讀
    <b class='flag-5'>一種</b>產(chǎn)生激光脈沖<b class='flag-5'>新方法</b>

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結(jié)構(gòu)進(jìn)行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實(shí)現(xiàn)近乎完美的高分辨率顯微鏡。 層析成像是一種強(qiáng)大的無
    的頭像 發(fā)表于 07-19 06:20 ?200次閱讀
    <b class='flag-5'>一種</b>無透鏡成像的<b class='flag-5'>新方法</b>