0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于生成對(duì)抗網(wǎng)絡(luò)對(duì)隨機(jī)變化進(jìn)行建模

lhl545545 ? 來(lái)源:計(jì)算機(jī)視覺(jué)芯片設(shè)計(jì) ? 作者:計(jì)算機(jī)視覺(jué)芯片設(shè) ? 2022-08-14 09:29 ? 次閱讀

在這項(xiàng)工作中,我們使用一種新穎的風(fēng)格特征表示學(xué)習(xí)方法來(lái)解決任意圖像風(fēng)格轉(zhuǎn)移的挑戰(zhàn)性問(wèn)題。作為圖像風(fēng)格化任務(wù)中的關(guān)鍵組成部分,合適的風(fēng)格表示對(duì)于獲得令人滿意的結(jié)果至關(guān)重要?,F(xiàn)有的基于深度神經(jīng)網(wǎng)絡(luò)的方法在二階統(tǒng)計(jì)(如內(nèi)容特征的 Gram 矩陣)的指導(dǎo)下取得了合理的結(jié)果。但是,它們沒(méi)有利用足夠的樣式信息,這會(huì)導(dǎo)致局部失真和樣式不一致等偽影。為了解決這些問(wèn)題,我們建議通過(guò)分析多種風(fēng)格之間的異同并考慮風(fēng)格分布,直接從圖像特征而不是二階統(tǒng)計(jì)中學(xué)習(xí)風(fēng)格表示。具體來(lái)說(shuō),我們提出了對(duì)比任意風(fēng)格遷移(CAST),這是一種通過(guò)對(duì)比學(xué)習(xí)的新風(fēng)格表示學(xué)習(xí)和風(fēng)格遷移方法。我們的框架由三個(gè)關(guān)鍵組件組成,即用于樣式代碼編碼的多層樣式投影儀、用于有效學(xué)習(xí)樣式分布的域增強(qiáng)模塊以及用于圖像樣式遷移的生成網(wǎng)絡(luò)。我們?nèi)孢M(jìn)行定性和定量評(píng)估,以證明與通過(guò)最先進(jìn)的方法獲得的方法相比,我們的方法取得了明顯更好的結(jié)果。

延時(shí)圖像序列為動(dòng)態(tài)過(guò)程提供了視覺(jué)上引人注目的洞察力,這些過(guò)程太慢而無(wú)法實(shí)時(shí)觀察。然而,由于隨機(jī)效應(yīng)(如天氣)以及循環(huán)效應(yīng)(如晝夜循環(huán)),將較長(zhǎng)的延時(shí)序列作為視頻播放通常會(huì)導(dǎo)致分散注意力的閃爍。我們以一種允許對(duì)圖像中的整體趨勢(shì)、循環(huán)效應(yīng)和隨機(jī)效應(yīng)進(jìn)行單獨(dú)的事后控制的方式引入了解開(kāi)延時(shí)序列的問(wèn)題,并描述了一種基于數(shù)據(jù)驅(qū)動(dòng)的生成模型的技術(shù),該技術(shù)可以實(shí)現(xiàn)這個(gè)目標(biāo)。這使我們能夠以單獨(dú)使用輸入圖像無(wú)法實(shí)現(xiàn)的方式“重新渲染”序列。例如,我們可以穩(wěn)定一個(gè)長(zhǎng)序列,在可選擇的、一致的天氣下,在幾個(gè)月內(nèi)專注于植物生長(zhǎng)。

我們的方法基于生成對(duì)抗網(wǎng)絡(luò) (GAN),它以延時(shí)序列的時(shí)間坐標(biāo)為條件。我們的架構(gòu)和訓(xùn)練程序的設(shè)計(jì)使網(wǎng)絡(luò)學(xué)習(xí)使用 GAN 的潛在空間對(duì)隨機(jī)變化(例如天氣)進(jìn)行建模,并通過(guò)使用具有特定頻率的傅立葉特征將調(diào)節(jié)時(shí)間標(biāo)簽饋送到模型來(lái)解開(kāi)整體趨勢(shì)和循環(huán)變化。

我們展示了我們的模型對(duì)訓(xùn)練數(shù)據(jù)中的缺陷具有魯棒性,使我們能夠修正捕捉長(zhǎng)延時(shí)序列的一些實(shí)際困難,例如臨時(shí)遮擋、幀間距不均勻和幀丟失。

我們展示了Shoot360,一個(gè)高效生成多鏡頭的系統(tǒng), 給定不同環(huán)境下的 360 度視頻錄制集合,具有所需內(nèi)容呈現(xiàn)和各種電影風(fēng)格的普通視圖視頻。我們系統(tǒng)的核心是一個(gè)三步?jīng)Q策過(guò)程: 1)首先對(duì)內(nèi)容進(jìn)行語(yǔ)義分析,基于鏡頭單元的每個(gè)全景環(huán)境的興趣,以及根據(jù)用戶對(duì)內(nèi)容呈現(xiàn)和電影風(fēng)格的規(guī)范,生成一個(gè)指導(dǎo),指定其輸出鏡頭的語(yǔ)義焦點(diǎn)和運(yùn)動(dòng)類(lèi)型。 2)基于獲得的指導(dǎo),它為每個(gè)鏡頭生成具有鏡頭級(jí)別控制參數(shù)的視頻候選,用于遵循拍攝規(guī)則的視圖投影。 3)系統(tǒng)進(jìn)一步聚合投影的正常視圖鏡頭與施加的局部和全局約束,其中結(jié)合了從示例視頻和專業(yè)拍攝規(guī)則中學(xué)習(xí)的外部知識(shí)。廣泛的實(shí)驗(yàn)驗(yàn)證了我們系統(tǒng)設(shè)計(jì)的有效性,我們總結(jié)了有希望的擴(kuò)展,以將其應(yīng)用于更通用的場(chǎng)景。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6837

    瀏覽量

    88754
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7489

    瀏覽量

    88557
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4728

    瀏覽量

    68251

原文標(biāo)題:2022 siggrqph:圖像和視頻生成(1)

文章出處:【微信號(hào):計(jì)算機(jī)視覺(jué)芯片設(shè)計(jì),微信公眾號(hào):計(jì)算機(jī)視覺(jué)芯片設(shè)計(jì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    藍(lán)牙AES+RNG如何保障物聯(lián)網(wǎng)信息安全

    功能可通過(guò)軟件實(shí)現(xiàn),也可以通過(guò)硬件實(shí)現(xiàn)。主要優(yōu)勢(shì)體現(xiàn)在:在保障通信安全方面,隨機(jī)數(shù)生成器能夠輸出非重復(fù)且隨機(jī)變化的數(shù)值。這些數(shù)值是構(gòu)建多種安全機(jī)制的基礎(chǔ),例如鑒權(quán)與加密過(guò)程,從而顯著提升藍(lán)牙通信
    發(fā)表于 11-08 15:38

    matlab 神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析

    matlab神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析 精通的可以討論下
    發(fā)表于 09-18 15:14

    請(qǐng)問(wèn)LM311能準(zhǔn)確的交截生成對(duì)應(yīng)的PWM波形嗎?

    UC3825, TLV3501輸入正是100k的正弦波 輸入負(fù)是100kHz的鋸齒波 二者交截生成PWM波形 請(qǐng)問(wèn)LM311能準(zhǔn)確的交截生成對(duì)應(yīng)的PWM波形嗎 之前使用UC3525里面自帶的比較器做的,LM311能達(dá)到這樣的速度嗎
    發(fā)表于 08-06 07:46

    生成對(duì)抗網(wǎng)絡(luò)(GANs)的原理與應(yīng)用案例

    生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GANs)是一種由蒙特利爾大學(xué)的Ian Goodfellow等人在2014年提出的深度學(xué)習(xí)算法。GANs通過(guò)構(gòu)建兩個(gè)
    的頭像 發(fā)表于 07-09 11:34 ?744次閱讀

    cad如何進(jìn)行三維建模

    三維建模是計(jì)算機(jī)輔助設(shè)計(jì)(CAD)中的一項(xiàng)重要技術(shù),它可以幫助設(shè)計(jì)師在計(jì)算機(jī)上創(chuàng)建和編輯三維模型。本文將介紹如何使用CAD軟件進(jìn)行三維建模,包括建模的基本步驟、
    的頭像 發(fā)表于 07-09 10:23 ?698次閱讀

    人工神經(jīng)網(wǎng)絡(luò)模型的分類(lèi)有哪些

    詳細(xì)介紹人工神經(jīng)網(wǎng)絡(luò)的分類(lèi),包括前饋神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、生成對(duì)抗
    的頭像 發(fā)表于 07-05 09:13 ?864次閱讀

    鴻蒙開(kāi)發(fā):Universal Keystore Kit密鑰管理服務(wù) 密鑰生成介紹及算法規(guī)格

    當(dāng)業(yè)務(wù)需要使用HUKS生成隨機(jī)密鑰,并由HUKS進(jìn)行安全保存時(shí),可以調(diào)用HUKS的接口生成密鑰。
    的頭像 發(fā)表于 07-04 21:50 ?290次閱讀
    鴻蒙開(kāi)發(fā):Universal Keystore Kit密鑰管理服務(wù) 密鑰<b class='flag-5'>生成</b>介紹及算法規(guī)格

    如何使用神經(jīng)網(wǎng)絡(luò)進(jìn)行建模和預(yù)測(cè)

    輸入信號(hào),對(duì)其進(jìn)行加權(quán)求和,然后通過(guò)激活函數(shù)進(jìn)行非線性轉(zhuǎn)換,生成輸出信號(hào)。通過(guò)這種方式,神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)輸入數(shù)據(jù)的復(fù)雜模式和關(guān)系。 神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-03 10:23 ?633次閱讀

    數(shù)學(xué)建模神經(jīng)網(wǎng)絡(luò)模型的優(yōu)缺點(diǎn)有哪些

    數(shù)學(xué)建模神經(jīng)網(wǎng)絡(luò)模型是一種基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)建模方法,它通過(guò)模擬人腦神經(jīng)元的連接和信息傳遞機(jī)制,對(duì)復(fù)雜系統(tǒng)進(jìn)行
    的頭像 發(fā)表于 07-02 11:36 ?771次閱讀

    神經(jīng)網(wǎng)絡(luò)在數(shù)學(xué)建模中的應(yīng)用

    數(shù)學(xué)建模是一種利用數(shù)學(xué)方法和工具來(lái)描述和分析現(xiàn)實(shí)世界問(wèn)題的過(guò)程。神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元結(jié)構(gòu)和功能的計(jì)算模型,可以用于解決各種復(fù)雜問(wèn)題。在數(shù)學(xué)建模中,神經(jīng)網(wǎng)絡(luò)可以作為一種有效的工具
    的頭像 發(fā)表于 07-02 11:29 ?792次閱讀

    神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

    、語(yǔ)音識(shí)別、自然語(yǔ)言處理等多個(gè)領(lǐng)域。本文將對(duì)幾種主要的神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行詳細(xì)介紹,包括前饋神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、
    的頭像 發(fā)表于 07-01 14:16 ?561次閱讀

    思科完成對(duì)Isovalent的收購(gòu)

    全球領(lǐng)先的網(wǎng)絡(luò)技術(shù)公司思科(Cisco)近日宣布,已完成對(duì)開(kāi)源云原生網(wǎng)絡(luò)與安全領(lǐng)域的佼佼者Isovalent的收購(gòu)。
    的頭像 發(fā)表于 05-06 10:41 ?586次閱讀

    如何使用Python生成四位隨機(jī)數(shù)字

    為了實(shí)現(xiàn)這些目標(biāo),Python 為我們提供了random() 模塊。random() 是一個(gè)內(nèi)置的 Python 模塊,用于生成隨機(jī)數(shù)。
    的頭像 發(fā)表于 04-15 12:47 ?584次閱讀

    深度學(xué)習(xí)生成對(duì)抗網(wǎng)絡(luò)(GAN)全解析

    GANs真正的能力來(lái)源于它們遵循的對(duì)抗訓(xùn)練模式。生成器的權(quán)重是基于判別器的損失所學(xué)習(xí)到的。因此,生成器被它生成的圖像所推動(dòng)著進(jìn)行訓(xùn)練,很難知
    發(fā)表于 03-29 14:42 ?4304次閱讀
    深度學(xué)習(xí)<b class='flag-5'>生成對(duì)抗</b><b class='flag-5'>網(wǎng)絡(luò)</b>(GAN)全解析

    生成式人工智能和感知式人工智能的區(qū)別

    生成新的內(nèi)容和信息的人工智能系統(tǒng)。這些系統(tǒng)能夠利用已有的數(shù)據(jù)和知識(shí)來(lái)生成全新的內(nèi)容,如圖片、音樂(lè)、文本等。生成式人工智能通?;谏疃葘W(xué)習(xí)技術(shù),如生成對(duì)抗
    的頭像 發(fā)表于 02-19 16:43 ?1482次閱讀