0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)two-stage框架,允許用戶直接操作自然場(chǎng)景的高級(jí)屬性

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-08-31 09:36 ? 次閱讀

編者按:近日,來自Hacettepe大學(xué)和阿姆斯特丹大學(xué)的研究人員在網(wǎng)上發(fā)布了一個(gè)短視頻,在外網(wǎng)引起極大反響。視頻中展示的是一個(gè)新型圖像編輯工具,不少人把它稱為“未來的Photoshop”,因?yàn)橹恍柽x擇天氣、季節(jié)、時(shí)間段等屬性,它就能即時(shí)改變圖片內(nèi)容,把春天變成冬天,把中午變成黃昏,同時(shí)原圖語義細(xì)節(jié)也會(huì)被極大保留。更驚人的是,只需選中繪制目標(biāo),比如“樹”,待研究人員在圖中畫出一篇區(qū)域后,這塊區(qū)域就會(huì)被樹填充,效果自然逼真。

目前作者只公布了調(diào)整圖像自然屬性的研究論文:Manipulating Attributes of Natural Scenes via Hallucination,其Pytorch代碼會(huì)在近期放出,有興趣的讀者可以關(guān)注Hacettepe大學(xué)的相關(guān)網(wǎng)頁。

下面是論文的大致內(nèi)容:

摘要

在本研究中,我們探索構(gòu)建了一個(gè)two-stage框架,允許用戶直接操作自然場(chǎng)景的高級(jí)屬性。這種方法的關(guān)鍵在于深層生成網(wǎng)絡(luò),它能基于原始圖像生成“幻覺”,即好像是在不同季節(jié)、不同天氣條件、一天中的不同時(shí)間段下拍攝的同一場(chǎng)景。

一旦根據(jù)給定自然屬性生成了“幻覺”場(chǎng)景,這個(gè)“幻覺”就能結(jié)合輸入圖像做風(fēng)格遷移,同時(shí)保持完整的語義細(xì)節(jié),輸出逼真的圖像屬性調(diào)整效果。和大多數(shù)風(fēng)格遷移方法不同,由于輸入圖像的目標(biāo)高級(jí)屬性來自“幻覺”,它無需額外的參考圖像。此外,它允許在單個(gè)模型內(nèi)基于瞬態(tài)屬性集同時(shí)操縱給定場(chǎng)景,因此可以避免訓(xùn)練多個(gè)神經(jīng)網(wǎng)絡(luò)。

根據(jù)全面定性定量實(shí)驗(yàn)的結(jié)果,我們提出的方法很有競爭力

簡介

園里樹木有的枝枒還覆蓋著積雪,影影綽綽顯現(xiàn)在多云的天幕上。月光慘淡?!蜖栐恕端_拉金》

在我們的生活中,視覺世界會(huì)隨著時(shí)間和季節(jié)不斷變化其外觀。比如在日落時(shí),太陽靠近地平線,這時(shí)西方天空會(huì)呈現(xiàn)宜人的紅色色調(diào);隨著夏季到來,草地上原本鮮嫩的黃綠色被綠色取代,整體更明亮,而夏去秋來,棕色色調(diào)開始慢慢出現(xiàn)在各種自然風(fēng)景中。

在時(shí)間、天氣和季節(jié)的影響下,自然界幾乎無時(shí)無刻不在發(fā)生視覺上的變化。我們把這種高級(jí)變化稱為瞬態(tài)場(chǎng)景屬性——例如陰天、霧天、夜晚、白天、日落、冬天、夏天……

圖像生成是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù),因?yàn)樗哪繕?biāo)是輸出逼真圖像。現(xiàn)在,如果要實(shí)現(xiàn)圖像場(chǎng)景屬性變化,比較常見的方法是風(fēng)格遷移,但這種方法需要我們提供帶有目標(biāo)屬性的樣本素材。雖然有人也提出了自動(dòng)風(fēng)格遷移,可以讓模型自動(dòng)檢索符合的素材,但它也產(chǎn)生了新的問題,就是我們?cè)撊绾卧O(shè)計(jì)一種可以根據(jù)期望屬性和語義分布檢索圖像的算法。

為了克服這一點(diǎn),我們提出了一種結(jié)合神經(jīng)圖像生成和風(fēng)格遷移的方法。首先,我們?cè)O(shè)計(jì)了一個(gè)條件圖像合成模型,它能夠在目標(biāo)場(chǎng)景中生成具有輸入圖像類似語義內(nèi)容的“幻覺”;其次,我們?cè)儆脠D像風(fēng)格遷移的方法,把“幻覺”移植到原始圖像中,最終輸出逼真的效果。

本研究主要貢獻(xiàn):

提出了一種新的two-stage視覺屬性操作框架,用于更改給定室外圖像的高級(jí)屬性。

開發(fā)了一個(gè)條件GAN的變體,用于生成忠實(shí)于原圖語義分布的、帶有目標(biāo)瞬態(tài)場(chǎng)景屬性的“幻覺”場(chǎng)景。

構(gòu)建一個(gè)用布局和瞬態(tài)屬性標(biāo)簽注釋的室外場(chǎng)景數(shù)據(jù)集。

網(wǎng)絡(luò)細(xì)節(jié)

上圖是本文提出框架的整體圖解,它的關(guān)鍵組件是下方這個(gè)黃色的場(chǎng)景生成網(wǎng)絡(luò)??梢园l(fā)現(xiàn),輸入圖像后,模型會(huì)先用簡單色塊模擬原圖語義分布,并把它作為場(chǎng)景生成網(wǎng)絡(luò)的第一個(gè)輸入。場(chǎng)景生成網(wǎng)絡(luò)的第二個(gè)輸入是瞬態(tài)屬性的連續(xù)值向量。

有了這兩個(gè)輸入,這個(gè)生成網(wǎng)絡(luò)能輸出和輸入圖像語義分布一致,且具有所需瞬態(tài)屬性的合成場(chǎng)景。在這幅新圖的基礎(chǔ)上,結(jié)合輸入圖像,模型就能用遷移學(xué)習(xí)生成逼真圖像。

上圖是生成網(wǎng)絡(luò)的整體圖解??梢园l(fā)現(xiàn),整個(gè)框架延續(xù)了GAN的一般特征,由一個(gè)生成器G和一個(gè)判別器D組成,兩者都以語義分布和瞬態(tài)場(chǎng)景屬性維條件。在模型中,語義分布被編碼為8位二進(jìn)制碼,而瞬態(tài)場(chǎng)景屬性被編碼為40維向量。

在圖的左側(cè),模型連接語義分布S、空間復(fù)制屬性向量a和z,將它門串聯(lián)饋送進(jìn)G中獲得輸出。隨后,這個(gè)輸出再和S、a一起輸入右側(cè)的D,由判別器確定這幅圖像是否既符合原圖的語義分布,又帶有期望的瞬態(tài)場(chǎng)景屬性。

結(jié)果

在上述研究過程中,作者制作了ALS17K數(shù)據(jù)集,它包含17,772幅室外圖像,其中訓(xùn)練集16,434幅,測(cè)試集1,338幅,有150個(gè)語義類別和40個(gè)瞬態(tài)場(chǎng)景屬性。目前這個(gè)數(shù)據(jù)集還沒有公開。

結(jié)合網(wǎng)站上的測(cè)試工具,我們檢驗(yàn)了論文的具體生成效果,如下所示:

原圖

日落

冬季

多云

青蔥

在示例的兩幅圖中,霧天效果都不是很明顯,因此這里不再展示。下面是論文中的一些圖片。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1075

    瀏覽量

    40270
  • 遷移學(xué)習(xí)
    +關(guān)注

    關(guān)注

    0

    文章

    74

    瀏覽量

    5536

原文標(biāo)題:新一代PS:用神經(jīng)網(wǎng)絡(luò)操縱圖像中的自然場(chǎng)景屬性

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    LABIVEW操作框架些問題

    各位大佬:小弟正在學(xué)習(xí)LABIVEW操作框架,看例程資料琢磨了幾天,有些地方看不懂,請(qǐng)各位大佬幫忙梳理下。例程是軟件自帶的
    發(fā)表于 07-17 13:50

    如何讓用戶插入插件的屬性?

    嗨,我試圖創(chuàng)建個(gè)模擬器插件來模擬連接到PIC的些引腳的簡單的外部ADC。模擬部分工作得很好,但我不允許用戶選擇連接到插件的引腳。我知道插
    發(fā)表于 09-27 10:21

    【推薦體驗(yàn)】騰訊云自然語言處理

    `相信大家對(duì)NLP自然語言處理的技術(shù)都不陌生,它是計(jì)算機(jī)科學(xué)領(lǐng)域和AI領(lǐng)域中的個(gè)分支,它與計(jì)算機(jī)和人類之間使用自然語言進(jìn)行交互密切相關(guān),而NLP的最終目標(biāo)是使計(jì)算機(jī)能夠像人類
    發(fā)表于 10-09 15:28

    centernet嵌入式網(wǎng)絡(luò)優(yōu)化的相關(guān)資料推薦

    檢測(cè)算法日新月異,面對(duì)琳瑯滿目的檢測(cè)模型(見圖 1),合適的才是最好的。(1)One-stage從模型的層次結(jié)構(gòu)上,可分為兩階段(two-stage)和單階段(one-stage)。(a)Tw
    發(fā)表于 12-23 07:01

    個(gè)簡單實(shí)用的MCU程序框架介紹

    系統(tǒng)。實(shí)際上,在我的使用過程中發(fā)現(xiàn),應(yīng)用這類實(shí)時(shí)操作系統(tǒng)的場(chǎng)景其實(shí)非常小,更多的應(yīng)用無需操作系統(tǒng),要做的只有簡單的幾個(gè)事情。?在無操作系統(tǒng)的程序上,如果沒有
    發(fā)表于 02-11 06:21

    Stage模型深入解讀

    2、Stage模型能力特點(diǎn) Stage模型能力示意圖 Stage模型的設(shè)計(jì),是為了提供給開發(fā)者個(gè)更好的開發(fā)方式,更好的適用于多設(shè)備、分布
    發(fā)表于 03-15 10:32

    OpenHarmony應(yīng)用開發(fā)-ArkUI方舟開發(fā)框架簡析

    進(jìn)行可視化界面開發(fā)。 、基本概念 UI: 即用戶界面。開發(fā)者可以將應(yīng)用的用戶界面設(shè)計(jì)為多個(gè)功能頁面,每個(gè)頁面進(jìn)行單獨(dú)的文件管理,并通過頁面路由API完成頁面間的調(diào)度管理如跳轉(zhuǎn)、回退等操作
    發(fā)表于 04-23 09:35

    OpenHarmony應(yīng)用模型的構(gòu)成要素與Stage優(yōu)勢(shì)

    應(yīng)用開發(fā)更簡單、高效。 二、Stage主推模型優(yōu)勢(shì) Stage模型之所以成為主推模型,源于其設(shè)計(jì)思想。Stage模型的設(shè)計(jì)基于如下出發(fā)點(diǎn)。 為復(fù)雜應(yīng)用而設(shè)計(jì) 多個(gè)應(yīng)用組件共享同一個(gè)Ar
    發(fā)表于 09-26 16:48

    Agilent HMMC-5618 6–20 GHz Medium Power Amplifier 1GG6-8002

    Description The HMMC-5618 66 to 20 GHz MMIC is an efficient two-stage medium-power amplifier
    發(fā)表于 08-02 10:48 ?34次下載

    two-stage transformer-coupled

    two-stage transformer-coupled amplifier雙通道變壓器耦合放大器電路圖
    發(fā)表于 09-29 21:52 ?1458次閱讀
    <b class='flag-5'>two-stage</b> transformer-coupled

    JESD204B時(shí)鐘發(fā)生器14輸出ad9528數(shù)據(jù)表LVDS技術(shù)

    The AD9528 is a two-stage PLL with an integrated JESD204B SYSREF generator for multiple device
    發(fā)表于 10-19 14:26 ?30次下載
    JESD204B時(shí)鐘發(fā)生器14輸出ad9528數(shù)據(jù)表LVDS技術(shù)

    全面探究SSD原理與實(shí)現(xiàn)

    前言 目標(biāo)檢測(cè)近年來已經(jīng)取得了很重要的進(jìn)展,主流的算法主要分為兩個(gè)類型(參考RefineDet): (1)two-stage方法,如R-CNN系算法,其主要思路是先通過啟發(fā)式方法(selective
    的頭像 發(fā)表于 04-26 13:59 ?2073次閱讀
    全面探究SSD原理與實(shí)現(xiàn)

    軟件使用SMMUv3的stage1還是stage2地址轉(zhuǎn)換

    如果SMMUv3硬件只支持stage1或只支持stage2,那么支持的stage可以用于Linux的DMA-IOMMU和VFIO的場(chǎng)景。
    的頭像 發(fā)表于 05-23 17:28 ?1457次閱讀
    軟件使用SMMUv3的<b class='flag-5'>stage</b>1還是<b class='flag-5'>stage</b>2地址轉(zhuǎn)換

    探討Spring框架中的屬性注入技術(shù)

    在本文中,我們深入探討了 Spring 框架中的屬性注入技術(shù),包括 setter 注入、構(gòu)造器注入、注解式屬性注入,以及使用 SpEL 表達(dá)式進(jìn)行屬性注入。
    的頭像 發(fā)表于 06-14 09:37 ?834次閱讀
    探討Spring<b class='flag-5'>框架</b>中的<b class='flag-5'>屬性</b>注入技術(shù)

    placeholder屬性和value屬性的差別

    在現(xiàn)代的Web設(shè)計(jì)和開發(fā)中,表單是至關(guān)重要的元素之。與此同時(shí),placeholder屬性和value屬性在表單中扮演著重要的角色。本文將詳細(xì)探討這兩個(gè)
    的頭像 發(fā)表于 11-30 10:13 ?1266次閱讀