国产不卡无码高清毛片一区二区三区 ,毛片一区二区三区蜜臀av,国产理论电影在线观看

近日，谷歌大腦研究人員提出了一種基于自監(jiān)督和半監(jiān)督學習的“條件GAN”，使用的標記數(shù)據(jù)量大降90%，生成圖像的質(zhì)量比現(xiàn)有全監(jiān)督最優(yōu)模型BigGAN高出20%（以FID得分計），有望緩解圖像生成和識別領(lǐng)域標記數(shù)據(jù)量嚴重不足的問題。

生成對抗網(wǎng)絡(luò)（GAN）是一類強大的深度生成模型。GAN背后的主要思想是訓練兩個神經(jīng)網(wǎng)絡(luò)：生成器負責學習如何合成數(shù)據(jù)，而判別器負責學習如何區(qū)分真實數(shù)據(jù)與生成器合成的虛假數(shù)據(jù)。目前，GAN已成功用于高保真自然圖像合成，改善學習圖像壓縮質(zhì)量，以及數(shù)據(jù)增強等任務(wù)。

對于自然圖像合成任務(wù)來說，現(xiàn)有的最優(yōu)結(jié)果是通過條件GAN實現(xiàn)的。與無條件GAN不同，條件GAN在訓練期間要使用標簽（比如汽車，狗等）。雖然數(shù)據(jù)標記讓圖像合成任務(wù)變得更容易實現(xiàn)，在性能上獲得了顯著提升，但是這種方法需要大量標記數(shù)據(jù)，而在實際任務(wù)中很少有大量標記數(shù)據(jù)可用。

隨著ImageNet上訓練過程的持續(xù)，生成的圖像逼真度進步明顯

谷歌大腦的研究人員在最近的《用更少的數(shù)據(jù)標簽生成高保真圖像》中，提出了一種新方法來減少訓練最先進條件GAN所需的標記數(shù)據(jù)量。文章提出結(jié)合大規(guī)模GAN的最新進展，將高保真自然圖像合成技術(shù)與最先進技術(shù)相結(jié)合，使數(shù)據(jù)標記數(shù)量減少到原來的10%。

在此基礎(chǔ)上，研究人員還發(fā)布了Compare GAN庫的重大更新，其中包含了訓練和評估現(xiàn)代GAN所需的所有組件。

利用半監(jiān)督和自監(jiān)督方式提升預測性能

條件GAN與基線BigGAN的FID分數(shù)對比，圖中黑色豎線為BigGAN基線模型（使用全部標記數(shù)據(jù)）得分。S3GAN在僅使用10%標記數(shù)據(jù)的情況下，得分比基線模型最優(yōu)得分高20%

在條件GAN中，生成器和判別器通常都以分類標簽為應用條件?，F(xiàn)在，研究人員建議使用推斷得出的數(shù)據(jù)標簽，來替換手工標記的真實標簽。

上行：BigGAN全監(jiān)督式學習生成的128×128像素最優(yōu)圖像樣本。下行為S3GAN生成的圖像樣本，標記數(shù)據(jù)量降低了90%，F(xiàn)ID得分與BigGAN表現(xiàn)相當

為了推斷大型數(shù)據(jù)集中多數(shù)未標記數(shù)據(jù)的高質(zhì)量標簽，可以采取兩步方法：首先，僅使用數(shù)據(jù)集的未標記部分來學習特征表示。

為了學習特征表示，需要利用新方法，以不同的方法利用自我監(jiān)督機制：將未標記的圖像進行隨機旋轉(zhuǎn)，由深度卷積神經(jīng)網(wǎng)絡(luò)負責預測旋轉(zhuǎn)角度。這背后的思路是，模型需要能夠識別主要對象及其形狀，才能在此類任務(wù)中獲得成功。

對一幅未標記的圖像進行隨機旋轉(zhuǎn)，網(wǎng)絡(luò)的任務(wù)是預測旋轉(zhuǎn)角度。成功的模型需要捕捉有意義的語義圖像特征，這些特征可用于完成其他視覺任務(wù)

研究人員將訓練網(wǎng)絡(luò)的一個中間層的激活模式視為輸入的新特征表示，并訓練分類器，以使用原始數(shù)據(jù)集的標記部分識別該輸入的標簽。由于網(wǎng)絡(luò)經(jīng)過預訓練，可以從數(shù)據(jù)中提取具有語義意義的特征，因此，訓練此分類器比從頭開始訓練整個網(wǎng)絡(luò)更具樣本效率。最后使用分類器對未標記的數(shù)據(jù)進行標記。

為了進一步提高模型質(zhì)量和訓練的穩(wěn)定性，最好讓判別器網(wǎng)絡(luò)學習有意義的特征表示。通過這些改進手段，在加上大規(guī)模的訓練，使得新的條件GAN在ImageNet圖像合成任務(wù)上達到了最優(yōu)性能。

給定潛在向量，由生成器網(wǎng)絡(luò)生成圖像。在每行中，最左側(cè)和最右側(cè)圖像的潛在代碼之間的線性插值導致圖像空間中的語義插值

CompareGAN：用于訓練和評估GAN的庫

對GAN的前沿研究在很大程度上依賴于經(jīng)過精心設(shè)計和測試的代碼庫，即使只是復制或再現(xiàn)先前的結(jié)果和技術(shù)，也需要付出巨大努力。

為了促進開放科學并讓研究界從最近的進步中獲益，研究人員發(fā)布了Compare GAN庫的重大更新。該庫包括現(xiàn)代GAN中常用的損失函數(shù)，正則化和歸一化方案，神經(jīng)架構(gòu)和量化指標，現(xiàn)已支持：

GPU和TPU訓練

通過Gin進行輕量級配置（含實例）

通過TensorFlow數(shù)據(jù)集庫提供大量數(shù)據(jù)集

未來方向：自監(jiān)督學習會讓GAN更強大

由于標記數(shù)據(jù)源和未標記數(shù)據(jù)源之間的差距越來越大，讓模型具備從部分標記的數(shù)據(jù)中學習的能力變得越來越重要。

目前來看，自監(jiān)督學習和半監(jiān)督學習的簡單而有力的結(jié)合，有助于縮小GAN的這一現(xiàn)實差距。自監(jiān)督是一個值得研究的領(lǐng)域，值得在該領(lǐng)域開展面向其他生成建模任務(wù)的研究。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6128

瀏覽量
104979
GaN

GaN

+關(guān)注

關(guān)注
19

文章
1910

瀏覽量
72757

原文標題：谷歌大腦打造“以一當十”的GAN：僅用10%標記數(shù)據(jù)，生成圖像卻更逼真

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

沃達豐與谷歌深化十年戰(zhàn)略合作

沃達豐近日宣布，其與全球科技巨頭谷歌的戰(zhàn)略合作伙伴關(guān)系得到了進一步深化。這一為期十年的協(xié)議，總價值超過10億美元，旨在將

發(fā)表于 10-09 16:22 ?212次閱讀

Freepik攜手Magnific AI推出AI圖像生成器

近日，設(shè)計資源巨頭Freepik攜手Magnific AI，共同推出了革命性的AI圖像生成器——Freepik Mystic，這一里程碑式的發(fā)布標志著AI圖像創(chuàng)作領(lǐng)域邁入了

發(fā)表于 08-30 16:23 ?1057次閱讀

深入理解渲染引擎：打造逼真圖像的關(guān)鍵

在數(shù)字世界中，圖像渲染是創(chuàng)造逼真視覺效果的核心技術(shù)。渲染引擎，作為這一過程中的關(guān)鍵組件，負責將二維或三維的模型、紋理、光照等數(shù)據(jù)轉(zhuǎn)化為人們?nèi)庋劭梢姷亩S

發(fā)表于 06-29 08:28 ?265次閱讀

深入理解渲染引擎：<b class='flag-5'>打造</b><b class='flag-5'>逼真</b><b class='flag-5'>圖像</b>的關(guān)鍵

谷歌發(fā)布AI文生圖大模型Imagen

近日，谷歌在人工智能領(lǐng)域取得新突破，正式推出了Imagen文生圖模型。這款模型以其卓越的細節(jié)調(diào)整功能、逼真的光線效果以及從草圖快速生成高分辨率圖像的能力，引起了業(yè)界的廣泛關(guān)注。

發(fā)表于 05-16 09:30 ?466次閱讀

谷歌發(fā)布Imagen 3，提升圖像文本生成技術(shù)

已為谷歌人工智能研究所DeepMind掌門人的德米斯·哈薩比斯指出，相比于前款I(lǐng)magen 2，Image 3能夠更加精準地解碼文字提示信息，并據(jù)此創(chuàng)建出更有創(chuàng)造力、細節(jié)豐富且出錯率較低的圖像。

發(fā)表于 05-15 11:24 ?587次閱讀

深度學習生成對抗網(wǎng)絡(luò)（GAN）全解析

GANs真正的能力來源于它們遵循的對抗訓練模式。生成器的權(quán)重是基于判別器的損失所學習到的。因此，生成器被它生成的圖像所推動著進行訓練，很難知道生成

發(fā)表于 03-29 14:42 ?4301次閱讀

麻省理工與Adobe新技術(shù)DMD提升圖像生成速度

2023年3月27日，據(jù)傳，新型文生圖算法雖然使得圖像生成無比逼真，但奈何運行速度較慢。近期，美國麻省理工學院聯(lián)合Adobe推出新型DMD方法，僅略微犧牲圖像質(zhì)量就大幅度提高

發(fā)表于 03-27 14:17 ?469次閱讀

谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

谷歌DeepMind的首席執(zhí)行官德米斯·哈薩比斯在2月26日透露，公司計劃在接下來的幾周內(nèi)重新發(fā)布其備受關(guān)注的Gemini AI模型人像生成功能。此前，由于在某些歷史圖像生成描述中出現(xiàn)

發(fā)表于 02-28 10:17 ?529次閱讀

谷歌暫停Gemini人像生成服務(wù)

盡管谷歌團隊于今年初就推介了這個GPU加速的人臉生成項目，但仍有部分用戶反映出生成的歷史名人形象存在著錯誤，因此決定實行技術(shù)停擺，并謀劃對這一功能進行調(diào)整和優(yōu)化。

發(fā)表于 02-27 14:16 ?441次閱讀

谷歌Gemini AI模型因人物圖像生成問題暫停運行

據(jù)報道，部分用戶發(fā)現(xiàn)Gemini生成的圖片存在明顯錯誤，如特斯拉創(chuàng)始人和其他名人變成了黑人模樣。谷歌已決定暫停該模型的人物圖像生成功能以待改善。

發(fā)表于 02-25 09:59 ?526次閱讀

谷歌推出圖像生成新工具ImageFX，提升圖像質(zhì)量

作為實驗室的新興工具，ImageFX 允許用戶借助簡潔的文字指令來創(chuàng)作圖像。經(jīng)過前期試驗，該團隊認為對生成型人工智能工具來說最關(guān)鍵的是如何啟發(fā)并鼓勵用戶挖掘和實踐創(chuàng)意想法。

發(fā)表于 02-02 14:18 ?601次閱讀

二值圖像連通區(qū)域的標記原理

二值圖像是一種由黑白兩色組成的圖像，其像素值只有兩種可能，分別對應黑色和白色。在二值圖像中，連通區(qū)域是指一塊相鄰的、像素值相同的區(qū)域。為了對

發(fā)表于 01-05 14:28 ?750次閱讀

圖像標注如何提升效率？

圖像標注是通過一定方式對圖像進行標記分類，是對數(shù)據(jù)集的圖像進行

發(fā)表于 12-19 08:29 ?428次閱讀

香港大學最新提出！實現(xiàn)超現(xiàn)實的人類圖像生成：HyperHuman

最后，為了進一步提高視覺質(zhì)量，我們提出了一種結(jié)構(gòu)引導細化器來組合預測條件，以更詳細地生成更高分辨率。大量的實驗表明，我們的框架具有最先進的性能，可以在不同的場景下生成超

發(fā)表于 11-27 16:03 ?714次閱讀

谷歌新作UFOGen：通過擴散GAN實現(xiàn)大規(guī)模文本到圖像生成

擴散模型和 GAN 的混合模型最早是英偉達的研究團隊在 ICLR 2022 上提出的 DDGAN（《Tackling the Generative Learning Trilemma with Denoising Diffusion GANs》）。其靈感來自于普通擴散模型對降噪分布進行高斯假設(shè)的根本缺陷。

發(fā)表于 11-21 16:02 ?581次閱讀

搜索歷史

谷歌大腦打造“以一當十”的GAN：僅用10%標記數(shù)據(jù)，生成圖像卻更逼真

評論

沃達豐與谷歌深化十年戰(zhàn)略合作

Freepik攜手Magnific AI推出AI圖像生成器

深入理解渲染引擎：打造逼真圖像的關(guān)鍵

谷歌發(fā)布AI文生圖大模型Imagen

谷歌發(fā)布Imagen 3，提升圖像文本生成技術(shù)

深度學習生成對抗網(wǎng)絡(luò)（GAN）全解析

麻省理工與Adobe新技術(shù)DMD提升圖像生成速度

谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

谷歌暫停Gemini人像生成服務(wù)

谷歌Gemini AI模型因人物圖像生成問題暫停運行

谷歌推出圖像生成新工具ImageFX，提升圖像質(zhì)量

二值圖像連通區(qū)域的標記原理

圖像標注如何提升效率？

香港大學最新提出！實現(xiàn)超現(xiàn)實的人類圖像生成：HyperHuman

谷歌新作UFOGen：通過擴散GAN實現(xiàn)大規(guī)模文本到圖像生成

搜索歷史

谷歌大腦打造“以一當十”的GAN：僅用10%標記數(shù)據(jù)，生成圖像卻更逼真

評論

谷歌大腦打造“以一當十”的GAN：僅用10%標記數(shù)據(jù)，生成圖像卻更逼真