0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

蒙娜麗莎一鍵復(fù)活 三星AI一張圖片就能合成動(dòng)畫

電子工程師 ? 來源:fqj ? 2019-05-27 17:43 ? 次閱讀

還記得哈利?波特第一次來到霍格沃茨看到墻上那些既會(huì)動(dòng)又會(huì)說話的掛畫是多么驚訝嗎?如果我們可以將掛畫 “復(fù)活”,和 500 多年前的蒙娜麗莎來場穿越時(shí)空的對話會(huì)怎樣呢?感謝 AI 技術(shù),把畫 “復(fù)活” 不再是夢!

名畫《蒙娜麗莎的微笑》,會(huì)動(dòng)了!

夢娜麗莎轉(zhuǎn)過頭,嘴里說著話,微微眨了眨眼,臉上帶著溫婉的微笑。

是的,《哈利·波特》世界中”會(huì)動(dòng)的畫“魔法實(shí)現(xiàn)了!來自三星AI中心(Samsung AI Center)和莫斯科斯的Skolkovo 科學(xué)技術(shù)研究所的一組研究人員,開發(fā)了一個(gè)能將讓JPEG變GIF的AI系統(tǒng)。

《哈利·波特》中守衛(wèi)格蘭芬多學(xué)院休息室的胖夫人畫像

更牛逼的是,該技術(shù)完全無需3D建模,僅需一張圖片就能訓(xùn)練出惟妙惟肖的動(dòng)畫。研究人員稱這種學(xué)習(xí)方式為“few-shot learning"。當(dāng)然,如果有多幾張照片——8張或32張——?jiǎng)?chuàng)造出來動(dòng)圖效果就更逼真了。比如:

愛因斯坦給你講物理:

瑪麗蓮夢露和你 flirt:

本周,三星AI實(shí)驗(yàn)室的研究人員發(fā)表了一篇題為 “Few-Shot Adversarial Learning of Realistic Neural Talking Head Models” 的論文,概述了這種技術(shù)。該技術(shù)基于卷積神經(jīng)網(wǎng)絡(luò),其目標(biāo)是獲得一個(gè)輸入源圖像,模擬目標(biāo)輸出視頻中某個(gè)人的運(yùn)動(dòng),從而將初始圖像轉(zhuǎn)換為人物正在說話的短視頻。

論文一發(fā)表馬上引起轟動(dòng),畢竟這項(xiàng)技術(shù)創(chuàng)造了巨大的想象空間!

類似這樣的項(xiàng)目有很多,所以這個(gè)想法并不特別新穎。但在這篇論文中,最有趣的是,該系統(tǒng)不需要大量的訓(xùn)練示例,而且系統(tǒng)只需要看一次圖片就可以運(yùn)行。這就是為什么它讓《蒙娜麗莎》活起來。

3個(gè)神經(jīng)網(wǎng)絡(luò),讓蒙娜麗莎活起來

這項(xiàng)技術(shù)采用“元學(xué)習(xí)”架構(gòu),如下圖所示:

圖2:“讓照片動(dòng)起來”元學(xué)習(xí)架構(gòu)

具體來說,涉及三個(gè)神經(jīng)網(wǎng)絡(luò):

首先,嵌入式網(wǎng)絡(luò)映射輸入圖像中的眼睛、鼻子、嘴巴大小等信息,并將其轉(zhuǎn)換為向量;

其次,生成式網(wǎng)絡(luò)通過繪制人像的面部地標(biāo)(face landmarks)來復(fù)制人在視頻中的面部表情;

第三,鑒別器網(wǎng)絡(luò)將來自輸入圖像的嵌入向量粘貼到目標(biāo)視頻的landmark上,使輸入圖像能夠模擬視頻中的運(yùn)動(dòng)。

最后,計(jì)算“真實(shí)性得分”。該分?jǐn)?shù)用于檢查源圖像與目標(biāo)視頻中的姿態(tài)的匹配程度。

元學(xué)習(xí)過程:只需1張輸入圖像

研究人員使用VoxCeleb2數(shù)據(jù)集對這個(gè)模型進(jìn)行了預(yù)訓(xùn)練,這是一個(gè)包含許多名人頭像的數(shù)據(jù)庫。在這個(gè)過程中,前面描述的過程是一樣的,但是這里的源圖像和目標(biāo)圖像只是同一視頻的不同幀。

因此,這個(gè)系統(tǒng)不是讓一幅畫去模仿視頻中的另一個(gè)人,而是有一個(gè)可以與之比較的ground truth。通過持續(xù)訓(xùn)練,直到生成的幀與訓(xùn)練視頻中的真實(shí)幀十分相似為止。

預(yù)訓(xùn)練階段允許模型在只有很少示例的輸入上工作。哪怕只有一張圖片可用時(shí),結(jié)果也不會(huì)太糟,但當(dāng)有更多圖片可用時(shí),結(jié)果會(huì)更加真實(shí)。

實(shí)驗(yàn)和結(jié)果

研究人員使用2個(gè)數(shù)據(jù)集分別進(jìn)行定量和定性評估:VoxCeleb1數(shù)據(jù)集用于與基準(zhǔn)模型進(jìn)行比較,VoxCeleb2用于展示他們所提出方法的效果。

研究人員在三種不同的設(shè)置中將他們的模型與基準(zhǔn)模型進(jìn)行了比較,使用fine-tuning集中的1幀、8幀和32幀。

蒙娜麗莎一鍵復(fù)活 三星AI一張圖片就能合成動(dòng)畫

表1:few-shot learning設(shè)置下不同方法的定量比較

結(jié)果如表1上半部分所示,基線模型在兩個(gè)相似性度量上始終優(yōu)于我們的方法。

不過,這些指標(biāo)不能完全代表人類的感知,因?yàn)檫@兩種方法都會(huì)產(chǎn)生恐怖谷偽影,從圖3的定性比較和用戶研究結(jié)果可以看出。

另一方面,余弦相似度與視覺質(zhì)量有更好的相關(guān)性,但仍然傾向于模糊、不太真實(shí)的圖像,這也可以通過表1-Top與圖3中的比較結(jié)果看出。

圖3:使用1張、8張和32張訓(xùn)練圖像時(shí)的三個(gè)示例。系統(tǒng)采用一個(gè)源圖像(第1列),并嘗試將該圖像映射到ground truth幀中的相同位置(第2列)。研究人員將他們的結(jié)果與X2Face、PixtopixHD模型進(jìn)行了比較。

大規(guī)模的結(jié)果。

隨后,我們擴(kuò)展可用的數(shù)據(jù),并在更大的VoxCeleb2數(shù)據(jù)集中訓(xùn)練我們的方法。

下面是2個(gè)變體模型的結(jié)果:

圖4:在VoxCeleb2數(shù)據(jù)集中的最佳模型的結(jié)果。

同樣,訓(xùn)練幀的數(shù)量是T(左邊的數(shù)字),第1列是示例訓(xùn)練幀。第2列是ground truth圖像,后3列分別是我們的FF feed-forward 模型及微調(diào)前后的結(jié)果。雖然 feed-forward變體的學(xué)習(xí)更快速,但fine-tuning 最終提供了更好的真實(shí)感和保真度。

最后,我們展示了的照片和繪畫的結(jié)果。

圖5:讓靜態(tài)照片“活”起來

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 三星電子
    +關(guān)注

    關(guān)注

    34

    文章

    15852

    瀏覽量

    180870
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29858

    瀏覽量

    268152

原文標(biāo)題:蒙娜麗莎一鍵“復(fù)活”!三星AI Lab:只需一張圖片就能合成動(dòng)畫

文章出處:【微信號(hào):aicapital,微信公眾號(hào):全球人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    更簡單、更全能的系統(tǒng)級AI,OPPO Find X8首發(fā)AI一鍵問屏

    10月18日,OPPO今日公布Find X8系列全新AI特性——「AI一鍵問屏」。Find X8系列通過集成全新的系統(tǒng)級AI,可以一鍵喚醒
    發(fā)表于 10-18 15:21 ?206次閱讀
    更簡單、更全能的系統(tǒng)級<b class='flag-5'>AI</b>,OPPO Find X8首發(fā)<b class='flag-5'>AI</b><b class='flag-5'>一鍵</b>問屏

    一鍵斷電開關(guān)的種類有哪些

    一鍵斷電開關(guān)的種類主要可以從其功能和實(shí)現(xiàn)方式上進(jìn)行分類。以下是些常見的一鍵斷電開關(guān)種類: 1. 繼電器式一鍵斷電開關(guān) 定義 :這種開關(guān)通過繼電器或接觸器控制電路的通斷,實(shí)現(xiàn)
    的頭像 發(fā)表于 09-13 16:45 ?642次閱讀

    一鍵斷電開關(guān)的控制原理是什么

    一鍵斷電開關(guān),也被稱為緊急斷電開關(guān)或緊急停止開關(guān),是種安全裝置,用于在緊急情況下迅速切斷電源,以防止事故的發(fā)生或擴(kuò)大。這種開關(guān)的設(shè)計(jì)和應(yīng)用在工業(yè)、實(shí)驗(yàn)室、醫(yī)療設(shè)備以及任何需要快速斷電的場合都
    的頭像 發(fā)表于 09-13 16:28 ?679次閱讀

    一鍵生成屬于自己的AI客服:開啟智能服務(wù)新時(shí)代

    在當(dāng)今數(shù)字化飛速發(fā)展的時(shí)代,科技的進(jìn)步為我們的生活和工作帶來了前所未有的便利。其中,AI 技術(shù)的應(yīng)用尤為引人注目。今日,我們帶來的 AI客服項(xiàng)目 ,僅需你一鍵上傳文件,就能即刻生成專屬
    的頭像 發(fā)表于 08-05 15:25 ?356次閱讀
    <b class='flag-5'>一鍵</b>生成屬于自己的<b class='flag-5'>AI</b>客服:開啟智能服務(wù)新時(shí)代

    變電站一鍵順控系統(tǒng)和開關(guān)柜一鍵順控有區(qū)別嗎?

    變電站一鍵順控系統(tǒng)和開關(guān)柜一鍵順控技術(shù)雖然都涉及到“一鍵順控”的概念,但它們在應(yīng)用范圍和具體實(shí)現(xiàn)上有所不同,因此變電站一鍵順控系統(tǒng)和開關(guān)柜一鍵
    的頭像 發(fā)表于 07-31 13:34 ?401次閱讀
    變電站<b class='flag-5'>一鍵</b>順控系統(tǒng)和開關(guān)柜<b class='flag-5'>一鍵</b>順控有區(qū)別嗎?

    智能開關(guān)柜能如何實(shí)現(xiàn)“可視化一鍵順控”?

    智能開關(guān)柜能如何實(shí)現(xiàn)“可視化一鍵順控”和“開關(guān)柜健康狀態(tài)管理”?蜀瑞創(chuàng)新推出智能開關(guān)柜一鍵順控測解決方案。建設(shè)主要包括柜內(nèi)無線溫度監(jiān)測、斷路器機(jī)械特性和電氣特性監(jiān)測、分合閘線圈/儲(chǔ)能電機(jī)監(jiān)測、電動(dòng)機(jī)構(gòu)設(shè)備等,并能通過裝置實(shí)現(xiàn)開關(guān)柜基于A
    的頭像 發(fā)表于 07-08 09:45 ?383次閱讀
    智能開關(guān)柜能如何實(shí)現(xiàn)“可視化<b class='flag-5'>一鍵</b>順控”?

    百度搜索重磅推出AI圖片助手

    近日,百度搜索全新上線了款名為“百度AI圖片助手”的智能工具,該工具賦予了用戶一鍵處理圖片的強(qiáng)大能力。無論是搜索中的
    的頭像 發(fā)表于 05-06 10:20 ?1266次閱讀

    華為云 Serverless 應(yīng)用中心:一鍵開啟 AI 文生圖新時(shí)代,引領(lǐng)行業(yè)創(chuàng)新浪潮

    隨著數(shù)字化時(shí)代的快速發(fā)展,AI 技術(shù)已成為推動(dòng)行業(yè)創(chuàng)新的關(guān)鍵動(dòng)力。華為云緊跟時(shí)代步伐,全新上線 Serverless 應(yīng)用中心,為用戶提供海量應(yīng)用模板,實(shí)現(xiàn)一鍵部署函數(shù)和周邊依賴資源,讓您輕松擁抱
    的頭像 發(fā)表于 03-19 22:57 ?424次閱讀

    三星手機(jī)AI功能將收費(fèi)?AI手機(jī)是噱頭還是未來?

    支持的三星Galaxy設(shè)備上免費(fèi)提供。而近日傳出,筆記助手這功能僅可免費(fèi)使用180天,后期則需要收費(fèi)。 ? 三星手機(jī)AI 功能將收費(fèi) ? 2024年1月18日,
    的頭像 發(fā)表于 03-13 01:42 ?3539次閱讀

    消息稱三星正在整合混合合技術(shù)

    據(jù)業(yè)界消息人士透露,為了進(jìn)步提升其芯片代工能力,三星正全力推進(jìn)混合合技術(shù)的整合工作。據(jù)悉,應(yīng)用材料公司和Besi Semiconductor已在三星的天安園區(qū)開始安裝先進(jìn)的混合
    的頭像 發(fā)表于 02-18 11:13 ?651次閱讀

    新火種AI|三星打響“AI手機(jī)”第槍,2024會(huì)是AI終端元年嗎?

    作者:文子 ? 編輯:小迪 AI手機(jī),距離取代傳統(tǒng)手機(jī)不遠(yuǎn)了。 三星新年第炸,AI手機(jī)重磅來襲 2024年才剛剛開始,手機(jī)行業(yè)就迎來第個(gè)
    的頭像 發(fā)表于 01-06 09:59 ?590次閱讀
    新火種<b class='flag-5'>AI</b>|<b class='flag-5'>三星</b>打響“<b class='flag-5'>AI</b>手機(jī)”第<b class='flag-5'>一</b>槍,2024會(huì)是<b class='flag-5'>AI</b>終端元年嗎?

    三星電子2024年旗艦手機(jī)將借助AI技術(shù)推動(dòng)銷量

    “Galaxy AI”即為三星計(jì)劃在S24系列中引入的整套AI方案。其Exynos 2400和高通驍龍8 Gen 3芯片都將具備強(qiáng)大的AI
    的頭像 發(fā)表于 01-03 14:04 ?574次閱讀

    一鍵閃測儀使用時(shí)的注意事項(xiàng)有哪些?

    中圖儀器VX系列一鍵閃測儀采用雙遠(yuǎn)心高分辨率光學(xué)鏡頭,結(jié)合高精度圖像分析算法,并融入一鍵閃測原理,可以對工件平面的點(diǎn)、線、圓等基本元素作精密測量,測量精度高,并且操作簡單、性能優(yōu)良穩(wěn)定。
    的頭像 發(fā)表于 12-13 09:28 ?791次閱讀
    <b class='flag-5'>一鍵</b>閃測儀使用時(shí)的注意事項(xiàng)有哪些?

    一鍵動(dòng)態(tài)切換IP腳本

    T*o*r*Proxy一鍵搭建動(dòng)態(tài)代*理,通過利用T*o*r搭建Socks5代*理,最終實(shí)現(xiàn)動(dòng)態(tài)切換IP的效果。
    的頭像 發(fā)表于 12-08 10:25 ?1004次閱讀
    <b class='flag-5'>一鍵</b>動(dòng)態(tài)切換IP腳本

    一張圖看懂“PCB設(shè)計(jì)考慮的因素”

    一張圖看懂“PCB設(shè)計(jì)考慮的因素”
    的頭像 發(fā)表于 11-23 18:15 ?982次閱讀
    <b class='flag-5'>一張</b>圖看懂“PCB設(shè)計(jì)考慮的因素”