0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種框架把專業(yè)舞蹈演員的動(dòng)作遷移到不會(huì)跳舞的人身上

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-08-27 09:30 ? 次閱讀

UC Berkeley近日發(fā)表了一篇論文,題目簡潔明了:Everybody Dance Now,大家一起跳起來!沒錯(cuò),這個(gè)被網(wǎng)友稱為“mad lab”的實(shí)驗(yàn)室提出了一種框架,把專業(yè)舞蹈演員的動(dòng)作遷移到不會(huì)跳舞的人身上,不論是酷酷的街舞還是優(yōu)雅的芭蕾,效果簡直是神同步,流暢度和還原度都非常高。下面跟著論智一起看看這篇論文吧。

我們在這篇文章中提出了一個(gè)簡單的方法進(jìn)行動(dòng)作遷移:首先選擇一支單人跳舞視頻作為源視頻,幾分鐘后,在另一個(gè)目標(biāo)視頻上(完全不會(huì)跳舞的人)會(huì)呈現(xiàn)同樣的動(dòng)作。我們將這一問題看作是每一幀上圖像到圖像的轉(zhuǎn)換,同時(shí)保證時(shí)間和空間的流暢。用動(dòng)作探測器作為源視頻和目標(biāo)視頻中間的表示,我們學(xué)習(xí)了一種從舞者動(dòng)作畫面到目標(biāo)物體的映射,并且對這一設(shè)置進(jìn)行調(diào)整,讓它與視頻完美融合,同時(shí)還加上了真實(shí)的人臉合成。

先放個(gè)視頻感受一下這驚艷的效果,在后半部分的補(bǔ)充案例中,還展示了芭蕾舞的遷移??梢钥吹?,原視頻中芭蕾舞演員的大腿部分被裙子遮擋,但是映射到目標(biāo)視頻中,大腿動(dòng)作也能正確呈現(xiàn),效果滿分!

簡介

我們提出了一種方法,實(shí)現(xiàn)了動(dòng)作在不同視頻中的不同人物之間的轉(zhuǎn)換?,F(xiàn)在有兩段視頻,其中一段是我們希望進(jìn)行合成的目標(biāo)(不會(huì)跳舞的人),另一個(gè)是模仿的源視頻(專業(yè)舞者)。我們通過基于像素的端到端通道實(shí)現(xiàn)了這一動(dòng)作遷移。這一方法與過去二十年常見的最近鄰搜索或3D中的重新制定目標(biāo)動(dòng)作不同。通過這一框架,我們讓很多未經(jīng)訓(xùn)練的人跳出了芭蕾和街舞。

為了實(shí)現(xiàn)兩視頻之間每幀的動(dòng)作遷移,我們必須學(xué)習(xí)一種兩個(gè)人物之間的映射。我們的目標(biāo)是在源視頻和目標(biāo)視頻之間進(jìn)行圖像到圖像的轉(zhuǎn)換。然而,我們沒有兩個(gè)目標(biāo)物體做出同樣動(dòng)作的圖片,也就無法直接對這一轉(zhuǎn)換進(jìn)行監(jiān)督學(xué)習(xí)。即使視頻中的兩個(gè)人做出一系列同樣的動(dòng)作,還是很難提取每一幀的姿勢,因?yàn)樯眢w形狀和風(fēng)格完全不同。

我們發(fā)現(xiàn),能體現(xiàn)身體各部分位置的關(guān)鍵點(diǎn)可以用作二者之間的表示。于是,我們設(shè)計(jì)了用來體現(xiàn)動(dòng)作的“中間表示(火柴人)”,如圖所示:

從目標(biāo)視頻中,我們用動(dòng)作識(shí)別器為每一幀制作了(火柴人, 目標(biāo)人物圖像)的組合。有了這樣相關(guān)的數(shù)據(jù),我們就能用監(jiān)督方法學(xué)習(xí)火柴人和目標(biāo)人物之間圖像到圖像的轉(zhuǎn)換模型了。于是,我們的模型通過訓(xùn)練,可以生成個(gè)性化的視頻。之后,為了將源視頻的動(dòng)作遷移到目標(biāo)視頻中,我們把火柴人輸入到經(jīng)過訓(xùn)練的模型后,得到和源視頻中人物相同的目標(biāo)動(dòng)作。另外,為了提高生成的質(zhì)量,我們添加了兩個(gè)元素。為了使生成的模型更流暢,我們都會(huì)根據(jù)上一幀對目前的幀進(jìn)行預(yù)測。為了提高生成人臉的真實(shí)性,我們還加入了經(jīng)過訓(xùn)練的GAN來生成目標(biāo)人物的臉部。

具體方法

這一任務(wù)大致分為三步:動(dòng)作檢測、全局動(dòng)作規(guī)范化和動(dòng)作映射。訓(xùn)練和遷移過程如下圖所示:

模型通過探測器P創(chuàng)造目標(biāo)視頻中人物所對應(yīng)的火柴人。訓(xùn)練時(shí),我們學(xué)習(xí)了映射G和一個(gè)對抗判別器D。D的作用是嘗試判斷火柴人和視頻中的人是否符合。

下面一行是遷移過程。我們用動(dòng)作探測器P:Y’→X’來獲得源視頻中的火柴人形象,這個(gè)火柴人形象通過歸一化處理變成了為目標(biāo)人物設(shè)計(jì)的火柴人。接著對其應(yīng)用經(jīng)過訓(xùn)練的映射G即可。

為了讓效果更真實(shí),我們還專門增加了生成對抗網(wǎng)絡(luò)設(shè)置,讓面部更真實(shí),效果也顯著提高。

網(wǎng)絡(luò)架構(gòu)

為了提取身體、面部和手部的動(dòng)作關(guān)鍵點(diǎn),我們使用了最先進(jìn)的動(dòng)作檢測器OpenPose。在圖像轉(zhuǎn)換階段,我們使用了Wang等人提出的pix2pixHD模型。對于面部圖像的生成,我們沒有使用完全的pix2pixHD生成器,而是利用pix2pixHD的全局生成器。

實(shí)驗(yàn)對比

由于我們沒有標(biāo)準(zhǔn)答案,為了對比兩個(gè)不同視頻中的目標(biāo)人物,我們分析了目標(biāo)人物的重建過程(也就是將源視頻人物當(dāng)做目標(biāo)人物)。另外,為了評估每一幀的生成質(zhì)量,我們測量了結(jié)構(gòu)相似度(SSIM)和學(xué)習(xí)認(rèn)知圖像補(bǔ)丁相似性(LPIPS)。

除此之外,我們還在每個(gè)系統(tǒng)的輸出上應(yīng)用了動(dòng)作檢測器P,比較這些重建之后的關(guān)鍵點(diǎn)和原始的動(dòng)作有何不同。

遷移結(jié)果。最上方的是源目標(biāo)人物,中間是對應(yīng)的“火柴人”,最下面一行是輸出的目標(biāo)人物動(dòng)作

我們對比了標(biāo)準(zhǔn)pix2pixHD、只含有流暢度設(shè)置的我們模型版本(T.S.)以及我們模型的最終版本(有流暢設(shè)置和人臉GAN)。首先,三種模式下相似度的對比如圖:

而在臉部區(qū)域,三種生成圖像的質(zhì)量對比:

可以看到,我們的完整版模型的分?jǐn)?shù)是最好的。

討論

看過這篇論文后,許多人只有一個(gè)反應(yīng):“Amazing?。 钡拇_,效果這么好的視頻生成技術(shù)未來可應(yīng)用的場景有很多,比如電影拍攝、VR動(dòng)畫等等。但也有人表示擔(dān)心,會(huì)不會(huì)像之前的deepfakes換臉一樣,再產(chǎn)生一堆虛假視頻?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1075

    瀏覽量

    40270
  • 遷移
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    7905

原文標(biāo)題:不如跳舞!伯克利的舞蹈動(dòng)作遷移效果逆天

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    經(jīng)典的QP框架原理

    狀態(tài)機(jī)是嵌入式開發(fā)中常見的一種方法,但狀態(tài)機(jī)的形式有很多,這里給大家分享下經(jīng)典的QP框架原理。 狀態(tài)機(jī)基本術(shù)語 現(xiàn)態(tài):是指當(dāng)前所處的狀態(tài)。條件:又稱為“事件”,當(dāng)個(gè)條件被滿足,將會(huì)
    的頭像 發(fā)表于 07-21 09:04 ?885次閱讀
    經(jīng)典的QP<b class='flag-5'>框架</b>原理

    怎么從Harmony 1.06遷移到1.07.01?

    你好!我的硬件是個(gè)PIC32 MZ2048 EFM與網(wǎng)絡(luò),USB,2×CAN,RS232,SPI。在框架1.06下工作,我試著這個(gè)項(xiàng)目從1.06遷移到1.07.01。問題之
    發(fā)表于 10-10 13:17

    EDK項(xiàng)目遷移到vivado的建議有哪些?

    大家好,我正在開發(fā)個(gè)目前處于planAhead ISE的項(xiàng)目。我正在將該EDK項(xiàng)目遷移到vivado。當(dāng)我嘗試遷移IP時(shí),我能夠成功遷移我的
    發(fā)表于 05-06 10:31

    請問下mysql怎么快速遷移到oceanBase???

    mysql怎么快速遷移到oceanBase啊
    發(fā)表于 05-30 17:04

    分享一種智能網(wǎng)卡對熱遷移支持的新思路

    Guest訪問的階段。Pass-through物理設(shè)備的方式是可以達(dá)到跟HOST訪問設(shè)備同等的性能,逐漸成為一種主流。但這給熱遷移帶來了問題,Pass-through的設(shè)備狀態(tài)要想被獲取,就需要硬件配合軟件
    發(fā)表于 07-05 14:46

    如何使用Neon intrinsic的矢量處理代碼遷移到氦intrinsic

    本指南旨在幫助任何將使用霓虹燈內(nèi)部函數(shù)的現(xiàn)有矢量處理代碼遷移到氦內(nèi)部函數(shù)的人。我們將研究不同復(fù)雜度的霓虹燈代碼示例,并研究如何將該霓虹燈代碼遷移到氦。通過研究這些示例,您將了解些通用
    發(fā)表于 08-02 07:39

    從電源架構(gòu)遷移到ARM的應(yīng)用說明

    本文檔的目的是強(qiáng)調(diào)那些參與將軟件應(yīng)用程序從Power架構(gòu)遷移到ARM平臺(tái)的人員感興趣的領(lǐng)域。 本文并不試圖將一種體系結(jié)構(gòu)提升到另一種體系結(jié)構(gòu)之上,只是為了清楚地解釋將現(xiàn)有軟件應(yīng)用程序從
    發(fā)表于 08-22 06:09

    可穿戴在人身上的驚人科技設(shè)備

     最近介紹了可以穿戴在人身上的多種設(shè)備,些甚至可以植入人體。其中有些設(shè)備能充當(dāng)“身體黑客”給醫(yī)生提供病人至關(guān)重要的信息,讓醫(yī)生洞察先機(jī),幫助人們克服病痛或者是永久性殘疾。
    發(fā)表于 06-01 09:19 ?3024次閱讀

    場探索人類與太陽關(guān)系的VR舞蹈體驗(yàn)

    作為款被稱為“Celestial Moon(天體月亮)”的VR舞蹈體驗(yàn),它結(jié)合了真人視頻和計(jì)算機(jī)生成的圖像。它的特點(diǎn)是幾個(gè)舞蹈演員,在個(gè)探索人類與太陽關(guān)系的常規(guī)中表演于超現(xiàn)實(shí)的宇宙
    發(fā)表于 04-19 10:16 ?1664次閱讀

    圖像遷移最新成果:人體姿勢和舞蹈動(dòng)作遷移

    加州大學(xué)伯克利分校的研究人員,近日在著名預(yù)印本網(wǎng)站 arXive 上,發(fā)布了最新的圖像遷移成果:人體姿勢和舞蹈動(dòng)作遷移
    的頭像 發(fā)表于 09-03 16:19 ?6211次閱讀

    谷歌與Wayne McGregor合作 研發(fā)出能預(yù)測特定風(fēng)格舞蹈動(dòng)作的人工智能

    近日,谷歌藝術(shù)與文化部的Damien Henry與英國舞蹈編導(dǎo)Wayne McGregor合作,共同研發(fā)了一種能夠預(yù)測特定風(fēng)格舞蹈動(dòng)作的人
    發(fā)表于 12-27 16:01 ?1438次閱讀

    一種能夠預(yù)測特定風(fēng)格舞蹈動(dòng)作的人工智能

    當(dāng)然,AI編舞也不是完全不具備創(chuàng)造力。該技術(shù)可以畫出張它所識(shí)別的不同舞蹈動(dòng)作的“地圖”,并且推薦特定的動(dòng)作序列。Henry解釋說, 它在動(dòng)作
    的頭像 發(fā)表于 12-28 14:23 ?3589次閱讀

    Hayden Barnes:微軟不會(huì)將Windows遷移到Linux

    轉(zhuǎn)自:開源中國 Canonical 桌面團(tuán)隊(duì)成員Hayden Barnes發(fā)表個(gè)人觀點(diǎn)稱,他認(rèn)為微軟不會(huì)將 Windows 遷移到 Linux。 近段時(shí)間以來,微軟積極融合 Linux 的舉措引發(fā)
    的頭像 發(fā)表于 10-23 11:56 ?1946次閱讀
    Hayden Barnes:微軟<b class='flag-5'>不會(huì)</b>將Windows<b class='flag-5'>遷移到</b>Linux

    一種基于標(biāo)簽比例信息的遷移學(xué)習(xí)算法

    不充分的問題,于是如何利用歷史數(shù)據(jù)(原任務(wù)數(shù)據(jù))幫助新產(chǎn)生的數(shù)據(jù)(目標(biāo)任務(wù)數(shù)據(jù))進(jìn)行分類顯得異常重要。本文提出了一種基于標(biāo)簽比例信息的遷移學(xué)習(xí)算法,將知識(shí)從原任務(wù)遷移到目標(biāo)任務(wù),幫助目標(biāo)任務(wù)更好構(gòu)建分類
    發(fā)表于 03-30 15:46 ?462次閱讀

    一種將CUDA代碼遷移到SYCL和C++的開源工具

    英特爾發(fā)布了項(xiàng)開源工具,該工具可通過名為SYCLomatic的項(xiàng)目,將代碼遷移至SYCL1,這有助于開發(fā)者更輕松地將CUDA代碼遷移到SYCL和C++,從而加速面向異構(gòu)架構(gòu)的跨架構(gòu)編程。這個(gè)開源
    的頭像 發(fā)表于 06-10 11:17 ?1368次閱讀