0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

4DGen:基于動(dòng)態(tài)3D高斯的可控4D生成新工作

CVer ? 來源:CVer ? 2024-01-04 15:57 ? 次閱讀

一、研究背景

盡管3D和視頻生成取得了飛速的發(fā)展,由于缺少高質(zhì)量的4D數(shù)據(jù)集,4D生成始終面臨著巨大的挑戰(zhàn)。過去幾篇工作嘗試了Text-To-4D的任務(wù),但依然存在兩個(gè)主要問題:

1.由于輸入依賴于單視角的圖片或者簡單的文本描述,并不能保證得到精準(zhǔn)的4D結(jié)果,需要花費(fèi)大量的時(shí)間進(jìn)行反復(fù)調(diào)整。

2.盡管采用了Hexplane作為4D的表征,基于NeRF的方法在高分辨率和長視頻上的渲染所需要的計(jì)算時(shí)間和顯存占用是難以接受的。即使采用了一個(gè)超分辨的后處理網(wǎng)絡(luò),依然會(huì)有模糊和閃爍的結(jié)果。

為了解決上述問題,4DGen定義了“Grounded 4D Generation“新型任務(wù)形式,并且設(shè)計(jì)了新的算法框架實(shí)現(xiàn)高質(zhì)量的4D內(nèi)容生成。

二、任務(wù)定義

過往的4D生成工作是“one click“的方式,并不能對生成的結(jié)果進(jìn)行有效的控制。4DGen提出了“Grounded 4D Generation“的形式,通過利用視頻序列和可選的3D模型作為4D生成的控制信息,可以實(shí)現(xiàn)更為精準(zhǔn)的4D內(nèi)容生成。用戶可通過輸入視頻序列或3D模型來約束4D結(jié)果的運(yùn)動(dòng)和外觀;當(dāng)用戶僅提供單張圖片作為輸入時(shí),可借助預(yù)訓(xùn)練好的視頻生成模型來得到視頻序列;當(dāng)用戶未提供3D模型時(shí),可通過單張圖片重建3D模型來作為起始點(diǎn)。

4b408368-a72d-11ee-8b88-92fbcf53809c.png

三、方法介紹

4DGen框架的輸入起始點(diǎn)為用戶給定或者模型生成的視頻序列,對于任意的單張圖片,借助多視角生成模型(multi-view diffusion model),可以得到不同視角的圖片。4DGen通過對第一幀多視圖進(jìn)行三維重建,得到初始的靜態(tài)3D Gaussians作為4D生成的起始點(diǎn)。

由于4D數(shù)據(jù)的匱乏,需要盡可能的從先驗(yàn)?zāi)P椭姓麴s信息。4DGen將每一幀生成的多視圖作為2D偽標(biāo)簽,并且采用多視圖生成的點(diǎn)云作為3D點(diǎn)的偽標(biāo)簽來監(jiān)督訓(xùn)練過程。

因?yàn)槎嘁晥D生成具有ill-posed的特點(diǎn),得到的偽標(biāo)簽在不同視角之間,不同時(shí)序之間存在不連續(xù)性,需要引入時(shí)間和空間上的一致性損失函數(shù)進(jìn)行約束。相較于擬合多視圖DDIM采樣得到的圖片,score distillation sampling(SDS)是根據(jù)先驗(yàn)的擴(kuò)散模型對場景表達(dá)進(jìn)行似然估計(jì)。

4DGen依據(jù)正面視角計(jì)算任意視角圖片在Zero123模型上的SDS損失,用于提升空間上的連續(xù)性。為了緩解閃爍問題,4DGen引入了無監(jiān)督的時(shí)間平滑約束。通過計(jì)算平面的平滑損失和Gaussians不同時(shí)刻的平滑損失,有效提升了時(shí)間上的一致性。

4b490ca4-a72d-11ee-8b88-92fbcf53809c.png

四、實(shí)施細(xì)節(jié)

4DGen的 4D表達(dá)采用了4D Gaussian Spaltting的方式,通過一個(gè)多分辨率Hexplane對每個(gè)Gaussian進(jìn)行編碼。將6個(gè)時(shí)空平面的特征進(jìn)行相加,并經(jīng)過一個(gè)額外的MLP解碼得到對應(yīng)Gaussian在不同時(shí)刻的位置偏移量。

訓(xùn)練上采用三階段方式,第一階段對場景進(jìn)行靜態(tài)建模,第二階段利用2D和3D的偽標(biāo)簽進(jìn)行動(dòng)態(tài)場景的初步建模,第三建模利用平滑損失增強(qiáng)模型的細(xì)節(jié)和連續(xù)性。

所有實(shí)驗(yàn)可以在一張RTX3090上完成,對于2.5萬個(gè)Gaussians只需45分鐘的訓(xùn)練,對于9萬個(gè)Gaussians訓(xùn)練2小時(shí)可以得到更加好的細(xì)節(jié)效果。

五、實(shí)驗(yàn)結(jié)果

4DGen可以實(shí)現(xiàn)不同視角、不同時(shí)間的高質(zhì)量圖片渲染。相較于對比方法在細(xì)節(jié)表達(dá)、噪聲去除、顏色還原、時(shí)空連續(xù)性等方面有顯著提升。更多視覺效果可以參考項(xiàng)目主頁。

4b62246e-a72d-11ee-8b88-92fbcf53809c.png

量化對比上,4DGen采用了不同時(shí)序圖片和參考圖片的CLIP距離來衡量生成質(zhì)量,采用CLIP-T衡量不同時(shí)間下的圖像連續(xù)性。4DGen在多項(xiàng)指標(biāo)上明顯優(yōu)于過往方法。

4b7e341a-a72d-11ee-8b88-92fbcf53809c.png

六、總結(jié)

4DGen定義了” Grounded 4D Generation“的任務(wù)形式,通過視頻序列和可選3D模型的引入提升了4D生成的可控性。通過高效的4D Gaussian Splatting的表達(dá),2D和3D偽標(biāo)簽的監(jiān)督和時(shí)空的連續(xù)性約束,使得4DGen可以實(shí)現(xiàn)高分辨率、長時(shí)序的高質(zhì)量的4D內(nèi)容生成。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 編解碼
    +關(guān)注

    關(guān)注

    1

    文章

    140

    瀏覽量

    19577
  • SDS
    SDS
    +關(guān)注

    關(guān)注

    0

    文章

    48

    瀏覽量

    15678
  • 3D模型
    +關(guān)注

    關(guān)注

    1

    文章

    71

    瀏覽量

    15671
  • MLP
    MLP
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    4213

原文標(biāo)題:3DGS殺瘋了!4DGen:基于動(dòng)態(tài)3D高斯的可控4D生成新工作

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    3D打印尚未成熟 4D打印異軍突起

    所謂4D打印技術(shù),就是在傳統(tǒng)3D打印的概念中加入了“時(shí)間”元素,被打印物體可以隨著時(shí)間的推移而在形態(tài)上發(fā)生自我調(diào)整。
    發(fā)表于 05-10 14:32 ?1253次閱讀

    生成顯示4D數(shù)據(jù)——LabVIEW中3D Mesh的研究,附贈(zèng)256色色譜生成

    各種設(shè)置,再也不用在程序框圖編寫煩人的屬性節(jié)點(diǎn)了。而且還有右鍵另存為的功能導(dǎo)出圖片??!見3D Scatter.vi控件:框圖:4 附贈(zèng)256色色譜生成器(\Color Spectrum\Color
    發(fā)表于 07-11 13:34

    3D NAND與4D NAND之間的差別在哪兒?

    什么是3D NAND?什么是4D NAND?3D NAND與4D NAND之間的差別在哪兒?
    發(fā)表于 06-18 06:06

    神奇的4D打?。何矬w可完成自我組裝

    你聽說過4D打印嗎?相比3D,這種更高級(jí)的打印技術(shù),除了包括三維立體結(jié)構(gòu),還增加了時(shí)間線。4D打印只需直接將想要的性狀輸入到材料中,物體就會(huì)經(jīng)過“形變”自動(dòng)組裝,而不需要任何設(shè)備。
    發(fā)表于 05-06 10:14 ?1359次閱讀

    4d打印技術(shù)是什么?

    就是通過3D打印機(jī),將電腦設(shè)計(jì)完成的數(shù)字模型文件通過粉末狀金屬或者塑料進(jìn)行打印,構(gòu)造出我們想要的物體。如今,4D打印的概念又被推出,那么究竟4d打印技術(shù)是什么呢?
    發(fā)表于 10-26 11:40 ?8010次閱讀

    4d打印與3d打印有什么區(qū)別?

    盡管3D打印技術(shù)興起的時(shí)間不長,大多數(shù)人還沒來得及弄清它是怎么回事,一項(xiàng)更先進(jìn)的4D打印技術(shù)又嶄露頭角、不期而至,大有徹底改變傳統(tǒng)工業(yè)打印甚至建筑行業(yè)之勢。
    發(fā)表于 10-26 14:08 ?2.9w次閱讀

    4d打印技術(shù)的應(yīng)用

    4D打印的創(chuàng)新點(diǎn)在于“變”,它是一個(gè)動(dòng)態(tài)的過程,它不但能夠創(chuàng)造出有智慧、有適應(yīng)能力的新事物,而且可以徹底改變傳統(tǒng)的工業(yè)打印。4D打印技術(shù)是對3D技術(shù)的改進(jìn)和完善,
    發(fā)表于 10-26 14:32 ?8432次閱讀

    4D打印技術(shù)是什么,與3D打印有何區(qū)別?

    3D打印相比,4D打印在3D打印的基礎(chǔ)上增加了一個(gè)時(shí)間維度,即4D打印的物件會(huì)隨著時(shí)間的推移(自動(dòng))變成不同的形狀。
    發(fā)表于 10-15 10:45 ?9084次閱讀

    4d打印原理

    所謂的4D打印,比3D打印多了一個(gè)“D”也就是時(shí)間維度,人們可以通過軟件設(shè)定模型和時(shí)間,變形材料會(huì)在設(shè)定的時(shí)間內(nèi)變形為所需的形狀。準(zhǔn)確地說4D打印是一種能夠自動(dòng)變形的材料,直接將設(shè)計(jì)內(nèi)
    的頭像 發(fā)表于 04-04 15:33 ?4670次閱讀

    4d打印比3d多了什么

    4D打印,準(zhǔn)確地說是一種能夠自動(dòng)變形的材料,只需將其放入水中,不需要連接任何復(fù)雜的機(jī)電設(shè)備,就能按照產(chǎn)品設(shè)計(jì)自動(dòng)折疊成相應(yīng)的形狀。4D打印最關(guān)鍵是記憶合金。
    的頭像 發(fā)表于 04-08 14:49 ?6946次閱讀

    4D打印與3D打印區(qū)別在哪?

    盡管早在2013年美國麻省理工學(xué)院就已經(jīng)展示出了一個(gè)關(guān)于4D打印技術(shù)的實(shí)驗(yàn),但該技術(shù)當(dāng)時(shí)并未引起太大關(guān)注。一直到2014年10月8日,美國《外交》雙月刊發(fā)表了一篇名為《準(zhǔn)備迎接4D打印革命
    發(fā)表于 07-27 11:14 ?5651次閱讀

    4D打印來了!

    來源:SAMPECHINA,微注塑,騰訊視頻,通用機(jī)械 也許,你連3D打印具體是什么都還未完全搞清楚,現(xiàn)在4D又來了 4D打印,準(zhǔn)確地說是一種能夠自動(dòng)變形的材料,只需將其放入水中,不需要連接任何復(fù)雜
    的頭像 發(fā)表于 09-04 09:26 ?2573次閱讀

    什么是4D毫米波雷達(dá)?4D毫米波雷達(dá)與傳統(tǒng)雷達(dá)有何區(qū)別?

    在2023年的CES上,4D成像毫米波雷達(dá)(簡稱4D毫米波雷達(dá)、4D成像雷達(dá)或4D雷達(dá))備受矚目。
    的頭像 發(fā)表于 03-13 09:58 ?1.3w次閱讀

    Meta提出Make-A-Video3D:一行文本,生成3D動(dòng)態(tài)場景!

    具體而言,該方法運(yùn)用 4D 動(dòng)態(tài)神經(jīng)輻射場(NeRF),通過查詢基于文本到視頻(T2V)擴(kuò)散的模型,優(yōu)化場景外觀、密度和運(yùn)動(dòng)的一致性。任意機(jī)位或角度都可以觀看到提供的文本生成動(dòng)態(tài)視頻
    的頭像 發(fā)表于 03-24 10:47 ?977次閱讀

    4D毫米波雷達(dá)的拆解報(bào)告分享

    如果把測速測距雷達(dá)稱之為2D雷達(dá),測速測距測角雷達(dá)就是3D雷達(dá),如果再加一個(gè)測量高度,那就是4D雷達(dá)。
    發(fā)表于 04-29 09:24 ?812次閱讀
    <b class='flag-5'>4D</b>毫米波雷達(dá)的拆解報(bào)告分享