0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

蘋(píng)果推出全新AI技術(shù):HUGS,僅需30分鐘即可生成短視頻

微云疏影 ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2023-12-20 11:01 ? 次閱讀

12 月 20 日,蘋(píng)果公司機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)公布了其創(chuàng)新性的生成式人工智能技術(shù)——HUGS,能在短短 30 分鐘內(nèi)分析短視頻,為其分配新的動(dòng)作和視角。

來(lái)自蘋(píng)果的研究人員 Anurag Ranjan 稱(chēng),HUGS 的全稱(chēng)為Human Gaussian Splats。借助機(jī)器學(xué)習(xí)及計(jì)算機(jī)視覺(jué),即使原始輸入數(shù)據(jù)有限,也能生成逼真的人像元素。

據(jù)蘋(píng)果透露,盡管神經(jīng)渲染技術(shù)已取得顯著進(jìn)展,但主要應(yīng)用仍限于靜態(tài)場(chǎng)景攝影測(cè)量。而對(duì)于活動(dòng)中的人物,要達(dá)到同樣效果,實(shí)施難度較大。

與此不同的是,HUGS利用3D Gaussian Splatting技術(shù)解決動(dòng)態(tài)人物的難題。這種方法僅需少量主體相關(guān)視頻進(jìn)行訓(xùn)練,通常要求在背景中運(yùn)動(dòng)并展示盡可能多的表面信息給系統(tǒng)。

在部分情況下,系統(tǒng)甚至只需 50 至 100 幀單目視頻作為源輸入,相當(dāng)于 2 至 4 秒長(zhǎng)度的每秒 24 幀視頻即可。

蘋(píng)果稱(chēng),通過(guò)這套系統(tǒng),可在半小時(shí)內(nèi)完成靜態(tài)場(chǎng)景和活動(dòng)人類(lèi)的虛擬再現(xiàn)。這項(xiàng)成果已經(jīng)過(guò)訓(xùn)練驗(yàn)證,能夠在短時(shí)間內(nèi)完成“世界級(jí)的渲染質(zhì)量”動(dòng)畫(huà)制作,相比其他同類(lèi)方法提速高達(dá) 100 倍。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 蘋(píng)果
    +關(guān)注

    關(guān)注

    61

    文章

    24337

    瀏覽量

    195592
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46671

    瀏覽量

    237123
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8353

    瀏覽量

    132315
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標(biāo)志著火山引擎在視頻內(nèi)容生成領(lǐng)域邁出了重要
    的頭像 發(fā)表于 09-25 14:11 ?239次閱讀

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設(shè)計(jì)資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發(fā)布標(biāo)志著
    的頭像 發(fā)表于 08-30 16:23 ?1051次閱讀

    MediaTek聯(lián)合快手推出高效端側(cè)視頻生成技術(shù)

    MediaTek 與快手共同宣布,推出高效端側(cè)視頻生成技術(shù),共同探索并推進(jìn)生成AI 技術(shù)的革
    的頭像 發(fā)表于 07-05 11:23 ?4471次閱讀

    阿里云視頻生成技術(shù)創(chuàng)新!視頻生成使用了哪些AI技術(shù)和算法

    照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領(lǐng)域的創(chuàng)新 ? EMO(Emote Portrait Alive)是一個(gè)由阿里巴巴集團(tuán)智能計(jì)算研究院開(kāi)發(fā)的框架,一個(gè)音頻驅(qū)動(dòng)的 AI 肖像
    的頭像 發(fā)表于 05-08 00:07 ?3304次閱讀

    [技術(shù)干貨](méi)?MoneyPrinterTurbo,利用 AI 大模型,一鍵生成高清短視頻

    開(kāi)始使用 步驟 1?訪問(wèn)該促銷(xiāo)活動(dòng)購(gòu)買(mǎi)頁(yè)面,按照如下配置完成 AI 生成短視頻服務(wù)器的部署。 步驟 2?登錄彈性云服務(wù)器控制臺(tái)。使用 Linux 連接工具登錄服務(wù)器,或者在控制臺(tái)單擊“遠(yuǎn)程登錄
    的頭像 發(fā)表于 04-07 15:11 ?1407次閱讀
    [<b class='flag-5'>技術(shù)</b>干貨](méi)?MoneyPrinterTurbo,利用 <b class='flag-5'>AI</b> 大模型,一鍵<b class='flag-5'>生成</b>高清<b class='flag-5'>短視頻</b>

    蘋(píng)果或推全新服務(wù):實(shí)體店面提供未拆封iPhone無(wú)線軟件更新

    外媒IGEN.FR已提前揭示了“Presto”設(shè)備的樣貌,一種能夠容納六部iPhone的小型儲(chǔ)物柜。在iPhone放入后,15至30分鐘即可
    的頭像 發(fā)表于 03-28 11:32 ?2343次閱讀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出全新的 Stable Video 3D 模型,該模型以其獨(dú)特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成多視圖3D
    的頭像 發(fā)表于 03-22 10:30 ?753次閱讀

    Stability AI推出Stable Video 3D模型,可制作多視角3D視頻

    SV3D_u是Stable Video 3D的一個(gè)版本,單幅圖片即可生成運(yùn)動(dòng)軌跡視頻,無(wú)須進(jìn)行相機(jī)調(diào)整。擴(kuò)充版本的SV3D_p加入了軌道
    的頭像 發(fā)表于 03-21 14:57 ?923次閱讀

    阿里巴巴推出全新AI圖生視頻模型EMO

    近日,阿里巴巴集團(tuán)智能計(jì)算研究院宣布推出了一款革命性的AI圖片-音頻-視頻模型技術(shù)——EMO。據(jù)官方介紹,EMO是一種先進(jìn)的音頻驅(qū)動(dòng)肖像視頻生成
    的頭像 發(fā)表于 03-05 11:00 ?1266次閱讀

    OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,視頻生成模型“Sora”

    人工智能,根據(jù)書(shū)面命令立即創(chuàng)建短視頻。JAEALOT2024年2月16日2月16日凌晨,也就是中國(guó)大年初七,OpenAI在AI生成視頻領(lǐng)域扔出一枚“王炸”,宣布
    的頭像 發(fā)表于 02-22 08:25 ?337次閱讀
    OpenAI 在 <b class='flag-5'>AI</b> <b class='flag-5'>生成</b><b class='flag-5'>視頻</b>領(lǐng)域扔出一枚“王炸”,<b class='flag-5'>視頻生成</b>模型“Sora”

    探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

    OpenAI的Sora現(xiàn)已擴(kuò)展其能力范圍,進(jìn)入視頻生成領(lǐng)域,標(biāo)志著人工智能技術(shù)在多媒體內(nèi)容創(chuàng)作上的一個(gè)重大突破。Sora的視頻AI功能使得用戶能夠根據(jù)文本描述自動(dòng)
    的頭像 發(fā)表于 02-20 12:01 ?1385次閱讀

    OpenAI發(fā)布文生視頻模型Sora,引領(lǐng)AI視頻生成新紀(jì)元

    在人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽(yù)的模型,以其“逼真”和“富有想象力”的視頻生成能力,徹底顛覆了傳統(tǒng)
    的頭像 發(fā)表于 02-19 11:03 ?862次閱讀

    OpenAI推出全新文生視頻模型Sora

    近日,全球領(lǐng)先的人工智能研究公司OpenAI宣布推出其最新的文生視頻大模型“Sora”。該模型具有突破性的功能,能夠根據(jù)用戶提供的文本指令或靜態(tài)圖像,自動(dòng)生成長(zhǎng)達(dá)1分鐘的高清
    的頭像 發(fā)表于 02-19 10:56 ?754次閱讀

    OpenAI發(fā)布首個(gè)視頻生成模型Sora

    OpenAI近日宣布推出全新的文本到視頻生成模型——Sora。這一突破性的技術(shù)視頻創(chuàng)作帶入了一個(gè)全新
    的頭像 發(fā)表于 02-18 10:07 ?977次閱讀

    蘋(píng)果全新AI功能今年發(fā)布

    蘋(píng)果公司CEO蒂姆·庫(kù)克近日在財(cái)報(bào)會(huì)議上宣布,蘋(píng)果將在今年發(fā)布全新AI(人工智能)功能,這是繼推出Siri語(yǔ)音助手之后的又一重要?jiǎng)?chuàng)新。
    的頭像 發(fā)表于 02-03 09:16 ?1082次閱讀