0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI視頻創(chuàng)作一條龍!達(dá)摩院“尋光”平臺(tái)炸場(chǎng)WAIC,突破可控編輯難題

卡奧斯開源社區(qū) ? 來源:jf_92107760 ? 作者:jf_92107760 ? 2024-07-09 18:19 ? 次閱讀

卡奧斯智能交互引擎是卡奧斯基于海爾近40年工業(yè)生產(chǎn)經(jīng)驗(yàn)積累和卡奧斯7年工業(yè)互聯(lián)網(wǎng)平臺(tái)建設(shè)的最佳實(shí)踐,基于大語言模型和RAG技術(shù),集合海量工業(yè)領(lǐng)域生態(tài)資源方優(yōu)質(zhì)產(chǎn)品和知識(shí)服務(wù),旨在通過智能搜索、連續(xù)交互,實(shí)時(shí)生成個(gè)性化的內(nèi)容和智能化產(chǎn)品推薦,為用戶提供快速、可靠的交互式搜索服務(wù),首創(chuàng)了聚焦工業(yè)領(lǐng)域的智能交互引擎。

詳情戳:卡奧斯智能交互引擎

AIGC時(shí)代,視頻創(chuàng)作這事兒真的不一樣了。

就像這樣,輕輕一圈,選定目標(biāo)立刻變身單獨(dú)圖層,再絲滑嵌入不同的背景視頻,場(chǎng)景變換so easy~

wKgaomaNDo6AR2pSAB1uboTkOdo152.gifwKgZomaNDpCAS3fcAC3awFqdVQg861.gif

想要調(diào)整一下鏡頭角度,交給AI,同樣能一鍵完成:

wKgZomaNDpKAD0bYACLCtNQOdNo851.gif

還能一鍵消除、修改目標(biāo):

wKgZomaNDpSAJ76DAH1qC9l9eeQ809.gif

后期再也不用加班加到手抽筋(doge)。

劃!重!點(diǎn)!這還不是實(shí)驗(yàn)室里的單一技術(shù)demo,而是馬上就要開放內(nèi)測(cè),讓創(chuàng)作者們直接可以用起來的一站式AI視頻創(chuàng)作平臺(tái)——“尋光”。

就是說,傳統(tǒng)上分散在不同制作流程中的劇本創(chuàng)作、分鏡圖設(shè)計(jì)、視頻素材編輯等步驟,現(xiàn)在都可以在AI加持下,在同一個(gè)平臺(tái)上流暢完成。

這就是阿里達(dá)摩院在上海世界人工智能大會(huì)上帶來的最新驚喜。

演示一出,現(xiàn)場(chǎng)的觀眾都坐不住了。

wKgaomaNDpeAPdlRAAGtTIkTDyQ062.jpg

而達(dá)摩院官方,也透露出了AI視頻領(lǐng)域新成果背后更大的“野心”:

不對(duì)標(biāo)Sora,而是走自己的路,希望更快讓AI生產(chǎn)力匹配人類想象力。

“尋夢(mèng)光影間”

所謂尋光,意指“尋夢(mèng)光影間”:

即通過人工智能技術(shù),提供全新的視頻創(chuàng)作模式。

wKgZomaNDpeAZgmKAADOPZ0QVVw690.jpg

與Sora等今年備受關(guān)注的AI視頻生成模型不同,尋光關(guān)注到的,是“Sora之后,視頻工作流的變革”。

達(dá)摩院認(rèn)為,Sora等AI視頻生成模型給足了人們對(duì)視頻生產(chǎn)方式徹底變革的想象力,但一方面,AI視頻內(nèi)容的可控編輯,包括對(duì)復(fù)雜劇情的理解、生成對(duì)象的一致性等,仍然是當(dāng)前算法所面臨的一大挑戰(zhàn)。

另一方面,業(yè)界尚沒有統(tǒng)一的AI視頻編輯平臺(tái),能讓創(chuàng)作者們一站式體驗(yàn)到AI加持的視頻創(chuàng)作全流程。

舉個(gè)例子,OpenAI創(chuàng)始成員Andrej Karpathy最近也玩上了AI視頻,整出了個(gè)AI版《傲慢與偏見》。

wKgaomaNDpiAOWo2AAKn0uuR_sI796.jpg

在這個(gè)短片的制作過程中,他用到的工具包括Claude、Ideogram、Luma、ElevenLabs、VEED……而他本人也抱怨說:

老實(shí)說這個(gè)工作流非?;靵y,工具與工具之間存在大量的復(fù)制粘貼,3個(gè)片段的簡(jiǎn)單小視頻就花了我大約1個(gè)小時(shí)的時(shí)間。
這里面存在一個(gè)巨大的機(jī)會(huì)。誰正在打造100%的AI原生視頻制作平臺(tái)?

達(dá)摩院打造尋光,定位為PUGC一站式AI視頻創(chuàng)作平臺(tái),目標(biāo)正是針對(duì)以上問題,用AI能力重塑傳統(tǒng)視頻制作的全流程

具體來說,尋光可以輔助用戶創(chuàng)作劇本、分鏡圖等,支持對(duì)生成及上傳素材進(jìn)行豐富的AI編輯,包括人物控制、場(chǎng)景控制、運(yùn)鏡控制、目標(biāo)新增/消除/修改等10多種功能。

wKgZomaNDpiAS-tLAAE9HV54ZVw851.jpg

并且在交互方面,主打“讓視頻編輯像操作PPT一樣簡(jiǎn)單”。

以分鏡設(shè)計(jì)環(huán)節(jié)為例,上傳到尋光的原始視頻素材,會(huì)由算法切分成多個(gè)分鏡頭。

在創(chuàng)作空間里,用戶可以方便地查看到每一個(gè)分鏡頭,并用簡(jiǎn)單的拖拽操作對(duì)其進(jìn)行調(diào)整。

在新建的空白分鏡中,除了添加已有素材,尋光平臺(tái)還支持用戶調(diào)用多種多模態(tài)生成模型,生產(chǎn)新的內(nèi)容。

wKgaomaNDpmANaB-AAESfyvvQXc330.jpg

而在編輯功能方面,尋光強(qiáng)調(diào)的是精細(xì)化的編輯和控制:在AI加持下,依據(jù)用戶意圖,在語義層面而不是像素層面實(shí)現(xiàn)編輯;同時(shí),視頻里的人體、人臉、前景、背景等任意局部目標(biāo),都可以進(jìn)行精細(xì)化的編輯和修改。

在現(xiàn)場(chǎng),達(dá)摩院視覺技術(shù)實(shí)驗(yàn)室高級(jí)算法專家陳威華著重提到了基于視頻圖層的編輯能力。

以前景圖層功能為例,用戶通過文本輸入,即可生成符合描述的、具有透明背景的視頻,并且一鍵就能將其融合到其他背景視頻當(dāng)中。

wKgZomaNDpqAXsWtADDSKWQb4IU629.gif

尋光也支持圖層拆解功能,用戶在視頻第一幀選擇想要提取的物體,算法就會(huì)自動(dòng)跟蹤,把整段視頻中對(duì)應(yīng)的目標(biāo)拆解出來,形成獨(dú)立的帶透明背景的視頻圖層。

飄動(dòng)的頭發(fā)也扣得很精細(xì)的那種:

wKgZomaNDpyAXZkOAAPnGk2nWZM681.gif

另外,在對(duì)視頻全局元素的編輯方面,風(fēng)格遷移上,尋光平臺(tái)提供了20+不同風(fēng)格。

wKgaomaNDp6AcfFwAFySxVBqiZ4748.gif

運(yùn)鏡控制上,左右平移、上下平移、推進(jìn)拉遠(yuǎn)、左右環(huán)繞等都能支持。

wKgZomaNDqCAHxsHAAFm8YcDJjs066.jpg

在對(duì)視頻局部元素的編輯方面,除了目標(biāo)消除,尋光平臺(tái)還能實(shí)現(xiàn)人臉的精準(zhǔn)控制:

視頻取自國(guó)風(fēng)武俠動(dòng)漫《少年白馬醉春風(fēng)》第三集

輕輕一拉實(shí)現(xiàn)運(yùn)動(dòng)控制:

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28876

    瀏覽量

    266216
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46060

    瀏覽量

    234979
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    即夢(mèng)AI上線,字節(jié)跳動(dòng)挑戰(zhàn)Sora等AI創(chuàng)作平臺(tái)

    字節(jié)跳動(dòng)近期動(dòng)作頻頻,其剪映團(tuán)隊(duì)精心研發(fā)的“即夢(mèng)AI”移動(dòng)版已正式登陸蘋果App Store,標(biāo)志著字節(jié)在AI創(chuàng)作領(lǐng)域的又重要布局。即夢(mèng)AI
    的頭像 發(fā)表于 08-07 16:47 ?390次閱讀

    商湯發(fā)布首個(gè)“可控”人物視頻生成大模型Vimi

    近日,商湯科技在人工智能領(lǐng)域再次取得重大突破,正式發(fā)布了其首個(gè)面向消費(fèi)者的“可控”人物視頻生成大模型——Vimi。這創(chuàng)新技術(shù)的問世,標(biāo)志著視頻
    的頭像 發(fā)表于 07-04 15:29 ?600次閱讀

    谷歌AI突破:為無聲視頻智能配音

    近日,谷歌DeepMind團(tuán)隊(duì)公布了項(xiàng)革命性的技術(shù)——利用AI為無聲視頻生成背景音樂的“video-to-audio”技術(shù)。這技術(shù)的出現(xiàn),不僅為
    的頭像 發(fā)表于 06-21 10:50 ?401次閱讀

    AI角色創(chuàng)作平臺(tái)「捏Ta」完成超千萬元融資

    AI角色創(chuàng)作平臺(tái)“捏Ta”(公司名為“看見概念”)近期完成了天使輪和Pre-A輪融資,總額超千萬元。
    的頭像 發(fā)表于 04-12 10:41 ?733次閱讀
    <b class='flag-5'>AI</b>角色<b class='flag-5'>創(chuàng)作</b><b class='flag-5'>平臺(tái)</b>「捏Ta」完成超千萬元融資

    迪思與百度智能云聯(lián)手發(fā)布AI視頻創(chuàng)作模型

    迪思傳媒與百度智能云聯(lián)手研發(fā)的AI視頻創(chuàng)作模型D&S-AI Video于3月25日正式亮相,并成功集成至迪思AI智鏈
    的頭像 發(fā)表于 03-26 11:46 ?599次閱讀

    云知聲AIGC內(nèi)容創(chuàng)作平臺(tái)藍(lán)藻AI全新升級(jí)

    近日,云知聲AIGC內(nèi)容創(chuàng)作平臺(tái)藍(lán)藻AI宣布完成全新升級(jí),并推出超值會(huì)員服務(wù),旨在為廣大創(chuàng)作者提供更豐富多元的聲音選擇,助力內(nèi)容創(chuàng)作更高效、
    的頭像 發(fā)表于 03-16 14:05 ?1086次閱讀

    Stability AI與Morph AI共同推出體化AI視頻創(chuàng)作工具

    近日,業(yè)界領(lǐng)先的AI技術(shù)公司Stability AI與中國(guó)AI創(chuàng)業(yè)公司Morph AI達(dá)成重要合作。雙方宣布共同推出款革新性的all-in
    的頭像 發(fā)表于 03-05 10:44 ?706次閱讀

    阿里達(dá)摩北京公司新增AI業(yè)務(wù)

    阿里巴巴達(dá)摩(北京)科技有限公司近日進(jìn)行了工商變更,經(jīng)營(yíng)范圍有所調(diào)整。具體來說,公司去除了智聯(lián)網(wǎng)、芯片技術(shù)、量子計(jì)算等數(shù)據(jù)通信、電子產(chǎn)品、軟件和硬件技術(shù)及產(chǎn)品的研究、開發(fā)等業(yè)務(wù),而新增了人工智能應(yīng)用軟件開發(fā)、人工智能基礎(chǔ)軟件開發(fā),以及第
    的頭像 發(fā)表于 02-23 11:39 ?866次閱讀

    OpenAI 在 AI 生成視頻領(lǐng)域扔出枚“王”,視頻生成模型“Sora”

    ABSTRACT摘要2月16日凌晨,也就是中國(guó)大年初七,OpenAI在AI生成視頻領(lǐng)域扔出枚“王”,宣布推出全新的生成式人工智能模型“Sora”。這家舊金山公司周四推出的該工具使用
    的頭像 發(fā)表于 02-22 08:25 ?291次閱讀
    OpenAI 在 <b class='flag-5'>AI</b> 生成<b class='flag-5'>視頻</b>領(lǐng)域扔出<b class='flag-5'>一</b>枚“王<b class='flag-5'>炸</b>”,<b class='flag-5'>視頻</b>生成模型“Sora”

    UCB_SWAP配置信息共16,寫入一條有效配置后,上一條需寫1使配置無效是為什么?

    UCB_SWAP配置信息共16,寫入一條有效配置后,上一條需寫1使配置無效。 經(jīng)過實(shí)測(cè)發(fā)現(xiàn)配置是從下至上檢索,取最后一條有效配置,而不是從上至下檢索,取第
    發(fā)表于 01-24 08:31

    云知聲全新推出AIGC內(nèi)容創(chuàng)作平臺(tái)藍(lán)藻AI

    近日,云知聲基于智能語音技術(shù)和山海大模型技術(shù),全新推出AIGC內(nèi)容創(chuàng)作平臺(tái)——藍(lán)藻AI,為創(chuàng)作者提供AI聲音克隆、
    的頭像 發(fā)表于 01-10 13:38 ?651次閱讀

    產(chǎn)學(xué)研三界頂級(jí)大咖分享:RISC-V場(chǎng)景Show暨開源生態(tài)高級(jí)別論壇定檔12/19

    和中科軟件研究所高級(jí)工程師于佳耕出席,現(xiàn)場(chǎng)為大家分享新輪處理器技術(shù)突破、RISC-V架構(gòu)生態(tài)建設(shè)以及開源操作系統(tǒng)教學(xué)。同時(shí),現(xiàn)場(chǎng)嘉賓還將分享勘智AI芯片的性能展示及其在開源操作系統(tǒng)
    發(fā)表于 12-15 18:36

    阿里達(dá)摩量子實(shí)驗(yàn)室裁撤 整體捐獻(xiàn)給浙江大學(xué)

    日前,阿里達(dá)摩量子實(shí)驗(yàn)室裁撤,達(dá)摩量子實(shí)驗(yàn)室以及儀器設(shè)備全部被捐給浙江大學(xué)。相關(guān)信息從首席科學(xué)家施堯耘發(fā)布的動(dòng)態(tài)可以印證;這可以說是來自官方的確認(rèn)。 2015年阿里云和中國(guó)科學(xué)院開
    的頭像 發(fā)表于 11-28 16:04 ?534次閱讀

    閱流智作:種全新的生成式AI視頻制作方式,或?qū)㈩嵏矊I(yè)視頻生產(chǎn)

    隨著AIGC技術(shù)的興起和發(fā)展,智能創(chuàng)作逐漸成為全球熱議的焦點(diǎn),而面向?qū)I(yè)場(chǎng)景,可控的智能圖片、視頻生成式方向是所有內(nèi)容創(chuàng)作者最關(guān)心的。 AI
    的頭像 發(fā)表于 11-02 14:40 ?321次閱讀

    高通在2023驍峰會(huì)上推動(dòng)突破性的生成式AI落地多品類終端

    眾多支持Windows 11的PC平臺(tái)中擁有流的CPU性能和能效。 ?? 第三代驍8擁有面向移動(dòng)終端的性能強(qiáng)大的NPU,并利用AI能力增強(qiáng)旗艦智能手機(jī)的內(nèi)容
    的頭像 發(fā)表于 10-25 10:30 ?274次閱讀
    高通在2023驍<b class='flag-5'>龍</b>峰會(huì)上推動(dòng)<b class='flag-5'>突破</b>性的生成式<b class='flag-5'>AI</b>落地多品類終端