0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

阿里巴巴發(fā)布AtomoVideo,兼容多款文生圖模型的高保真圖像視頻框架

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-03-07 11:22 ? 次閱讀

據(jù)披露,阿里巴巴研發(fā)部門近期推出了一款名為 AtomoVideo 的高保真 I2V(即 Image to Video)框架,可將靜態(tài)圖像轉(zhuǎn)化成精美的視頻內(nèi)容。其主要特點有:

1. 高保真度:生成視頻與輸入圖片在細節(jié)和風格上保持一致;

2. 運動連貫:視頻流暢無跳躍,保證時間上的連續(xù)性;

3. 視頻幀預測:通過精確的預測來支持長時延視頻序列生成;

4. 兼容性強:適配現(xiàn)有各式各樣的 T2I(Text-to-image)模型;

5. 高語義控制力:能夠針對客戶特殊需求,打造個性化的視頻內(nèi)容。

AtomoVideo運用預設的 T2I 模型,在每個空間卷積層和注意力層后新增一維時空卷積和注意力模塊。現(xiàn)有的 T2I 模型參數(shù)固定不變,它們只會訓練新增的時空層,而輸入的串聯(lián)圖像信息由 VAE 編碼解析,這代表的是低層次信息,有利于提高視頻對輸入圖像的還原度。此外,團隊還使用 Cross-Attention 的方法融入高級圖像語義,以加強圖像語義可控性。

目前,該項目僅發(fā)布了論文和演示視頻,尚未開放線上試用途徑。另外,阿里巴巴已開啟 GitHub 賬號,但現(xiàn)在只是作為官方網(wǎng)站的托管地,并不包含相關代碼分享。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1075

    瀏覽量

    40267
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1603

    瀏覽量

    46774
  • 模型
    +關注

    關注

    1

    文章

    3032

    瀏覽量

    48357
收藏 人收藏

    評論

    相關推薦

    阿里巴巴完成雙重主要上市

    8月28日阿里巴巴在香港聯(lián)交所主板主要上市,成為在港交所、紐交所雙重主要上市的公司。如今,阿里巴巴完成雙重主要上市。 此外,有投資機構(gòu)認為阿里巴巴最快有望于9月份就納入港股通。 截至8月28日收盤,
    的頭像 發(fā)表于 08-29 16:06 ?246次閱讀

    阿里巴巴季報出爐 阿里云二季度營收增長6%

    阿里巴巴季報出爐我們一起來圍觀一下,根據(jù)阿里巴巴集團發(fā)布的截至2024年6月30日的第二季度經(jīng)營業(yè)績數(shù)據(jù)顯示,阿里巴巴該季度營收達到2432.4億元,而上年同期營收2341.56億元,
    的頭像 發(fā)表于 08-16 16:45 ?365次閱讀

    快手自研文生模型“可”開放,支持AI圖像創(chuàng)作及定制

    5月30日最新動態(tài),快手于近日向公眾推出其自主研發(fā)的文生模型命名為“可”。該模型具備文生
    的頭像 發(fā)表于 05-31 10:32 ?493次閱讀

    阿里巴巴投資逐際動力,深化智能機器人布局

    近日,阿里巴巴集團對深圳逐際動力科技有限公司(簡稱:逐際動力)進行戰(zhàn)略投資,此舉再次體現(xiàn)了阿里巴巴在智能機器人領域的堅定布局。
    的頭像 發(fā)表于 05-22 11:52 ?662次閱讀

    阿里巴巴集團2024財年穩(wěn)健增長

    阿里巴巴集團近日公布了其2024財年第四季度及全年業(yè)績報告,數(shù)據(jù)亮眼。在經(jīng)歷一年的主動變革后,阿里巴巴重回健康增長軌道。
    的頭像 發(fā)表于 05-16 11:23 ?549次閱讀

    谷歌發(fā)布AI文生模型Imagen

    近日,谷歌在人工智能領域取得新突破,正式推出了Imagen文生模型。這款模型以其卓越的細節(jié)調(diào)整功能、逼真的光線效果以及從草圖快速生成高分辨率圖像
    的頭像 發(fā)表于 05-16 09:30 ?405次閱讀

    阿里巴巴杭州全球總部正式啟用

    近日,阿里巴巴在杭州的未來科技城正式揭開了其全球總部新園區(qū)的面紗。這座園區(qū)不僅是阿里巴巴目前規(guī)模最大的綜合性辦公空間,更是其綠色、科技、可持續(xù)發(fā)展理念的生動體現(xiàn)。
    的頭像 發(fā)表于 05-13 11:15 ?457次閱讀

    阿里達摩院提出“知識鏈”框架,降低大模型幻覺

    近日,阿里巴巴達摩院(湖畔實驗室)攜手新加坡南洋理工大學等研究機構(gòu),共同推出了大模型知識鏈(CoK)框架。該框架不僅可實時檢索異構(gòu)知識源,還能逐步糾正推理錯誤,有效提高了大
    的頭像 發(fā)表于 05-10 11:46 ?560次閱讀

    阿里巴巴推出全新AI視頻模型EMO

    近日,阿里巴巴集團智能計算研究院宣布推出了一款革命性的AI圖片-音頻-視頻模型技術——EMO。據(jù)官方介紹,EMO是一種先進的音頻驅(qū)動肖像視頻生成框架
    的頭像 發(fā)表于 03-05 11:00 ?1138次閱讀

    阿里巴巴重返中國頂級電商軌道

    阿里巴巴集團董事會主席蔡崇信近日宣布,經(jīng)過一系列架構(gòu)重組和管理層變動后,阿里巴巴已成功重返中國頂級電商軌道。蔡崇信在講話中強調(diào),公司正在逐步調(diào)整戰(zhàn)略,重新定位其在電商領域的領導地位。
    的頭像 發(fā)表于 02-27 14:29 ?780次閱讀

    OpenAI文生視頻模型Sora要點分析

    近日,美國人工智能公司OpenAI發(fā)布了首個視頻生成模型Sora。不同于此前許多AI大模型文生
    的頭像 發(fā)表于 02-22 16:37 ?865次閱讀
    OpenAI<b class='flag-5'>文生</b><b class='flag-5'>視頻</b><b class='flag-5'>模型</b>Sora要點分析

    奧特曼發(fā)布王炸模型Sora OpenAI首個文生視頻模型Sora正式亮相

    奧特曼發(fā)布王炸模型Sora OpenAI首個文生視頻模型Sora正式亮相 2月16日凌晨OpenAI的首個
    的頭像 發(fā)表于 02-18 17:41 ?863次閱讀

    阿里巴巴漲超3% 財報或超預期

    阿里巴巴漲超3% 今日港股開盤后阿里巴巴漲超3%,恒生科技表現(xiàn)也很亮眼??焓帧⒈葋喌想娮?、聯(lián)想集團等多股上漲。 阿里巴巴將于2月7日發(fā)布2024財年第三季度財報,業(yè)界分析會超預期。
    的頭像 發(fā)表于 02-06 16:05 ?1399次閱讀

    軟銀子公司確認減持阿里 阿里巴巴最大股東易主

    軟銀子公司確認減持阿里 軟銀集團旗下全資子公司Skybridge LLC在回應關于買賣阿里巴巴股票時表示,此前已經(jīng)與金融機構(gòu)簽訂了預付遠期合約涉及5.21億股;由于近幾年已經(jīng)分階段實施并完成實物結(jié)算
    的頭像 發(fā)表于 01-26 20:45 ?1685次閱讀

    鐳神智能入選阿里巴巴諸神之戰(zhàn)2023年度智能制造賽道之星

    近日,阿里發(fā)布《Create@阿里巴巴諸神之戰(zhàn)2023年度新勢力榜單》,鐳神智能入選Create@阿里巴巴諸神之戰(zhàn)2023年度智能制造賽道之星。據(jù)悉,2023年,Create@
    的頭像 發(fā)表于 01-20 08:23 ?341次閱讀
    鐳神智能入選<b class='flag-5'>阿里巴巴</b>諸神之戰(zhàn)2023年度智能制造賽道之星