0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟亞洲研究院發(fā)布VASA-1模型,實(shí)現(xiàn)圖片人物自動(dòng)言語(yǔ)表達(dá)

微云疏影 ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2024-04-19 11:21 ? 次閱讀

4 月 19 日?qǐng)?bào)道,近期微軟亞洲研究院推出了名為 VASA-1 的創(chuàng)新模型,針對(duì)靜態(tài)肖像照片和錄音音頻片段,其能實(shí)現(xiàn)圖片中角色的自動(dòng)化配音。

該模型,尤其擅長(zhǎng)展現(xiàn)逼真的面部表情及各類情緒,且嘴唇動(dòng)作高度擬真。然而,盡管研究員坦承目前仍有不足之處,如無(wú)法精準(zhǔn)處理頭發(fā)等纖維質(zhì)元素,但相較于其他類似模型,VASA-1 的表現(xiàn)已屬優(yōu)異。

此外,研究員還透露,VASA-1 在離線批量處理模式下,可生成分辨率高達(dá) 512*512 的動(dòng)態(tài)短片,幀速率為 45fps;在線直播模式下,幀速率也可達(dá)到 40fps,延遲時(shí)間僅為 170ms。而完成這一切,只需一臺(tái)搭載 NVIDIA RTX 4090 顯卡的計(jì)算機(jī)即可。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6554

    瀏覽量

    103896
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3112

    瀏覽量

    48660
  • Vasa
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    6557
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    中國(guó)電信人工智能研究院完成首個(gè)全國(guó)產(chǎn)化萬(wàn)卡萬(wàn)參大模型訓(xùn)練

    近日,中國(guó)電信人工智能研究院宣布了一項(xiàng)重大技術(shù)突破:成功完成國(guó)內(nèi)首個(gè)基于全國(guó)產(chǎn)化萬(wàn)卡集群訓(xùn)練的萬(wàn)億參數(shù)大模型。
    的頭像 發(fā)表于 09-30 16:41 ?1612次閱讀

    摩爾線程攜手智源研究院完成基于Triton的大模型算子庫(kù)適配

    近日,摩爾線程與北京智源人工智能研究院(簡(jiǎn)稱:智源研究院)已順利完成基于Triton語(yǔ)言的高性能算子庫(kù)FlagGems的適配工作。得益于摩爾線程自研統(tǒng)一系統(tǒng)計(jì)算架構(gòu)MUSA,雙方在短短一周多的時(shí)間
    的頭像 發(fā)表于 08-02 11:06 ?734次閱讀

    中國(guó)電信發(fā)布全球首個(gè)單體稠密萬(wàn)億參數(shù)語(yǔ)義模型

    近日,中國(guó)電信人工智能研究院(TeleAI)攜手北京智源人工智能研究院,共同推出了全球首個(gè)單體稠密萬(wàn)億參數(shù)語(yǔ)義模型——Tele-FLM-1T,這一里程碑式的成就標(biāo)志著中國(guó)電信在人工智能
    的頭像 發(fā)表于 06-20 10:50 ?611次閱讀

    中國(guó)電信發(fā)布首個(gè)支持30種方言混說(shuō)語(yǔ)音大模型

    中國(guó)電信人工智能研究院(TeleAI)近日發(fā)布了一項(xiàng)引領(lǐng)業(yè)界的語(yǔ)音識(shí)別技術(shù)——星辰超多方言語(yǔ)音識(shí)別大模型。這一模型突破性地支持30種方言的自
    的頭像 發(fā)表于 05-28 09:14 ?529次閱讀

    長(zhǎng)沙北斗研究院總部基地正式奠基

    長(zhǎng)沙北斗研究院總部基地正式奠基 日前長(zhǎng)沙北斗研究院總部基地正式奠基,項(xiàng)目由長(zhǎng)沙北斗研究院牽頭建設(shè);項(xiàng)目又名“北斗足跡”。項(xiàng)目一期預(yù)計(jì)2025年年底前建成投用。 據(jù)悉,長(zhǎng)沙北斗研究院總部
    的頭像 發(fā)表于 05-16 12:49 ?1140次閱讀

    航天宏圖與天儀研究院合作共同推動(dòng)遙感衛(wèi)星數(shù)據(jù)應(yīng)用創(chuàng)新

    近日,航天宏圖信息技術(shù)股份有限公司(以下簡(jiǎn)稱“航天宏圖”)與長(zhǎng)沙天儀空間科技研究院有限公司(以下簡(jiǎn)稱“天儀研究院”)正式簽署戰(zhàn)略合作框架協(xié)議。
    的頭像 發(fā)表于 04-23 17:11 ?492次閱讀
    航天宏圖與天儀<b class='flag-5'>研究院</b>合作共同推動(dòng)遙感衛(wèi)星數(shù)據(jù)應(yīng)用創(chuàng)新

    本源入榜胡潤(rùn)研究院2024全球獨(dú)角獸榜單!

    胡潤(rùn)研究院從2017年開(kāi)始追蹤記錄獨(dú)角獸企業(yè),這是第六次發(fā)布全球獨(dú)角獸榜。榜單顯示,截至2024年11日,全球共有1453家獨(dú)角獸企業(yè),總價(jià)值4.6萬(wàn)億美元,分
    的頭像 發(fā)表于 04-12 08:22 ?386次閱讀
    本源入榜胡潤(rùn)<b class='flag-5'>研究院</b>2024全球獨(dú)角獸榜單!

    浙江圖靈算力研究院向知存科技頒發(fā)“年度最具影響力企業(yè)獎(jiǎng)”

    近日,浙江圖靈算力研究院生態(tài)伙伴聯(lián)誼會(huì)在杭州舉行,知存科技作為研究院生態(tài)企業(yè)之一,與賽迪研究院、中科計(jì)算所、自動(dòng)化所和中國(guó)RISC-V聯(lián)盟
    的頭像 發(fā)表于 03-06 14:02 ?692次閱讀

    微軟內(nèi)部對(duì)亞洲研究院的未來(lái)持有不同看法

    四位消息人士披露,微軟內(nèi)部曾考慮過(guò)關(guān)閉或搬遷MSRA,但高層領(lǐng)導(dǎo)普遍傾向于維持實(shí)驗(yàn)室在中國(guó)的運(yùn)作。目前,微軟已在加拿大溫哥華設(shè)立MSR分中心,部分研究員已被調(diào)配至此。此舉旨在作為備用安置點(diǎn),以應(yīng)對(duì)可能面臨的
    的頭像 發(fā)表于 01-11 13:58 ?525次閱讀

    院士專家齊聚!京彩未來(lái)聯(lián)合重點(diǎn)研究院創(chuàng)建數(shù)字空間聯(lián)合實(shí)驗(yàn)室

    1月6日,京彩未來(lái)與北京大學(xué)數(shù)字中國(guó)研究院華南分院暨廣東省數(shù)字廣東研究院共同創(chuàng)建的“數(shù)字空間共同體聯(lián)合室驗(yàn)室”正式掛牌運(yùn)營(yíng)。著名經(jīng)濟(jì)學(xué)家管清友博士、北京大學(xué)數(shù)字中國(guó)研究院華南分院暨廣東
    的頭像 發(fā)表于 01-08 18:15 ?322次閱讀
    院士專家齊聚!京彩未來(lái)聯(lián)合重點(diǎn)<b class='flag-5'>研究院</b>創(chuàng)建數(shù)字空間聯(lián)合實(shí)驗(yàn)室

    北京大學(xué)無(wú)錫EDA研究院揭牌

    研究院自2023年1月5日起正式投入運(yùn)營(yíng),項(xiàng)目總投資額達(dá)3億元人民幣,下設(shè)三個(gè)研發(fā)機(jī)構(gòu),分別致力于高性能EDA技術(shù)、中國(guó)EDA產(chǎn)業(yè)標(biāo)準(zhǔn)以及半導(dǎo)體量測(cè)技術(shù)研究及其產(chǎn)業(yè)化。
    的頭像 發(fā)表于 12-14 09:25 ?880次閱讀

    周禮棟對(duì)話比爾·蓋茨:深入的科學(xué)研究比以往任何時(shí)候都更加重要

    2023年是微軟亞洲研究院建院25周年。25年來(lái),微軟亞洲研究院探索并實(shí)踐了一種獨(dú)特且有效的企業(yè)
    的頭像 發(fā)表于 12-12 15:55 ?324次閱讀
    周禮棟對(duì)話比爾·蓋茨:深入的科學(xué)<b class='flag-5'>研究</b>比以往任何時(shí)候都更加重要

    IBM 咨詢獲 SAP 中國(guó)研究院 EcoFactory-首屆合作伙伴駭客松創(chuàng)新?tīng)I(yíng)獎(jiǎng),期待攜手客戶共創(chuàng)代碼現(xiàn)代化

    生態(tài) 2.0 發(fā)起,由 SAP 合作伙伴微軟、SAP 中國(guó)研究院創(chuàng)新生態(tài) 2.0 專家委員會(huì)成員單位中國(guó)信息通信研究院共同協(xié)作舉辦。
    的頭像 發(fā)表于 12-07 18:25 ?389次閱讀

    天數(shù)智芯支持智源研究院首次完成大模型異構(gòu)算力混合訓(xùn)練,突破異構(gòu)算力束縛

    11 月 29 日,北京智源人工智能研究院副院長(zhǎng)兼總工程師林詠華在 2023 人工智能計(jì)算大會(huì)上宣布,正式開(kāi)源 700 億參數(shù)大模型 Aquila2-70B-Expr (異構(gòu)先驅(qū)版), 這是首個(gè)
    的頭像 發(fā)表于 11-30 13:10 ?3214次閱讀
    天數(shù)智芯支持智源<b class='flag-5'>研究院</b>首次完成大<b class='flag-5'>模型</b>異構(gòu)算力混合訓(xùn)練,突破異構(gòu)算力束縛

    新華社研究院:商湯“商量”獲評(píng)中國(guó)大模型市場(chǎng)未來(lái)領(lǐng)袖

    編者按 : 日前,新華社研究院中國(guó)企業(yè)發(fā)展研究中心發(fā)布《人工智能大模型體驗(yàn)報(bào)告3.0》,對(duì)主流大模型進(jìn)行了全面評(píng)估,并為中國(guó)企業(yè)的大模型產(chǎn)品
    的頭像 發(fā)表于 11-29 18:30 ?472次閱讀
    新華社<b class='flag-5'>研究院</b>:商湯“商量”獲評(píng)中國(guó)大<b class='flag-5'>模型</b>市場(chǎng)未來(lái)領(lǐng)袖