0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Omniverse Audio2Face加速AI虛擬數(shù)字人的語音與表情訓(xùn)練

麗臺(tái)科技 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-11-15 10:43 ? 次閱讀

元宇宙熱潮迭起,推動(dòng)了虛擬數(shù)字人產(chǎn)業(yè)發(fā)展。當(dāng)前,隨著虛擬人技術(shù)日益成熟,相關(guān)產(chǎn)業(yè)鏈逐漸成型,以及虛擬人的智能化、多元化應(yīng)用不斷完善,數(shù)智人發(fā)展逐漸成為行業(yè)趨勢(shì)。

深圳幻影未來信息科技有限公司(以下簡(jiǎn)稱“幻影未來”)專注于虛擬人互動(dòng)的內(nèi)容研發(fā),是領(lǐng)先的虛擬人及互動(dòng)方案、AI 數(shù)智人創(chuàng)新提供商。借助NVIDIA Omniverse Audio2Face和NVIDIA RTX GPU,幻影未來加速虛擬人 Kiko 的語音及表情訓(xùn)練,助力打造高品質(zhì) AI 數(shù)智人。

虛擬人語音互動(dòng)與表情變化仍需優(yōu)化

虛擬現(xiàn)實(shí)技術(shù)的演進(jìn)和虛擬人行業(yè)的逐步發(fā)展,帶動(dòng)直播、電商、娛樂行業(yè)等逐漸開展虛擬人產(chǎn)業(yè)布局?;糜拔磥韽奶摂M人直播入手,蓄力將虛擬人 Kiko 打造成虛擬人 IP。由于目前虛擬人主播與觀眾之間的溝通場(chǎng)景仍需豐富,幻影未來立足技術(shù)背景,著力開展虛擬人的技術(shù)升級(jí)。

利用現(xiàn)有技術(shù),虛擬人主播可實(shí)現(xiàn)語音輸入輸出及相應(yīng)動(dòng)畫展示,但仍缺乏相應(yīng)的互動(dòng)力和表現(xiàn)力,因此,在語音互動(dòng)和表達(dá)的基礎(chǔ)上,驅(qū)動(dòng)虛擬人產(chǎn)生豐富而逼真的表情以提升與用戶之間的溝通水平、加強(qiáng)虛擬人與用戶間的情感交流仍是行業(yè)發(fā)展的痛點(diǎn)。

Omniverse Audio2Face + RTX GPU

加速虛擬人訓(xùn)練與升級(jí)

幻影未來通過 NVIDIA 初創(chuàng)加速計(jì)劃了解到,借助 NVIDIA Omniverse Audio2Face 可以直接將虛擬人語音轉(zhuǎn)換為嘴型和表情動(dòng)畫,其在使用和測(cè)試后,對(duì)輸出的表情 BS 進(jìn)行改造并訓(xùn)練自定義模型,同時(shí)借助 NVIDIA RTX GPU,加速對(duì)虛擬人訓(xùn)練大量數(shù)據(jù)的交換與處理。

Omniverse Audio2Face 是一款由 AI 提供技術(shù)支持的應(yīng)用,僅憑借一個(gè)音頻來源便能生成面部表情動(dòng)畫。Audio2Face 可簡(jiǎn)化 3D 角色的動(dòng)畫制作,與任何配音音軌匹配,在交互式應(yīng)用場(chǎng)景中可以使用該應(yīng)用,也可將其用作傳統(tǒng)的面部動(dòng)畫創(chuàng)作工具,實(shí)時(shí)運(yùn)行結(jié)果或烘焙結(jié)果都可輕松獲得。借助 Omniverse Audio2Face,幻影未來只需錄制語音音軌,輸入到該應(yīng)用中,即可生成生動(dòng)的虛擬人面部表情。

虛擬人模型訓(xùn)練包括數(shù)據(jù)采集和清洗、數(shù)據(jù)處理和數(shù)據(jù)訓(xùn)練,訓(xùn)練過程中數(shù)據(jù)量龐大,對(duì)數(shù)據(jù)處理能力要求較高,幻影未來借助 RTX GPU,相較于常規(guī)硬件訓(xùn)練方法而言,訓(xùn)練時(shí)間可縮短至 10 分鐘左右,訓(xùn)練速度提高了 99% 以上。

數(shù)智人服務(wù)場(chǎng)景拓寬

元宇宙基礎(chǔ)服務(wù)潛力無限

NVIDIA Omniverse Audio2Face 與 NVIDIA GPU 加速平臺(tái)賦能幻影未來實(shí)現(xiàn)虛擬人語音和表情動(dòng)畫升級(jí),使傳統(tǒng)虛擬人向數(shù)智人的升級(jí)成為了可能?;糜拔磥淼奶摂M人表現(xiàn)力解決方案助力豐富數(shù)智人服務(wù)場(chǎng)景,推動(dòng)了元宇宙基礎(chǔ)服務(wù)的豐富和發(fā)展。

幻影未來創(chuàng)始人兼 CTO 姜龍表示,“未來元宇宙中的應(yīng)用軟件一定不是以 APP 形式展現(xiàn),也一定不會(huì)是需要通過點(diǎn)擊操控 UI 的形式出現(xiàn),我相信未來元宇宙中的所有服務(wù)是以數(shù)智虛擬人形式出現(xiàn),通過自然交互的方式來進(jìn)行,這一天不會(huì)太遠(yuǎn)?!?

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102429
  • 虛擬數(shù)字
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    7038
  • 元宇宙
    +關(guān)注

    關(guān)注

    13

    文章

    1378

    瀏覽量

    11208

原文標(biāo)題:Omniverse Audio2Face 加速 AI 虛擬數(shù)字人的語音與表情訓(xùn)練

文章出處:【微信號(hào):Leadtek,微信公眾號(hào):麗臺(tái)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA Omniverse微服務(wù)助力構(gòu)建大規(guī)模數(shù)字孿生

    NVIDIA Omniverse Cloud Sensor RTX 生成用于加速自動(dòng)駕駛汽車、機(jī)械臂、移動(dòng)機(jī)器、人形機(jī)器人和智能空間 AI 開發(fā)工作的合成數(shù)據(jù)。
    的頭像 發(fā)表于 09-09 10:20 ?343次閱讀

    英偉達(dá)利用人工智能和Omniverse加速人形機(jī)器開發(fā)

    8月6日,英偉達(dá)揭曉了一項(xiàng)創(chuàng)新工作流程,該流程深度融合了人工智能技術(shù)與其Omniverse平臺(tái),旨在為人形機(jī)器的研發(fā)按下加速鍵。通過巧妙結(jié)合蘋果Vision Pro的先進(jìn)功能與英偉達(dá)的人
    的頭像 發(fā)表于 08-06 17:29 ?566次閱讀

    英偉達(dá)打造人形機(jī)器訓(xùn)練平臺(tái),引領(lǐng)AI新紀(jì)元

    英偉達(dá)近日宣布了一項(xiàng)重大舉措,為全球機(jī)器制造業(yè)與AI領(lǐng)域注入強(qiáng)勁動(dòng)力。公司推出了專為人形機(jī)器人設(shè)計(jì)的訓(xùn)練平臺(tái),旨在為行業(yè)領(lǐng)先的制造商、AI模型開發(fā)者及軟件制造商提供一站式服務(wù)、先進(jìn)模
    的頭像 發(fā)表于 08-05 11:45 ?539次閱讀

    使用OpenUSD和NVIDIA Omniverse開發(fā)虛擬工廠解決方案

    工業(yè)開發(fā)者正在借助 NVIDIA AI、NVIDIA Omniverse 和通用場(chǎng)景描述 (OpenUSD)生態(tài)系統(tǒng)的力量構(gòu)建虛擬工廠解決方案,通過優(yōu)化棕地和綠地開發(fā)流程加快產(chǎn)品上市時(shí)間、實(shí)現(xiàn)產(chǎn)能的最大化并降低成本。
    的頭像 發(fā)表于 05-28 18:12 ?1103次閱讀
    使用OpenUSD和NVIDIA <b class='flag-5'>Omniverse</b>開發(fā)<b class='flag-5'>虛擬</b>工廠解決方案

    NVIDIA數(shù)字技術(shù)加速部署生成式AI驅(qū)動(dòng)的游戲角色

    NVIDIA 在 GDC 2024 大會(huì)上宣布,Inworld AI 等領(lǐng)先的 AI 應(yīng)用程序開發(fā)者,正在使用 NVIDIA 數(shù)字技術(shù)加速
    的頭像 發(fā)表于 04-09 10:08 ?505次閱讀
    NVIDIA<b class='flag-5'>數(shù)字</b><b class='flag-5'>人</b>技術(shù)<b class='flag-5'>加速</b>部署生成式<b class='flag-5'>AI</b>驅(qū)動(dòng)的游戲角色

    新思科技攜手英偉達(dá):基于加速計(jì)算、生成式AIOmniverse釋放下一代EDA潛能

    。這一合作將在集成電路設(shè)計(jì)、驗(yàn)證、仿真及制造各環(huán)節(jié)實(shí)現(xiàn)最高15倍的效能提升; 將 Synopsys.ai 的芯片設(shè)計(jì)生成式AI技術(shù)與英偉達(dá) AI 企業(yè)級(jí)軟件平臺(tái)進(jìn)行整合,平臺(tái)中包含英偉達(dá)微服務(wù),并且利用英偉達(dá)的
    發(fā)表于 03-20 13:43 ?190次閱讀
    新思科技攜手英偉達(dá):基于<b class='flag-5'>加速</b>計(jì)算、生成式<b class='flag-5'>AI</b>和<b class='flag-5'>Omniverse</b>釋放下一代EDA潛能

    育碧發(fā)布全新生成式AI原型:NPC以自發(fā)行為展開對(duì)話

    近日,育碧巴黎工作室推出了一款名為 NEON NPC 的全新 AI 原型項(xiàng)目。借助 NVIDIA 的 Audio2Face 及 InWorld 的 LLM 大語言模型技術(shù),NPC可以根據(jù)角色設(shè)定自發(fā)生成對(duì)話。
    的頭像 發(fā)表于 03-20 10:17 ?323次閱讀

    在線研討會(huì) | 大模型時(shí)代語音 AI 模型的訓(xùn)練、優(yōu)化與應(yīng)用

    AI 大模型在語音識(shí)別、自然語言處理等領(lǐng)域已經(jīng)取得了令人矚目的成就。語音 AI(Speech AI)技術(shù)已經(jīng)廣泛應(yīng)用在
    的頭像 發(fā)表于 12-15 15:50 ?491次閱讀
    在線研討會(huì) | 大模型時(shí)代<b class='flag-5'>語音</b> <b class='flag-5'>AI</b> 模型的<b class='flag-5'>訓(xùn)練</b>、優(yōu)化與應(yīng)用

    在 NVIDIA ACE 中使用 AI 動(dòng)畫和語音功能打造逼真的虛擬形象

    和情感表達(dá)。 開發(fā)者現(xiàn)在可以使用新的云 API 在應(yīng)用中輕松實(shí)現(xiàn)和擴(kuò)展智能虛擬形象,包括自動(dòng)語音識(shí)別(ASR)、文本轉(zhuǎn)語音(TTS)、神經(jīng)機(jī)器翻譯(NMT)和 Audio2Face(A
    的頭像 發(fā)表于 12-15 15:50 ?472次閱讀
    在 NVIDIA ACE 中使用 <b class='flag-5'>AI</b> 動(dòng)畫和<b class='flag-5'>語音</b>功能打造逼真的<b class='flag-5'>虛擬</b>形象

    如何在NVIDIA ACE中使用AI動(dòng)畫和語音功能打造逼真的虛擬形象呢?

    NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE)的一系列技術(shù),增強(qiáng)了 AI 虛擬形象和數(shù)字的真實(shí)感和可訪問性,這些新的動(dòng)畫和
    的頭像 發(fā)表于 12-15 15:48 ?521次閱讀
    如何在NVIDIA ACE中使用<b class='flag-5'>AI</b>動(dòng)畫和<b class='flag-5'>語音</b>功能打造逼真的<b class='flag-5'>虛擬</b>形象呢?

    NVIDIA 初創(chuàng)加速計(jì)劃 Omniverse 加速營(yíng)

    新的 AI 技術(shù)和迅速發(fā)展的應(yīng)用正在改變各行各業(yè),生成式 AI 已經(jīng)展示出在藝術(shù)、設(shè)計(jì)、影視動(dòng)畫、互娛、建筑等領(lǐng)域加速內(nèi)容創(chuàng)作的價(jià)值,助力實(shí)現(xiàn)高質(zhì)量、高效率、多樣化的內(nèi)容生產(chǎn),成為推動(dòng)數(shù)字
    的頭像 發(fā)表于 12-04 20:35 ?539次閱讀
    NVIDIA 初創(chuàng)<b class='flag-5'>加速</b>計(jì)劃 <b class='flag-5'>Omniverse</b> <b class='flag-5'>加速</b>營(yíng)

    Omniverse 資訊速遞 | 最新發(fā)布、應(yīng)用案例、研討會(huì)回顧等你來解鎖!

    、人工為主的流程,升級(jí)進(jìn)化成軟件驅(qū)動(dòng)的 AI 增強(qiáng)數(shù)字化系統(tǒng)。為幫助他們節(jié)約成本并縮短交付周期,NVIDIA 在 Omniverse Cloud 上發(fā)布了兩個(gè)全新的仿真引擎:虛擬工廠仿
    的頭像 發(fā)表于 11-20 21:05 ?554次閱讀
    <b class='flag-5'>Omniverse</b> 資訊速遞 | 最新發(fā)布、應(yīng)用案例、研討會(huì)回顧等你來解鎖!

    NVIDIA 宣布在 Microsoft Azure 上提供 Omniverse Cloud 服務(wù),加速汽車行業(yè)的數(shù)字化進(jìn)程

    驅(qū)動(dòng)的 AI 增強(qiáng)數(shù)字化系統(tǒng)。 為幫助他們節(jié)約成本并縮短交付周期,NVIDIA 在 Omniverse Cloud 上發(fā)布了兩個(gè)全新的仿真引擎:虛擬工廠仿真引擎和自動(dòng)駕駛汽車(AV)仿
    的頭像 發(fā)表于 11-16 21:10 ?450次閱讀

    AI數(shù)字操作的底層邏輯

    與動(dòng)作,實(shí)現(xiàn)與用戶的互動(dòng)。這個(gè)人物模型是通過AI技術(shù)預(yù)先訓(xùn)練得到的,能夠通過文本驅(qū)動(dòng)生成語音和對(duì)應(yīng)動(dòng)畫,業(yè)內(nèi)將此模型稱為 TTSA(Text To Speech & Animation)人物模型。 另一種是真人驅(qū)動(dòng)型
    的頭像 發(fā)表于 11-14 17:51 ?922次閱讀

    完美世界游戲借助 NVIDIA Omniverse 等平臺(tái)與技術(shù),加速數(shù)字開發(fā)并優(yōu)化游戲畫面

    越來越關(guān)鍵的作用。 創(chuàng)立于 2004 年的全球化游戲公司——完美世界游戲,集游戲開發(fā)、發(fā)行、運(yùn)營(yíng)為一體,其正在使用? NVIDIA Omniverse Audio2Face? 應(yīng)用、 NVIDIA ACE? 平臺(tái),以及光線追蹤與 DLSS 技術(shù)等,塑造更精致的游戲畫面,構(gòu)
    的頭像 發(fā)表于 09-26 18:35 ?884次閱讀
    完美世界游戲借助 NVIDIA <b class='flag-5'>Omniverse</b> 等平臺(tái)與技術(shù),<b class='flag-5'>加速</b><b class='flag-5'>數(shù)字</b><b class='flag-5'>人</b>開發(fā)并優(yōu)化游戲畫面