0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新版NVIDIA Maxine為實時音頻和視頻通信鋪平道路

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-09-26 09:19 ? 次閱讀

搶先體驗 AI 微服務在云端提供的優(yōu)質通信。

新版NVIDIA Maxine為實時音頻視頻通信鋪平了道路。無論是參加視頻會議、致電客戶服務中心,還是進行直播,Maxine 都能夠助您實現(xiàn)清晰明確的溝通,增強虛擬交互的效果。

NVIDIA Maxine 是一套由 GPU 加速的 AI 軟件開發(fā)套件 (SDK) 和云原生微服務,用于部署經過優(yōu)化和加速的 AI 功能,可達到實時增強音頻、視頻和增強現(xiàn)實 (AR) 效果的目的。

借助 Maxine 的先進模型,最終用戶無需使用昂貴的設備即可改進音頻和視頻質量?;?NVIDIA AI 的技術使標準的麥克風和攝像頭設備也能夠達到這些高質量的效果。

在 GTC 上,NVIDIA 宣布為云原生微服務重新構建 Maxine,并推出了 Maxine 音頻效果微服務的搶先體驗版。此外,還推出了新的 Maxine SDK 功能,包括發(fā)言者聚焦和人臉表情估計,并正式推出了眼神交流功能。NVIDIA Maxine 現(xiàn)在還包含現(xiàn)有 SDK 功能的增強版。

Maxine 實現(xiàn)云原生

Maxine 的云原生微服務允許開發(fā)者構建實時 AI 應用。微服務可以獨立管理,并在云端進行無縫部署,從而縮短開發(fā)周期。

搶先體驗版的 Audio Effects 微服務中包含四種先進的音頻功能:

背景噪音消除:使用 AI 模型消除多種常見的背景噪音,同時保留說話者的自然聲音。

房間回聲消除:使用 AI 模型消除音頻中的混響,恢復說話者聲音的清晰度。

音頻超高分辨率:提高音頻信號的時間分辨率,改善音頻質量。該功能目前支持 8 kHz 到 16 kHz 以及 16 kHz 到 48 kHz 的上采樣。

聲學回聲消除:消除輸入音頻流中的實時聲學設備回聲,從而去除不匹配的聲對和雙聲。借助基于 AI 的技術,Maxine 實現(xiàn)了比傳統(tǒng)數(shù)字信號處理算法更有效的回聲消除。

Pexip 是一家領先的企業(yè)視頻會議和協(xié)作解決方案提供商,正在利用 NVIDIA 的 AI 技術將虛擬會議提升到更高水平,為現(xiàn)代員工隊伍提供先進的功能。

Pexip 戰(zhàn)略聯(lián)盟高級副總裁 Eddie Clifton 表示:“隨著 Maxine 向云原生微服務的轉化,我們能夠更加輕松地將 NVIDIA 的先進 AI 技術與我們獨特的服務器端架構結合起來。這使我們的 Pexip 團隊能夠為虛擬會議提供更強的體驗?!?/p>

探索 SDK 的增強功能

Maxine 提供了三款由 GPU 加速的 SDK,能夠通過 AI 重塑實時通信的音頻、視頻和 AR 效果。

音頻效果 SDK 可提供多效果、低延遲,以及基于 AI 的音頻質量增強算法。發(fā)言者聚焦是搶先體驗版中的新功能,該功能能夠分離前景和背景發(fā)言者的音軌,使聽眾能夠更加輕松地識別每種聲音。此外,還更新了音頻超高分辨率SDK 功能,使其具備更高的質量。

視頻效果 SDK 會使用標準網絡攝像頭輸入創(chuàng)建基于 AI 的視頻效果。虛擬背景功能已獲得更新,增強了時間穩(wěn)定性,該功能能夠分割個人形象并應用由 AI 驅動的背景去除、替換或模糊功能。

AR SDK 基于標準網絡攝像頭饋送,提供基于 AI 的實時 3D 面部追蹤和身體姿態(tài)估計。新功能包括:

眼神交流:通過預估和將視線與攝像頭對齊來模擬眼神交流。

人臉表情估計:追蹤人臉并推斷主體所呈現(xiàn)的表情。

更新了以下 AR 功能:

身體姿態(tài)估計:以 2D 和 3D 形式預測和追蹤人體的 34 個關鍵點,并且現(xiàn)已支持多人追蹤。

面部特征點追蹤:使用 126 個關鍵點來識別面部特征和輪廓。現(xiàn)已可使用“畫質”模式來追蹤由于頭部運動和表情造成的頭部姿勢和面部變形(實時追蹤的自由度為 3 度),實現(xiàn)了更高質量的跟蹤效果。

人臉網格:以高達 3000 個頂點和 6 個自由度的 3D 網格表示人臉,并且現(xiàn)在包括USC 創(chuàng)意技術研究所的 3D 可變形模型。

直接體驗 Maxine 的驚艷效果。

體驗由 AI 的強大功能帶來的先進效果

Maxine SDK 和微服務可為您提供一套低延遲的 AI 效果,且可與現(xiàn)有的客戶基礎設施進行集成。由于 Maxine 的尖端 AI 功能的構建以 NVIDIA AI 平臺為基礎,并且擁有領先的預訓練模型,所以開發(fā)者用戶可利用其來創(chuàng)建、定制和部署優(yōu)質的音頻和視頻質量功能。

Maxine 也是NVIDIA Omniverse Avatar Cloud Engine的一部分,NVIDIA Omniverse Avatar Cloud Engine 是一系列基于云的 AI 模型和服務,可供開發(fā)者構建、定制和部署交互式虛擬形象。Maxine 的可定制云原生微服務允許您在 AI 效果制作流程中進行獨立部署。而且,您可以在本地、云端或邊緣部署 Maxine。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4793

    瀏覽量

    102427
  • AI
    AI
    +關注

    關注

    87

    文章

    28876

    瀏覽量

    266218
  • 云原生
    +關注

    關注

    0

    文章

    238

    瀏覽量

    7918

原文標題:GTC22 | 全新 NVIDIA Maxine 云原生架構可大規(guī)模實現(xiàn)突破性影音質量

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    IB Verbs和NVIDIA DOCA GPUNetIO性能測試

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個庫,專門實時在線 GPU 數(shù)據(jù)包處理而設計。它結合了 GPUDirect RDMA 和 GPUD
    的頭像 發(fā)表于 08-23 17:03 ?263次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO性能測試

    英偉達發(fā)布新版NVIDIAApp

    英偉達推出了 NVIDIA App 測試版?10.0.2 版本,?NVIDIA App新版本新增功能包括顯示設置、RTX 視頻增強控制、應用排序,以及面向其他國家 / 地區(qū)用戶的應用翻
    的頭像 發(fā)表于 08-07 16:16 ?737次閱讀

    可以使用esp8266處理實時視頻音頻流到服務器到移動設備?

    各位專家,您好: 我是 esp8266 的新手,我正在做一個項目,我需要使用 esp8266 使用服務器到移動設備處理實時視頻音頻流??梢允褂?esp8266 處理實時
    發(fā)表于 07-19 08:40

    【新品】隔離型一轉多路RS485中繼器,高速傳輸,穩(wěn)定通信必備

    隨著電動汽車的普及,智能電網正在構建兼容的充電網絡,實現(xiàn)能源的高效分配和管理。融合了傳統(tǒng)電網與先進的通信技術的智能電網構建更加高效、環(huán)保和可靠的能源體系鋪平道路。RS485中繼器能夠將現(xiàn)代先進
    的頭像 發(fā)表于 07-19 08:21 ?165次閱讀
    【新品】隔離型一轉多路RS485中繼器,高速傳輸,穩(wěn)定<b class='flag-5'>通信</b>必備

    NVIDIA 通過 Holoscan NVIDIA IGX 提供企業(yè)軟件支持

    美敦力、SETI 協(xié)會以及領先制造商正在構建 NVIDIA IGX 系統(tǒng), AI 在工業(yè)邊緣賦能。 ? NVIDIA 于6月2日宣布,集成NVIDIA Holoscan的
    的頭像 發(fā)表于 06-04 10:21 ?389次閱讀

    NVIDIA 通過 Holoscan NVIDIA IGX 提供企業(yè)軟件支持,實現(xiàn)邊緣實時醫(yī)療、工業(yè)和科學 AI 應用

    美敦力、SETI協(xié)會以及領先的制造商正在構建? NVIDIA IGX 系統(tǒng), ?AI 在工業(yè)邊緣賦能 ? ? COMPUTEX — 2024 年 6 月 2 日 — NVIDIA 今日宣布,集成
    發(fā)表于 06-03 09:48 ?238次閱讀
      <b class='flag-5'>NVIDIA</b> 通過 Holoscan <b class='flag-5'>為</b> <b class='flag-5'>NVIDIA</b> IGX 提供企業(yè)軟件支持,實現(xiàn)邊緣<b class='flag-5'>實時</b>醫(yī)療、工業(yè)和科學 AI 應用

    倍加福IO-Link系統(tǒng)解決方案,“工業(yè)數(shù)字互聯(lián)”鋪平道路

    早在2014年,倍加福就前瞻性地提出“Sensorik 4.0”概念,旨在推動制造工廠現(xiàn)場層在工業(yè)4.0革命種的發(fā)展。
    的頭像 發(fā)表于 05-31 14:03 ?338次閱讀

    華為面向中東中亞地區(qū)發(fā)布星河AI園區(qū)網絡,以體驗中心,企業(yè)數(shù)智升級首選

    華為數(shù)據(jù)通信創(chuàng)新峰會2024中東中亞站期間,在“高品質萬兆園區(qū)網絡,以體驗中心,企業(yè)數(shù)智升級首選”專題分論壇上,華為發(fā)布星河AI園區(qū)網絡解決方案,旨在為企業(yè)提供卓越的網絡體驗,助力中東中亞地區(qū)企業(yè)數(shù)智化轉型,提升運營效率和業(yè)務靈活性,
    的頭像 發(fā)表于 05-15 09:17 ?379次閱讀

    【RTC程序設計:實時視頻權威指南】音頻采集與渲染

    在進行視頻的采集與渲染的同時,我們還需要對音頻進行實時的采集和渲染。對于rtc來說,音頻實時性和流暢性更加重要。 聲音是由于物體在空氣中振
    發(fā)表于 04-28 21:00

    【RTC程序設計:實時視頻權威指南】音頻采集與預處理

    閑暇之余,繼續(xù)學習【RTC程序設計:實時視頻權威指南】這本書。 書中對于音頻采集的介紹非常詳細和全面,包括原理、方法、技術細節(jié)以及實踐應用等方面的內容。 音頻采集是
    發(fā)表于 04-25 10:41

    巍泰技術基于 TurMass? 通信技術的道路交通安全雷達風險防控解決方案

    車輛檢測雷達與 TurMass? 無線通信技術結合,實現(xiàn)了對道路交通安全風險的有效防控。該方案包括道路安全哨兵系統(tǒng)和智能霧燈誘導系統(tǒng),利用雷達實時探測車輛信息并通過無線
    的頭像 發(fā)表于 03-15 14:35 ?481次閱讀
    巍泰技術基于 TurMass? <b class='flag-5'>通信</b>技術的<b class='flag-5'>道路</b>交通安全雷達風險防控解決方案

    智能交互革新:采用人機界面?zhèn)鞲薪鉀Q方案汽車的演進鋪平道路

    對于汽車而言,這是一個重要的時代;科技創(chuàng)新的匯聚徹底改變了我們道路上車輛的面貌。在過去的15年里,一系列開創(chuàng)性的進步重塑了現(xiàn)代汽車,將它們推向了便利性、連接性和安全性的領域。
    的頭像 發(fā)表于 03-12 11:36 ?922次閱讀

    Starlab與SpaceX聯(lián)手,商業(yè)空間站將進駐低地球軌道

    SpaceX 商業(yè)業(yè)務高級副總裁 Tom Ochinero對此評論道:“Starlab 的單次發(fā)射方案若能得到驗證,不僅會提升這項商業(yè)模式的可信度,還將為未來的發(fā)展鋪平道路。”
    的頭像 發(fā)表于 02-01 14:24 ?401次閱讀

    通宇通訊全力布局5G技術與特殊領域產品

    此外,近來,通宇通訊已經在咸寧開設了全資子公司——“通宇衛(wèi)星通訊(湖北)有限公司”,以此進一步深化其對衛(wèi)星通信領域的投資,今后衛(wèi)星通信產品的規(guī)?;a和擴展鋪平道路。
    的頭像 發(fā)表于 12-12 09:54 ?443次閱讀

    用街景圖守衛(wèi)建筑:深度學習提高建筑安全鋪平道路

    佛羅里達大學研究人員使用 AI 和街景圖像實現(xiàn)自動化建筑安全分析。 在佛羅里達大學人工智能助理教授 Chaofeng Wang 的努力下,圖像將發(fā)揮新的用途,例如谷歌街景中的圖像。 Wang 的項目致力于研究如何將街景圖像與深度學習相結合,以實現(xiàn)城市建筑評估的自動化。該項目旨在通過提供加固建筑結構或進行災后恢復所需的信息,幫助政府減少因自然災害造成的損失。 在地震等自然災害發(fā)生后,地方政府通常會派出工作小組對建筑物狀況進行檢查和評估。
    的頭像 發(fā)表于 11-09 10:45 ?278次閱讀
    用街景圖守衛(wèi)建筑:深度學習<b class='flag-5'>為</b>提高建筑安全<b class='flag-5'>鋪平道路</b>