0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用Riva和NeMo Megatron構(gòu)建語音AI

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:About Siddharth Sharm ? 2022-03-31 15:49 ? 次閱讀

上周, NVIDIA GTC 2022 宣布了對 Riva 的重大更新。 Riva 是一個用于構(gòu)建語音 AI 應(yīng)用程序的 SDK ,以及一個付費的 Riva 企業(yè)產(chǎn)品。 NeMo Megatron 是一個用于訓(xùn)練大型語言模型的框架,它的幾項關(guān)鍵更新也已宣布。

Riva 2.0 通用性

Riva 為跨多種語言的實時自動語音識別( ASR )和文本到語音( TTS )技能提供了世界級的準(zhǔn)確性,并且可以部署在 prem 上、任何云中。 Snap 、 T-Mobile 、 RingCentral 和 Kore 等行業(yè)領(lǐng)導(dǎo)者。 ai 在客戶服務(wù)中心應(yīng)用程序、轉(zhuǎn)錄和虛擬助理中使用 Riva 。

最新的 Riva 版本包括:

ASR 有多種語言:英語、西班牙語、德語、俄語和普通話。

高質(zhì)量的 TTS 語音可定制獨特的語音字體。

使用 TAO Toolkit 或 NVIDIA NeMo 進行特定于領(lǐng)域的定制,在口音、領(lǐng)域和國家特定術(shù)語方面具有無與倫比的準(zhǔn)確性。

支持在云端、 prem 和嵌入式平臺上運行。

Riva-Controllable-TTS-Demo-GTC-Spring.gif

Riva-Controllable-TTS-Demo-GTC-Spring.gif

圖 1:NVIDIA Riva 可控文本到語音使得使用 SSML 標(biāo)簽可以輕松調(diào)整音調(diào)和速度。

手機上嘗試 Riva 自動語音識別 Riva 產(chǎn)品頁面 。

Defined.ai 與 NVIDIA 合作,為希望購買跨語言、域和錄音類型的語音培訓(xùn)和驗證數(shù)據(jù)的企業(yè)提供一個順暢的工作流程??稍?此處 中找到針對 NVIDIA 開發(fā)人員的 DefinedCrowd 數(shù)據(jù)集示例。

下載 RIVA ,它是免費的NVIDIA 開發(fā)人員的成員從 NGC 免費。

Riva 企業(yè)

NVIDIA 還推出了 Riva Enterprise ,這是一款付費產(chǎn)品,面向在NVIDIA 專家的業(yè)務(wù)標(biāo)準(zhǔn)支持下大規(guī)模部署 Riva 的企業(yè)。

好處包括:

在任何云和 prem 平臺上不受限制地使用 ASR 和 TTS 服務(wù)。

在當(dāng)?shù)貭I業(yè)時間與NVIDIA 人工智能專家聯(lián)系,獲取有關(guān)配置和性能的指導(dǎo)。

為維護控制和升級計劃提供長期支持。

優(yōu)先訪問新版本和功能。

Riva Enterprise 在 NVIDIA Launchpad 上提供免費試用版,供企業(yè)評估并制作應(yīng)用程序原型。

Riva launchpad 上的 Enterprise 包括引導(dǎo)實驗室,用于:

與實時語音 AI API 交互。

將語音 AI 功能添加到對話 AI 應(yīng)用程序中。

在自定義數(shù)據(jù)上微調(diào)語音 AI 管道以獲得更高的準(zhǔn)確性。

申請 用于您的 Riva 企業(yè)試用。

通過 對話人工智能解謎 GTC 課程了解有關(guān)如何構(gòu)建、優(yōu)化和部署語音 AI 應(yīng)用程序的更多信息。

NeMo Megatron

NVIDIA 宣布了新的更新 NVIDIA NeMo Megatron ,這是一個培訓(xùn)大型語言模型( LLM )的框架,其參數(shù)高達數(shù)萬億?;?Megatron paper 的創(chuàng)新, NeMo Megatron 的研究機構(gòu)和企業(yè)可以培訓(xùn)任何 LLM ,以實現(xiàn)融合。 NeMo Megatron 提供數(shù)據(jù)預(yù)處理、并行(數(shù)據(jù)、張量和管道)、編排和調(diào)度,以及自動精度自適應(yīng)。

它包括經(jīng)過徹底測試的配方、流行的 LLM 架構(gòu)實現(xiàn),以及組織快速開始 LLM 之旅所需的工具。

瑞典,法學(xué)博士。 com 、 Naver 和佛羅里達大學(xué)是 Nvidia 技術(shù)的早期采用者,用于建立大型語言模型。

最新版本包括:

Hyperparameter tuning tool 會根據(jù)客戶需求和基礎(chǔ)設(shè)施限制自動創(chuàng)建配方。

T5 和 mT5 車型的參考配方。

支持在云上培訓(xùn) LLM ,從 Azure 開始。

分布式數(shù)據(jù)預(yù)處理腳本,縮短端到端培訓(xùn)時間。

關(guān)于作者

About Siddharth Sharma:

Siddharth Sharma 是NVIDIA 加速計算的高級技術(shù)營銷經(jīng)理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產(chǎn)品營銷經(jīng)理,與汽車和航空航天公司密切合作,采用基于模型的設(shè)計來創(chuàng)建控制軟件。

About Gordana Neskovic:

Gordana Neskovic 是AI/DL產(chǎn)品營銷團隊的成員,負責(zé) NVIDIA Maxine。在加入 NVIDIA 之前,Gordana曾在VMware、Wells Fargo、Pinterest、SFO-ITT和KLA Tencor擔(dān)任過各種產(chǎn)品營銷、數(shù)據(jù)科學(xué)家、AI架構(gòu)師和工程職位。她擁有博士學(xué)位。圣塔 Clara 大學(xué),塞爾維亞貝爾格萊德大學(xué)電氣工程碩士和學(xué)士學(xué)位。

About Sirisha Rella:

Sirisha Rella 是 NVIDIA 的技術(shù)產(chǎn)品營銷經(jīng)理,專注于計算機視覺、語音和基于語言的深度學(xué)習(xí)應(yīng)用。 Sirisha 獲得了密蘇里大學(xué)堪薩斯城分校的計算機科學(xué)碩士學(xué)位,是國家科學(xué)基金會大學(xué)習(xí)中心的研究生助理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4862

    瀏覽量

    102722
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29852

    瀏覽量

    268151
收藏 人收藏

    評論

    相關(guān)推薦

    AI云平臺怎么構(gòu)建

    構(gòu)建AI云平臺是一個復(fù)雜而系統(tǒng)的過程,涉及多個環(huán)節(jié)和技術(shù)棧。從準(zhǔn)備工作到最終的部署運行,每一步都需要精心設(shè)計和實現(xiàn)。
    的頭像 發(fā)表于 10-11 10:52 ?134次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    NVIDIA AI Enterprise 平臺中的 NIM 微服務(wù)與 NeMo 框架構(gòu)建和運行他們的 AI 應(yīng)用,創(chuàng)建數(shù)據(jù)驅(qū)動型 AI
    發(fā)表于 08-28 10:10 ?199次閱讀
    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 <b class='flag-5'>AI</b>

    Mistral AI與NVIDIA推出全新語言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同發(fā)布了一款全新的領(lǐng)先語言模型Mistral NeMo 12B。開發(fā)者可以輕松定制和部署該模型,令其適用于支持聊天機器人、多語言任務(wù)、編碼和摘要的企業(yè)應(yīng)用。
    的頭像 發(fā)表于 07-27 11:04 ?616次閱讀

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集)

    本帖最后由 jf_40317719 于 2024-6-18 17:39 編輯 視覺語音大模型 AI 開發(fā)套件( CSK6-MIX )是圍繞 CSK6011A 芯片設(shè)計的具備豐富語音圖像功能
    發(fā)表于 06-18 17:33

    英特爾助力京東云CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?479次閱讀
    英特爾助力京東云<b class='flag-5'>用</b>CPU加速<b class='flag-5'>AI</b>推理,以大模型<b class='flag-5'>構(gòu)建</b>數(shù)智化供應(yīng)鏈

    USB AI話務(wù)語音降噪音頻方案

    USB AI話務(wù)語音降噪音頻方案
    的頭像 發(fā)表于 04-25 18:16 ?508次閱讀
    USB <b class='flag-5'>AI</b>話務(wù)<b class='flag-5'>語音</b>降噪音頻方案

    基于NVIDIA Megatron Core的MOE LLM實現(xiàn)和訓(xùn)練優(yōu)化

    本文將分享阿里云人工智能平臺 PAI 團隊與 NVIDIA Megatron-Core 團隊在 MoE (Mixture of Experts) 大語言模型(LLM)實現(xiàn)與訓(xùn)練優(yōu)化上的創(chuàng)新工作。
    的頭像 發(fā)表于 03-22 09:50 ?687次閱讀
    基于NVIDIA <b class='flag-5'>Megatron</b> Core的MOE LLM實現(xiàn)和訓(xùn)練優(yōu)化

    AI語音與機器視覺開發(fā)應(yīng)用系統(tǒng)

    一、簡介 AI語音與機器視覺開發(fā)應(yīng)用系統(tǒng)是一款集成AI語音、機器視覺、深度學(xué)習(xí)基礎(chǔ)、嵌入式Linux于一體的高端教學(xué)科研實驗平臺。 整個教學(xué)平臺由實驗箱高性能嵌入式主板夠成,高性能嵌入
    的頭像 發(fā)表于 01-26 11:24 ?363次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>語音</b>與機器視覺開發(fā)應(yīng)用系統(tǒng)

    AI如何助力我們構(gòu)建更智能的空間?利用AI構(gòu)建智能空間的5種方式

    當(dāng)下業(yè)界都聚焦于生成式 AI 如何推動未來變革,但我們也不妨回顧一下過去的一年,AI 如何助力我們構(gòu)建更智能的空間。
    的頭像 發(fā)表于 01-24 18:19 ?1034次閱讀

    語音數(shù)據(jù)集:AI語音技術(shù)的靈魂

    一、引言 在人工智能領(lǐng)域,語音技術(shù)被譽為“未來人機交互的入口”,而語音數(shù)據(jù)集則是AI語音技術(shù)的靈魂。本文將深入探討語音數(shù)據(jù)集的重要性、
    的頭像 發(fā)表于 12-14 14:33 ?951次閱讀

    語音數(shù)據(jù)集:推動AI語音技術(shù)的核心力量

    一、引言 隨著人工智能的快速發(fā)展,語音技術(shù)作為人機交互的重要手段,正發(fā)揮著越來越重要的作用。而語音數(shù)據(jù)集則是推動AI語音技術(shù)的核心力量。本文將詳細介紹
    的頭像 發(fā)表于 12-12 11:32 ?660次閱讀

    NVIDIA 通過企業(yè)級生成式 AI 微服務(wù)為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    微服務(wù),支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應(yīng)用能夠提供高度準(zhǔn)確的響應(yīng)。 NVIDIA NeMo Retriever 是 NVIDIA NeMo (一個用于構(gòu)建
    的頭像 發(fā)表于 11-29 21:05 ?578次閱讀

    NVIDIA 通過企業(yè)級生成式 AI 微服務(wù) 為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    。 ? NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務(wù),通過企業(yè)級檢索增強生成(
    發(fā)表于 11-29 14:37 ?263次閱讀
    NVIDIA 通過企業(yè)級生成式 <b class='flag-5'>AI</b> 微服務(wù) 為聊天機器人、<b class='flag-5'>AI</b> 助手和摘要工具帶來商業(yè)智能

    NVIDIA AI Foundation Models:使用生產(chǎn)就緒型 LLM 構(gòu)建自定義企業(yè)聊天機器人和智能副駕

    ? 系列基礎(chǔ)模型是一套功能強大的全新工具,可用于為企業(yè)構(gòu)建生產(chǎn)就緒生成式 AI 應(yīng)用,從而推動從客服 AI 聊天機器人到尖端 AI 產(chǎn)品的各種創(chuàng)新。 這些新的基礎(chǔ)模型現(xiàn)已加入? NVI
    的頭像 發(fā)表于 11-17 21:35 ?850次閱讀
    NVIDIA <b class='flag-5'>AI</b> Foundation Models:使用生產(chǎn)就緒型 LLM <b class='flag-5'>構(gòu)建</b>自定義企業(yè)聊天機器人和智能副駕

    AI 模型構(gòu)建的五個過程詳解

    AI 模型構(gòu)建的過程 模型構(gòu)建主要包括 5 個階段,分別為模型設(shè)計、特征工程、模型訓(xùn)練、模型驗證、模型融合。
    發(fā)表于 11-17 10:31 ?7936次閱讀
    <b class='flag-5'>AI</b> 模型<b class='flag-5'>構(gòu)建</b>的五個過程詳解