0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA通過NeMo 1.0加速會話AI從研究到生產(chǎn)過程

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:About Sirisha Rella ? 2022-04-01 15:30 ? 次閱讀

NVIDIA 發(fā)布了世界級的語音識別功能,可為企業(yè)生成高精度的轉(zhuǎn)錄本, NeMo 1.0 包括用于民主化和加速對話人工智能研究的最新語音和語言模型。

世界級語音識別

NVIDIA Riva 世界級語音識別是一種現(xiàn)成的語音服務(wù),可以輕松部署在任何云或數(shù)據(jù)中心。企業(yè)可以使用 遷移學(xué)習(xí)工具包 ( TLT )跨各種行業(yè)和用例定制語音服務(wù)。 通過 TLT ,開發(fā)人員可以將定制語音和語言模型的開發(fā)速度提高 10 倍。

語音識別模型是高度精確的,并在電信、金融、醫(yī)療保健、教育以及各種專有和開源數(shù)據(jù)集的領(lǐng)域無關(guān)詞匯上進(jìn)行訓(xùn)練。此外,它還接受了噪聲數(shù)據(jù)、多種采樣率(包括呼叫中心 8khz )、各種口音和對話的訓(xùn)練,所有這些都有助于提高模型的準(zhǔn)確性。

使用 Riva 語音服務(wù),您可以在 10 毫秒內(nèi)生成一個轉(zhuǎn)錄。它在多個專有數(shù)據(jù)集上進(jìn)行評估,準(zhǔn)確率超過 90% ,并且可以適應(yīng)各種各樣的用例和領(lǐng)域。它可以在幾個應(yīng)用程序中使用,例如在呼叫中心、視頻會議和虛擬助理中轉(zhuǎn)錄音頻

T-Mobile 是美國最大的電信運營商之一,它利用 Riva 提供卓越的客戶服務(wù)。

T-Mobile 負(fù)責(zé)產(chǎn)品和技術(shù)的副總裁 Matthew Davis 說:“借助 NVIDIA Riva 服務(wù),利用 T-Mobile 數(shù)據(jù)進(jìn)行微調(diào),我們正在構(gòu)建產(chǎn)品,以幫助我們實時解決客戶問題?!?。

“在評估了幾種自動語音識別解決方案后, T-Mobile 發(fā)現(xiàn) Riva 能夠以極低的延遲提供高質(zhì)量的模型,實現(xiàn)客戶喜愛的體驗?!?/p>

您可以從 NGC 目錄 下載 Riva 語音服務(wù),現(xiàn)在就開始構(gòu)建自己的轉(zhuǎn)錄應(yīng)用程序。

NeMo 1.0 版本

NVIDIA NeMo 是一個開源工具包,供研究人員開發(fā)最先進(jìn)的( SOTA )會話人工智能模型。它包括自動語音識別( ASR )、自然語言處理( NLP )和文本到語音( TTS )的集合,使研究人員能夠快速試驗新的 SOTA 神經(jīng)網(wǎng)絡(luò),以便創(chuàng)建新的模型或在現(xiàn)有模型的基礎(chǔ)上進(jìn)行構(gòu)建。

PyTorch 與 NeMo 、 PyTorch Lightning 和 Hydra 框架緊密耦合。這些集成使研究人員能夠結(jié)合 PyTorch 和 PyTorch 閃電模塊開發(fā)和使用 NeMo 模型和模塊。此外,借助 Hydra 框架和 NeMo ,研究人員可以輕松定制復(fù)雜的會話人工智能模型。

此版本的亮點包括:

增加了對多種語言的語音識別支持,以及新的 CitriNet 和 Conformer CTC ASR 模型

從英語到西班牙語、俄語、普通話、德語和法語的五種語言支持雙向神經(jīng)機器翻譯模型

新的語音合成模型,如 Fastpitch 、 Talknet 、 Fastspeech2 ,以及端到端模型,如 Fastpitch + HiFiGAN 和 Fastspeech2 + HiFiGAN

用于自動執(zhí)行 反文本規(guī)范化和反規(guī)范化 以及 基于 CTC 分割的數(shù)據(jù)集生成 和 探索 語音數(shù)據(jù)集的功能

此外,大多數(shù) NeMo 模型可以導(dǎo)出到 NVIDIA Riva ,用于產(chǎn)品部署和高性能推斷。

關(guān)于作者

About Sirisha Rella是 NVIDIA 的技術(shù)產(chǎn)品營銷經(jīng)理,專注于計算機視覺、語音和基于語言的深度學(xué)習(xí)應(yīng)用。 Sirisha 獲得了密蘇里大學(xué)堪薩斯城分校的計算機科學(xué)碩士學(xué)位,是國家科學(xué)基金會大學(xué)習(xí)中心的研究生助理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4862

    瀏覽量

    102722
  • 語音識別
    +關(guān)注

    關(guān)注

    38

    文章

    1712

    瀏覽量

    112503
收藏 人收藏

    評論

    相關(guān)推薦

    詳解MES系統(tǒng)的生產(chǎn)過程實時監(jiān)控與異常處理

    萬界星空科技的MES系統(tǒng)能實時監(jiān)控生產(chǎn)過程,檢測異常情況并自動糾正,確保生產(chǎn)過程的連續(xù)性和穩(wěn)定性。通過可視化界面,管理人員可以實時查看生產(chǎn)進(jìn)度和設(shè)備狀態(tài)。預(yù)警機制一旦檢測到異常情況,會
    的頭像 發(fā)表于 10-28 15:57 ?147次閱讀
    詳解MES系統(tǒng)的<b class='flag-5'>生產(chǎn)過程</b>實時監(jiān)控與異常處理

    MES系統(tǒng)如何實現(xiàn)生產(chǎn)過程的全流程追溯

    萬界星空科技的MES系統(tǒng)通過實時采集、傳輸、處理、監(jiān)控和追溯管理,實現(xiàn)了生產(chǎn)過程的實時跟蹤,為企業(yè)提供了決策支持。
    的頭像 發(fā)表于 10-12 10:51 ?213次閱讀
    MES系統(tǒng)如何實現(xiàn)<b class='flag-5'>生產(chǎn)過程</b>的全流程追溯

    NVIDIA加速計算和生成式AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財年可持續(xù)發(fā)展報告開篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計算和生成式 AI 領(lǐng)域的創(chuàng)新,以及
    的頭像 發(fā)表于 09-09 09:18 ?477次閱讀

    借助NVIDIA NIM加速AI應(yīng)用部署

    大語言模型(LLM)在企業(yè)組織中的應(yīng)用日益廣泛,許多企業(yè)都將其整合到 AI 應(yīng)用中。雖然基礎(chǔ)模型著手十分高效,但需要花費一定的精力才能將它們整合到生產(chǎn)就緒型環(huán)境中。NVIDIA NI
    的頭像 發(fā)表于 08-23 16:38 ?338次閱讀
    借助<b class='flag-5'>NVIDIA</b> NIM<b class='flag-5'>加速</b><b class='flag-5'>AI</b>應(yīng)用部署

    Mistral AINVIDIA推出全新語言模型Mistral NeMo 12B

    Mistral AINVIDIA 于近日共同發(fā)布了一款全新的領(lǐng)先語言模型Mistral NeMo 12B。開發(fā)者可以輕松定制和部署該模型,令其適用于支持聊天機器人、多語言任務(wù)、編碼和摘要的企業(yè)應(yīng)用。
    的頭像 發(fā)表于 07-27 11:04 ?616次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Foundry 提供數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護評估的全方位生成式 AI 模型服務(wù),以便部署自定義 Llama 3.1 NVIDIA NIM 微服務(wù)和新的
    發(fā)表于 07-24 09:39 ?675次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> 模型

    科普 EVASH Ultra EEPROM 晶圓生產(chǎn)過程

    科普 EVASH Ultra EEPROM 晶圓生產(chǎn)過程
    的頭像 發(fā)表于 06-26 10:16 ?373次閱讀

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    by HPE 包含了可持續(xù)的加速計算產(chǎn)品組合以及全生命周期服務(wù),將簡化 AI 創(chuàng)造價值的過程加速生成式 AI 的發(fā)展步伐。
    的頭像 發(fā)表于 06-21 14:39 ?308次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

    簡化 AI 創(chuàng)造價值的過程加速生成式 AI 的發(fā)展步伐。 NVIDIA AI Computin
    的頭像 發(fā)表于 06-20 17:36 ?664次閱讀

    助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究

    科學(xué)家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報、遺傳學(xué)和材料科學(xué)領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?373次閱讀
    助力科學(xué)發(fā)展,<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b><b class='flag-5'>加速</b>HPC<b class='flag-5'>研究</b>

    利用NVIDIA Holoscan 1.0開發(fā)生產(chǎn)就緒型AI傳感器處理應(yīng)用

    邊緣 AI 開發(fā)者正在構(gòu)建用于安全關(guān)鍵型和受監(jiān)管用例的 AI 應(yīng)用和產(chǎn)品。借助 NVIDIA Holoscan 1.0,這些應(yīng)用可在幾毫秒內(nèi)整合實時洞察和加工處理。
    的頭像 發(fā)表于 04-25 09:58 ?408次閱讀

    NVIDIA 初創(chuàng)加速計劃 Omniverse 加速

    新的 AI 技術(shù)和迅速發(fā)展的應(yīng)用正在改變各行各業(yè),生成式 AI 已經(jīng)展示出在藝術(shù)、設(shè)計、影視動畫、互娛、建筑等領(lǐng)域加速內(nèi)容創(chuàng)作的價值,助力實現(xiàn)高質(zhì)量、高效率、多樣化的內(nèi)容生產(chǎn),成為推動
    的頭像 發(fā)表于 12-04 20:35 ?607次閱讀
    <b class='flag-5'>NVIDIA</b> 初創(chuàng)<b class='flag-5'>加速</b>計劃 Omniverse <b class='flag-5'>加速</b>營

    NVIDIA 通過企業(yè)級生成式 AI 微服務(wù)為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語義檢索,實現(xiàn)準(zhǔn)確的 AI 推理 NVIDIA 今日宣布推出一項
    的頭像 發(fā)表于 11-29 21:05 ?578次閱讀

    NVIDIA 通過企業(yè)級生成式 AI 微服務(wù) 為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    。 ? NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系
    發(fā)表于 11-29 14:37 ?263次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>通過</b>企業(yè)級生成式 <b class='flag-5'>AI</b> 微服務(wù) 為聊天機器人、<b class='flag-5'>AI</b> 助手和摘要工具帶來商業(yè)智能

    NVIDIA AI Foundation Models:使用生產(chǎn)就緒型 LLM 構(gòu)建自定義企業(yè)聊天機器人和智能副駕

    ? 系列基礎(chǔ)模型是一套功能強大的全新工具,可用于為企業(yè)構(gòu)建生產(chǎn)就緒生成式 AI 應(yīng)用,從而推動客服 AI 聊天機器人尖端
    的頭像 發(fā)表于 11-17 21:35 ?850次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundation Models:使用<b class='flag-5'>生產(chǎn)</b>就緒型 LLM 構(gòu)建自定義企業(yè)聊天機器人和智能副駕