0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NeMo開源框架概述、優(yōu)勢及功能特性

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-07-19 10:53 ? 次閱讀

NVIDIA NeMo 是一款供開發(fā)者構(gòu)建和訓練先進的對話式 AI 模型的開源框架。

NVIDIA NeMo 是什么?

NVIDIA NeMo 是一個框架,用于借助簡單的 Python 界面構(gòu)建、訓練和微調(diào) GPU 加速的語音和自然語言理解(NLU)模型。使用 NeMo,開發(fā)者可以創(chuàng)建新的模型架構(gòu),并通過易于使用的應(yīng)用編程接口(API),在 NVIDIA GPU 中的Tensor Core 上使用混合精度計算對其進行訓練。

NeMo Megatron 是此框架的一部分,提供并行化技術(shù)(例如 Megatron-LM 研究項目中的工作流和張量并行化),用于訓練大規(guī)模語言模型。

借助 NeMo,您可以構(gòu)建用于實時自動語音識別(ASR)、自然語言處理(NLP)和文本轉(zhuǎn)語音(TTS)應(yīng)用(例如視頻通話轉(zhuǎn)錄、智能視頻助理以及醫(yī)療健康、金融、零售和電信行業(yè)的自動化呼叫中心支持)的模型。

NVIDIA NeMo 的優(yōu)勢

快速建模

使用簡單的 Python API 快速配置、構(gòu)建和訓練模型。

可定制的模型

從 NVIDIA NGC 目錄中下載并自定義經(jīng)過預(yù)訓練的先進模型。

廣泛集成

實現(xiàn) NeMo 與 PyTorch 和 PyTorch Lightning 生態(tài)系統(tǒng)的互操作。

輕松部署

應(yīng)用 NVIDIA TensorRT 優(yōu)化,并導(dǎo)出至 NVIDIA Riva 進行高性能推理

NVIDIA NeMo 的功能特性

輕松構(gòu)建新的模型架構(gòu)

NeMo 包含針對 ASR、NLP 和 TTS 的特定領(lǐng)域集合,用于開發(fā) Citrinet、Jasper、BERT、Fastpitch 和 HiFiGAN 等先進模型。NeMo 模型由神經(jīng)模組構(gòu)成,神經(jīng)模組是模型的基礎(chǔ)模組。神經(jīng)類型將這些模組的輸入和輸出強有力地類型化,可自動在模塊之間執(zhí)行語義檢查。

NeMo 旨在提供高靈活性,您可以使用 Hydra 框架輕松修改模型的行為。例如,您可以使用 Hydra 在以下圖表中修改 Citrinet Encoder 模組的架構(gòu)。

訓練先進的對話式 AI 模型

NGC 中的幾個 NeMo 預(yù)訓練的先進模型基于開源的免費數(shù)據(jù)集在 NVIDIA DGX 上進行了超過 100000 小時的訓練。在訓練您的用例之前,您可以微調(diào)這些模型或使用 NeMo 修改它們。

NeMo 使用 Tensor Core上的混合精度,訓練速度能達到在單個 GPU 上使用 FP32 精度的 4.5 倍。您可以進一步將訓練擴展到多 GPU 系統(tǒng)和多節(jié)點集群。

使用 NeMo Megatron 進行大規(guī)模語言建模

基于 Transformer 的大規(guī)模語言模型正應(yīng)用于廣泛的自然語言任務(wù),例如文本生成、摘要和聊天機器人。NeMo Megatron 能夠管理訓練數(shù)據(jù),并使用多達數(shù)萬億個參數(shù)訓練大規(guī)模模型。它會執(zhí)行數(shù)據(jù)管理任務(wù),例如格式化、過濾、重復(fù)數(shù)據(jù)刪除和混合,使用其他方式完成這些任務(wù)可能需要花費數(shù)月時間。它還使用張量并行性在節(jié)點內(nèi)擴展模型,并利用數(shù)據(jù)和工作流并行性跨節(jié)點擴展數(shù)據(jù)和模型。

NeMo Megatron 可依托數(shù)千個 GPU 提供高訓練效率,使企業(yè)訓練大規(guī)模 NLP 變得可行。

NeMo Megatron 可以將經(jīng)過訓練的模型導(dǎo)出到 NVIDIA Triton 推理服務(wù)器,以在多個 GPU 和多個節(jié)點上運行大規(guī)模 NLP 模型。

靈活、開源、快速擴展的生態(tài)系統(tǒng)

NeMo 基于 PyTorch 和 PyTorch Lightning 構(gòu)建,為研究人員開發(fā)和集成他們已習慣使用的模組提供了便捷的途徑。PyTorch 和 PyTorch Lightning 是開源 Python 庫,可提供用于合成模型的模組。

NeMo 集成了 Hydra 框架,助力研究人員輕松靈活地自定義模型/模組。Hydra 是一款熱門框架,可簡化復(fù)雜的對話式 AI 模型的開發(fā)。

NeMo 是一款開源框架,研究人員可為其獻言獻策,也可在此基礎(chǔ)上進行構(gòu)建。

部署到生產(chǎn)環(huán)境中

要在使用 NVIDIA Riva 的生產(chǎn)環(huán)境中部署 NeMo 語音模型,開發(fā)者應(yīng)使用與 Riva 兼容的格式導(dǎo)出 NeMo 模型,然后執(zhí)行 Riva 構(gòu)建和部署命令,以創(chuàng)建可實時運行的優(yōu)化技能。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102429
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128144
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266238
  • 開源框架
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    9402

原文標題:DevZone | NVIDIA NeMo

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓練數(shù)據(jù)

    Nemotron-4 340B 是針對 NVIDIA NeMoNVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進的指導(dǎo)和獎勵模型,以及一個用于生成式 AI 訓練的數(shù)據(jù)集。
    的頭像 發(fā)表于 09-06 14:59 ?140次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型幫助開發(fā)者生成合成訓練數(shù)據(jù)

    Mistral AI與NVIDIA推出全新語言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同發(fā)布了一款全新的領(lǐng)先語言模型Mistral NeMo 12B。開發(fā)者可以輕松定制和部署該模型,令其適用于支持聊天機器人、多語言任務(wù)、編碼和摘要的企業(yè)應(yīng)用。
    的頭像 發(fā)表于 07-27 11:04 ?543次閱讀

    螞蟻集團發(fā)布首個開源金融場景多智能體框架

    在第七屆數(shù)字中國建設(shè)峰會上,螞蟻集團宣布了一項引人注目的舉措:正式開源其多智能體框架agentUniverse。這一框架不僅是金融領(lǐng)域的首個開源多智能體技術(shù)
    的頭像 發(fā)表于 05-28 09:25 ?560次閱讀

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優(yōu)化從 PC 到云端的
    的頭像 發(fā)表于 04-28 10:36 ?393次閱讀

    NVIDIA宣布推出基于Omniverse Cloud API構(gòu)建的全新軟件框架

    NVIDIA 在 GTC 大會上宣布推出基于 Omniverse Cloud API(應(yīng)用編程接口)構(gòu)建的全新軟件框架。
    的頭像 發(fā)表于 03-25 09:09 ?416次閱讀

    基于NVIDIA DOCA 2.6實現(xiàn)高性能和安全的AI云設(shè)計

    作為專為 NVIDIA? BlueField? 網(wǎng)絡(luò)平臺而設(shè)計的數(shù)據(jù)中心基礎(chǔ)設(shè)施軟件框架,NVIDIA? DOCA? 使廣大開發(fā)者能夠利用其行業(yè)標準 API 在 NVIDIA Blue
    的頭像 發(fā)表于 02-23 10:02 ?366次閱讀

    NVIDIA TAO 5.2版本發(fā)布

    NVIDIA TAO 提供了一個低代碼開源 AI 框架,無論你是初學者還是專業(yè)的數(shù)據(jù)科學家,都可以使用該框架加速視覺 AI 模型開發(fā)。開發(fā)者現(xiàn)在可以利用遷移學習的強大
    的頭像 發(fā)表于 01-03 10:11 ?505次閱讀

    邊緣計算平臺開源框架有哪些類型

    邊緣計算平臺開源框架是指基于邊緣計算概念開發(fā)的開源軟件框架,用于構(gòu)建和管理邊緣計算平臺。這些框架提供了一套工具和技術(shù),用于將計算和存儲資源推
    的頭像 發(fā)表于 12-27 15:17 ?976次閱讀

    NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓練支持

    本文將介紹亞馬遜如何使用 NVIDIA NeMo 框架、GPU 以及亞馬遜云科技的 EFA 來訓練其 最大的新一代大語言模型(LLM)。 大語言模型的一切都很龐大——巨型模型是在數(shù)千顆 NVI
    的頭像 發(fā)表于 11-29 21:15 ?457次閱讀
    <b class='flag-5'>NVIDIA</b> 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓練支持

    NVIDIA 通過企業(yè)級生成式 AI 微服務(wù)為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    AI 模型的框架和工具系列)的一項全新服務(wù),通過企業(yè)級檢索增強生成(RAG)功能,幫助組織加強其生成式 AI 應(yīng)用。 作為一項語義檢索微服務(wù),NeMo Retriever 借助經(jīng)
    的頭像 發(fā)表于 11-29 21:05 ?530次閱讀

    NVIDIA 通過企業(yè)級生成式 AI 微服務(wù) 為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    。 ? NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系
    發(fā)表于 11-29 14:37 ?208次閱讀
    <b class='flag-5'>NVIDIA</b> 通過企業(yè)級生成式 AI 微服務(wù) 為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    NVIDIA AI Foundation Models:使用生產(chǎn)就緒型 LLM 構(gòu)建自定義企業(yè)聊天機器人和智能副駕

    ? 系列基礎(chǔ)模型是一套功能強大的全新工具,可用于為企業(yè)構(gòu)建生產(chǎn)就緒生成式 AI 應(yīng)用,從而推動從客服 AI 聊天機器人到尖端 AI 產(chǎn)品的各種創(chuàng)新。 這些新的基礎(chǔ)模型現(xiàn)已加入? NVIDIA NeMo 。這個端到端
    的頭像 發(fā)表于 11-17 21:35 ?758次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundation Models:使用生產(chǎn)就緒型 LLM 構(gòu)建自定義企業(yè)聊天機器人和智能副駕

    NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

    應(yīng)用。 這項 NVIDIA AI foundry 服務(wù)整合了? NVIDIA AI Foundation Models 、 NVIDIA NeMo ?
    的頭像 發(fā)表于 11-16 21:15 ?431次閱讀

    NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的 生成式 AI Foundry 服務(wù)

    Models、NVIDIA NeMo? 框架和工具,以及 NVIDIA DGX? 云 AI 超算服務(wù)三大要素,為企業(yè)提供創(chuàng)建自定義生成式 AI 模型
    發(fā)表于 11-16 14:13 ?281次閱讀
    <b class='flag-5'>NVIDIA</b> 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的 生成式 AI Foundry 服務(wù)

    現(xiàn)已公開發(fā)布!歡迎使用 NVIDIA TensorRT-LLM 優(yōu)化大語言模型推理

    能。該開源程序庫現(xiàn)已作為 NVIDIA NeMo 框架的一部分,在 /NVIDIA/TensorRT-LLM GitHub 資源庫中免費提供
    的頭像 發(fā)表于 10-27 20:05 ?801次閱讀
    現(xiàn)已公開發(fā)布!歡迎使用 <b class='flag-5'>NVIDIA</b> TensorRT-LLM 優(yōu)化大語言模型推理