0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NeMo加速并簡化自定義模型開發(fā)

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-07-26 11:17 ? 次閱讀

如果企業(yè)希望充分發(fā)揮出 AI 的力量,就需要根據(jù)其行業(yè)需求量身定制的自定義模型。

NVIDIA AI Foundry 是一項使企業(yè)能夠使用數(shù)據(jù)、加速計算和軟件工具創(chuàng)建并部署自定義模型的服務(wù),這些模型將為企業(yè)的生成式 AI 項目提供強力支持。

就像臺積電制造其他公司設(shè)計的芯片一樣,NVIDIA AI Foundry 為其他公司提供基礎(chǔ)設(shè)施和工具,使他們能夠使用 DGX Cloud、基礎(chǔ)模型、NVIDIA NeMo 軟件、NVIDIA 專業(yè)知識以及各種生態(tài)系統(tǒng)工具和支持,開發(fā)和自定義 AI 模型。

關(guān)鍵的區(qū)別在于產(chǎn)品:臺積電生產(chǎn)實體半導(dǎo)體芯片,而 NVIDIA AI Foundry 則幫助創(chuàng)建自定義模型。兩者都在推動創(chuàng)新,并與龐大的工具和合作伙伴生態(tài)系統(tǒng)相連接。

企業(yè)可以使用 AI Foundry 自定義 NVIDIA 模型和開放社區(qū)模型,包括新推出的 Llama 3.1 系列以及 NVIDIA Nemotron、Google DeepMind 的 CodeGemma、CodeLlama、Google DeepMind 的 Gemma、Mistral、Mixtral、Phi-3 和 StarCoder2 等。

行業(yè)領(lǐng)導(dǎo)者推動 AI 創(chuàng)新

行業(yè)領(lǐng)導(dǎo)者 Amdocs、Capital One、Getty Images、KT、現(xiàn)代汽車公司、SAP、ServiceNow 和 Snowflake 是 NVIDIA AI Foundry 的首批企業(yè)用戶。這些領(lǐng)軍企業(yè)正在企業(yè)軟件、技術(shù)、通信和媒體領(lǐng)域開辟一個由 AI 驅(qū)動創(chuàng)新的新時代。

ServiceNow AI 產(chǎn)品副總裁 Jeremy Barnes 表示:“部署 AI 的企業(yè)可以通過融合了行業(yè)和業(yè)務(wù)知識的自定義模型獲得競爭優(yōu)勢。ServiceNow 正在使用 NVIDIA AI Foundry 微調(diào)和部署可以輕松集成到客戶現(xiàn)有的工作流中的模型?!?/p>

NVIDIA AI Foundry 的關(guān)鍵支柱

NVIDIA AI Foundry 的關(guān)鍵支柱包括基礎(chǔ)模型、企業(yè)軟件、加速計算、專家支持和龐大的合作伙伴生態(tài)系統(tǒng)。

這項服務(wù)的軟件包括來自 NVIDIA 和 AI 社區(qū)的 AI 基礎(chǔ)模型,以及能夠加速模型開發(fā)的完整 NVIDIA NeMo 軟件平臺。

NVIDIA AI Foundry 的計算核心是 NVIDIA DGX Cloud,該加速計算資源網(wǎng)絡(luò)由 NVIDIA 與全球公有云領(lǐng)軍企業(yè)亞馬遜科技、谷歌云和 Oracle Cloud Infrastructure 共同設(shè)計。通過 DGX Cloud,AI Foundry 客戶能夠以前所未有的便捷和效率開發(fā)和微調(diào)自定義生成式 AI 應(yīng)用,并根據(jù)需要擴展他們的 AI 項目,而無需在前期進行大量硬件方面的投入。這種靈活性對于希望在瞬息萬變的市場中保持靈活性的企業(yè)來說至關(guān)重要。

NVIDIA AI Enterprise 專家會在 AI Foundry 客戶需要時提供幫助。NVIDIA 專家可以指導(dǎo)客戶完成使用專有數(shù)據(jù)構(gòu)建、微調(diào)和部署模型所需的各個步驟,確保模型貼合客戶的業(yè)務(wù)需求。

NVIDIA AI Foundry 客戶可以進入到一個全球合作伙伴生態(tài)系統(tǒng),以獲得全方位的支持。埃森哲、德勤、Infosys、Wipro 等 NVIDIA 合作伙伴將為他們提供 AI Foundry 咨詢服務(wù),涵蓋設(shè)計、實施和管理 AI 驅(qū)動的數(shù)字化轉(zhuǎn)型項目。埃森哲率先推出了基于 AI Foundry 的自定義模型開發(fā)產(chǎn)品——Accenture AI Refinery 框架。

另外,Data Monsters、Quantiphi、Slalom 和 SoftServe 等服務(wù)交付合作伙伴幫助企業(yè)解決將 AI 集成到現(xiàn)有 IT 環(huán)境中所遇到的復(fù)雜問題,確保 AI 應(yīng)用的可擴展性、安全性和與業(yè)務(wù)目標(biāo)的吻合性。

Cleanlab、DataDog、Dataiku、Dataloop、DataRobot、Domino Data Lab、Fiddler AI、New Relic、Scale、Weights & Biases 等 NVIDIA 合作伙伴還為客戶提供用于開發(fā)生產(chǎn)級 NVIDIA AI Foundry 模型的 AIOps 和 MLOps 平臺。

客戶可以將其 AI Foundry 模型導(dǎo)出為 NVIDIA NIM 推理微服務(wù)(包括自定義模型、優(yōu)化引擎和標(biāo)準 API),以便在其選擇的加速基礎(chǔ)設(shè)施上運行。

NVIDIA TensorRT-LLM 這樣的推理解決方案為 Llama 3.1 模型提供了更高的效率,以最大限度地減少延遲和最大限度地提高吞吐量。這使企業(yè)能夠更快地生成 token,同時降低在生產(chǎn)中運行模型的總成本。企業(yè)級的支持和安全性由 NVIDIA AI Enterprise 軟件套件提供。

275062d8-4a67-11ef-b8af-92fbcf53809c.png

NVIDIA NIM 和 TensorRT-LLM 最大限度地減少了 Llama 3.1 模型的推理延遲并最大限度地提高了吞吐量,從而更快地生成 token。

它們可部署在多種基礎(chǔ)設(shè)施上,包括思科、戴爾科技、慧與、聯(lián)想、超微等全球服務(wù)器制造合作伙伴的 NVIDIA 認證系統(tǒng)以及亞馬遜云科技、谷歌云和 Oracle Cloud 的云實例。

此外,領(lǐng)先的 AI 加速云平臺 Together AI 宣布,將讓其擁有超過 10 萬名開發(fā)者和企業(yè)的生態(tài)系統(tǒng)能夠使用 NVIDIA GPU 加速推理堆棧,在 DGX Cloud 上部署 Llama 3.1 端點和其他開放模型。Together AI 創(chuàng)始人兼首席執(zhí)行官 Vipul Ved Prakash 表示:“每個運行生成式 AI 應(yīng)用程序的企業(yè)都希望獲得更快的用戶體驗,使效率更高,成本更低。現(xiàn)在,使用 Together Inference Engine 的開發(fā)者和企業(yè)可以在 NVIDIA DGX Cloud 上最大化其性能、可擴展性和安全性?!?/p>

NVIDIA NeMo 加速并簡化

自定義模型開發(fā)

通過集成在 AI Foundry 中的 NVIDIA NeMo,開發(fā)者可以隨時使用所需的工具來整理數(shù)據(jù)、自定義基礎(chǔ)模型和評估性能。NeMo 將提供以下技術(shù):

NeMo Curator:一個由 GPU 提供加速的數(shù)據(jù)管理庫,通過為預(yù)訓(xùn)練和微調(diào)準備大規(guī)模、高質(zhì)量的數(shù)據(jù)集,提高生成式 AI 模型的性能。

NeMo Customizer:一項高性能且可擴展的微服務(wù),可簡化針對特定領(lǐng)域用例的 LLM 微調(diào)和對齊。

NeMo Evaluator:可在任何加速云或數(shù)據(jù)中心上,使用各種學(xué)術(shù)和自定義基準測試對生成式 AI 模型進行自動評估。

NeMo Guardrails:能夠編排對話管理,通過大語言模型提高智能應(yīng)用的準確性、適當(dāng)性和安全性,為生成式 AI 應(yīng)用提供保障。

借助 NVIDIA AI Foundry 中的 NeMo 平臺,企業(yè)能夠創(chuàng)建出精準滿足其需求的自定義 AI 模型。這種定制化與戰(zhàn)略目標(biāo)更加吻合,提高了決策的準確性以及運營的效率。例如企業(yè)可以開發(fā)出理解行業(yè)術(shù)語、符合監(jiān)管要求并與現(xiàn)有工作流無縫集成的模型。

SAP 首席人工智能官 Philipp Herzig 表示:“作為我們合作的下一步,SAP 計劃使用 NVIDIA 的 NeMo 平臺,來幫助企業(yè)去加速由 SAP Business AI 驅(qū)動的 AI 生產(chǎn)力?!?/p>

企業(yè)可以通過 NVIDIA NeMo Retriever NIM 推理微服務(wù)將其自定義 AI 模型部署到生產(chǎn)中。它們可以幫助開發(fā)者獲取專有數(shù)據(jù),然后通過檢索增強生成(RAG)為其 AI 應(yīng)用生成知識淵博的回答。

Snowflake AI 主管 Baris Gultekin 表示:“安全、可信的 AI 是企業(yè)充分利用生成式 AI 的必要前提,而檢索的準確性直接影響到 RAG 系統(tǒng)中生成的回答的相關(guān)性和質(zhì)量。通過 NVIDIA AI Foundry 中的 NeMo Retriever 組件,Snowflake Cortex AI 可以使用企業(yè)的自定義數(shù)據(jù),進一步為企業(yè)提供簡單、高效和可信的回答?!?/p>

自定義模型為企業(yè)帶來競爭優(yōu)勢

NVIDIA AI Foundry 的一大優(yōu)勢是能夠解決企業(yè)在采用 AI 時所面臨的獨特挑戰(zhàn)。通用 AI 模型可能無法滿足特定的業(yè)務(wù)需求和數(shù)據(jù)安全要求,而自定義 AI 模型則具有出色的靈活性、適應(yīng)性和性能,是企業(yè)獲得競爭優(yōu)勢的理想途徑。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102421
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266191
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3032

    瀏覽量

    48346

原文標(biāo)題:NVIDIA AI Foundry 如何幫助企業(yè)打造自定義生成式 AI 模型

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護到評估的全方位生成式 AI 模型服務(wù),以便部署自定義 Llama 3.1 NVIDIA NIM 微服務(wù)和新的 NVIDIA
    發(fā)表于 07-24 09:39 ?621次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry 為全球企業(yè)打造<b class='flag-5'>自定義</b> Llama 3.1 生成式 AI <b class='flag-5'>模型</b>

    揭秘NVIDIA AI Workbench 如何助力應(yīng)用開發(fā)

    者能夠根據(jù)其具體需求調(diào)整 AI 模型。 此類工作在過去可能需要復(fù)雜的設(shè)置,而新工具使這項工作變得空前簡單。 NVIDIA AI Workbench 可協(xié)助 AI 開發(fā)者構(gòu)建自己的 RAG 項目、
    發(fā)表于 07-10 18:51 ?511次閱讀
    揭秘<b class='flag-5'>NVIDIA</b> AI Workbench 如何助力應(yīng)用<b class='flag-5'>開發(fā)</b>

    HarmonyOS開發(fā)案例:【 自定義彈窗】

    基于ArkTS的聲明式開發(fā)范式實現(xiàn)了三種不同的彈窗,第一種直接使用公共組件,后兩種使用CustomDialogController實現(xiàn)自定義彈窗
    的頭像 發(fā)表于 05-16 18:18 ?1060次閱讀
    HarmonyOS<b class='flag-5'>開發(fā)</b>案例:【 <b class='flag-5'>自定義</b>彈窗】

    AWTK 開源串口屏開發(fā)(18) - 用 C 語言自定義命令

    編寫代碼即可實現(xiàn)常見的應(yīng)用。但是,有時候我們需要自定義一些命令,以實現(xiàn)一些特殊的功能。本文檔介紹如何使用C語言自定義命令。1.實現(xiàn)hmi_model_cmd_t接口
    的頭像 發(fā)表于 05-11 08:24 ?327次閱讀
    AWTK 開源串口屏<b class='flag-5'>開發(fā)</b>(18) - 用 C 語言<b class='flag-5'>自定義</b>命令

    HarmonyOS開發(fā)實例:【自定義Emitter】

    使用[Emitter]實現(xiàn)事件的訂閱和發(fā)布,使用[自定義彈窗]設(shè)置廣告信息。
    的頭像 發(fā)表于 04-14 11:37 ?880次閱讀
    HarmonyOS<b class='flag-5'>開發(fā)</b>實例:【<b class='flag-5'>自定義</b>Emitter】

    鴻蒙ArkUI實例:【自定義組件】

    組件是 OpenHarmony 頁面最小顯示單元,一個頁面可由多個組件組合而成,也可只由一個組件組合而成,這些組件可以是ArkUI開發(fā)框架自帶系統(tǒng)組件,比如?`Text`?、?`Button`?等,也可以是自定義組件,本節(jié)筆者簡單介紹一下
    的頭像 發(fā)表于 04-08 10:17 ?484次閱讀

    基于YOLOv8實現(xiàn)自定義姿態(tài)評估模型訓(xùn)練

    Hello大家好,今天給大家分享一下如何基于YOLOv8姿態(tài)評估模型,實現(xiàn)在自定義數(shù)據(jù)集上,完成自定義姿態(tài)評估模型的訓(xùn)練與推理。
    的頭像 發(fā)表于 12-25 11:29 ?2417次閱讀
    基于YOLOv8實現(xiàn)<b class='flag-5'>自定義</b>姿態(tài)評估<b class='flag-5'>模型</b>訓(xùn)練

    NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

    GPU 和海量的數(shù)據(jù)集上所訓(xùn)練而成。 不過這可能會給想要使用生成式 AI 的企業(yè)帶來很多巨大的挑戰(zhàn)。 NVIDIA NeMo (一個用于構(gòu)建、自定義和運行 LLM 的框架)能夠幫助企業(yè)克服上述挑戰(zhàn)
    的頭像 發(fā)表于 11-29 21:15 ?456次閱讀
    <b class='flag-5'>NVIDIA</b> 為部分大型亞馬遜 Titan 基礎(chǔ)<b class='flag-5'>模型</b>提供訓(xùn)練支持

    NVIDIA 通過企業(yè)級生成式 AI 微服務(wù)為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    微服務(wù),支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應(yīng)用能夠提供高度準確的響應(yīng)。 NVIDIA NeMo Retriever 是 NV
    的頭像 發(fā)表于 11-29 21:05 ?529次閱讀

    NVIDIA 通過企業(yè)級生成式 AI 微服務(wù) 為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    。 ? NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構(gòu)建、自定義和部署生成式 AI
    發(fā)表于 11-29 14:37 ?207次閱讀
    <b class='flag-5'>NVIDIA</b> 通過企業(yè)級生成式 AI 微服務(wù) 為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

    NVIDIA AI Foundation Models:使用生產(chǎn)就緒型 LLM 構(gòu)建自定義企業(yè)聊天機器人和智能副駕

    ? 系列基礎(chǔ)模型是一套功能強大的全新工具,可用于為企業(yè)構(gòu)建生產(chǎn)就緒生成式 AI 應(yīng)用,從而推動從客服 AI 聊天機器人到尖端 AI 產(chǎn)品的各種創(chuàng)新。 這些新的基礎(chǔ)模型現(xiàn)已加入? NVIDIA
    的頭像 發(fā)表于 11-17 21:35 ?757次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundation Models:使用生產(chǎn)就緒型 LLM 構(gòu)建<b class='flag-5'>自定義</b>企業(yè)聊天機器人和智能副駕

    NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

    應(yīng)用。 這項 NVIDIA AI foundry 服務(wù)整合了? NVIDIA AI Foundation Models 、 NVIDIA NeMo ?框架和工具,以及?
    的頭像 發(fā)表于 11-16 21:15 ?431次閱讀

    NVIDIA 加快企業(yè)自定義生成式 AI 模型開發(fā)

    的業(yè)務(wù)數(shù)據(jù)進行自定義。 如今,免費、開源的大語言模型對企業(yè)來說就像是一頓“自助餐”。但對于構(gòu)建自定義生成式 AI 應(yīng)用的開發(fā)者來說,這頓“大餐”可能會讓他們應(yīng)接不暇,因為他們需要滿足各
    的頭像 發(fā)表于 11-16 21:15 ?491次閱讀
    <b class='flag-5'>NVIDIA</b> 加快企業(yè)<b class='flag-5'>自定義</b>生成式 AI <b class='flag-5'>模型</b><b class='flag-5'>開發(fā)</b>

    NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的 生成式 AI Foundry 服務(wù)

    Models、NVIDIA NeMo? 框架和工具,以及 NVIDIA DGX? 云 AI 超算服務(wù)三大要素,為企業(yè)提供創(chuàng)建自定義生成式 AI
    發(fā)表于 11-16 14:13 ?280次閱讀
    <b class='flag-5'>NVIDIA</b> 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的 生成式 AI Foundry 服務(wù)

    如何在Matlab中自定義Message

    自定義Message 當(dāng)我們的 message 消息比較復(fù)雜時,通常要用到自定義的 message 消息,MATLAB 2020b以上的版本自帶了ROS Toolbox Interface
    的頭像 發(fā)表于 11-15 18:12 ?1037次閱讀
    如何在Matlab中<b class='flag-5'>自定義</b>Message