0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NIM微服務(wù)帶來(lái)巨大優(yōu)勢(shì)

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-08-23 15:20 ? 次閱讀

新服務(wù)通過(guò)熱門 AI 模型為數(shù)百萬(wàn)開發(fā)者帶來(lái)高達(dá) 5 倍的 token 效率提升,使他們能夠立即訪問(wèn)在 NVIDIA DGX Cloud 上運(yùn)行的 NIM 微服務(wù)。

全球最大人工智能社區(qū)之一 Hugging Face 平臺(tái)上的 400 萬(wàn)開發(fā)者在一些最熱門的 AI 模型上可輕松獲得 NVIDIA 加速推理。

借助新的推理即服務(wù)能力,開發(fā)者將能夠快速部署 Llama 3 系列和 Mistral AI 模型等領(lǐng)先的大語(yǔ)言模型,并使用運(yùn)行在NVIDIA DGX Cloud上的NVIDIA NIM微服務(wù)進(jìn)行優(yōu)化。

這項(xiàng)服務(wù)在 SIGGRAPH 大會(huì)上發(fā)布,它將幫助開發(fā)者利用托管在 Hugging Face Hub 上的開源 AI 模型快速建立原型并將其部署在生產(chǎn)中。Enterprise Hub 用戶可以利用 NVIDIA NIM 進(jìn)行無(wú)服務(wù)器推理,以提高靈活性,盡可能降低基礎(chǔ)設(shè)施用度并優(yōu)化性能。

推理服務(wù)補(bǔ)充了在 DGX Cloud 端的訓(xùn)練(Train on DGX Cloud),一種已在 Hugging Face 上提供的 AI 訓(xùn)練服務(wù)。

由于開發(fā)者面對(duì)著越來(lái)越多的開源模型,可供其輕松比較各種選項(xiàng)的資源中心會(huì)非常有幫助。這些訓(xùn)練和推理工具為 Hugging Face 開發(fā)者提供了在 NVIDIA 加速基礎(chǔ)設(shè)施上試驗(yàn)、測(cè)試和部署先進(jìn)模型的新方法。它們可以通過(guò) Hugging Face 模型卡上的“訓(xùn)練”和“部署”下拉菜單輕松訪問(wèn),用戶只需點(diǎn)擊幾下就能輕松使用這些功能。

不僅限于 Token 層面的提升

— NVIDIA NIM 帶來(lái)巨大優(yōu)勢(shì)

NVIDIA NIM 是一系列 AI 微服務(wù)(包括 NVIDIA AI 基礎(chǔ)模型和開源社區(qū)模型)的集合,而且已使用行業(yè)標(biāo)準(zhǔn)應(yīng)用編程接口(API)針對(duì)推理進(jìn)行了優(yōu)化。

NIM 為用戶帶來(lái)更高的 token 處理效率 — token 是語(yǔ)言模型使用和生成的數(shù)據(jù)單位。經(jīng)優(yōu)化的微服務(wù)還能改善底層 NVIDIA DGX Cloud 基礎(chǔ)架構(gòu)的效率,從而提高關(guān)鍵 AI 應(yīng)用的速度。

這意味著,與模型的其他版本相比,開發(fā)者可以通過(guò)訪問(wèn) NIM AI 模型,更快、更可靠地得到結(jié)果。例如,與 NVIDIA Tensor Core GPU 驅(qū)動(dòng)系統(tǒng)上的現(xiàn)成部署相比,通過(guò) NIM 訪問(wèn) Llama 3 的 700 億參數(shù)版本時(shí),可實(shí)現(xiàn)最高達(dá) 5 倍的吞吐量提升。

近乎即時(shí)的 DGX Cloud

訪問(wèn)讓 AI 加速觸手可及

NVIDIA DGX Cloud 平臺(tái)專為生成式 AI 打造,為開發(fā)者提供輕松訪問(wèn)可靠加速計(jì)算基礎(chǔ)設(shè)施的途徑,幫助他們更快地將生產(chǎn)就緒型應(yīng)用推向市場(chǎng)。

該平臺(tái)提供可擴(kuò)展的 GPU 資源,可為從原型設(shè)計(jì)到生產(chǎn)的每一步 AI 開發(fā)提供支持,同時(shí)無(wú)需開發(fā)者做出長(zhǎng)期的 AI 基礎(chǔ)設(shè)施承諾。

借助由 NIM 微服務(wù)提供支持、在 NVIDIA DGX Cloud 上運(yùn)行的 Hugging Face 推理即服務(wù),用戶可輕松訪問(wèn)針對(duì) AI 部署進(jìn)行優(yōu)化的計(jì)算資源,在企業(yè)級(jí)環(huán)境中實(shí)驗(yàn)最新的 AI 模型。

詳細(xì)了解在 SIGGRAPH 大會(huì)上

發(fā)布的 NVIDIA NIM 相關(guān)信息

在 SIGGRAPH 大會(huì)上,NVIDIA 還推出了面向 OpenUSD 框架的生成式 AI 模型和 NIM 微服務(wù),以加速開發(fā)者構(gòu)建高精度虛擬世界的能力,推動(dòng) AI 再次演進(jìn)。

體驗(yàn)超過(guò) 100 種 NVIDIA NIM 微服務(wù)在各行各業(yè)的應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102427
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266215
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46060

    瀏覽量

    234977
  • 微服務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    126

    瀏覽量

    7303

原文標(biāo)題:SIGGRAPH 2024 | Hugging Face 為開發(fā)者帶來(lái)由 NVIDIA NIM 提供支持的推理即服務(wù)

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    借助NVIDIA Metropolis微服務(wù)構(gòu)建視覺(jué)AI應(yīng)用

    伴隨著視覺(jué) AI 復(fù)雜性的增加,精簡(jiǎn)的部署解決方案已成為優(yōu)化空間和流程的關(guān)鍵。NVIDIA 能夠加快企業(yè)的開發(fā)速度,借助 NVIDIA Metropolis AI 工作流和微服務(wù),企業(yè)只需數(shù)周就能將想法變成現(xiàn)實(shí),而原本這項(xiàng)工作需
    的頭像 發(fā)表于 09-09 09:46 ?140次閱讀
    借助<b class='flag-5'>NVIDIA</b> Metropolis<b class='flag-5'>微服務(wù)</b>構(gòu)建視覺(jué)AI應(yīng)用

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    NVIDIA AI Enterprise 平臺(tái)中的 NIM 微服務(wù)與 NeMo 框架構(gòu)建和運(yùn)行他們的 AI 應(yīng)用,創(chuàng)建數(shù)據(jù)驅(qū)動(dòng)型 AI 飛輪 埃森哲、思科、戴爾科技、德勤、慧與、聯(lián)想、SoftServe
    發(fā)表于 08-28 10:10 ?147次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    借助NVIDIA NIM微服務(wù)助力可口可樂(lè)公司擴(kuò)展生成式AI內(nèi)容

    借助 NVIDIA NIM 微服務(wù) USD Search 和 USD Code,市場(chǎng)營(yíng)銷領(lǐng)導(dǎo)者 WPP 幫助飲料公司在全球范圍內(nèi)加速創(chuàng)意活動(dòng)的迭代。
    的頭像 發(fā)表于 08-13 16:16 ?433次閱讀

    全新NVIDIA NIM微服務(wù)將生成式AI引入數(shù)字環(huán)境

    生成式物理 AI NIM 微服務(wù)以及 NVIDIA Metropolis 參考工作流旨在協(xié)助創(chuàng)建智能的沉浸式工作環(huán)境。
    的頭像 發(fā)表于 08-02 15:20 ?394次閱讀

    采用OpenUSD和NVIDIA NIM微服務(wù)創(chuàng)建精準(zhǔn)品牌視覺(jué)

    全球領(lǐng)先的創(chuàng)意和制作服務(wù)機(jī)構(gòu)率先采用 OpenUSD 和 NVIDIA NIM 微服務(wù)來(lái)創(chuàng)建精準(zhǔn)的品牌視覺(jué)。
    的頭像 發(fā)表于 08-01 14:33 ?322次閱讀

    NVIDIA提供一套服務(wù)、模型以及計(jì)算平臺(tái) 加速人形機(jī)器人發(fā)展

    開發(fā)者可以訪問(wèn)新的 NVIDIA NIM 微服務(wù),用于 Isaac Lab 和 Isaac Sim 中的機(jī)器人仿真、OSMO 機(jī)器人云計(jì)算編排服務(wù)和遠(yuǎn)程操作數(shù)據(jù)捕獲工作流等。 為加速全
    的頭像 發(fā)表于 07-31 10:41 ?494次閱讀

    全新 NVIDIA NeMo Retriever微服務(wù)大幅提升LLM的準(zhǔn)確性和吞吐量

    企業(yè)能夠通過(guò)提供檢索增強(qiáng)生成功能的生產(chǎn)就緒型 NVIDIA NIM 推理微服務(wù),充分挖掘業(yè)務(wù)數(shù)據(jù)的價(jià)值。這些微服務(wù)現(xiàn)已集成到 Cohesity、DataStax、NetApp 和 Sn
    的頭像 發(fā)表于 07-26 11:13 ?663次閱讀
    全新 <b class='flag-5'>NVIDIA</b> NeMo Retriever<b class='flag-5'>微服務(wù)</b>大幅提升LLM的準(zhǔn)確性和吞吐量

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成式AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)NVIDIA NIM
    的頭像 發(fā)表于 07-25 16:57 ?390次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)NVIDIA NIM 推理微服務(wù)
    的頭像 發(fā)表于 07-25 09:48 ?567次閱讀

    NVIDIA宣布全面推出 NVIDIA ACE 生成式 AI 微服務(wù)

    采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成式 AI 微服務(wù),以加速新一代數(shù)字人的發(fā)展,并將在平臺(tái)上推出全新的生成式 AI 突破。客戶服務(wù)、游戲和醫(yī)療健康領(lǐng)域的公司率先
    的頭像 發(fā)表于 06-04 10:18 ?516次閱讀

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡(jiǎn)化AI模型部署過(guò)程,為全球的2800萬(wàn)英偉達(dá)開發(fā)者提供前所未有的便利。
    的頭像 發(fā)表于 06-04 09:15 ?538次閱讀

    NVIDIA將全球數(shù)百萬(wàn)開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

    來(lái)自 AI 生態(tài)系統(tǒng)各個(gè)領(lǐng)域的 150 余家合作伙伴嵌入了 NIM 推理微服務(wù),將企業(yè)級(jí) AI 應(yīng)用的部署時(shí)間從數(shù)周縮短至幾分鐘 NVIDIA 開發(fā)者計(jì)劃會(huì)員可免費(fèi)使用 NIM 來(lái)進(jìn)行
    的頭像 發(fā)表于 06-03 18:21 ?899次閱讀

    NVIDIA NIM 革命性地改變模型部署,將全球數(shù)百萬(wàn)開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

    來(lái)自 AI 生態(tài)系統(tǒng)各個(gè)領(lǐng)域的 150 余家合作伙伴嵌入了 NIM 推理微服務(wù),將企業(yè)級(jí) AI 應(yīng)用的部署時(shí)間從數(shù)周縮短至幾分鐘 NVIDIA 開發(fā)者計(jì)劃會(huì)員可免費(fèi)使用 NIM 來(lái)進(jìn)行
    發(fā)表于 06-03 09:12 ?181次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b> 革命性地改變模型部署,將全球數(shù)百萬(wàn)開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

    NVIDIA與Google DeepMind合作推動(dòng)大語(yǔ)言模型創(chuàng)新

    支持 NVIDIA NIM 推理微服務(wù)的谷歌最新開源模型 PaliGemma 首次亮相。
    的頭像 發(fā)表于 05-16 09:44 ?372次閱讀

    NVIDIA 通過(guò)企業(yè)級(jí)生成式 AI 微服務(wù)為聊天機(jī)器人、AI 助手和摘要工具帶來(lái)商業(yè)智能

    微服務(wù),支持企業(yè)將自定義大語(yǔ)言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應(yīng)用能夠提供高度準(zhǔn)確的響應(yīng)。 NVIDIA NeMo Retriever 是 NVIDIA NeMo (一個(gè)用于構(gòu)建、自定義和部署生成式
    的頭像 發(fā)表于 11-29 21:05 ?529次閱讀