0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過阿里云計(jì)算巢快速部署NVIDIA NIM

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-11-05 14:13 ? 次閱讀

人工智能飛速發(fā)展的今天,大語言模型(LLM)為各個(gè)行業(yè)帶來了全新的場(chǎng)景和機(jī)遇。諸如客戶服務(wù)數(shù)字人,計(jì)算機(jī)輔助藥物研發(fā)的生成式虛擬篩選,基于檢索增強(qiáng)生成(RAG)的企業(yè)多模態(tài) PDF 數(shù)據(jù)提取,網(wǎng)絡(luò)安全流數(shù)據(jù)過濾、處理和分類優(yōu)化等工作流,正在無縫集成和運(yùn)行在定制化的企業(yè) AI 應(yīng)用,企業(yè)還能夠基于專有業(yè)務(wù)數(shù)據(jù)和用戶反饋數(shù)據(jù),不斷優(yōu)化 AI 應(yīng)用。

同時(shí),企業(yè)也面臨著如何高效、安全地部署 LLM 的挑戰(zhàn)。阿里云計(jì)算巢基于 NVIDIA 加速計(jì)算技術(shù),通過阿里云云市場(chǎng)為企業(yè)和開發(fā)者提供NVIDIA AI Enterprise軟件套件,其包含了NVIDIA NIM Agent Blueprint、NVIDIA NIM和NVIDIA NeMo等企業(yè)級(jí) AI 開發(fā)工作流和 AI 開發(fā)工具鏈。其中,NVIDIA NIM 提供可靠、高性能的 LLM 推理服務(wù),結(jié)合阿里云計(jì)算巢實(shí)現(xiàn)一站式云上部署,助力企業(yè)加速實(shí)現(xiàn) LLM 的 SaaS 化。

本文以 Llama3 為例,介紹該方案的整體架構(gòu)和部署方式。

NVIDIA NIM:

易于使用的預(yù)構(gòu)建容器工具

NVIDIA NIM 微服務(wù)是一套易于使用的預(yù)構(gòu)建容器工具,目的是幫助企業(yè)客戶在云、數(shù)據(jù)中心和工作站上安全、可靠地部署高性能 AI 模型。作為 NVIDIA AI Enterprise 的一部分,NIM 具備以下核心優(yōu)勢(shì):

安全、靈活的部署:NIM 在不同環(huán)境的 CUDA GPU 加速基礎(chǔ)設(shè)施和 Kubernetes 發(fā)行版中經(jīng)過嚴(yán)格驗(yàn)證和基準(zhǔn)測(cè)試,它支持企業(yè)在云、數(shù)據(jù)中心、工作站上安全可靠地部署高性能的 AI 推理,只需 5 分鐘即可完成部署。

加速產(chǎn)品上市:企業(yè)通過預(yù)構(gòu)建、持續(xù)維護(hù)的微服務(wù),能夠快速將產(chǎn)品推向市場(chǎng),縮短開發(fā)周期。

開發(fā)者友好:開發(fā)者使用標(biāo)準(zhǔn) API 和幾行代碼即可輕松將 NIM 集成到企業(yè)級(jí) AI 應(yīng)用程序中。

優(yōu)化的推理引擎:NIM 基于Triton 推理服務(wù)器、TensorRT、TensorRT-LLM和 PyTorch 等強(qiáng)大的推理引擎構(gòu)建, 提供行業(yè)領(lǐng)先的吞吐率、延遲和 token 生成速度,確保服務(wù)響應(yīng)更快。

企業(yè)級(jí)支持:NIM 采用企業(yè)級(jí)基礎(chǔ)容器構(gòu)建,提供嚴(yán)格的驗(yàn)證、定期安全更新,適合企業(yè)生產(chǎn)環(huán)境部署。

阿里云計(jì)算巢:專為服務(wù)商

及其客戶打造的云集成 PaaS 平臺(tái)

阿里云計(jì)算巢服務(wù)是一個(gè)開放給企業(yè)應(yīng)用服務(wù)商(包括:企業(yè)應(yīng)用服務(wù)商、IT 集成服務(wù)商、交付服務(wù)商和管理服務(wù)提供商等)及其用戶的服務(wù)管理 PaaS 平臺(tái),提供軟件上云的“一站式”解決方案。

阿里云計(jì)算巢能提供軟件的交付、部署、運(yùn)維流程標(biāo)準(zhǔn)化的服務(wù),支持軟件和資源的一體化交付,真正實(shí)現(xiàn)了軟件的開箱即用。

阿里云計(jì)算巢服務(wù)集成了阿里云一系列底層產(chǎn)品能力,通過通用的應(yīng)用管控框架、租戶管理框架,幫助服務(wù)商提升服務(wù)的交付效率、管理效率和服務(wù)能力,在提升用戶滿意度的同時(shí)降低運(yùn)營成本;并為用戶提供了統(tǒng)一管理多種應(yīng)用服務(wù)的平臺(tái),提升用戶使用服務(wù)的效率和安全性,降低用戶獲取服務(wù)和管理服務(wù)的成本。

方案介紹

下圖展示了通過阿里云計(jì)算巢快速部署 NVIDIA NIM 的整體架構(gòu)。以 Llama3 為例,我們通過計(jì)算巢來創(chuàng)建、管理 LLM 推理服務(wù):在阿里云容器服務(wù) ACK (容器服務(wù) Kubernetes 版)集群上,我們使用阿里云 ACK 的云原生 AI 套件,集成開源推理服務(wù)框架 KServe,來部署 NVIDIA NIM。

同時(shí),結(jié)合 ACK 的 Prometheus 和 Grafana 監(jiān)控服務(wù),快速搭建監(jiān)控大盤,實(shí)時(shí)觀測(cè)推理服務(wù)狀態(tài);利用 NVIDIA NIM 提供豐富的監(jiān)控指標(biāo),如 num_requests_waiting,配置推理服務(wù)彈性擴(kuò)縮容策略。

這里列出的云上資源,以及阿里云彈性計(jì)算服務(wù)(ECS)、專有網(wǎng)絡(luò)(VPC) 等基礎(chǔ)資源,都可以通過計(jì)算巢來輕松配置,一鍵拉起,最終實(shí)現(xiàn)一個(gè)云上高性能、可實(shí)時(shí)觀測(cè)、極致彈性的大語言模型推理服務(wù)。用戶只需要根據(jù)該服務(wù)創(chuàng)建實(shí)例,便可部署該服務(wù)。

6b85514c-9b30-11ef-a511-92fbcf53809c.jpg

圖 1. 通過阿里云計(jì)算巢快速部署

NVIDIA NIM 架構(gòu)圖

(圖片來源于阿里云,如您有任何疑問或需要使用本圖片,請(qǐng)聯(lián)系阿里云)

部署流程

1. 參考 NVIDIA NIM 文檔,生成NVIDIA NGC API Key,用于訪問需要部署的模型鏡像。以本文用到的 Llama-3-8B-Instruct 為例,可以通過NVIDIA NGC 目錄來獲取。

同時(shí),請(qǐng)閱讀并承諾遵守 Llama 模型的自定義可商用開源協(xié)議。

2. 在阿里云計(jì)算巢服務(wù)目錄中找到“基于 NVIDIA NIM 快速部署 LLM 模型推理服務(wù)”,并進(jìn)入實(shí)例部署頁面。

如下圖所示,主要配置服務(wù)的基本信息和云上資源,以及第一步中獲取的 NVIDIA NGC API Key,需要填寫在下圖相應(yīng)位置。

6ba8566a-9b30-11ef-a511-92fbcf53809c.png

圖 2. 在阿里云計(jì)算巢創(chuàng)建服務(wù)實(shí)例

(圖片來源于阿里云,如您有任何疑問或需要使用本圖片,請(qǐng)聯(lián)系阿里云)

因?yàn)榉?wù)部署在阿里云 ACK 集群之上,這里也包含了 Kubernetes 配置:

6bd91598-9b30-11ef-a511-92fbcf53809c.png

圖 3. 阿里云 ACK 集群上 Kubernetes

選項(xiàng)頁面

(圖片來源于阿里云,如您有任何疑問或需要使用本圖片,請(qǐng)聯(lián)系阿里云)

3. 按照頁面提示完成所有配置之后,點(diǎn)擊下一步:確認(rèn)訂單,在這里確認(rèn)第 2 步配置的服務(wù)實(shí)例信息和價(jià)格預(yù)覽。

6c132620-9b30-11ef-a511-92fbcf53809c.png

圖 4. 確認(rèn)服務(wù)實(shí)例信息和價(jià)格預(yù)覽

(圖片來源于阿里云,如您有任何疑問或需要使用本圖片,請(qǐng)聯(lián)系阿里云)

部署過程中,用戶需要?jiǎng)?chuàng)建和訪問阿里云資源,當(dāng)阿里云賬號(hào)屬于 RAM 賬號(hào)時(shí),需要開通以下權(quán)限,頁面上也有開通這些權(quán)限的入口。

6c49b92e-9b30-11ef-a511-92fbcf53809c.png

4. 點(diǎn)擊立即創(chuàng)建,開始部署。過程中會(huì)涉及阿里云資源的創(chuàng)建、NIM 模型鏡像的拉取等。拉取過程的日志,可通過”點(diǎn)擊資源 tab-> 找到 ACK 集群->頁面左側(cè)的工作負(fù)載->無狀態(tài)”來查看。部署完成后,進(jìn)入服務(wù)實(shí)例詳情查看使用說明。通過 curl 發(fā)送 HTTP 請(qǐng)求訪問推理服務(wù),修改 content 字段,便可自定義和推理服務(wù)交互的內(nèi)容。

6c65803c-9b30-11ef-a511-92fbcf53809c.png

圖 5. 服務(wù)實(shí)例詳情頁面截圖

(圖片來源于阿里云,如您有任何疑問或需要使用本圖片,請(qǐng)聯(lián)系阿里云)

通過阿里云的云市場(chǎng)獲取

NVIDIA AI Enterprise 使用該方案

NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,正式使用時(shí)須獲得 NVIDIA AI Enterprise 的許可證授權(quán)?,F(xiàn)在,企業(yè)用戶可以通過阿里云云市場(chǎng)獲取 NVIDIA AI Enterprise 來使用該方案。阿里云市場(chǎng)提供了概念驗(yàn)證(PoC)測(cè)試服務(wù)和購買 NVIDIA AI Enterprise 許可證,共兩個(gè)下單頁面。

PoC 測(cè)試服務(wù)

提供 90 天 NVIDIA AI Enterprise PoC License,暨 90 天免費(fèi)試用,而使用時(shí)須支付阿里云計(jì)算資源的費(fèi)用。

通過阿里云的云市場(chǎng)購買 NVIDIA AI Enterprise 許可證

該頁面提供的信息僅供參考,用戶需要通過該頁面的“NVIDIA 服務(wù)咨詢”釘釘來溝通采購,最終通過云市場(chǎng)官網(wǎng)推送下單鏈接獲取 NVIDIA AI Enterprise 許可證。

總結(jié)

本文介紹了通過阿里云計(jì)算巢快速部署 NVIDIA NIM 的方案收益和部署方式,該方案充分利用了 NIM 的安全與高性能的無縫 AI 推理功能,以及計(jì)算巢的軟件一站式上云和交付能力,從而打造極致彈性、高性能、可實(shí)時(shí)觀測(cè)的云上 LLM 推理服務(wù)。

作者信息

毛亦姝

NVIDIA 解決方案架構(gòu)師,主要負(fù)責(zé)生成式 AI 模型的訓(xùn)練、推理在云上的落地,多年互聯(lián)網(wǎng)算法工作經(jīng)驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4857

    瀏覽量

    102722
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29846

    瀏覽量

    268146
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46686

    瀏覽量

    237173
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    935

    瀏覽量

    42935

原文標(biāo)題:通過阿里云計(jì)算巢部署 NVIDIA NIM,加速企業(yè)大語言模型 SaaS 化

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【產(chǎn)品活動(dòng)】阿里GPU服務(wù)器年付5折!阿里異構(gòu)計(jì)算助推行業(yè)發(fā)展!

    摘要: 阿里GPU服務(wù)器全力支持AI生態(tài)發(fā)展,進(jìn)一步普惠開發(fā)者紅利,本周將會(huì)推出針對(duì)異構(gòu)計(jì)算GPU實(shí)例GN5年付5折的優(yōu)惠活動(dòng),希望能夠打造良好的AI生態(tài)環(huán)境,幫助更多的人工智能企
    發(fā)表于 12-26 11:22

    一張圖看懂阿里新發(fā)布的物聯(lián)網(wǎng)設(shè)備上神器——HiTSDB + IoT套件

    設(shè)備狀態(tài),快速發(fā)現(xiàn)數(shù)據(jù)價(jià)值等,可以讓更多物聯(lián)網(wǎng)企業(yè)快速擁抱計(jì)算。點(diǎn)此查看原文:http://click.aliyun.com/m/41185/HiTSDB +IoT 套件是
    發(fā)表于 01-29 17:43

    阿里彈性高性能計(jì)算產(chǎn)品商業(yè)化正式發(fā)布

    更新快,可根據(jù)應(yīng)用需求購置最適合的計(jì)算資源配比(如 ECS 實(shí)例)。E-HPC 充分復(fù)用阿里產(chǎn)品,大大提高了數(shù)據(jù)安全性和高可用性。 通過事件驅(qū)動(dòng)的方式連接云端服務(wù),
    發(fā)表于 02-02 16:36

    【深圳云棲大會(huì)】阿里彈性計(jì)算ESSD盤產(chǎn)品全面解析

    摘要: 2018年3月29日,在**深圳云棲**大會(huì)彈性計(jì)算技術(shù)專場(chǎng)上,來自阿里彈性計(jì)算產(chǎn)品專家崆聞做了主題為**《百萬級(jí)別IOPS盤產(chǎn)
    發(fā)表于 04-04 10:19

    AI開發(fā)者福音!阿里推出國內(nèi)首個(gè)基于英偉達(dá)NGC的GPU優(yōu)化容器

    阿里上的NGC容器, 開發(fā)者們可以快速的接入深度學(xué)習(xí)框架,大大縮減了產(chǎn)品開發(fā)以及業(yè)務(wù)部署的時(shí)間;,用戶通過
    發(fā)表于 04-04 14:39

    阿里免費(fèi)使用及手冊(cè)

    自己使用阿里服務(wù)器搭建的一個(gè)個(gè)人知識(shí)分享博客網(wǎng)站,基于網(wǎng)站搭建過程,分享一些經(jīng)驗(yàn)。先對(duì)阿里服務(wù)器大體介紹下,后續(xù)有時(shí)間再分享技術(shù)方面的東西。希望對(duì)大家有用。這是目錄,具體手冊(cè)在附件
    發(fā)表于 05-10 21:17

    阿里專有宿主機(jī)(公測(cè))發(fā)布

    。為了提供遷移的靈活性,阿里提供ECS實(shí)例從共享宿主機(jī)遷移至專有宿主機(jī)的選項(xiàng),同時(shí)也支持ECS實(shí)例從一臺(tái)專有宿主機(jī)遷移至另一臺(tái)專有宿主機(jī)。部署的靈活性能夠給與您更大的部署選擇,降低調(diào)
    發(fā)表于 05-15 10:56

    阿里HPC助力新制造 | 上汽仿真計(jì)算SSCC

    消化負(fù)荷,保障CAE仿真計(jì)算求解業(yè)務(wù)順利運(yùn)作。第五,快速POC 直接在阿里控制臺(tái)操作公共資源開通,分鐘級(jí)交付整個(gè)集群,即可開展測(cè)試。無需
    發(fā)表于 05-31 15:30

    Bazaar:阿里Serverless計(jì)算服務(wù)探秘

    出現(xiàn)。通過將無服務(wù)器計(jì)算的概念嵌入到整個(gè)計(jì)算服務(wù)的整體框架中,無服務(wù)器計(jì)算正式走進(jìn)了
    發(fā)表于 06-08 15:35

    阿里企業(yè)IPv6部署方案

    方便的在阿里部署IPv6公網(wǎng)入口,同時(shí)將實(shí)例后端關(guān)聯(lián)到線下IDC或其他平臺(tái)的服務(wù)器。在阿里
    發(fā)表于 07-09 16:18

    阿里應(yīng)用上邊緣解決方案助力互聯(lián)網(wǎng)All in Cloud

    計(jì)算再次向場(chǎng)景化服務(wù)邁出重要一步。談到阿里對(duì)邊緣計(jì)算的定義及布局,徐剛表示:“未來,阿里除了
    發(fā)表于 10-11 09:58

    阿里展示“到端”整體方案

    MDM9206 中預(yù)集成阿里 Link 物聯(lián)網(wǎng)套件,模組廠商和物聯(lián)網(wǎng)開發(fā)者可以利用 LTE IoT 連接以及運(yùn)行在 LTE 系統(tǒng)級(jí)芯片上的客戶端軟件,實(shí)現(xiàn)解決方案的快速開發(fā)和部署。
    發(fā)表于 07-27 06:30

    NVIDIA NIM 革命性地改變模型部署,將全球數(shù)百萬開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

    部署、數(shù)據(jù)中心或工作站上。借助 NVIDIA NIM,開發(fā)者能夠輕松地為 copilots、聊天機(jī)器人等構(gòu)建生成式 AI 應(yīng)用,所需時(shí)間從
    發(fā)表于 06-03 09:12 ?207次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b> 革命性地改變模型<b class='flag-5'>部署</b>,將全球數(shù)百萬開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

    借助NVIDIA NIM加速AI應(yīng)用部署

    大語言模型(LLM)在企業(yè)組織中的應(yīng)用日益廣泛,許多企業(yè)都將其整合到 AI 應(yīng)用中。雖然從基礎(chǔ)模型著手十分高效,但需要花費(fèi)一定的精力才能將它們整合到生產(chǎn)就緒型環(huán)境中。NVIDIA NIM簡(jiǎn)化了這一過程,使企業(yè)能夠在數(shù)據(jù)中心、、
    的頭像 發(fā)表于 08-23 16:38 ?338次閱讀
    借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b>加速AI應(yīng)用<b class='flag-5'>部署</b>

    NVIDIA NIM助力企業(yè)高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺(tái)集成了 NVIDIA NIM,將允許用戶通過 API 調(diào)用來大規(guī)模地部署大語言模型。
    的頭像 發(fā)表于 10-10 09:49 ?343次閱讀