生成式 AI 的大火,讓 AI 不再是一個(gè)學(xué)術(shù)層面的概念競(jìng)賽,而是能夠有效提升各行各業(yè)的生產(chǎn)力。但是在應(yīng)用開(kāi)發(fā)的層面上,AI 技術(shù)面臨著不少挑戰(zhàn)。尤其是在企業(yè)級(jí) AI 應(yīng)用中,如何將模型部署到生產(chǎn)環(huán)境,如何確保模型部署后的可用性和可靠性,以及如何監(jiān)控和維護(hù)模型的性能等都是開(kāi)發(fā)中需要解決的問(wèn)題以及困難所在,這些問(wèn)題也極大地制約了企業(yè)在開(kāi)發(fā) AI 應(yīng)用上的生產(chǎn)力提升。
NVIDIA AI Enterprise是一款面向企業(yè)級(jí) AI 應(yīng)用的一站式開(kāi)發(fā)平臺(tái),也被視作 NVIDIA AI 加速平臺(tái)的操作系統(tǒng),為 NVIDIA 的加速基礎(chǔ)架構(gòu)提供穩(wěn)定可靠的軟件及開(kāi)發(fā)環(huán)境,借助開(kāi)發(fā)和部署優(yōu)化的云原生和加速 SDK 軟件套件和框架,實(shí)現(xiàn) AI 工作流的快速開(kāi)發(fā)和應(yīng)用部署。
7 月 11 日下午 2 點(diǎn),智東西公開(kāi)課聯(lián)合 NVIDIA 策劃推出「 NVIDIA AI Enterprise 加速 LLM 與推薦系統(tǒng)開(kāi)發(fā)在線研討會(huì)」。研討會(huì)邀請(qǐng)到 NVIDIA 開(kāi)發(fā)者發(fā)展經(jīng)理崔曉楠、NVIDIA 消費(fèi)互聯(lián)網(wǎng)事業(yè)部解決方案團(tuán)隊(duì)高級(jí)機(jī)器學(xué)習(xí)架構(gòu)師張海辰和 NVIDIA 產(chǎn)品經(jīng)理高文雯參與主講。
其中,崔曉楠將以《NVIDIA AI Enterprise 助力并延展大模型 AI 工作流》為主題,分享 NVIDIA AI Enterprise 的最新更新內(nèi)容及特性。之后,張海辰將圍繞主題《基于 NVIDIA NeMo 框架的 LLM 部署實(shí)踐》,著重介紹端到端云原生框架 NVIDIA NeMoTM,以及其是如何支持開(kāi)發(fā)者構(gòu)建、定制以及部署 AI 模型。
最后,來(lái)自 NVIDIA 總部的 Merlin 產(chǎn)品經(jīng)理高文雯,將就主題《利用 NVIDIA Merlin 訓(xùn)練部署高性能推薦系統(tǒng)》,為大家介紹 NVIDIA MerlinTM 是如何助力數(shù)據(jù)科學(xué)家、機(jī)器學(xué)習(xí)工程師和研究院大規(guī)模的構(gòu)建高性能推薦系統(tǒng),從而獲得更好的預(yù)測(cè)、更高的點(diǎn)擊率和更快的系統(tǒng)部署。
NVIDIA AI Enterprise 加速LLM
與推薦系統(tǒng)開(kāi)發(fā)在線研討會(huì)
★
直播時(shí)間
2023 年 7 月 11 日 1400
演講嘉賓&主題
14:00 - 14:20
NVIDIA AI Enterprise 助力
并延展大模型 AI 工作流
針對(duì)大模型等場(chǎng)景,在最新的 NVIDIA AI Enterprise 軟件堆棧中,包含了針對(duì) NeMo Framework 的官方支持。同時(shí),針對(duì)推薦系統(tǒng),語(yǔ)音,視覺(jué)大模型,多模態(tài)等應(yīng)用方向也會(huì)在 NVIDIA AI Enterprise 的堆棧中獲得支持。
在應(yīng)用的部署上,NVIDIA AI Enterprise 支持應(yīng)用的加速再到任意位置的大規(guī)模部署,甚至延展到多云部署的架構(gòu)。本次分享將會(huì)對(duì) NVIDIA AI Enterprise 軟件套件的最新更新進(jìn)行深度講解。
演講嘉賓
崔曉楠
NVIDIA 開(kāi)發(fā)者發(fā)展經(jīng)理
14:20 - 14:40
基于 NVIDIA NeMo 框架
的 LLM 部署實(shí)踐
NVIDIA NeMo 是 NVIDIA AI 平臺(tái)的一部分,是一個(gè)端到端云原生企業(yè)框架,用于構(gòu)建、客戶(hù)化和部署具有數(shù)十億參數(shù)的生成式 AI 模型。
NeMo 框架通過(guò)多 GPU 和多節(jié)點(diǎn)配置,通過(guò) 3D 并行技術(shù)加速訓(xùn)練工作流程,提供多種客戶(hù)化技術(shù)選擇,以及針對(duì)語(yǔ)言和圖像應(yīng)用的大規(guī)模模型的優(yōu)化推理。NeMo 使企業(yè)的生成式 AI 模型開(kāi)發(fā)變得簡(jiǎn)單、經(jīng)濟(jì)、快速。
本次分享會(huì)深度講解 NVIDIA NeMo 框架,以及面向開(kāi)發(fā)者的 LLM 模型構(gòu)建、定制和部署。
演講嘉賓
張海辰
NVIDIA 消費(fèi)互聯(lián)網(wǎng)事業(yè)部解決方案團(tuán)隊(duì)
高級(jí)機(jī)器學(xué)習(xí)架構(gòu)師
14:40 - 15:00
利用 NVIDIA Merlin
訓(xùn)練部署高性能推薦系統(tǒng)
NVIDIA Merlin 是 NVIDIA AI 平臺(tái)的一部分,提供訓(xùn)練和部署推薦模型的解決方案。本次分享將圍繞 Merlin 的上層 API 和底層加速包展開(kāi)。
其中,上層 API 包括 Merlin models 和 Merlin systems 。Merlin models 可以幫助開(kāi)發(fā)者輕松搭建 session-based 以及 transformer 模型,而 Merlin systems 則提供工具搭建端到端的多個(gè) stage 的推薦系統(tǒng)。
底層加速包包括 Distributed-Embeddings (TFDE) 和 Hierarchical Parameter Server (HPS)。TFDE 可以通過(guò) 3 行 TF 的 API 輕松實(shí)現(xiàn)多機(jī)多卡的大模型同步訓(xùn)練,HPS 則可以通過(guò) GPU cache 和多級(jí)存儲(chǔ)加速大模型的部署。
演講嘉賓
高文雯
NVIDIA 產(chǎn)品經(jīng)理
掃描二維碼即刻報(bào)名
相關(guān)資料
掃描上方二維碼試用
NVIDIA AI Enterprise
掃描上方二維碼試用 NVIDIA Merlin
掃描上方二維碼立即下載
NVIDIA NeMo Framework
點(diǎn)擊“閱讀原文”,或掃描下方海報(bào)二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領(lǐng)域的最新進(jìn)展!
原文標(biāo)題:NVIDIA AI Enterprise 加速 LLM 與推薦系統(tǒng)開(kāi)發(fā)在線研討會(huì)
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3721瀏覽量
90693 -
LLM
+關(guān)注
關(guān)注
0文章
264瀏覽量
297
原文標(biāo)題:NVIDIA AI Enterprise 加速 LLM 與推薦系統(tǒng)開(kāi)發(fā)在線研討會(huì)
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論