NVIDIA發(fā)布Triton 推理服務(wù)器重大更新，全球超過25000余家公司部署NVIDIA AI推理平臺

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等全球行業(yè)領(lǐng)導(dǎo)者都在使用該平臺。

加利福尼亞州圣克拉拉市 – 2021 年 11 月 9 日 – NVIDIA今日宣布其AI推理平臺的重大更新，目前Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等25000多家客戶都在使用該平臺。

這些更新包括開源NVIDIA Triton推理服務(wù)器軟件的新功能，該軟件為所有AI模型和框架提供跨平臺推理；同時也包含對NVIDIA TensorRT的更新，該軟件優(yōu)化AI模型并為NVIDIA GPU上的高性能推理提供運(yùn)行時優(yōu)化。

NVIDIA還推出了NVIDIA A2 Tensor Core GPU，這是一款用于邊緣AI推理的低功耗、小尺寸的加速器，其推理性能比CPU高出20倍。

NVIDIA副總裁兼加速計算總經(jīng)理Ian Buck表示：“NVIDIA AI推理平臺正在推動各行各業(yè)的突破，包括醫(yī)療健康、金融服務(wù)、零售、制造和超級計算。無論是提供更智能的建議，發(fā)揮對話式AI的力量，還是推進(jìn)科學(xué)發(fā)現(xiàn)，NVIDIA推理平臺都能以簡單易用的方式提供低延遲、高吞吐及多種性能組合的服務(wù)，為全球關(guān)鍵的AI新應(yīng)用賦能?！?/p>

關(guān)鍵的軟件優(yōu)化

Triton 推理服務(wù)器的主要更新包括：

● Triton 模型分析器 – 這款新工具可以自動化地從數(shù)百種組合中為 AI 模型選擇最佳配置，以實(shí)現(xiàn)最優(yōu)性能，同時確保應(yīng)用程序所需的服務(wù)質(zhì)量。

● 多 GPU 多節(jié)點(diǎn)功能 – 這一新功能支持基于Transformer的大規(guī)模語言模型，例如 Megatron 530B，在多個GPU和服務(wù)器節(jié)點(diǎn)上運(yùn)行并提供實(shí)時推理性能，而不是在單個GPU上運(yùn)行。

● RAPIDS FIL – 這一針對隨機(jī)森林和梯度提升決策樹模型 GPU 或 CPU 推理的新后端為開發(fā)者使用 Triton 進(jìn)行深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)提供了一個統(tǒng)一的部署引擎。

● Amazon SageMaker 集成 – 這種無縫集成讓客戶能夠在 SageMaker（AWS 完全托管的 AI 服務(wù)）中使用 Triton 輕松部署多框架的模型，并實(shí)現(xiàn)高推理性能。

● 支持 Arm CPU – 除了 NVIDIA GPU 和 x86 CPU 外，Triton 后端現(xiàn)在還支持在 Arm CPU 上優(yōu)化 AI 推理工作負(fù)載。

Triton 支持在云、數(shù)據(jù)中心、企業(yè)邊緣和嵌入式設(shè)備等環(huán)境中對 GPU 和 CPU 進(jìn)行 AI 推理，并與 AWS、Google Cloud、Microsoft Azure、阿里云PAI-EAS 等平臺集成。此外，NVIDIA AI Enterprise 也集成了 Triton。

NVIDIA AI Enterprise 是一款經(jīng) NVIDIA 優(yōu)化、認(rèn)證和支持的用于開發(fā)和部署 AI 的端到端軟件套件，客戶可利用它在本地數(shù)據(jù)中心和私有云的主流服務(wù)器上運(yùn)行 AI 工作負(fù)載。

除了 Triton 外，TensorRT 現(xiàn)在還與TensorFlow和PyTorch集成，只需一行代碼就能提供比框架內(nèi)推理快3倍的性能。這使得開發(fā)人員采用極為簡化的工作流程就可以體會TensorRT的強(qiáng)大功能。

NVIDIA TensorRT 8.2 是SDK的最新版本，可加速高性能的深度學(xué)習(xí)推理，在云端、本地或邊緣提供高吞吐和低延遲。有了最新的性能優(yōu)化，數(shù)十億個參數(shù)的語言模型可實(shí)現(xiàn)實(shí)時運(yùn)行。

行業(yè)領(lǐng)導(dǎo)者支持 NVIDIA AI 平臺推理

全球眾多行業(yè)領(lǐng)導(dǎo)者都正在使用 NVIDIA AI 推理平臺改進(jìn)業(yè)務(wù)運(yùn)營并為客戶提供新的AI賦能服務(wù)。

Microsoft Azure 認(rèn)知服務(wù)為高品質(zhì) AI 模型提供基于云的 API，以創(chuàng)建智能應(yīng)用程序。他們正在使用Triton 運(yùn)行語音轉(zhuǎn)文本模型，為 Microsoft Teams 用戶提供準(zhǔn)確的實(shí)時字幕和轉(zhuǎn)錄。

“Microsoft Teams 是全球溝通和協(xié)作的重要工具，每月有近 2.5 億活躍用戶，”Microsoft 團(tuán)隊(duì)呼叫、會議和設(shè)備部首席 PM 經(jīng)理 Shalendra Chhabra 表示。“這樣的 AI 模型極其復(fù)雜，需要數(shù)千萬個神經(jīng)網(wǎng)絡(luò)參數(shù)才能在幾十種不同的語言中提供準(zhǔn)確的結(jié)果。模型越大，就越難以經(jīng)濟(jì)高效地實(shí)時運(yùn)行。Microsoft Azure 認(rèn)知服務(wù)上的 NVIDIA GPU 和 Triton 推理服務(wù)器使用 28 種語言和方言，通過 AI 近乎實(shí)時地幫助改進(jìn)實(shí)時字幕和轉(zhuǎn)錄功能?！盡icrosoft Azure 認(rèn)知服務(wù)上的 NVIDIA GPU 和 Triton 推理服務(wù)器，結(jié)合AI模型，幫助提升了涉及28 種語言和方言的實(shí)時字幕和轉(zhuǎn)錄功能的成本效益。

Samsung Medison 是三星電子旗下一家全球醫(yī)療設(shè)備公司。該公司正利用 NVIDIA TensorRT 通過智能輔助功能來為其超聲波系統(tǒng)提供增強(qiáng)的更優(yōu)質(zhì)的醫(yī)療影像。Samsung Medison 致力于通過提高患者的舒適度、減少掃描時間、簡化工作流程并最終提高系統(tǒng)吞吐量來改善患者和醫(yī)療健康領(lǐng)域?qū)I(yè)人員的生活。

“在新款 V8 高端超聲波系統(tǒng)中應(yīng)用 NVIDIA TensorRT 后，我們能夠在查看和診斷圖像時更好地為醫(yī)學(xué)專家提供支持，”Samsung Medison 副總裁、客戶體驗(yàn)團(tuán)隊(duì)主管 Won-Chul Bang 表示?！拔覀冋诜e極地將基于 AI 的技術(shù)引入我們的超聲波系統(tǒng)，以便為醫(yī)療專業(yè)人員提供更好的支持，使他們能夠?qū)Ｗ⒂诨颊咴\斷和治療等更重要的領(lǐng)域?！?/p>

Siemens Energy是一家擁有領(lǐng)先能源技術(shù)解決方案的能源專營公司，該公司正利用 Triton 通過 AI 來幫助其發(fā)電廠客戶管理相關(guān)設(shè)施。

“高度復(fù)雜的發(fā)電廠通常會配備攝像頭和傳感器，但采用的卻是傳統(tǒng)軟件系統(tǒng)，NVIDIA Triton 推理服務(wù)器出色的靈活性能夠讓這些發(fā)電廠加入自主工業(yè)革命，” Siemens Energy自主運(yùn)營部投資組合經(jīng)理 Arik Ott 表示。

Snap是一家全球性攝影軟件和社交媒體公司，其主要產(chǎn)品和服務(wù)包括Snapchat、Spectacles和Bitmoji等。Snap正在使用NVIDIA技術(shù)來提高商業(yè)變現(xiàn)能力和降低成本。

“Snap使用NVIDIA GPU和TensorRT將機(jī)器學(xué)習(xí)推理的成本效率提高了50%，并將服務(wù)延遲降低了2倍，“Snap公司策劃與商業(yè)變現(xiàn)部門工程副總裁Nima Khajehnouri表示?！边@為我們提供了計算資源，以實(shí)踐和部署更大型、更準(zhǔn)確的廣告和內(nèi)容排名模型。“

NVIDIA面向推理的 AI 平臺包括了新的 NVIDIA 認(rèn)證系統(tǒng)，全新A2 GPU

NVIDIA 認(rèn)證系統(tǒng)可以幫助客戶在高性能、經(jīng)濟(jì)高效且可擴(kuò)展的基礎(chǔ)設(shè)施上為各種現(xiàn)代 AI 應(yīng)用識別、獲取和部署系統(tǒng)，該認(rèn)證系統(tǒng)現(xiàn)在包含兩個新的邊緣AI類別。

擴(kuò)展的類別允許 NVIDIA 系統(tǒng)的合作伙伴為客戶提供完整系列的由基于 NVIDIA Ampere 架構(gòu)的 GPU 支持的 NVIDIA 認(rèn)證系統(tǒng)，來處理各種實(shí)際工作負(fù)載。新的 NVIDIA A2 GPU 也包含在內(nèi)，它是一個入門級、低功耗的緊湊型加速器，適用于邊緣服務(wù)器中的推理和邊緣 AI。 NVIDIA A2與適用于主流企業(yè)服務(wù)器的 NVIDIA A30 、適用高性能 AI 服務(wù)器的 NVIDIA A100 一起，為邊緣、數(shù)據(jù)中心和云端的 AI 推理提供了完整的方案。

Atos、戴爾科技、技嘉、慧與、浪潮、聯(lián)想和 Supermicro 等全球領(lǐng)先的企業(yè)系統(tǒng)供應(yīng)商，其AI系統(tǒng)產(chǎn)品線均支持在 NVIDIA 認(rèn)證系統(tǒng)上使用 NVIDIA AI Enterprise。

其他系統(tǒng)提供商，如研華科技、ASRock Rack、華碩、寧暢、新華三和 QCT 也為各種工作負(fù)載提供了 NVIDIA 認(rèn)證系統(tǒng)。包括研華科技、技嘉和聯(lián)想在內(nèi)的領(lǐng)先供應(yīng)商將很快推出首款通過新邊緣類別認(rèn)證的 NVIDIA 認(rèn)證系統(tǒng)。

供貨情況

Triton 通過 NVIDIA NGC 目錄提供。NVIDIA NGC是針對 GPU 優(yōu)化的 AI 軟件中心，包括框架、工具包、預(yù)訓(xùn)練模型和 Jupyter Notebooks。Triton源代碼可從 Triton GitHub 資源庫獲取。

NVIDIA 開發(fā)者計劃成員可通過 TensorRT 頁面獲取 TensorRT。最新版本的插件、解析器和示例也以開源形式提供，可從 TensorRT GitHub 資源庫獲取。

客戶可以通過今日獨(dú)家發(fā)布的 NVIDIA LaunchPad中的全球精選實(shí)驗(yàn)室，在 NVIDIA AI Enterprise 軟件套件中體驗(yàn) NVIDIA Triton。

NVIDIA AI Enterprise 軟件套件可通過全球 NVIDIA 渠道合作伙伴獲取，包括 Atea、Axians、Carahsoft Technology Corp.、Computacenter、Insight Enterprises、Presidio、Sirius、SoftServe、SVA System Vertrieb Alexander GmbH、TD SYNNEX、Trace3 和 WWT。

閱讀全文

cpu(206166) cpu(206166)
NVIDIA(101461) NVIDIA(101461)
gpu(126255) gpu(126255)
服務(wù)器(82172) 服務(wù)器(82172)
AI(263628) AI(263628)

NVIDIA擴(kuò)大AI推理性能領(lǐng)先優(yōu)勢，首次在Arm服務(wù)器上取得佳績

最新MLPerf基準(zhǔn)測試表明，NVIDIA已將其在AI推理性能和能效方面的高標(biāo)準(zhǔn)擴(kuò)展到Arm以及x86計算機(jī)。

2021-09-23 14:18:06

2518

MLPerf V2.0推理結(jié)果放榜，NVIDIA表現(xiàn)搶眼

不久前，AI性能基準(zhǔn)評測平臺MLPerf公布了2022年首次推理（Inference v2.0）測試成績，NVIDIA的AI平臺表現(xiàn)依然搶眼。

2022-04-15 22:12:00

2738

NVIDIA 如何應(yīng)對會話式AI帶來的推理挑戰(zhàn)？

NVIDIA Turing GPU和Xavier 芯片系統(tǒng)在首個獨(dú)立AI推理基準(zhǔn)測試 ——MLPerf Inference 0.5中取得第一名。

2019-11-08 16:53:29

5054

NVIDIA打破AI推理性能記錄

　NVIDIA憑借A100進(jìn)一步擴(kuò)大了在MLPerf基準(zhǔn)測試中的領(lǐng)先優(yōu)勢，實(shí)現(xiàn)了比CPU快237倍的AI推理性能，助力企業(yè)將AI研究轉(zhuǎn)化為生產(chǎn)力。

2020-10-22 14:07:58

714

NVIDIA 借助超大規(guī)模 AI 語言模型為全球企業(yè)賦能

NVIDIA NeMo Megatron 框架; 可定制的大規(guī)模語言模型 Megatron 530B；多GPU、多節(jié)點(diǎn) Triton推理服務(wù)器助力基于語言的AI開發(fā)和部署，推動行業(yè)和科學(xué)發(fā)展。

2021-11-10 14:22:52

752

40/5000 XenApp 7.14.1和NVIDIA M10許可

Windows Server 2016許可證服務(wù)器上獲取并安裝了環(huán)境的NVIDIA Virtual Applications許可證。選擇虛擬應(yīng)用程序許可證的決定基于使用XenApp（已發(fā)布的應(yīng)用程序/桌面

2018-09-25 17:32:49

Ai 部署的臨界考慮電子指南

雖然GPU解決方案對訓(xùn)練，AI部署需要更多。預(yù)計到2020年代中期，人工智能行業(yè)將增長到200億美元，其中大部分增長是人工智能推理。英特爾Xeon可擴(kuò)展處理器約占運(yùn)行AI推理的處理器單元的70

2023-08-04 07:25:00

NVIDIA Jetson介紹

首發(fā)極術(shù)社區(qū)如對Arm相關(guān)技術(shù)感興趣，歡迎私信 aijishu20加入技術(shù)微信群。分享內(nèi)容NVIDIA Jetson是嵌入式計算平臺，具有低功耗、高性能和小體積等特點(diǎn)，可加速各行業(yè)的AI應(yīng)用落地

2021-12-14 08:05:01

NVIDIA 在首個AI推理基準(zhǔn)測試中大放異彩

此次測試的十二家公司中，只有NVIDIA AI平臺提交了 MLPerf的全部五項(xiàng)推理測試成績（MLPerf是一個于2018年5月成立的行業(yè)基準(zhǔn)測試小組）。這證明了NVIDIA CUDA-X AI

2019-11-08 19:44:51

Nvidia Tesla與Nvidia GRID vGPU購買SUMS服務(wù)是否正確理解了所有內(nèi)容

我們計劃使用2臺Nvidia Tesla M60顯卡進(jìn)行遠(yuǎn)程管理，并可選擇進(jìn)一步擴(kuò)展，使用HP Apollo 2600服務(wù)器。據(jù)我了解，要部署遠(yuǎn)程虛擬管理，我們需要Nvidia GRID程序

2018-09-13 17:08:32

nVidia許可服務(wù)器存在問題

客戶在其環(huán)境中擁有nVidia Licensing服務(wù)器（vSphere Enterprise Plus和Horizo??n 7）。許可證文件在nVidia企業(yè)門戶中生成，并且許可證服務(wù)器中安裝了2

2018-09-20 11:41:44

可以安裝NVIDIA許可證服務(wù)器嗎？

嗨，我想知道，如果可以安裝NVIDIA許可證服務(wù)器嗎？我沒有找到任何關(guān)于此的明確文件。 setup.exe也沒有我能夠使用的任何清晰的開關(guān)/參數(shù)。謝謝，延以上來自于谷歌翻譯以下為原文Hi, I

2018-09-18 16:18:10

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理

2020-12-30 07:28:28

如何在RK3399上搭建Tengine AI推理框架呢

Tengine是什么？如何在RK3399這一 Arm64 平臺上搭建 Tengine AI 推理框架，并運(yùn)行圖像識別相關(guān)應(yīng)用？

2022-03-07 07:53:43

如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢

Tengine是什么呢？如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢？

2022-03-04 12:31:35

深度剖析OpenHarmony AI調(diào)度管理與推理接口

1 簡介AI任務(wù)管理與統(tǒng)一的推理能力提供了接口的統(tǒng)一標(biāo)準(zhǔn)系統(tǒng)上CPU提供了AI任務(wù)調(diào)度管理的能力，對AI的能力進(jìn)行了開放的推理和推理，同時，提供了一個不同的生命周期框架層級的應(yīng)用程序。推理接口

2022-03-25 11:15:36

深度學(xué)習(xí)推理和計算-通用AI核心

商業(yè)發(fā)行之前就已經(jīng)過時了。算法明天需要對架構(gòu)、內(nèi)存/數(shù)據(jù)進(jìn)行徹底改革資源和能力。推理的夢幻建筑重新定義重寫在計算和交付突破性的人工智能加速和靈活的計算能力超越了服務(wù)器級CPU和比GPU/ASIC通用

2020-11-01 09:28:57

NVIDIA深度學(xué)習(xí)平臺

為幫助數(shù)據(jù)科學(xué)家和開發(fā)人員充分利用深度學(xué)習(xí)領(lǐng)域中的機(jī)遇，NVIDIA為其深度學(xué)習(xí)軟件平臺發(fā)布了三項(xiàng)重大更新，它們分別是NVIDIA DIGITS 4、CUDA深度神經(jīng)網(wǎng)絡(luò)庫(cuDNN)5.1和全新的GPU推理引擎(GIE)?！　? NVIDIA深度學(xué)習(xí)軟件平臺推三項(xiàng)重大更新

2016-08-06 15:00:26

1806

NVIDIA在最新AI推理基準(zhǔn)測試中大獲成功

MLPerf Inference 0.5是業(yè)內(nèi)首個獨(dú)立AI推理基準(zhǔn)套件，其測試結(jié)果證明了NVIDIA Turing數(shù)據(jù)中心GPU以及 NVIDIA Xavier 邊緣計算芯片系統(tǒng)的性能。

2019-11-29 14:45:02

2696

NVIDIA推出一款突破性的推理軟件可以實(shí)現(xiàn)會話式AI應(yīng)用

2019年12月18日— — NVIDIA于今日發(fā)布一款突破性的推理軟件。借助于該軟件，全球各地的開發(fā)者都可以實(shí)現(xiàn)會話式AI應(yīng)用，大幅減少推理延遲。而此前，巨大的推理延遲一直都是實(shí)現(xiàn)真正交互式互動的一大阻礙。

2019-12-19 10:06:51

1045

NVIDIA發(fā)布了首款基于NVIDIA Ampere架構(gòu)的GPU ——NVIDIA A100 GPU

了全球超強(qiáng)大的AI和HPC服務(wù)器平臺HGX A100，最大可組成AI算力達(dá)10 PFLOPS的超大型服務(wù)器。

2020-06-02 17:11:45

3709

NVIDIA和多家全球領(lǐng)先的服務(wù)器制造商發(fā)布多款內(nèi)置NVIDIA A100的系統(tǒng)

NVIDIA和多家全球領(lǐng)先的服務(wù)器制造商于今日發(fā)布多款內(nèi)置NVIDIA A100的系統(tǒng)。這些系統(tǒng)具有多種不同的設(shè)計和配置，可應(yīng)對AI、數(shù)據(jù)科學(xué)和科學(xué)計算領(lǐng)域最復(fù)雜的挑戰(zhàn)。

2020-06-24 16:04:33

2585

NVIDIA GPU加速AI推理洞察，推動跨行業(yè)創(chuàng)新

這些AI模型被運(yùn)行在裝載了V100Tensor Core GPU的NVIDIADGX系統(tǒng)上的數(shù)據(jù)中心服務(wù)器上，以及裝載了JetsonAGX Xavier模塊的邊緣計算網(wǎng)絡(luò)中。該硬件運(yùn)行NVIDIA

2020-07-02 15:00:54

1819

NVIDIA A100 GPU推理性能237倍碾壓CPU

）的12個提交者增加了近一倍。結(jié)果顯示，今年5月NVIDIA（Nvidia）發(fā)布的安培（Ampere）架構(gòu)A100 Tensor Core GPU，在云端推理的基準(zhǔn)測試性能是最先進(jìn)Intel CPU

2020-10-23 17:40:02

3929

NVIDIA公布通過NVIDIA認(rèn)證系統(tǒng)測試的全球首批加速服務(wù)器企業(yè) AI 使用量倍增

芯東西1月27日報道，剛剛，NVIDIA公布通過NVIDIA認(rèn)證系統(tǒng)測試的全球首批加速服務(wù)器，它們是目前業(yè)內(nèi)唯一通過現(xiàn)代工作負(fù)載測試的服務(wù)器，可用于機(jī)器學(xué)習(xí)和分析。通過NVIDIA認(rèn)證系統(tǒng)的產(chǎn)品

2021-01-27 16:25:59

1716

NVIDIA發(fā)布面向企業(yè)的即時AI基礎(chǔ)設(shè)施

領(lǐng)導(dǎo)者 Equinix 將首先加入 AI LaunchPad 程序，其將通過 Platform Equinix 平臺向全球提供由 NVIDIA 支持的混合云解決方案。Equinix 基礎(chǔ)設(shè)施在幾分鐘內(nèi)就能部

2021-06-24 17:35:50

2095

NVIDIA在推理方面取得突破，從云端到邊緣實(shí)現(xiàn)更智能、更具互動性的對話式AI

NVIDIA于今日發(fā)布公司第八代AI軟件TensorRT? 8。該軟件將語言查詢推理時間縮短了一半，使開發(fā)者能夠從云端到邊緣構(gòu)建全球最佳性能的搜索引擎、廣告推薦和聊天機(jī)器人。

2021-07-21 15:07:57

3208

NVIDIA技術(shù)助力線上大模型推理

自然語言理解、匹配排序等等，這些模型的訓(xùn)練和推理都大量依賴于NVIDIA GPU，尤其在推理方面，NVIDIA GPU及相應(yīng)的解決方案都滿足了業(yè)務(wù)所需的延遲和吞吐要求。微信搜索業(yè)務(wù)需要更高效平臺微信搜索業(yè)務(wù)由多個子模塊構(gòu)成，包括查

2021-10-28 15:28:12

1551

NVIDIA為全球企業(yè)開發(fā)和部署大型語言模型打開一扇新的大門

NVIDIA NeMo Megatron 框架; 可定制的大規(guī)模語言模型Megatron 530B；多GPU、多節(jié)點(diǎn) Triton推理服務(wù)器助力基于語言的AI開發(fā)和部署，推動行業(yè)和科學(xué)發(fā)展

2021-11-12 14:30:07

1327

NVIDIA宣布其AI推理平臺的重大更新

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等25000多家客戶都在使用該平臺。這些更新包括開源NVIDIA Triton推理服務(wù)器

2021-11-12 14:42:53

1684

NVIDIA邊緣網(wǎng)絡(luò)技術(shù)加速企業(yè)AI發(fā)展

平臺），NVIDIA和Mavenir 正在實(shí)現(xiàn)智能邊緣網(wǎng)絡(luò)構(gòu)建方式的創(chuàng)新。企業(yè)和電信公司能夠利用配備聚合加速器的邊緣服務(wù)器快速部署各種AI 技術(shù)，例如同時部署NVIDIA Metropolis智

2021-11-15 14:25:56

2108

NVIDIA宣布擴(kuò)大NVIDIA LaunchPad計劃在全球的覆蓋區(qū)域

。符合條件的企業(yè)可以體驗(yàn)用于AI開發(fā)的NVIDIA Base Command云服務(wù)、用于AI部署的NVIDIA F

2021-11-15 15:14:50

1546

NVIDIA Triton 推理服務(wù)器助力西門子提升工業(yè)效率

西門子能源公司正在發(fā)揮 NVIDIA Triton 推理服務(wù)器的強(qiáng)大力量，利用 AI 協(xié)助解決全球發(fā)電廠在預(yù)測性服務(wù)管理方面的擔(dān)憂。

2021-11-16 16:25:31

3490

NVIDIA Triton開源推理服務(wù)軟件三大功能推動效率提升

Microsoft Teams借助AI生成的實(shí)時字幕和轉(zhuǎn)錄功能，幫助全球學(xué)生和職場人士順利進(jìn)行在線會議。用于訓(xùn)練的NVIDIA AI計算技術(shù)和用于推理語音識別模型的NVIDIA Triton推理服務(wù)器進(jìn)一步提升了這兩個功能。

2022-01-04 14:20:11

1407

NVIDIA Triton推理服務(wù)器幫助Teams使用認(rèn)知服務(wù)優(yōu)化語音識別模型

2022-01-04 17:45:12

1472

NVIDIA AI 大力推進(jìn)語音、推薦系統(tǒng)和超大規(guī)模推理領(lǐng)域的發(fā)展

NVIDIA AI 可供開發(fā)者免費(fèi)使用，包括用于語音 AI 的 NVIDIA Riva 和用于智能推薦系統(tǒng)的 NVIDIA Merlin?，這兩款軟件均已正式全面上線。而整個軟件套件也進(jìn)行了更新，包括 NVIDIA Triton、NeMo、Maxine 和 TAO 工具包等工具。

2022-03-23 14:27:08

1058

GTC2022大會黃仁勛：NVIDIA Triton是AI部署的“中央車站”

GTC2022大會黃仁勛：NVIDIA Triton是AI部署的“中央車站”，支持在每一代NVIDIA GPU、x86和ARM CPU上部署模型。

2022-03-23 16:23:04

1259

NVIDIA助力微軟將AI Transformer模型投入生產(chǎn)用途

Microsoft 的目標(biāo)是，通過結(jié)合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件，率先將一系列強(qiáng)大的 AI Transformer 模型投入生產(chǎn)用途。

2022-03-28 09:43:38

1029

NVIDIA加速VIVO推薦系統(tǒng)部署艾默生公布2022第一季度業(yè)績

推薦系統(tǒng)的大規(guī)模部署帶來了諸多工程化挑戰(zhàn)，借助NVIDIA TensorRT， Triton and MPS （Multi-Process Service）及單張T4 GPU推理卡，其性能優(yōu)于約6臺以上的78核CPU服務(wù)器，成本方面也降低75%。

2022-03-29 15:25:05

1106

NVIDIA TensorRT 8.2將推理速度提高6倍

　　TensorRT 是一款高性能的深度學(xué)習(xí)推理優(yōu)化器和運(yùn)行時，為人工智能應(yīng)用程序提供低延遲、高吞吐量推理。 TensorRT 用于醫(yī)療、汽車、制造、互聯(lián)網(wǎng)/電信服務(wù)、金融服務(wù)和能源等多個行業(yè)。

2022-03-31 17:10:29

1469

NVIDIA發(fā)布Riva語音AI和大型LLM軟件

　　它包括Megatron方面的進(jìn)步，這是一個由 NVIDIA 研究人員領(lǐng)導(dǎo)的開源項(xiàng)目，旨在開發(fā)有效培訓(xùn)法學(xué)碩士的技術(shù)。企業(yè)可以使用 NeMo Megatron 定制 LLM ，如 Megatron 530B ，并使用 NVIDIA Triton 推理服務(wù)器跨多個 GPU 和節(jié)點(diǎn)進(jìn)行部署。

2022-04-01 16:27:36

10987

Microsoft使用NVIDIA Triton加速AI Transformer模型應(yīng)用

Microsoft 的目標(biāo)是，通過結(jié)合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件，率先將一系列強(qiáng)大的 AI Transformer 模型投入生產(chǎn)用途。

2022-04-02 13:04:21

1456

使用MIG和Kubernetes部署Triton推理服務(wù)器

　　NVIDIA Triton 推理服務(wù)器是一款開源人工智能模型服務(wù)軟件，可簡化在生產(chǎn)中大規(guī)模部署經(jīng)過培訓(xùn)的人工智能模型。對于服務(wù)器管理的任何模型，客戶端可以遠(yuǎn)程向提供的 HTTP 或 gRPC 端點(diǎn)發(fā)送推斷請求。

2022-04-07 09:54:05

2902

使用Bottlerocket和Amazon EC2部署AI模型

　　對于 AWS 上的人工智能推理部署，您可以利用 NVIDIA Triton 推理服務(wù)器 。使用開源推理服務(wù)軟件在任何 CPU 或 CPU 基礎(chǔ)設(shè)施上部署來自多個框架的經(jīng)過培訓(xùn)的人工智能模型，包括 TensorFlow 、 TensorRT 、 PyTorch 、 ONNX 、 XGBoost 和 Python 。

2022-04-08 15:37:28

881

NVIDIA推理平臺和全棧方法提供最佳性能

現(xiàn)在，您和開發(fā)人員社區(qū)的其他成員都可以使用這些成果，主要是以開源軟件的形式。此外， TensorRT 和 Triton 推理服務(wù)器可從?NVIDIA NGC?免費(fèi)獲得，以及預(yù)訓(xùn)練模型、深度學(xué)習(xí)框架

2022-04-08 16:31:31

931

NVIDIA Triton推理服務(wù)器簡化人工智能推理

GKE 的 Triton 推理服務(wù)器應(yīng)用程序是一個 helm chart 部署程序，可自動安裝和配置 Triton ，以便在具有 NVIDIA GPU 節(jié)點(diǎn)池的 GKE 集群上使用，包括

2022-04-08 16:43:03

1855

NVIDIA Triton助力騰訊構(gòu)建高性能推理服務(wù)

通過將 Triton 編譯為動態(tài)鏈接庫，可以方便地鏈入公司內(nèi)部框架，對接公司的平臺治理體系。符合 C 語言規(guī)范的 API 也極大降低了用戶的接入成本。

2022-04-10 10:08:31

1104

如何使用Triton進(jìn)行高效的推理部署

一個完整的醫(yī)療影像推理流程一般包含數(shù)據(jù)的前處理、AI 推理以及數(shù)據(jù)后處理這幾部分。

2022-04-10 15:06:09

2396

用NVIDIA TSPP和Triton推理服務(wù)器加速模型推理

NVIDIA 時間序列預(yù)測平臺提供從訓(xùn)練到時間序列模型的推斷的端到端 GPU 加速。平臺中包含的參考示例經(jīng)過優(yōu)化和認(rèn)證，可在 NVIDIA DGX A100 和 NVIDIA 認(rèn)證系統(tǒng)上運(yùn)行。

2022-04-10 17:44:04

1762

如何使用FIL后端部署XGBOOST模型

　　使用 FIL 后端，NVIDIA Triton 推理服務(wù)器現(xiàn)在提供了一個高度優(yōu)化的實(shí)時服務(wù)的森林模型，無論是在他們自己或旁邊的深度學(xué)習(xí)模型。

2022-04-11 14:35:54

1138

NVIDIA TensorRT助力打造AI計算機(jī)視覺算法推理平臺

“在使用 NVIDIA TensorRT和NVIDIA T4 GPU對平臺賦能后，“極星”推理平臺的算法推理效率得到了進(jìn)一步的提升，更好地支持速接入各類算法、數(shù)據(jù)及智能設(shè)備，實(shí)現(xiàn)AI自閉環(huán)能力，并通過應(yīng)用服務(wù)和標(biāo)準(zhǔn)化接口，幫助終端客戶低成本實(shí)現(xiàn)AI與業(yè)務(wù)的結(jié)合，快速構(gòu)建智能應(yīng)用。

2022-04-13 14:49:19

862

使用NVIDIA Triton推理服務(wù)器簡化邊緣AI模型部署

　　NVIDIA Triton 有助于在每個數(shù)據(jù)中心、云和嵌入式設(shè)備中實(shí)現(xiàn)標(biāo)準(zhǔn)化的可擴(kuò)展生產(chǎn) AI 。它支持多個框架，在 GPU 和 DLA 等多個計算引擎上運(yùn)行模型，處理不同類型的推理查詢。通過與 NVIDIA JetPack 的集成， NVIDIA Triton 可用于嵌入式應(yīng)用。

2022-04-18 15:40:02

2306

利用NVIDIA Triton推理服務(wù)器加速語音識別的速度

網(wǎng)易互娛 AI Lab 的研發(fā)人員，基于 Wenet 語音識別工具進(jìn)行優(yōu)化和創(chuàng)新，利用 NVIDIA Triton 推理服務(wù)器的 GPU Batch Inference 機(jī)制加速了語音識別的速度，并且降低了成本。

2022-05-13 10:40:19

1481

NVIDIA Triton助力騰訊PCG加速在線推理

　　借助NVIDIA Triton 推理框架，配合 DALI/FIL/Python 等Backend，以及 TensorRT，整體推理服務(wù)的吞吐能力最大提升 6 倍，延遲最大降低 40%。

2022-05-20 15:25:10

2131

使用NVIDIA Triton模型分析器確定最佳AI模型服務(wù)配置

在這篇文章中，我們使用預(yù)訓(xùn)練 BERT Hugging Face 的大型模型，采用 PyTorch 格式。 NVIDIA Triton 推理服務(wù)器可以使用其LibTorch后端為TorchScript模型提供服務(wù)，也可以使用其 Python 后端為純 PyTorch 模型提供服務(wù)。

2022-05-30 09:38:08

2378

實(shí)現(xiàn)智能制造的工業(yè)推理管道

　　使用 NVIDIA Triton ?聲波風(fēng)廓線儀，愛夏可在數(shù)據(jù)中心使用高性能 GPU 或在靠近數(shù)據(jù)的邊緣使用 Jetson 邊緣 AI 平臺部署預(yù)訓(xùn)練模型的優(yōu)化版本。

2022-05-30 09:46:57

609

基于NVIDIA Triton的AI模型高效部署實(shí)踐

NVIDIA Triton 推理服務(wù)器(以前稱為 TensorRT 推理服務(wù)器)是一款開源軟件，可簡化深度學(xué)習(xí)模型在生產(chǎn)環(huán)境中的部署。借助 Triton 推理服務(wù)器，Devops 和 MLops

2022-06-28 15:49:47

1293

NVIDIA助力阿里巴巴天貓精靈大幅提升服務(wù)運(yùn)行效率

NVIDIA Triton 推理服務(wù)器在 NVIDIA T4 GPU 上進(jìn)行高效部署，幫助阿里巴巴天貓精靈流式 TTS 服務(wù)將吞吐提升 50%，首包延時降低 35%，大幅提升服務(wù)運(yùn)行效率，提升資源利用率。

2022-07-14 10:05:00

817

NVIDIA Triton的概念、特性及主要功能

NVIDIA Triton 推理服務(wù)器是 NVIDIA AI 平臺的一部分，它是一款開源推理服務(wù)軟件，可助力標(biāo)準(zhǔn)化模型的部署和執(zhí)行，并在生產(chǎn)環(huán)境中提供快速且可擴(kuò)展的 AI。

2022-07-18 10:11:26

2525

騰訊云與NVIDIA仍持續(xù)為AI推理加速進(jìn)行合作

騰訊云計算加速套件 TACO Kit 包含 TACO Train 和 TACO Infer 兩個 AI 組件?；?GPU 異構(gòu)計算平臺針對業(yè)界 AI 訓(xùn)練和推理任務(wù)進(jìn)行了全方位的加速優(yōu)化。TACO

2022-08-31 09:24:07

1235

騰訊云TI平臺利用NVIDIA Triton推理服務(wù)器構(gòu)造不同AI應(yīng)用場景需求

騰訊云 TI 平臺 TI-ONE 利用 NVIDIA Triton 推理服務(wù)器構(gòu)造高性能推理服務(wù)部署平臺，使用戶能夠非常便捷地部署包括 TNN 模型在內(nèi)的多種深度學(xué)習(xí)框架下獲得的 AI 模型，并且顯著提升推理服務(wù)的吞吐、提升 GPU 利用率。

2022-09-05 15:33:01

1419

螞蟻鏈AIoT團(tuán)隊(duì)與NVIDIA合作加速AI推理

螞蟻鏈 AIoT 團(tuán)隊(duì)與 NVIDIA 合作，將量化感知訓(xùn)練(QAT)技術(shù)應(yīng)用于深度學(xué)習(xí)模型性能優(yōu)化中，并通過 NVIDIA TensorRT 高性能推理 SDK 進(jìn)行高效率部署，通過 INT8 推理，吞吐量提升了 3 倍，助力螞蟻鏈版權(quán) AI 平臺中的模型推理服務(wù)大幅降本增效。

2022-09-09 09:53:52

872

蔚來基于NVIDIA Triton搭建的推理服務(wù)平臺

在近日舉行的 GTC 大會上，蔚來 AI 平臺負(fù)責(zé)人白宇利帶來非常有價值的分享，他首次對外透露了蔚來自研的全棧式自動駕駛系統(tǒng)（NAD）的部署和開發(fā)情況，同時也將蔚來自動駕駛研發(fā)平臺（NADP）這個神秘的“Peta Factory”帶到了公眾視野中。

2022-10-09 10:18:20

661

使用推理服務(wù)器加速大型Transformer模型的推理

這是討論 NVIDIA FasterTransformer 庫的兩部分系列的第一部分，該庫是用于對任意大小（多達(dá)數(shù)萬億個參數(shù)）的Transformer進(jìn)行分布式推理的最快庫之一。它提供了 FasterTransformer 的概述，包括使用該庫的好處。

2022-10-10 16:07:48

1067

使用NVIDIA Triton解決人工智能推斷挑戰(zhàn)

Triton 為高效的多模型推理帶來了一種新的模型編排服務(wù)。該軟件應(yīng)用程序目前處于早期使用階段，有助于以資源高效的方式簡化 Kubernetes 中 Triton 實(shí)例的部署，其中包含許多模型。此服務(wù)的一些關(guān)鍵功能包括：

2022-10-11 14:24:32

972

NADP加Triton搭建穩(wěn)定高效的推理平臺

蔚來自動駕駛研發(fā)平臺（NADP）是著力服務(wù)于自動駕駛核心業(yè)務(wù)方向的研發(fā)平臺。平臺化的推理能力作為常規(guī)機(jī)器學(xué)習(xí)平臺的重要組成部分，也是NADP所重點(diǎn)建設(shè)和支持的能力之一。 NADP所支持的推理業(yè)務(wù)，整體上有以下幾個特性：

2022-10-12 09:32:29

724

通過稀疏性支持和變壓器優(yōu)化增強(qiáng)AI推理

　　NVIDIA 張量RT 是一個高性能推理平臺，對于利用 NVIDIA 張量核心 GPU 的強(qiáng)大功能至關(guān)重要。TensorRT 8 是一個具有增強(qiáng)功能的軟件開發(fā)工具包，旨在提高性能和準(zhǔn)確性，以應(yīng)對邊緣和嵌入式設(shè)備中發(fā)生的越來越多的 AI 推理。它允許對張量流和PyTorch神經(jīng)網(wǎng)絡(luò)進(jìn)行廣泛的計算推斷。

2022-10-18 09:32:46

390

NVIDIA GPU加速潞晨科技Colossal-AI大模型開發(fā)進(jìn)程

通過 NVIDIA GPU 加速平臺，Colossal-AI 實(shí)現(xiàn)了通過高效多維并行、異構(gòu)內(nèi)存管理、大規(guī)模優(yōu)化庫、自適應(yīng)任務(wù)調(diào)度等方式，更高效快速部署 AI 大模型訓(xùn)練與推理。

2022-10-19 09:39:39

1149

NVIDIA Triton推理服務(wù)器的基本特性及應(yīng)用案例

推理識別是人工智能最重要的落地應(yīng)用，其他與深度學(xué)習(xí)相關(guān)的數(shù)據(jù)收集、標(biāo)注、模型訓(xùn)練等工作，都是為了得到更好的最終推理性能與效果。

2022-10-26 09:43:57

1370

NVIDIA Triton推理服務(wù)器的功能與架構(gòu)簡介

前面文章介紹微軟 Teams 會議系統(tǒng)、微信軟件與騰訊 PCG 服務(wù)三個 Triton 推理服務(wù)器的成功案例，讓大家對 Triton 有初步的認(rèn)知，但別誤以為這個軟件只適合在大型的服務(wù)類應(yīng)用中使用，事實(shí)上 Triton 能適用于更廣泛的推理環(huán)節(jié)中，并且在越復(fù)雜的應(yīng)用環(huán)境中就越能展現(xiàn)其執(zhí)行成效。

2022-11-02 10:44:41

1813

NVIDIA Triton系列文章：開發(fā)資源說明

與 Getting Started 屬于入門范疇，其余 User Guide、API Guide、Additional Resources 與 Customization Guide 等四個部分，都是 Triton 推理服務(wù)器非常重要的技術(shù)內(nèi)容。

2022-11-09 16:17:46

506

NVIDIA Triton 系列文章（4）：創(chuàng)建模型倉

推理模型倉（inference model repository）是 Triton 推理服務(wù)器的最基礎(chǔ)元件，如同數(shù)據(jù)庫（database）服務(wù)器必須先創(chuàng)建一個數(shù)據(jù)庫是類似的道理。要使

2022-11-15 21:20:12

589

NVIDIA Triton 系列文章（5）：安裝服務(wù)器軟件

在前一篇文章已經(jīng)帶著讀者創(chuàng)建一個 Triton 的推理模型倉，現(xiàn)在只要安裝好服務(wù)器端與用戶端軟件，就能進(jìn)行基本的測試與體驗(yàn)。為了簡化過程，我們使用 NVIDIA Jetson AGX Orin

2022-11-22 19:50:02

882

NVIDIA Triton 系列文章（6）：安裝用戶端軟件

在前面的文章中，已經(jīng)帶著讀者創(chuàng)建好 Triton 的模型倉、安裝并執(zhí)行 Triton 推理服務(wù)器軟件，接下來就是要安裝 Triton 用戶端軟件，對服務(wù)器提出推理請求（requests），才能觸發(fā)

2022-11-29 19:20:06

751

在 NGC 上玩轉(zhuǎn)新一代推理部署工具 FastDeploy，幾行代碼搞定 AI 部署

模型，并提供開箱即用的云邊端部署體驗(yàn)，實(shí)現(xiàn) AI 模型端到端的推理性能優(yōu)化。歡迎廣大開發(fā)者使用 NVIDIA 與飛槳聯(lián)合深度適配的 NGC 飛槳容器，在 NVIDIA GPU 上進(jìn)

2022-12-13 19:50:05

909

NVIDIA Triton 系列文章（9）：為服務(wù)器添加模型

的材料，處理起來是很容易的，比較復(fù)雜的部分是配置文件 config.pbtxt 的內(nèi)容，里面提供 Triton 服務(wù)器用來管理模型執(zhí)行特

2022-12-27 21:20:07

715

NVIDIA Triton 系列文章（10）：模型并發(fā)執(zhí)行

前面已經(jīng)做好了每個推理模型的基礎(chǔ)配置，基本上就能正常讓 Triton 服務(wù)器使用這些獨(dú)立模型進(jìn)行推理。接下來的重點(diǎn)，就是要讓設(shè)備的計算資源盡可能地充分使用，首先第一件事情就是模型并發(fā)執(zhí)行

2023-01-05 11:55:06

637

NVIDIA 助力 DeepRec 為 vivo 推薦業(yè)務(wù)實(shí)現(xiàn)高性能 GPU 推理優(yōu)化

本案例中，vivo 人工智能推薦算法組自研的推薦服務(wù)平臺，使用阿里巴巴開源大規(guī)模稀疏模型訓(xùn)練和預(yù)測引擎 DeepRec，在稀疏模型訓(xùn)練（稀疏功能、I/O 優(yōu)化）和高性能推理框架層面，實(shí)現(xiàn)其搜廣推各類

2023-01-18 00:55:01

548

如何最大化推理性能？Triton 社區(qū)技術(shù)交流活動與您暢聊

、NVIDIA 的技術(shù)專家將帶來 AI Infra 、推理引擎相關(guān)的專題分享，包括目前各企業(yè)面臨的模型推理挑戰(zhàn)、Triton 的應(yīng)用及落地的具體方案等，現(xiàn)身說法，干貨十足。此外，還有來自

2023-02-15 16:10:05

207

寧暢率先支持NVIDIA L4 和 L40 GPU

從元宇宙到AIGC，全球AI熱潮迭起，拉動巨大算力需求。作為AI與元宇宙全球盛會，于3月20-23日舉行的NVIDIA GTC將展示這一輪新的全球技術(shù)變革。寧暢X620 G50全能型AI服務(wù)器率先

2023-03-22 14:27:49

525

NVIDIA推出用于大型語言模型和生成式AI工作負(fù)載的推理平臺

日 – NVIDIA于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式AI應(yīng)用進(jìn)行了優(yōu)化，能夠幫助開發(fā)人員快速構(gòu)建用于提供新服務(wù)和洞察的AI驅(qū)動的專業(yè)應(yīng)用。 ? 這些平臺將NVIDIA的全棧推理

2023-03-22 14:48:39

256

GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負(fù)載的推理平臺

日 – NVIDIA 于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式 AI 應(yīng)用進(jìn)行了優(yōu)化，能夠幫助開發(fā)人員快速構(gòu)建用于提供新服務(wù)和洞察的 AI 驅(qū)動的專業(yè)應(yīng)用。這些平臺將 NVIDIA

2023-03-23 06:55:02

654

GTC23 | NVIDIA 攜手谷歌云提供強(qiáng)大的全新生成式 AI 平臺，基于新款 L4 GPU 和 Vertex AI 構(gòu)建

NVIDIA 生成式 AI 推理平臺將集成至谷歌云 Vertex AI 中；谷歌云成為首家提供 NVIDIA L4 GPU 實(shí)例的云服務(wù)商加利福尼亞州圣克拉拉 – GTC – 太平洋時間 2023

2023-03-23 06:55:02

438

超過1000家公司正在使用NVIDIA Metropolis開發(fā)者工具視覺AI解決方案

NVIDIA在3月23日周四舉行的全球AI和元宇宙大會GTC上發(fā)布了多項(xiàng)引爆新一輪視覺AI熱潮的技術(shù)更新，包括用于創(chuàng)建自定義生產(chǎn)級AI模型的NVIDIA TAO工具套件5.0、用于開發(fā)視覺AI應(yīng)用和服務(wù)的軟件開發(fā)工具套件NVIDIA DeepStream擴(kuò)展...

2023-03-27 16:57:40

927

NVIDIA 在 MLPerf 測試中將推理帶到新高度

的第三方基準(zhǔn)測試，MLPerf 仍是衡量 AI 性能的權(quán)威標(biāo)準(zhǔn)。自 MLPerf 誕生以來，NVIDIA 的 AI 平臺在訓(xùn)練和推理這兩個方面一直展現(xiàn)出領(lǐng)先優(yōu)勢，包括最新發(fā)布的 MLPerf

2023-04-08 00:30:08

389

NVIDIA GPU 加速 WPS Office AI 服務(wù)，助力打造優(yōu)質(zhì)的用戶體驗(yàn)

案例介紹金山辦公與 NVIDIA 團(tuán)隊(duì)合作，通過 NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識別與理解的推理效率；借助 NVIDIA Triton 推理服務(wù)器

2023-06-29 21:35:04

366

如何使用NVIDIA Triton 推理服務(wù)器來運(yùn)行推理管道

使用集成模型在 NVIDIA Triton 推理服務(wù)器上為 ML 模型管道提供服務(wù)

2023-07-05 16:30:34

1082

SIGGRAPH 2023 | NVIDIA 與全球數(shù)據(jù)中心系統(tǒng)制造商大力推動 AI 與工業(yè)數(shù)字化的發(fā)展

OVX 服務(wù)器采用全新 NVIDIA GPU 以加速訓(xùn)練和推理以及圖形密集型工作負(fù)載，將通過戴爾科技、慧與、聯(lián)想、超微等公司提供。洛杉磯 — SIGGRAPH — 太平洋時間 2023

2023-08-09 19:10:06

264

生成式AI時代要來了嗎 NVIDIA生成式AI獲新突破

這些性能強(qiáng)大的新系統(tǒng)將利用 NVIDIA Omniverse 平臺加速高計算密集度的復(fù)雜應(yīng)用，包括 AI 訓(xùn)練和推理、3D 設(shè)計和可視化、視頻處理、工業(yè)數(shù)字化等。

2023-08-23 14:20:18

224

全球領(lǐng)先系統(tǒng)制造商推出 NVIDIA AI 就緒型服務(wù)器，為企業(yè)大幅提升生成式 AI 性能

with NVIDIA 拉斯維加斯 — VMware Explore — 太平洋時間 2023 年 8 月 22 日 — NVIDIA 宣布，全球領(lǐng)先的系統(tǒng)制造商將推出 AI 就緒型服務(wù)器，其支持同發(fā)布的 VMware

2023-08-23 19:10:09

350

NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準(zhǔn)測試

超級芯片首次亮相 MLPerf 行業(yè)基準(zhǔn)測試，其運(yùn)行了所有數(shù)據(jù)中心推理測試，進(jìn)一步擴(kuò)大了 NVIDIA H100 Tensor Core GPU 的領(lǐng)先優(yōu)勢。總體測試結(jié)果表明，NVIDIA AI

2023-09-12 20:40:04

249

NVIDIA Grace Hopper超級芯片橫掃M(jìn)LPerf推理基準(zhǔn)測試

Hopper超級芯片首次亮相 MLPerf 行業(yè)基準(zhǔn)測試，其運(yùn)行了所有數(shù)據(jù)中心推理測試，進(jìn)一步擴(kuò)大了NVIDIA H100 Tensor Core GPU的領(lǐng)先優(yōu)勢。 ? 總體測試結(jié)果表明，NVIDIA AI

2023-09-13 09:45:40

139

周四研討會預(yù)告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

，使用 NVIDIA Triton TM? 推理服務(wù)器進(jìn)行端到端部署 LLM Serving，以及金融行業(yè)的 AI、NLP/LLM 應(yīng)用場景、客戶案例。通過本次活動，您將了解基于上述產(chǎn)品的 LLM

2023-10-26 09:05:02

174

NVIDIA 為全球領(lǐng)先的 AI 計算平臺 Hopper 再添新動力

NVIDIA HGX? H200，為 Hopper 這一全球領(lǐng)先的 AI 計算平臺再添新動力。NVIDIA HGX H200 平臺基于 NVIDIA Hopper? 架構(gòu)，搭載 NVIDIA H200

2023-11-14 14:30:01

NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

和初創(chuàng)公司在 Microsoft Azure 上開發(fā)、調(diào)優(yōu)和部署其自定義生成式 AI 應(yīng)用。 ? 這項(xiàng) NVIDIA AI foundry 服務(wù)整合了 NVIDIA AI Foundation

2023-11-16 14:13:08

116

NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

AI Enterprise 軟件進(jìn)行部署 NVIDIA 于今日推出一項(xiàng) AI foundry 服務(wù)，助力企業(yè)和初創(chuàng)公司在 Microsoft Azure 上開發(fā)、調(diào)優(yōu)和部署其自定義生成式 AI

2023-11-16 21:15:02

270

利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學(xué)習(xí)模型，并借助NVIDIA Triton推理服務(wù)器在NVIDIA V100 GPU上進(jìn)行高效部署，幫助必優(yōu)科技的文檔智能

2024-01-17 09:30:35

335

使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

這家云計算巨頭的計算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。

2024-02-29 14:04:40

162

已全部加載完成

搜索歷史

NVIDIA發(fā)布Triton 推理服務(wù)器重大更新，全球超過25000余家公司部署NVIDIA AI推理平臺

評論