久久综合美女视频,玩弄大乳奶水中文字幕电影,无遮挡黄动漫手机在线观看

這家云計算巨頭的計算機視覺和數(shù)據(jù)科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。

作為一名狂熱的自行車愛好者，Thomas Park 深知擁有多個變速檔位對于平穩(wěn)、快速騎行的重要性。

因此，當這位軟件架構師為 Or acle Cloud Infrastructure（OCI）的視覺 AI 服務設計 AI 推理平臺時，他選擇了 NVIDIA Triton 推理服務器，因為它可以通過變換“檔位”，來快速高效地處理幾乎任何 AI 模型、框架、硬件和運行模式。

Park 表示：“NVIDIA AI推理平臺為我們的全球云服務客戶帶來了巨大的靈活性，讓他們可以構建和運行 AI 應用?！盤ark 是一位在蘇黎世工作的計算機工程師，同時也是一名富有競爭力的自行車手，他曾先后就職于四家全球超大型云服務提供商。

具體而言，Triton 將 OCI 的總擁有成本降低了 10%、將遷移到 Triton 的 OCI 視覺和文檔理解服務模型的預測吞吐量提高了 76%，并將推理延遲降低了 51%。Park 和一位同事在今年早些時候發(fā)布的一篇 Oracle 博客中指出，全球有超過 45 個區(qū)域數(shù)據(jù)中心在運行這些服務。

計算機視覺加速深入洞察

依靠 OCI 視覺 AI，客戶可以進行各種物體檢測和圖像分類工作。例如，美國的一家運輸公司利用它來自動檢測經(jīng)過的車軸數(shù)，以計算和結算過橋費，從而節(jié)省了忙碌的卡車司機在收費站的等待時間。

OCI AI 還通過 Oracle NetSuite 提供，Oracle NetSuite 是全球 37,000 多個企業(yè)組織使用的一套商業(yè)應用程序，它可以用于自動識別發(fā)票等工作。

在 Park 的努力下，Triton 如今也被其他 OCI 服務所采用。

能夠識別 Triton 的數(shù)據(jù)服務

負責處理 Oracle 內外部用戶機器學習事務的 OCI 數(shù)據(jù)科學服務產(chǎn)品管理總監(jiān) Tzvi Keisar 表示：“我們的 AI 平臺能夠識別 Triton，以造福于我們的客戶?！?/p>

Keisar 提到：“想要使用 Triton 的客戶不必擔心配置問題，因為平臺會自動完成配置，為他們啟動一個 Triton 驅動的推理終端節(jié)點?！?/p>

Triton 包含在 NVIDIA AI Enterprise 中，該平臺可提供企業(yè)所需的全方位的安全和支持，并且可以在 OCI Marketplace 上獲得

一個龐大的 SaaS 平臺

OCI 的數(shù)據(jù)科學服務是一個適用于 Oracle NetSuite 和 Oracle Fusion 應用程序的機器學習平臺。

“這些商業(yè)應用套件規(guī)模龐大，有數(shù)以萬計的客戶也在我們的服務上構建他們的框架。”Keisar 說。

這些客戶主要是來自于制造業(yè)、零售業(yè)、交通運輸業(yè)等行業(yè)的企業(yè)用戶。他們正在構建和使用幾乎所有形態(tài)與規(guī)模的 AI 模型。

推理是該團隊推出的首批服務之一，而 Triton 在推出后不久就進入了該團隊的視線。

最佳的推理框架

“我們看到 Triton 作為一流的服務框架越來越受歡迎，于是開始試用?！盞eisar 說，“我們發(fā)現(xiàn)它的性能非常出色，彌補了現(xiàn)有產(chǎn)品的不足，尤其是在多模型推理方面。它是目前功能最全面、最先進的推理框架。”

Triton 于 3 月在 OCI 上發(fā)布，已經(jīng)吸引了 Oracle 許多內部團隊的關注。他們希望將其用于需要同時運行多個 AI 模型以作出預測的推理工作。

他表示：“當用于部署在單個端點上的多個模型時，Triton 的表現(xiàn)和性能都非常好?！?/p>

加快未來發(fā)展

展望未來，復雜的大語言模型（LLM）激發(fā)了眾多用戶的想象力。為了能夠在未來為這些模型上的推理提供更強大的助力，Keisar 的團隊正在對 NVIDIA TensorRT-LLM 軟件進行評估。

身為一名活躍的博主，Keisar 在其最新文章中詳細介紹了在 NVIDIA A10 Tensor Core GPU 上運行具有高達 700 億參數(shù)的 Llama 2 LLM 的量化技術。

他表示：“即使減低到四位參數(shù)，模型輸出的質量仍然相當不錯。在 NVIDIA GPU 上的部署使我們能夠靈活地在延遲、吞吐量和成本之間找到良好的平衡點?！?/p>

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
4793

瀏覽量
102423
計算機視覺

計算機視覺

+關注

關注
8

文章
1685

瀏覽量
45811
LLM

LLM

+關注

關注
0

文章
247

瀏覽量
279

原文標題：名不虛傳：NVIDIA Triton 加速 Oracle Cloud 上的推理

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達企業(yè)解決方案】歡迎添加關注！文章轉載請注明出處。

AMD助力HyperAccel開發(fā)全新AI推理服務器

HyperAccel 是一家成立于 2023 年 1 月的韓國初創(chuàng)企業(yè)，致力于開發(fā) AI 推理專用型半導體器件和硬件，最大限度提升推理工作負載的存儲器帶寬使用，并通過將此解決方案應用于

發(fā)表于 09-18 09:37 ?160次閱讀

AMD助力HyperAccel開發(fā)全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>服務器</b>

NVIDIA助力提供多樣、靈活的模型選擇

在本案例中，Dify 以模型中立以及開源生態(tài)的優(yōu)勢，為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理

發(fā)表于 09-09 09:19 ?312次閱讀

AI云服務器：開啟智能計算新時代

一、AI云服務器的定義與特點 AI云服務器的定義 AI云服務器是一種基于云計算技術，專為處理人工

發(fā)表于 08-09 16:08 ?400次閱讀

NVIDIA攜手Meta推出AI服務，為企業(yè)提供生成式AI服務

NVIDIA近日宣布了一項重大舉措，正式推出NVIDIA AI Foundry服務與NVIDIA NIM（

發(fā)表于 07-25 16:57 ?389次閱讀

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理

發(fā)表于 07-25 09:48 ?567次閱讀

AI服務器的特點和關鍵技術

AI服務器，即人工智能服務器，是一種專門設計用于運行和加速人工智能（AI）算法與模型的硬件設備。隨著人工智能技術的快速發(fā)展和普及，

發(fā)表于 07-17 16:34 ?764次閱讀

ai服務器是什么架構類型

AI服務器，即人工智能服務器，是專門為人工智能應用設計的高性能計算服務器。AI服務器的架構類型有

發(fā)表于 07-02 09:51 ?576次閱讀

英偉達推出AI模型推理服務NVIDIA NIM

英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI

發(fā)表于 06-04 09:15 ?537次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將

發(fā)表于 04-20 09:39 ?503次閱讀

臺積電：AI服務器處理器預計翻番，拉動收入增長?

臺積電將 AI 服務器處理器嚴格限定為用于 AI 訓練與推理的 GPU、CPU 及 AI

發(fā)表于 04-19 15:04 ?256次閱讀

利用NVIDIA產(chǎn)品技術組合提升用戶體驗

本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型，并借助NVIDIA Triton推理

發(fā)表于 01-17 09:30 ?564次閱讀

AI服務器當前的發(fā)展現(xiàn)狀分析

總的來說，除非有某種因素能夠抑制AI模型的增長，或者AI訓練和推理的計算成本能夠降低，否則我們預測到2026年或2027年，AI計算將占據(jù)

發(fā)表于 11-30 11:18 ?811次閱讀

創(chuàng)新企業(yè)云福利：騰訊云 × NVIDIA 初創(chuàng)加速計劃

x NVIDIA 初創(chuàng)加速計劃助您降低產(chǎn)品使用門檻高性能計算集群?HCC 以高性能云服務器為節(jié)點，通過 RDMA 互聯(lián)，大幅提升網(wǎng)絡性能，提供高帶寬和極低延遲的網(wǎng)絡服務，能滿足

發(fā)表于 11-13 20:40 ?487次閱讀

周四研討會預告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

，使用 NVIDIA Triton TM? 推理服務器進行端到端部署 LLM Serving，以及金融行業(yè)的 AI、NLP/LLM 應用場景

發(fā)表于 10-26 09:05 ?283次閱讀

AI服務器帶動PCB性能價格雙升

AI 服務器中 PCB 價值量的提升主要體現(xiàn)在以下幾個模塊：GPU 加速卡（OAM），主要由 GPU 芯片、內存芯片、電源模塊、散熱器等部件組成，通過 PCB 板

發(fā)表于 09-21 15:46 ?778次閱讀