0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Oracle 云基礎(chǔ)設(shè)施提供新的 NVIDIA GPU 加速計(jì)算實(shí)例

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-09-25 20:40 ? 次閱讀

生成式 AI 和大語言模型(LLM)不斷推動(dòng)突破性創(chuàng)新,訓(xùn)練和推理對(duì)算力的需求也隨之急劇上升。

這些現(xiàn)代生成式 AI 應(yīng)用需要全棧加速計(jì)算,首先要有能夠快速、準(zhǔn)確處理大量工作負(fù)載的先進(jìn)基礎(chǔ)設(shè)施。為了幫助滿足這一需求,Oracle 云基礎(chǔ)設(shè)施(OCI)于近日宣布,在 OCI Compute 上全面提供 NVIDIA H100 Tensor Core GPU,同時(shí) NVIDIA L40S GPU 也即將在 OCI Compute 上推出。

wKgaomUo-1mAfOR9AACyoa3iSyI779.png

OCI 上的 NVIDIA

H100 Tensor Core GPU 實(shí)例

OCI Compute 裸機(jī)實(shí)例配備了具有NVIDIA Hopper架構(gòu)的 NVIDIA H100 GPU,不僅大幅提升了大規(guī)模 AI 和高性能計(jì)算的性能,也為各種工作負(fù)載提供了前所未有的性能、可擴(kuò)展性和通用性。

相比于NVIDIA A100 Tensor Core GPU,使用 NVIDIA H100 GPU 的企業(yè)可提升 30 倍的 AI 推理性能和 4 倍的 AI 訓(xùn)練性能。H100 GPU 專為資源密集型計(jì)算任務(wù)構(gòu)建,包括訓(xùn)練 LLM 和在運(yùn)行 LLM 的同時(shí)進(jìn)行推理等。

BM.GPU.H100.8 OCI Compute 機(jī)型配置(Shape)包含 8 顆 NVIDIA H100 GPU,每顆都具有 80GB 的 HBM2 GPU 內(nèi)存。8 顆 GPU 之間的 3.2TB/s 雙向帶寬使每顆 GPU 都能通過 NVIDIA NVSwitchNVLink 4.0 技術(shù)與其他 7 顆 GPU 直接通信。該配置還包含 16 塊容量為 3.84TB 的本地 NVMe 硬盤、112 個(gè)內(nèi)核的第四代英特爾至強(qiáng) CPU 處理器以及 2TB 系統(tǒng)內(nèi)存。

簡(jiǎn)而言之,該機(jī)型配置針對(duì)企業(yè)最具挑戰(zhàn)性的工作負(fù)載進(jìn)行了優(yōu)化。

根據(jù)工作負(fù)載的時(shí)間線和規(guī)模,OCI Supercluster 使企業(yè)能夠通過高性能、超低延遲的網(wǎng)絡(luò),將所使用的 NVIDIA H100 GPU 從單個(gè)節(jié)點(diǎn)擴(kuò)展到多達(dá)數(shù)萬顆 H100 GPU。

OCI 上的 NVIDIA L40S GPU 實(shí)例

NVIDIA L40S GPU 基于 NVIDIA Ada Lovelace 架構(gòu)構(gòu)建而成,是一款數(shù)據(jù)中心的通用 GPU,可以為 LLM 推理和訓(xùn)練、視覺計(jì)算以及視頻應(yīng)用提供驚人的多負(fù)載加速。搭載 NVIDIA L40S GPU 的 OCI Compute 裸機(jī)實(shí)將于今年晚些時(shí)候推出搶先體驗(yàn)版本,并于 2024 年初全面上市。 這些實(shí)例將作為 NVIDIA H100 和 A100 GPU 實(shí)例的替代方案,用于處理中小型 AI 工作負(fù)載以及圖形和視頻計(jì)算任務(wù)。相比于 NVIDIA A100,NVIDIA L40S GPU 可將生成式 AI 工作負(fù)載的性能提升 20%,將微調(diào) AI 模型方面的性能提升 70%。 BM.GPU.L40S.4 OCI Compute 機(jī)型配置包含 4 顆 NVIDIA L40S GPU,以及多達(dá) 112 個(gè)核的最新一代英特爾至強(qiáng) CPU、1TB 系統(tǒng)內(nèi)存、15.36TB 用于緩存數(shù)據(jù)的低延遲 NVMe 本地存儲(chǔ)和 400GB/s 集群網(wǎng)絡(luò)帶寬。創(chuàng)建該實(shí)例的目的是應(yīng)對(duì)從 LLM 訓(xùn)練、微調(diào)和推理一直到 NVIDIA Omniverse 工作負(fù)載以及工業(yè)數(shù)字化、3D 圖形和渲染、視頻轉(zhuǎn)碼和 FP32 HPC 等各種用例。

NVIDIA 與 OCI:企業(yè)級(jí) AI

OCI 與 NVIDIA 的協(xié)作,將為各種規(guī)模的企業(yè)帶來最先進(jìn)的 NVIDIA H100 和 L40S GPU 加速基礎(chǔ)設(shè)施,助力企業(yè)加入到這場(chǎng)生成式 AI 革命。僅訪問 NVIDIA GPU 加速實(shí)例可能還不夠。若要在 OCI Compute 上釋放 NVIDIA GPU 的最大潛能,就必須擁有一個(gè)最好的軟件層。NVIDIA AI Enterprise 通過專為底層 NVIDIA GPU 基礎(chǔ)設(shè)施優(yōu)化的開源容器和框架,簡(jiǎn)化了企業(yè)級(jí)加速 AI 軟件的開發(fā)和部署,所有這一切都離不開支持服務(wù)的幫助。

如要了解更多信息,歡迎訪問有關(guān) Oracle 云基礎(chǔ)設(shè)施(OCI)、OCI Compute、Oracle 如何邁向 AI 以及 NVIDIA AI Platform 網(wǎng)頁(yè)。

Oracle 云基礎(chǔ)設(shè)施(OCI):https://www.oracle.com/cloud/

OCI Compute:https://www.oracle.com/cloud/compute/

Oracle 如何邁向 AI:https://www.oracle.com/artificial-intelligence/

NVIDIA AI Platform:https://www.nvidia.cn/ai-data-science/

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開放。點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,關(guān)注更多會(huì)議及活動(dòng)信息。

wKgaomUo-1qAVDoQAAFtccdApf0800.jpg


原文標(biāo)題:Oracle 云基礎(chǔ)設(shè)施提供新的 NVIDIA GPU 加速計(jì)算實(shí)例

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3720

    瀏覽量

    90678

原文標(biāo)題:Oracle 云基礎(chǔ)設(shè)施提供新的 NVIDIA GPU 加速計(jì)算實(shí)例

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA SuperNIC推進(jìn)現(xiàn)代AI基礎(chǔ)設(shè)施發(fā)展

    在生成式 AI 時(shí)代,加速網(wǎng)絡(luò)對(duì)于為大規(guī)模分布式 AI 工作負(fù)載構(gòu)建高性能計(jì)算平臺(tái)至關(guān)重要。NVIDIA加速網(wǎng)絡(luò)領(lǐng)域繼續(xù)保持領(lǐng)先地位,提供
    的頭像 發(fā)表于 11-06 13:59 ?131次閱讀

    NVIDIA助力印度打造AI基礎(chǔ)設(shè)施

    在孟買舉辦的 NVIDIA AI Summit 上,黃仁勛和穆克什·安巴尼(Mukesh Ambani)探討了關(guān)于 AI 基礎(chǔ)設(shè)施的投資,這些投資有望為各行各業(yè)帶來變革。
    的頭像 發(fā)表于 10-27 09:44 ?202次閱讀

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡(jiǎn)而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來加速科學(xué)
    的頭像 發(fā)表于 10-25 09:23 ?189次閱讀

    Oracle與亞馬遜科技宣布建立戰(zhàn)略合作伙伴關(guān)系

    科技中訪問基于專屬基礎(chǔ)設(shè)施Oracle Autonomous Database和Oracle Exadata Database Service。Oracle Database@Ama
    的頭像 發(fā)表于 10-08 17:25 ?534次閱讀

    如何理解計(jì)算?

    和硬件資源。 在數(shù)字化時(shí)代,互聯(lián)網(wǎng)已經(jīng)成為基礎(chǔ)設(shè)施。計(jì)算使得數(shù)據(jù)中心能夠像一臺(tái)計(jì)算機(jī)一樣去工作。通過互聯(lián)網(wǎng)將算力以按需使用、按量付費(fèi)的形式提供
    發(fā)表于 08-16 17:02

    應(yīng)用NVIDIA Spectrum-X網(wǎng)絡(luò)構(gòu)建新型主權(quán)AI

    、Hugging Face、Golem.ai 等。Scaleway 提供一站式的服務(wù),以開發(fā)創(chuàng)新解決方案并幫助用戶從零開始構(gòu)建和擴(kuò)展 AI 項(xiàng)目,目前 Scaleway 正在構(gòu)建區(qū)域 AI ,
    的頭像 發(fā)表于 07-26 18:58 ?1123次閱讀

    NVIDIA宣布與GPU編排軟件提供商Run:ai達(dá)成最終收購(gòu)協(xié)議

    這家初創(chuàng)公司通過共享加速計(jì)算基礎(chǔ)設(shè)施促進(jìn) AI 工作負(fù)載高效集群的資源利用。
    的頭像 發(fā)表于 04-28 11:49 ?407次閱讀

    垂直起降機(jī)場(chǎng):飛行基礎(chǔ)設(shè)施的未來是綠色的

    電動(dòng)垂直起降(eVTOL)飛機(jī)的日益發(fā)展為建立一個(gè)新的網(wǎng)絡(luò)來支持它們提供了理由,這將推動(dòng)開發(fā)綠色基礎(chǔ)設(shè)施新模式的機(jī)會(huì)。這些電氣化的“短途”客運(yùn)和貨運(yùn)飛機(jī)通常被描述為飛行汽車,是區(qū)域飛行和城市出租車
    發(fā)表于 03-25 06:59

    NVIDIA 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級(jí) GPU 計(jì)算和 AI 基礎(chǔ)設(shè)施

    NVIDIA 軟件實(shí)現(xiàn)了跨 ?Blackwell GPU、新交換機(jī)和 BlueField-3 SuperNIC 的分布式計(jì)算,大幅提升了 AI、數(shù)據(jù)處理、高性能計(jì)算
    發(fā)表于 03-19 10:05 ?306次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級(jí) <b class='flag-5'>GPU</b> <b class='flag-5'>計(jì)算</b>和 AI <b class='flag-5'>基礎(chǔ)設(shè)施</b>

    百度智能將在三大方面重構(gòu)計(jì)算服務(wù)

    基礎(chǔ)設(shè)施層,移動(dòng)互聯(lián)網(wǎng)時(shí)代的應(yīng)用,底層大多依賴CPU算力,而AI應(yīng)用對(duì)GPU或異構(gòu)計(jì)算的需求大幅增加,市場(chǎng)的底層算力需求將逐漸轉(zhuǎn)向以
    發(fā)表于 12-21 15:41 ?321次閱讀
    百度智能<b class='flag-5'>云</b>將在三大方面重構(gòu)<b class='flag-5'>云</b><b class='flag-5'>計(jì)算</b>服務(wù)

    探索未來計(jì)算,華為耀服務(wù)器 L 實(shí)例引領(lǐng)行業(yè)新動(dòng)力

    服務(wù)器 L 實(shí)例(以下簡(jiǎn)稱:耀 L 實(shí)例),為中小企業(yè)和開發(fā)者提供簡(jiǎn)單上的全新體驗(yàn)。
    的頭像 發(fā)表于 12-08 15:13 ?292次閱讀
    探索未來<b class='flag-5'>云</b><b class='flag-5'>計(jì)算</b>,華為<b class='flag-5'>云</b>耀<b class='flag-5'>云</b>服務(wù)器 L <b class='flag-5'>實(shí)例</b>引領(lǐng)行業(yè)新動(dòng)力

    Gartner解讀計(jì)算與數(shù)據(jù)中心基礎(chǔ)設(shè)施市場(chǎng)發(fā)展

    隨著數(shù)據(jù)中心基礎(chǔ)設(shè)施計(jì)算市場(chǎng)的不斷發(fā)展,企業(yè)對(duì)遷移工作負(fù)載的興趣與日俱增,但卻難以找到合適的合作伙伴和解決方案。在Gartner近期發(fā)布的《計(jì)
    的頭像 發(fā)表于 12-08 15:00 ?505次閱讀

    亞馬遜科技與 NVIDIA 宣布開展戰(zhàn)略合作,為生成式 AI 提供全新超級(jí)計(jì)算基礎(chǔ)架構(gòu)、軟件和服務(wù)

    計(jì)算機(jī),用于 NVIDIA AI 研發(fā)和自定義模型開發(fā)。 搭載 NVIDIA GH200、H200、L40S 和 L4 GPU的全新亞馬遜 EC2
    的頭像 發(fā)表于 11-29 21:00 ?595次閱讀
    亞馬遜<b class='flag-5'>云</b>科技與 <b class='flag-5'>NVIDIA</b> 宣布開展戰(zhàn)略合作,為生成式 AI <b class='flag-5'>提供</b>全新超級(jí)<b class='flag-5'>計(jì)算</b>基礎(chǔ)架構(gòu)、軟件和服務(wù)

    華為耀服務(wù)器 L 實(shí)例,是否是企業(yè)簡(jiǎn)單上的最佳選擇?

    中小企業(yè)和開發(fā)者簡(jiǎn)單上,華為推出一款輕量應(yīng)用服務(wù)器——華為耀服務(wù)器 L 實(shí)例(以下稱:
    的頭像 發(fā)表于 11-21 09:19 ?323次閱讀
    華為<b class='flag-5'>云</b>耀<b class='flag-5'>云</b>服務(wù)器 L <b class='flag-5'>實(shí)例</b>,是否是企業(yè)簡(jiǎn)單上<b class='flag-5'>云</b>的最佳選擇?

    創(chuàng)新企業(yè)福利:騰訊 × NVIDIA 初創(chuàng)加速計(jì)劃

    x NVIDIA 初創(chuàng)加速計(jì)劃 助您降低產(chǎn)品使用門檻 高性能計(jì)算集 群?HCC 以高性能服務(wù)器為節(jié)點(diǎn),通過 RDMA 互聯(lián),大幅提升網(wǎng)絡(luò)性能,
    的頭像 發(fā)表于 11-13 20:40 ?545次閱讀
    創(chuàng)新企業(yè)<b class='flag-5'>云</b>福利:騰訊<b class='flag-5'>云</b> × <b class='flag-5'>NVIDIA</b> 初創(chuàng)<b class='flag-5'>加速</b>計(jì)劃