国产精品大屁股流白浆精品一区,国产精品人成电影在线观看

學(xué)過微處理器的同學(xué)可能還記得，最初的8086/8088處理器沒有浮點(diǎn)單元。主板通常有一個(gè)額外的插槽，用于可選的8087 數(shù)學(xué)協(xié)處理器。數(shù)學(xué)協(xié)處理器進(jìn)入了 CPU 本身，如今，CPU 沒有可選的數(shù)學(xué)協(xié)處理器。

然而， SIMD 處理器（例如GPU）有多種選擇。眾所周知，GPU 可以比 CPU 主機(jī)更快地加速數(shù)學(xué)處理（例如矩陣運(yùn)算）。

隨著Nvidia GH-200 處理器和AMD MI300A APU的推出，市場(chǎng)正在見證“8087 時(shí)刻”——即 CPU 吸收外部性能硬件。Nvidia 和 AMD 都已將 GPU 納入處理器中，其結(jié)果是 HPC 性能大幅躍升，并預(yù)示著未來的發(fā)展。

再見 PCI

AMD 和 Nvidia 的 GPU 都依賴 PCI 總線與 CPU 進(jìn)行通信。CPU 和 GPU 有兩個(gè)不同的內(nèi)存域，數(shù)據(jù)必須通過 PCI 接口從 CPU 域移動(dòng)到 GPU 域（并返回）。

使用第 5 代 PCIe 總線中全部 16 個(gè)通道的 GPU 的最大帶寬約為 63GB/s。此瓶頸將限制 CPU 和 GPU 之間的內(nèi)存移動(dòng)。

Nvidia GH200 通過 900 GB/s 雙向 NVLink-C2C 連接 Grace CPU 和 Hooper GPU。結(jié)果大約快了 14 倍。此外，GH200 還帶來了單一共享 CPU-GPU 內(nèi)存域的優(yōu)勢(shì)。無需通過 PCI 總線在 CPU 和 GPU 之間移動(dòng)數(shù)據(jù)。如圖 1 所示，CPU 和 GPU 對(duì)所有內(nèi)存具有一致的視圖。CPU內(nèi)存高達(dá)480GB LPDDR5X（帶ECC），GPU具有96GB HBM3或144GB HBM3e。總的相干（單域）內(nèi)存在 576GB 到 624GB 之間。

當(dāng)前的 AMD Instinct MI300A APU 中采用單一內(nèi)存域，具有 128 GB HBM3 內(nèi)存，使用 Infinity Fabric 在 CPU 和 GPU 之間一致共享，封裝峰值吞吐量為 5.3 TB/s 。雖然 MI300A 目前不支持像 GH200 那樣額外的 DDR 內(nèi)存擴(kuò)展，但 CXL 是一個(gè)值得將來記住的詞。

對(duì)于 GH200 和 MI300A，關(guān)鍵的突出短語是“呈現(xiàn)單個(gè)存儲(chǔ)域”。在傳統(tǒng)的CPU-PCIe-GPU組合中，GPU內(nèi)存量通常小于CPU內(nèi)存，數(shù)據(jù)必須通過PCIe接口進(jìn)行混洗。這兩個(gè)新設(shè)計(jì)消除了這個(gè)瓶頸。單個(gè)大內(nèi)存域一直對(duì) HPC 有吸引力，而 GenAI 的增長加速了這種需求（即，能夠在內(nèi)存中加載大型模型并使用 GPU 運(yùn)行它們）。對(duì)于傳統(tǒng) GPU，GPU 內(nèi)存量限制了模型大小，需要采用分布式 GPU 方法。（注：GH200 可以通過外部 NVLink 連接，創(chuàng)建海量統(tǒng)一內(nèi)存；例如，Nvidia-AWS NLV32可以提供高達(dá) 20 TB 的統(tǒng)一內(nèi)存。）

離你的桌面并不遠(yuǎn)

技術(shù)領(lǐng)域明顯的趨勢(shì)之一是從昂貴的新技術(shù)市場(chǎng)轉(zhuǎn)向低成本的大宗商品市場(chǎng)。高性能計(jì)算也不例外。隨著市場(chǎng)需求，從多核到高級(jí)內(nèi)存的一切都已從高端轉(zhuǎn)移到“手機(jī)”。遷移到單個(gè)內(nèi)存域就是這些變化之一。

最近，在 Linux 基準(zhǔn)測(cè)試網(wǎng)站Phoronix上，杰出的測(cè)試員Michael Larabel在 GH200 工作站上運(yùn)行了 HPC 基準(zhǔn)測(cè)試。該系統(tǒng)由德國的GPTshop.ai提供。

據(jù)了解，系統(tǒng)塔式機(jī)箱配備 GH200 Grace Hopper Superchip，配備 576G 內(nèi)存、雙 2000+ W 電源、QCT 主板以及多種配置選項(xiàng)，包括 SSD 和 NVIDIA Bluefield/Connect-X 適配器。一項(xiàng)有趣且有用的功能是 TDP 可以從 450W 編程到 1000W（CPU + GPU + 內(nèi)存），這在非數(shù)據(jù)中心環(huán)境中應(yīng)該很有用。另外，默認(rèn)風(fēng)冷噪音據(jù)稱為25分貝。液體冷卻也是一種選擇。

然而，桌面超級(jí)工作站并不便宜。目前可用的型號(hào) GH200 576GB起價(jià)為 47,500 歐元（根據(jù) Phoronix 的說法，由于在歐盟以外地區(qū)運(yùn)輸時(shí)無需繳納 19% 的增值稅，因此該價(jià)格相當(dāng)于 41,000 美元）

這個(gè)價(jià)格可能看起來很高，但考慮到具有 80 GB HBM2e 內(nèi)存的 Nvidia H100 PCIe GPU 目前的市場(chǎng)價(jià)格在 3 萬美元到 3.5 萬美元之間。這不包括為 GPU 供電和運(yùn)行的主機(jī)系統(tǒng)。此外，用戶還受到 80GB GPU 內(nèi)存的限制，該內(nèi)存通過 PCIe 總線與主內(nèi)存域分開。

GPTshop工作站提供576GB的單域內(nèi)存。HPC 和 GenAI 用戶會(huì)發(fā)現(xiàn)這半 TB 的 CPU-GPU 內(nèi)存很有吸引力。

初步基準(zhǔn)

借助 GPTshop，Phoronix 能夠遠(yuǎn)程運(yùn)行多個(gè)基準(zhǔn)測(cè)試?；鶞?zhǔn)應(yīng)被視為初步的，而不是最終的績效衡量標(biāo)準(zhǔn)。特別是，基準(zhǔn)測(cè)試僅針對(duì) CPU，沒有使用 Hopper A100 GPU。因此，基準(zhǔn)圖是不完整的。Phoronix 計(jì)劃在未來測(cè)試基于 GPU 的應(yīng)用程序。

據(jù) Phoronix 稱，Ubuntu 23.10 與 Linux 6.5 一起使用 GCC-13 作為標(biāo)準(zhǔn)編譯器。使用類似的環(huán)境來測(cè)試可比較的處理器，包括 Intel Xeon Scalable、AMD EPYC 和 Ampere Altra Max 處理器。完整的列表可以在Phoronix 網(wǎng)站上找到。

此外，沒有可用于基準(zhǔn)測(cè)試運(yùn)行的功耗數(shù)據(jù)。據(jù) Phoronix 稱，NVIDIA GH200 目前似乎沒有在 Linux 下公開任何 RAPL/PowerCap/HWMON 接口，僅用于讀取 GH200 的功率/能源使用情況。系統(tǒng)上的BMC確實(shí)通過Web界面暴露了整個(gè)系統(tǒng)的功耗，并且功率數(shù)據(jù)沒有通過IPMI暴露。

盡管存在這些限制，一些重要的基準(zhǔn)測(cè)試還是首次在 Nvidia 之外的 GH200 上運(yùn)行。

好奧萊 HPCG

Phoronix 報(bào)告的第一個(gè)測(cè)試是標(biāo)準(zhǔn)HPCG內(nèi)存帶寬基準(zhǔn)測(cè)試，如圖 2 所示。

可以看出，GH200 Arm 的性能達(dá)到了可觀的 42 GFLOPS，略高于 Xeon Platinum 8380 2P（40 GFLOPS），略低于 EPYC 9654 Genoa 2P（44 GFLOPS）。另外值得注意的是 72 核 Arm Grace CPU，其性能幾乎是 Ampere Altra Max 128 核 Arm 處理器的兩倍。

GH200 在其他基準(zhǔn)測(cè)試中表現(xiàn)良好。最令人印象深刻的結(jié)果如圖 3 所示。使用 72 核 Arm GH200 的NWChem (C240-Bucky Ball) 運(yùn)行時(shí)間為 1404 秒，僅落后于領(lǐng)先者 128 核 Epyc 9554 (2p)，成績?yōu)?1323 秒。

即將發(fā)生的事情

Nvidia GH200 和 AMD MI300A 引入了新的處理器架構(gòu)。與吸收 8087 數(shù)學(xué)協(xié)處理器類似，高端 CPU 也開始吸收 GPU（或 SIMD 處理單元）。然而，這個(gè)想法并不是全新的。自 2011 年以來，AMD 已將中等 GPU 集成到其臺(tái)式機(jī)/筆記本電腦APU 處理器中。雖然這些高端處理器可能被認(rèn)為是“專用”的，因此價(jià)格昂貴，但隨著時(shí)間的推移，對(duì) GenAI 的巨大興趣可能會(huì)將這些設(shè)計(jì)推向商品價(jià)格點(diǎn)。隨著更多基準(zhǔn)的出現(xiàn)，這個(gè)故事將繼續(xù)發(fā)展。

此外，引入具有足夠內(nèi)存的個(gè)人高性能工作站，可以在您的辦公桌旁運(yùn)行一些最大的法學(xué)碩士，這是一個(gè)重要的里程碑。更不用說運(yùn)行許多大內(nèi)存 GPU 優(yōu)化的 HPC 應(yīng)用程序的能力了。數(shù)據(jù)中心和云仍將是當(dāng)今的主力，但必須要說的是“擁有重置按鈕”。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

微處理器

微處理器

+關(guān)注

關(guān)注
11

文章
2244

瀏覽量
82267
PCIe

PCIe

+關(guān)注

關(guān)注
15

文章
1200

瀏覽量
82355
英偉達(dá)

英偉達(dá)

+關(guān)注

關(guān)注
22

文章
3721

瀏覽量
90696
AMD芯片

AMD芯片

+關(guān)注

關(guān)注
0

文章
14

瀏覽量
2810

原文標(biāo)題：英偉達(dá)和AMD新芯片，突破PCIe限制

文章出處：【微信號(hào)：AI_Architect，微信公眾號(hào)：智能計(jì)算芯世界】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

AMD發(fā)布英偉達(dá)競品AI芯片,預(yù)期市場(chǎng)規(guī)模將大幅增長

10月11日，AMD在英偉達(dá)主導(dǎo)的AI算力市場(chǎng)中舉辦了一場(chǎng)人工智能主題發(fā)布會(huì)，推出了包括MI325X算力芯片在內(nèi)的一系列新品。然而，市場(chǎng)對(duì)此反應(yīng)平平，

發(fā)表于 10-11 16:25 ?552次閱讀

英偉達(dá)Blackwell芯片已投產(chǎn)，預(yù)告未來AI芯片發(fā)展

英偉達(dá)創(chuàng)始人兼CEO黃仁勛近日宣布，公司旗下的Blackwell芯片已正式投入生產(chǎn)。這款芯片是英偉達(dá)

發(fā)表于 06-04 09:23 ?1905次閱讀

美國限制英偉達(dá)和AMD向中東銷售AI芯片

據(jù)知情人士透露，美國官方已經(jīng)收緊了對(duì)向英偉達(dá)（NVIDIA）和AMD等芯片制造商發(fā)放向中東地區(qū)出口AI加速器的許可證，同時(shí)正在進(jìn)行一項(xiàng)關(guān)于該地區(qū)人工智能開發(fā)的國家安全評(píng)估。

發(fā)表于 05-31 14:25 ?2438次閱讀

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

2024年3月19日，[英偉達(dá)]CEO[黃仁勛]在GTC大會(huì)上公布了新一代AI芯片架構(gòu)BLACKWELL，并推出基于該架構(gòu)的超級(jí)芯片GB200，將助推數(shù)據(jù)處理、工程模擬、電子設(shè)計(jì)自動(dòng)化

發(fā)表于 05-13 17:16

英偉達(dá)、AMD、英特爾GPU產(chǎn)品及優(yōu)勢(shì)匯總

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）隨著人工智能技術(shù)的快速發(fā)展，GPU的市場(chǎng)規(guī)模在全球范圍內(nèi)持續(xù)提升。目前，GPU市場(chǎng)主要由英偉達(dá)、AMD和英特爾等幾家大公司主導(dǎo)。其中，英偉

發(fā)表于 05-10 00:59 ?4737次閱讀

美方持續(xù)收緊AI芯片對(duì)華出口限制，英偉達(dá)等巨頭面臨挑戰(zhàn)

為了挽回中國市場(chǎng)，英偉達(dá)不得不做出妥協(xié)，推出了符合美方限制政策的A100和A800芯片。

發(fā)表于 04-02 16:28 ?1082次閱讀

市值最高的半導(dǎo)體公司　英偉達(dá)市值短暫突破兩萬億美元

市值最高的半導(dǎo)體公司英偉達(dá)市值短暫突破兩萬億美元就在英偉達(dá)發(fā)布了超級(jí)亮眼的財(cái)報(bào)之后英偉

發(fā)表于 02-24 18:13 ?1095次閱讀

英偉達(dá)股價(jià)突破600美元

在周一的美股交易中，英偉達(dá)股價(jià)首次突破600美元，創(chuàng)下了歷史新高。最高點(diǎn)達(dá)到603.31美元，這使得英偉達(dá)的總市值達(dá)到了驚人的1.47萬億美

發(fā)表于 01-23 14:39 ?832次閱讀

臺(tái)積電財(cái)報(bào)引發(fā)股價(jià)漲，英偉達(dá)與AMD再創(chuàng)新高

在此次上漲趨勢(shì)中，英偉達(dá)和AMD無疑占據(jù)了主導(dǎo)地位。英偉達(dá)占據(jù)AI GPU市場(chǎng)的大多數(shù)份額，然而隨著業(yè)內(nèi)人士對(duì)

發(fā)表于 01-19 13:50 ?560次閱讀

英偉達(dá)與AMD激戰(zhàn)AI芯片市場(chǎng)，臺(tái)積電成最大贏家

AI芯片市場(chǎng)上，英偉達(dá)和AMD之間的競爭越來越激烈。AMD的MI300A系列產(chǎn)品已開始批量生產(chǎn)，并受到了客戶的熱情追捧。

發(fā)表于 01-10 18:11 ?1296次閱讀

英偉達(dá)和AMD發(fā)布適用于臺(tái)式電腦的新型AI芯片

英偉達(dá)和AMD這兩家GPU巨頭近日宣布，他們將發(fā)布適用于臺(tái)式電腦的新型AI芯片。

發(fā)表于 01-10 13:59 ?822次閱讀

Meta、OpenAI和微軟將采用AMD AI芯片挑戰(zhàn)英偉達(dá)市場(chǎng)地位

若AMD的高端芯片Instinct MI300X于明年初問世，并符合人工智能公司及云服務(wù)提供商的期望，有望降低開發(fā)模型成本，為英偉達(dá)的暴漲的人工智能

發(fā)表于 12-11 16:13 ?648次閱讀

谷歌揭秘Gemini，AMD對(duì)峙英偉達(dá)

今天，我們看到谷歌揭開了多模態(tài)AI模型Gemini的神秘面紗，AMD挑戰(zhàn)英偉達(dá)在AI芯片市場(chǎng)的霸主地位，微軟在英國AI領(lǐng)域的巨額投資，以及3GPP啟動(dòng)6G規(guī)范規(guī)劃。

發(fā)表于 12-07 20:05 ?689次閱讀

騰訊：已儲(chǔ)備足夠英偉達(dá)芯片！

劉熾平表示，騰訊已經(jīng)儲(chǔ)備足夠的英偉達(dá)芯片，可以繼續(xù)開發(fā)名為“混元”的人工智能模型，“至少再持續(xù)幾代”。因此，新的芯片限制短期內(nèi)不會(huì)影響騰訊A

發(fā)表于 11-22 17:00 ?604次閱讀

英偉達(dá)特供版芯片性能降80%！

報(bào)道中提到，英偉達(dá)的這三款A(yù)I芯片并非“改良版”，而是“縮水版”，其分別是HGX H20、L20 PCle和L2 PCle。用于AI模型訓(xùn)練的HGX H20在帶寬、計(jì)算速度等方面均有所限制

發(fā)表于 11-14 17:09 ?883次閱讀

搜索歷史

英偉達(dá)和AMD新芯片，突破PCIe限制

評(píng)論

AMD發(fā)布英偉達(dá)競品AI芯片,預(yù)期市場(chǎng)規(guī)模將大幅增長

英偉達(dá)Blackwell芯片已投產(chǎn)，預(yù)告未來AI芯片發(fā)展

美國限制英偉達(dá)和AMD向中東銷售AI芯片

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

英偉達(dá)、AMD、英特爾GPU產(chǎn)品及優(yōu)勢(shì)匯總

美方持續(xù)收緊AI芯片對(duì)華出口限制，英偉達(dá)等巨頭面臨挑戰(zhàn)

市值最高的半導(dǎo)體公司　英偉達(dá)市值短暫突破兩萬億美元

英偉達(dá)股價(jià)突破600美元

臺(tái)積電財(cái)報(bào)引發(fā)股價(jià)漲，英偉達(dá)與AMD再創(chuàng)新高

英偉達(dá)與AMD激戰(zhàn)AI芯片市場(chǎng)，臺(tái)積電成最大贏家

英偉達(dá)和AMD發(fā)布適用于臺(tái)式電腦的新型AI芯片

Meta、OpenAI和微軟將采用AMD AI芯片挑戰(zhàn)英偉達(dá)市場(chǎng)地位

谷歌揭秘Gemini，AMD對(duì)峙英偉達(dá)

騰訊：已儲(chǔ)備足夠英偉達(dá)芯片！

英偉達(dá)特供版芯片性能降80%！

搜索歷史

英偉達(dá)和AMD新芯片，突破PCIe限制

評(píng)論

英偉達(dá)和AMD新芯片，突破PCIe限制