0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

緩解AI推理算力焦慮,高帶寬GDDR6成殺手锏?

Rambus 藍(lán)鉑世科技 ? 來源:芯東西 ? 2023-06-02 15:49 ? 次閱讀

芯東西 5 月 22 日?qǐng)?bào)道,生成式 AI 的日益火爆,正對(duì)數(shù)據(jù)中心內(nèi)存性能提出更加苛刻的要求。無論是云端 AI 訓(xùn)練還是向網(wǎng)絡(luò)邊緣轉(zhuǎn)移的 AI 推理,都需要高帶寬、低時(shí)延的內(nèi)存。邁向高性能 GDDR6 內(nèi)存接口已是大勢(shì)所趨。

近日,推出業(yè)界領(lǐng)先 24Gb/s GDDR6 PHY 的美國(guó)半導(dǎo)體 IP 和芯片供應(yīng)商 Rambus,其兩位高管與芯東西等媒體進(jìn)行線上交流,分享了 Rambus 在 GDDR6 領(lǐng)域的技術(shù)創(chuàng)新及行業(yè)發(fā)展趨勢(shì)。

"ChatGPT 等 AIGC 應(yīng)用與我們公司產(chǎn)品組合是非常契合的。"Rambus 大中華區(qū)總經(jīng)理蘇雷說,Rambus China 立足于中國(guó)市場(chǎng),愿意更多、更緊密地支持中國(guó)公司在 ChatGPT 產(chǎn)業(yè)的發(fā)展,為他們保駕護(hù)航,"Rambus 面對(duì)中國(guó)客戶的需求,有最好的技術(shù)、最快的響應(yīng)和最好的技術(shù)支持來服務(wù)中國(guó)市場(chǎng)。"

據(jù) Rambus IP 核產(chǎn)品營(yíng)銷高級(jí)總監(jiān) Frank Ferro 分享,AI 推理應(yīng)用對(duì)帶寬的需求通常在 200 到 500Gb/s 的范圍之間波動(dòng),每一個(gè) GDDR6 設(shè)備的帶寬都可以達(dá)到 96Gb/s,因此通過將 4-5 個(gè) GDDR6 設(shè)備組合在一起,就能輕松滿足 500Gb/s 及以下的帶寬需求。

他談道,如果用到一個(gè) HBM3 設(shè)備,基本上會(huì)把這個(gè)帶寬需求的數(shù)字翻倍,能夠達(dá)到接近 800Gb/s 的帶寬,而這超過了 AI 推理本身所需要的 400 到 500Gb/s 帶寬,會(huì)使成本增加 3~4 倍。在這種條件下,HBM 并非一個(gè)經(jīng)濟(jì)高效的選擇,GDDR6 則是一個(gè)更好的替代。

他建議按需選擇 HBM 或是 GDDR6 內(nèi)存,對(duì)于對(duì)高帶寬和低延遲有很高要求的 AI 訓(xùn)練場(chǎng)景,HBM 可能是更好的選擇;對(duì)于需要更大容量、更高帶寬的 AI 推理場(chǎng)景,GDDR6 會(huì)是更合適的選擇。

高性能內(nèi)存和互連方案,支持下一代數(shù)據(jù)中心發(fā)展

Rambus 大中華區(qū)總經(jīng)理蘇雷談道,Rambus 主要業(yè)務(wù)包含基礎(chǔ)專利授權(quán)、芯片 IP 授權(quán)和內(nèi)存接口芯片。其中芯片 IP 又主要分為接口 IP 和安全 IP。其技術(shù)和產(chǎn)品面向數(shù)據(jù)密集型市場(chǎng),包括數(shù)據(jù)中心、5G、物聯(lián)網(wǎng) IoT、汽車等細(xì)分市場(chǎng),后續(xù)還將推出 CXL 家族各產(chǎn)品組合芯片。

b3cf8354-fbd7-11ed-90ce-dac502259ad0.jpg

面向數(shù)據(jù)中心,Rambus 非常注重產(chǎn)品和方案的易用性,通過一站式的解決方案以及完善的服務(wù)機(jī)制,使產(chǎn)品方案變得更易在客戶端集成使用。Rambus 陸續(xù)推出了各內(nèi)存子系統(tǒng)、接口子系統(tǒng),提供業(yè)界領(lǐng)先、可靠的數(shù)據(jù)傳輸。其 GDDR6 接口子系統(tǒng)率先實(shí)現(xiàn)高達(dá) 24Gb/s 的內(nèi)存接口數(shù)據(jù)速率,并能為每個(gè) GDDR6 內(nèi)存設(shè)備提供最高達(dá)到 96Gb/s 的帶寬。

Rambus 的內(nèi)存接口芯片產(chǎn)品不斷提高數(shù)據(jù)中心內(nèi)存模塊的速度和容量,同時(shí)它擁有非常豐富而全面的安全 IP 產(chǎn)品線,對(duì)用于靜態(tài)數(shù)據(jù)以及動(dòng)態(tài)數(shù)據(jù)安全保護(hù)都有著專門安全的產(chǎn)品方案。

總體來說,Rambus 通過領(lǐng)先的高性能內(nèi)存和互聯(lián)解決方案以及硬件級(jí)安全,支持下一代數(shù)據(jù)中心的發(fā)展。其產(chǎn)品應(yīng)用領(lǐng)域聚焦于服務(wù)器主內(nèi)存、人工智能和網(wǎng)絡(luò)加速器、智能網(wǎng)卡、網(wǎng)絡(luò)存儲(chǔ)、網(wǎng)絡(luò)交換機(jī)以及內(nèi)存擴(kuò)展和池化等。

b3f79e98-fbd7-11ed-90ce-dac502259ad0.jpg

內(nèi)存是未來 AI 性能的關(guān)鍵

Rambus IP 核產(chǎn)品營(yíng)銷高級(jí)總監(jiān) Frank Ferro 著重分享了迄今市場(chǎng)推動(dòng)高性能需求的主要驅(qū)動(dòng)力,以及未來如何更好滿足 AI 性能需求。

數(shù)據(jù)需求依舊呈現(xiàn)上漲趨勢(shì)。ChatGPT 等 AI 相關(guān)應(yīng)用快速發(fā)展,對(duì)內(nèi)存帶寬需求旺盛,因此市面上越來越多公司開始專注于開發(fā)自己個(gè)性化、定制化的處理器產(chǎn)品,以更好地滿足神經(jīng)網(wǎng)絡(luò)以及專屬應(yīng)用的需求。

Frank Ferro 強(qiáng)調(diào)說,盡管算力增長(zhǎng)非常顯著,但帶寬的進(jìn)步與之并不匹配,即現(xiàn)有高算力的基礎(chǔ)之上,很多的 GPU 資源其實(shí)并沒有得到充分的占用和利用,這造成了現(xiàn)在的困境。

AI 訓(xùn)練環(huán)節(jié)需要錄入大量數(shù)據(jù)進(jìn)行分析,需要消耗大量算力。AI 推理環(huán)節(jié)對(duì)算力的需求會(huì)大幅下降,但對(duì)成本和功耗更加敏感。Frank Ferro 談道,一個(gè)重要趨勢(shì)是 AI 推理越來越多地向邊緣設(shè)備上進(jìn)行集成和轉(zhuǎn)移。在這個(gè)變化過程中,擁有更高帶寬、更低時(shí)延特性的 GDDR6 方案,能夠幫助邊緣端更好地處理數(shù)據(jù)。

對(duì)帶寬需求進(jìn)一步的增加,驅(qū)動(dòng)了像 Rambus 這樣的公司不斷地在去打造更加新一代的產(chǎn)品,不斷地提高內(nèi)存帶寬以及接口帶寬的相關(guān)速度。

GDDR6 能夠提供 AI 推理所需的內(nèi)存性能

Rambus 有著豐富的接口 IP 產(chǎn)品組合,同時(shí)也提供像 DDR、LPDDR 以及 HBM 等產(chǎn)品,并非常關(guān)注 SerDes 產(chǎn)品的開發(fā),主要聚焦于 PCIe 和 CXL 接口,會(huì)開發(fā)配套的 PHY 及控制器。Rambus 的 HBM 產(chǎn)品擁有領(lǐng)先的市占率,同時(shí)其 HBM3 產(chǎn)品已經(jīng)能夠提供高達(dá) 8.4Gbps/s 的數(shù)據(jù)傳輸速率。

b43677c6-fbd7-11ed-90ce-dac502259ad0.jpg

其全新 GDDR6 PHY 及控制器的配套產(chǎn)品已達(dá)到業(yè)界領(lǐng)先的 24Gb/s 的數(shù)據(jù)傳輸速率,可為 AI 推理等應(yīng)用場(chǎng)景帶來巨大性能優(yōu)勢(shì)和收益。此外,該產(chǎn)品在功耗管理方面優(yōu)勢(shì)明顯,并實(shí)現(xiàn)了 PHY 以及控制器的完整集成,即客戶收到產(chǎn)品后,可以直接對(duì)其子系統(tǒng)進(jìn)行定制化應(yīng)用。

b4563b92-fbd7-11ed-90ce-dac502259ad0.jpg

如圖是 GDDR6 內(nèi)存接口系統(tǒng),Rambus 提供的是中間標(biāo)藍(lán)的兩個(gè)重要環(huán)節(jié),也就是完整的子系統(tǒng)。Rambus 會(huì)根據(jù)客戶具體應(yīng)用場(chǎng)景和實(shí)際的訴求對(duì)子系統(tǒng)來進(jìn)行優(yōu)化,并將其作為完整的子系統(tǒng)來交付給客戶。

clamshell 模式指每個(gè)信道可支持兩個(gè) GDDR6 的設(shè)備。換句話說,在 clamshell 模式之下,整個(gè)容量是直接翻倍乘以 2 的。值得一提的是,GDDR6 現(xiàn)已支持先進(jìn)的 FinFET 工藝節(jié)點(diǎn)環(huán)境。

此外,Rambus 也會(huì)針對(duì) PCB 以及封裝提供相關(guān)的參考設(shè)計(jì),同時(shí)內(nèi)部有信號(hào)完整度和邊緣完整性方面的專家,來幫助客戶完成整個(gè)設(shè)計(jì)工作。

市面上很多 GPU 加速器都已經(jīng)用到 GDDR6。由于在成本和性能之間達(dá)到不錯(cuò)的平衡,GDDR6 成為在 AI 應(yīng)用場(chǎng)景下比較合理的產(chǎn)品和選擇。而 Rambus 擁有領(lǐng)先的 SI/PI 專業(yè)知識(shí),可以進(jìn)行早期的協(xié)同設(shè)計(jì)和開發(fā),確保 GDDR6 產(chǎn)品的性能表現(xiàn),也能更好地去縮短產(chǎn)品的上市時(shí)間。

結(jié)語:在帶寬、成本、方案復(fù)雜性之間實(shí)現(xiàn)平衡

隨著 AI 應(yīng)用趨于盛行,蘇雷談道,下游廠商首先關(guān)注高帶寬,并開始關(guān)注方案的成本和復(fù)雜性,"GDDR 技術(shù)是在帶寬、成本和方案復(fù)雜性的各因素之間提供了一個(gè)非常完美的折中技術(shù)方案。" 他預(yù)計(jì)到 2025 年或 2026 年市場(chǎng)上會(huì)出現(xiàn)使用 GDDR6 IP 的芯片。

進(jìn)入全新的 GDDR6 時(shí)代,相關(guān)產(chǎn)品已開始采用 16 位的雙讀寫通道。雙讀寫通道加起來是 32 位的數(shù)據(jù)寬度,而 GDDR6 內(nèi)存有 8 個(gè)雙讀寫通道,總共可實(shí)現(xiàn) 256 位的數(shù)據(jù)傳輸寬度,所以能夠顯著提高數(shù)據(jù)傳輸?shù)乃俣群托剩到y(tǒng)層效率和功耗管理也能得到進(jìn)一步的優(yōu)化。

除了適用于 AI 推理場(chǎng)景外,F(xiàn)rank Ferro 說,GDDR6 也會(huì)在圖形領(lǐng)域和一些網(wǎng)絡(luò)應(yīng)用場(chǎng)景中起到重要作用,能夠大幅降低網(wǎng)絡(luò)邊緣設(shè)備對(duì) DDR 數(shù)量的需求。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    450

    文章

    49632

    瀏覽量

    417136
  • 控制器
    +關(guān)注

    關(guān)注

    112

    文章

    15882

    瀏覽量

    175353
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266216

原文標(biāo)題:【媒體報(bào)道】緩解 AI 推理算力焦慮,高帶寬 GDDR6 成殺手锏?

文章出處:【微信號(hào):Rambus 藍(lán)鉑世科技,微信公眾號(hào):Rambus 藍(lán)鉑世科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    下一代高端顯卡標(biāo)配,容量和速度雙翻倍的GDDR7登場(chǎng)!

    大量用于渲染或計(jì)算的數(shù)據(jù),其本身需要具備極快的數(shù)據(jù)傳輸速度。 ? 如果我們除去各大AI GPU搭載的HBM的話,目前主流的消費(fèi)級(jí)GPU仍在采用GDDR6。GDDR6最早是由三星在2016年的HotChip提出來的,隨后三星、美光
    的頭像 發(fā)表于 03-08 09:04 ?1594次閱讀
    下一代高端顯卡標(biāo)配,容量和速度雙翻倍的<b class='flag-5'>GDDR</b>7登場(chǎng)!

    AI網(wǎng)絡(luò)物理層底座: 大算芯片先進(jìn)封裝技術(shù)

    的基礎(chǔ)。而Chiplet先進(jìn)封裝技術(shù)讓AI訓(xùn)練/推理芯片的量產(chǎn)成為可能,所以AI網(wǎng)絡(luò)的物理層底座即芯片先進(jìn)封裝技術(shù)?!?AI技術(shù)的發(fā)展極大地推動(dòng)了對(duì)先進(jìn)封裝技術(shù)的需求,在高密度,高速度
    發(fā)表于 09-11 09:47 ?162次閱讀
    <b class='flag-5'>AI</b>網(wǎng)絡(luò)物理層底座: 大算<b class='flag-5'>力</b>芯片先進(jìn)封裝技術(shù)

    英偉達(dá)推出搭載GDDR6顯存的GeForce RTX 4070顯卡

    面對(duì)全球GDDR6X顯存供應(yīng)的嚴(yán)峻挑戰(zhàn),英偉達(dá)今日宣布了一項(xiàng)靈活應(yīng)變的市場(chǎng)策略:正式推出搭載GDDR6顯存的GeForce RTX 4070顯卡,旨在有效緩解市場(chǎng)對(duì)這一熱門型號(hào)顯卡的急切渴望。此舉
    的頭像 發(fā)表于 08-21 15:09 ?405次閱讀

    成都匯陽投資關(guān)于跨越帶寬增長(zhǎng)極限,HBM 賦能AI新紀(jì)元

    。 內(nèi)存難以跟上AI硬件的計(jì)算速度,限制了AI 芯片性能發(fā)揮,形成了“ 內(nèi)存墻 ” ; 2)GDDR5限制了外形尺寸:為實(shí)現(xiàn)帶寬,越
    的頭像 發(fā)表于 07-04 10:55 ?456次閱讀

    美光出樣業(yè)界容量密度最高新一代 GDDR7 顯存

    β(1-beta)DRAM 技術(shù)和創(chuàng)新架構(gòu),以優(yōu)化的功耗設(shè)計(jì)打造了速率高達(dá) 32 Gb/s 的高性能內(nèi)存。美光 GDDR7 的系統(tǒng)帶寬超過 1.5 TB/s,2?較 GDDR6 提升高達(dá) 60%,3?并配備四個(gè)獨(dú)立
    的頭像 發(fā)表于 06-05 16:52 ?924次閱讀

    如何基于OrangePi?AIpro開發(fā)AI推理應(yīng)用

    香橙派AIpro開發(fā)板采用昇騰AI技術(shù)路線,接口豐富且具有強(qiáng)大的可擴(kuò)展性,提供8/20TOPS澎湃算,可廣泛使用于AI邊緣計(jì)算、深度視覺學(xué)習(xí)及視頻流AI分析、視頻圖像分析、自然語言處
    的頭像 發(fā)表于 06-04 14:23 ?329次閱讀
    如何基于OrangePi?AIpro開發(fā)<b class='flag-5'>AI</b><b class='flag-5'>推理</b>應(yīng)用

    AMD RDNA4或采用GDDR6顯存,Navi 4X或Navi 4C具備216個(gè)計(jì)算單元?

    因受限 RDNA 3 世代尷尬處境,AMD 下一代 RDNA4 游戲顯卡似乎選擇避開與英偉達(dá)在旗艦級(jí)別產(chǎn)品上的競(jìng)爭(zhēng)。據(jù)消息人士 Kepler 透露,AMD 下一代 RDNA4 游戲顯卡將全部采用 18Gbps 的 GDDR6 顯存,而英偉達(dá)則可能使用更強(qiáng)大的 GDDR7
    的頭像 發(fā)表于 04-28 14:29 ?594次閱讀

    Rambus推GDDR7內(nèi)存控制器IP滿足AI應(yīng)用需求

    據(jù)報(bào)道,該公司的 GDDR7 控制器采用 PAM3 信號(hào),運(yùn)行速度高達(dá) 40 Gbps,能為 GDDR7 存儲(chǔ)器設(shè)備提供 160 GB/s 的吞吐量,相比其自身研發(fā)的GDDR6 控制器,提升了 67%。
    的頭像 發(fā)表于 04-23 15:52 ?343次閱讀

    英偉達(dá)、AMD新款顯卡或仍配備2GB GDDR7顯存

    據(jù)悉,現(xiàn)行GDDR6顯存每模塊采用8GB顯存容量,對(duì)此,@kopite7kimi援引內(nèi)部消息稱,英偉達(dá)即將發(fā)布的GeForce RTX 5090顯卡并無內(nèi)存翻倍的可能性。
    的頭像 發(fā)表于 03-08 14:54 ?528次閱讀

    三星展示GDDR7技術(shù):優(yōu)化TRX均衡與ZQ校準(zhǔn),提升傳輸速度

    GDDR7將運(yùn)用PAM3編碼方式,這種介于PAM4和NRZ之間的技術(shù)可提高周期內(nèi)數(shù)據(jù)傳送率,相較NRZ技術(shù)降低了對(duì)總線頻率的依賴,獲得比GDDR6更高性能且能耗更低的特性。
    的頭像 發(fā)表于 01-29 11:20 ?526次閱讀

    三星將展示16Gb GDDR7技術(shù),重點(diǎn)關(guān)注PAM3優(yōu)化TRX均衡和ZQ校準(zhǔn)

    該款高性能的 DRAM 采用 PAM3 編碼技術(shù),兼具 PAM4 和 NRZ 的優(yōu)點(diǎn),相較于 NRZ,它能夠以更高的數(shù)據(jù)傳輸率運(yùn)行,且無需過高的內(nèi)存總線頻率,表現(xiàn)優(yōu)于 GDDR6,能耗及成本則低于 GDDR6X。
    的頭像 發(fā)表于 01-29 10:13 ?813次閱讀

    HarmonyOS:使用MindSpore Lite引擎進(jìn)行模型推理

    場(chǎng)景介紹 MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件設(shè)備 AI 模型推理的功能,目前已經(jīng)在圖像分類、目標(biāo)識(shí)別、人臉識(shí)別、文字識(shí)別等應(yīng)用中廣泛使用。 本文介紹
    發(fā)表于 12-14 11:41

    問界新M7聲學(xué)系統(tǒng)有何稀奇

     問界新M7是華為推出的一款智能座艙車型,其中的鴻蒙智能座艙被稱為其“殺手锏”。該系統(tǒng)可以實(shí)現(xiàn)手機(jī)與車機(jī)之間的無縫聯(lián)動(dòng)交互。
    的頭像 發(fā)表于 12-08 16:01 ?1515次閱讀

    利用搭載全域硬2D NoC的FPGA器件去完美實(shí)現(xiàn)智能化所需的帶寬低延遲計(jì)算

    在該FPGA器件的外圍,這個(gè)硬2D NoC連接到所有高速接口:包括多個(gè)400G以太網(wǎng)、PCIe Gen5、GDDR6和DDR4/5端口。這使得Achronix的Speedster7t成為了業(yè)界第一款
    的頭像 發(fā)表于 11-24 16:19 ?327次閱讀

    XPC-3399規(guī)格書

    在電子產(chǎn)品的世界中,性能是個(gè)永恒的話題,世界各大廠家使出渾身解數(shù)交替拋出殺手锏來證明自己的實(shí)力。而在這些廠家中,不能不提到
    發(fā)表于 10-09 06:21