0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Rambus提升GDDR6帶寬,以應(yīng)對邊緣計算挑戰(zhàn)

Rambus 藍(lán)鉑世科技 ? 來源:Rambus 藍(lán)鉑世科技 ? 2023-05-29 09:34 ? 次閱讀

為了不斷滿足人工智能機器學(xué)習(xí)需求的迅速增長,算力在快速增長,數(shù)據(jù)量也在快速增長。

現(xiàn)在ChatGPT等人工智能相關(guān)的應(yīng)用程序,它的增長速度以及對數(shù)據(jù)的需求更是非常龐大,而且ChatGPT-3是以1750 億個參數(shù)進(jìn)行訓(xùn)練的。這些人工智能應(yīng)用的快速發(fā)展,也對處理器及帶寬提出了更高的要求和標(biāo)準(zhǔn)。

“市面上越來越多的客戶和公司都開始專注于開發(fā)自己個性化、定制化的處理器產(chǎn)品,以更好地滿足神經(jīng)網(wǎng)絡(luò)以及專屬應(yīng)用的需求?!?a href="http://ttokpm.com/tags/ram/" target="_blank">Rambus IP核產(chǎn)品營銷高級總監(jiān)Frank Ferro說道。

此時,內(nèi)存墻問題越來越成為制約算力的重要問題。Frank表示:“盡管算力的增長非常顯著,但是帶寬上的進(jìn)步卻無法改善,也就是造成兩者間的不匹配,很多計算資源并沒有被充分利用到?!?/p>

正是由于對帶寬需求更加進(jìn)一步的增加,以及對需求的上漲,驅(qū)動了像Rambus公司一樣不斷打造新一代的產(chǎn)品,提高內(nèi)存帶寬以及接口帶寬。實際上,根據(jù)Rambus 5月初剛剛公布的2023年一季度業(yè)績公告,在內(nèi)存接口芯片的推動下,季度產(chǎn)品收入達(dá)到 6380 萬美元,同比增長 33%,總營收達(dá)到了1億1400萬,均創(chuàng)出新高。

HBM還是GDDR

人工智能的應(yīng)用場景可劃分為訓(xùn)練和推理兩部分,其中訓(xùn)練是指通過大數(shù)據(jù)訓(xùn)練出一個復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,通過大量標(biāo)記過的數(shù)據(jù)來訓(xùn)練相應(yīng)的系統(tǒng),使其能夠適應(yīng)特定的功能。而推理則是利用訓(xùn)練好的模型,使用新數(shù)據(jù)推理出各種結(jié)論。借助神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運算,利用輸入的新數(shù)據(jù)來一次性獲得正確結(jié)論的過程。

訓(xùn)練和推理在算力和存儲上的需求并不完全相同,訓(xùn)練需要更大的數(shù)據(jù)進(jìn)行分析,而推理則更注重成本。也正因此,產(chǎn)業(yè)界誕生了包括HBM與GDDR兩種存儲解決方案,以適應(yīng)不同的場景要求。

AI推理場景帶寬大概需要400-500Gb/s的帶寬,如果用HBM3,帶寬可以提高至800Gb/s,但卻是大材小用,同時成本會增加3-4倍之多。

e2e9c596-fdbc-11ed-90ce-dac502259ad0.png

HBM(高帶寬內(nèi)存)于 2013 年推出,是一種高性能 3D 堆疊 SDRAM架構(gòu)。如其名稱所述,HBM最重要的是帶寬更高,盡管HBM的內(nèi)存都以相對較低的數(shù)據(jù)速率運行,但其通道數(shù)更多。例如,以3.6 Gbps運行的HBM2E在存儲和處理器間的通道數(shù)達(dá)到了1024條,這無法在PCB上實現(xiàn),因此硅中階層(interposal)被用來連接內(nèi)存和處理器。

e2ffd656-fdbc-11ed-90ce-dac502259ad0.png

GDDR的歷史

隨著AI的推理越來越多地向邊緣設(shè)備上進(jìn)行集成和轉(zhuǎn)移,GDDR越來越成為邊緣AI處理所需。比起HBM,GDDR的歷史則更為悠久。GDDR可以追溯到PC和游戲機時代,早期的GPU使用SDRAM和DDR,這與CPU相同。隨著對GPU性能追求增強,推動了GDDR專用圖形顯示的需求增長。

2003 年 10 月,英偉達(dá)推出了 GeForce FX 5700 Ultra,搭配了256 MB GDDR2 DRAM,當(dāng)時5000系列大部分仍使用DDR DRAM。直到 2018 年底 GeForce 16 和 20 系列,GDDR被用于整個產(chǎn)品線。如今,GDDR6 是最先進(jìn)的顯存解決方案。

e31b8392-fdbc-11ed-90ce-dac502259ad0.png

相比于LPDDR和DDR,GDDR在帶寬關(guān)鍵參數(shù)上具有絕對優(yōu)勢,在24Gb/s傳輸速率和32位總線的時候,GDDR6可以提供最多96GB/s的帶寬,在速度、帶寬和延遲方面顯著優(yōu)于其他產(chǎn)品。

Rambus GDDR6方案

Rambus提供業(yè)內(nèi)鮮有的全面內(nèi)存IP產(chǎn)品組合,包括DDR、LPDDR、GDDR以及HBM,此外還有連接類Serdes,諸如PCIe和CXL,均達(dá)到了業(yè)界領(lǐng)先水平。并且Rambus的解決方案大多是提供包括控制器和PHY在內(nèi)的全套方案。

為了應(yīng)對邊緣AI對于GDDR的需求,Rambus日前推出的GDDR6 PHY,提供市場領(lǐng)先的數(shù)據(jù)傳輸速率,最高可達(dá)24 Gb/s,能夠為每個GDDR6內(nèi)存設(shè)備帶來96 GB/s的帶寬,達(dá)到了行業(yè)標(biāo)桿水平。此前GDDR6的傳輸率為16Gb/s,總帶寬64GB/s,全新的GDDR6使帶寬增加了50%,從而為人工智能/機器學(xué)習(xí)(AI/ML)、圖形和網(wǎng)絡(luò)應(yīng)用提供更高成本效益、高帶寬的內(nèi)存。并憑借與Foundry的密切合作,支持先進(jìn)的工藝節(jié)點。

e358f286-fdbc-11ed-90ce-dac502259ad0.png

除了業(yè)界領(lǐng)先的24Gb/s性能外,Rambus GDDR6 PHY還經(jīng)過了全方位的優(yōu)化,可滿足AI/ML及其他需要高帶寬、低延遲內(nèi)存解決方案的先進(jìn)應(yīng)用的需求。Rambus能夠?qū)崿F(xiàn)24Gb/s的數(shù)據(jù)傳輸速率,依靠的是其在信號完整性和電源完整性(SI/PI)方面享譽世界的專業(yè)知識,這些知識可用于設(shè)計PHY、芯片封裝和印刷電路板(PCB)。

此外,F(xiàn)rank還強調(diào)Rambus的工程師會和客戶在設(shè)計初期就緊密合作,并提供封裝參考設(shè)計,以確保系統(tǒng)達(dá)到最優(yōu)性能。

總而言之,Rambus的GDDR6方案在性能、功耗管理、集成、完整性、以及支持等方面都具有明顯優(yōu)勢,是提升邊緣計算能力的理想合作伙伴。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19100

    瀏覽量

    228810
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4733

    瀏覽量

    100415
  • Rambus
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    18784
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    506

    瀏覽量

    25430

原文標(biāo)題:【媒體報道】Rambus提升GDDR6帶寬,以應(yīng)對邊緣計算挑戰(zhàn)

文章出處:【微信號:Rambus 藍(lán)鉑世科技,微信公眾號:Rambus 藍(lán)鉑世科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    GDDR6和HBM2E雙利器!Rambus內(nèi)存接口方案助力突破AI應(yīng)用帶寬瓶頸

    12月9日,Rambus線上設(shè)計峰會召開,針對數(shù)據(jù)中心的存儲挑戰(zhàn)、5G邊緣計算,以及內(nèi)存接口方案如何提高人工智能和訓(xùn)練推理應(yīng)用程序的性能,Rambu
    的頭像 發(fā)表于 12-21 22:15 ?6169次閱讀

    Achronix Speedster7t FPGA如何運用GDDR6滿足網(wǎng)絡(luò)產(chǎn)品的高帶寬需求

    GDDR6的優(yōu)勢從圖形計算擴展至高性能網(wǎng)絡(luò)應(yīng)用?下文主要介紹Achronix Speedster7t FPGA如何運用GDDR6滿足下一代網(wǎng)絡(luò)產(chǎn)品的高帶寬需求。
    發(fā)表于 02-17 20:48 ?1622次閱讀

    GDDR6接口通道需要特殊的設(shè)計考慮

      許多系統(tǒng)公司正在進(jìn)行關(guān)于參與下一代 GDDR6 DRAM 實施的設(shè)計討論。與前幾代 DDR 不同,這一代存在許多設(shè)計挑戰(zhàn),需要 SoC 和系統(tǒng)設(shè)計人員仔細(xì)評估完整的 GDDR6 內(nèi)存接口,
    發(fā)表于 07-28 08:03 ?1068次閱讀

    Rambus通過業(yè)界領(lǐng)先的24Gb/s GDDR6 PHY提升AI性能

    中國北京,2023年5月17日 ——作為業(yè)界領(lǐng)先的芯片和半導(dǎo)體IP供應(yīng)商,致力于使數(shù)據(jù)傳輸更快更安全,Rambus Inc.(納斯達(dá)克股票代碼:RMBS)今日宣布推出新的里程碑式產(chǎn)品,提升GDDR6
    發(fā)表于 05-17 13:47 ?443次閱讀

    如何緩解GDDR6 DRAM實施所帶來的挑戰(zhàn)

    下一代GDDR6 DRAM的設(shè)計討論。與之前的DDR系列不同,這一系列產(chǎn)品還存在許多設(shè)計挑戰(zhàn),它要求SoC和系統(tǒng)設(shè)計人員仔細(xì)評估整個GDDR6存儲器接口實現(xiàn)成功的設(shè)計。
    發(fā)表于 01-01 06:29

    探究GDDR6給FPGA帶來的大帶寬存儲優(yōu)勢以及性能測試(上)

    的瓶頸。2020年7月15日,JEDEC存儲協(xié)會正式發(fā)布了DDR5 SDRAM的標(biāo)準(zhǔn)(JESD79-5),內(nèi)存的頻率相對DDR4的標(biāo)準(zhǔn)頻率有了大幅的提升,總傳輸帶寬提升了38%,但是還是和G
    發(fā)表于 12-21 08:00

    探究GDDR6給FPGA帶來的大帶寬存儲優(yōu)勢以及性能測試(下)

    GDDR6的顆粒,用x16模式,實現(xiàn)最高512Gb/s的帶寬。因為目前市面上GDDR6顆粒的最大容量是16Gb,在有些應(yīng)用中如果對容量有一定的要求,可以使用一種叫Clamshell的連接方式,如圖7
    發(fā)表于 12-22 08:00

    Rambus GDDR6 PHY內(nèi)存達(dá)18 Gbps 延續(xù)了公司長期開發(fā)領(lǐng)先產(chǎn)品的傳統(tǒng)

    硅IP和芯片提供商Rambus 31日宣布其Rambus GDDR6 PHY 內(nèi)存已達(dá)到行業(yè)領(lǐng)先的18 Gbps性能。Rambus GDDR6
    發(fā)表于 11-15 16:07 ?982次閱讀

    搭配GDDR6顯存的GTX 1650顯卡曝光 帶寬將從128GB/s提升到192GB/s

    DIY玩家都知道NVIDIA近年來刀法精妙,卡位很準(zhǔn),不過老黃也會有良心升級的時候,千元級GTX 1650顯卡很快會從GDDR5升級到GDDR6顯存,顯存帶寬預(yù)計提升50%。
    發(fā)表于 03-30 14:45 ?2551次閱讀

    GTX 1650 GDDR6和GTX 1650 GDDR5區(qū)別在哪里

    GDDR6顯存很長時間以來是中高端顯卡的標(biāo)志,可是隨著GDDR6價格的不斷下降,時代早就變了,近幾天入門級游戲顯卡GTX 1650終于也投向了GDDR6,相關(guān)產(chǎn)品紛紛上架。不過GDDR
    的頭像 發(fā)表于 08-18 14:24 ?2.1w次閱讀
    GTX 1650 <b class='flag-5'>GDDR6</b>和GTX 1650 <b class='flag-5'>GDDR</b>5區(qū)別在哪里

    紫光國芯宣布推出12nm工藝的GDDR6存儲控制器和物理接口IP

    根據(jù)紫光國芯介紹,這個GDDR6 MC/PHY IP包括一個可配置的內(nèi)存控制器(MC),其完全符合DFI3.1和AMBA AXI4.0標(biāo)準(zhǔn),并允許設(shè)計工程師生成具有優(yōu)化延遲和帶寬GDDR6控制器
    的頭像 發(fā)表于 11-19 14:53 ?2227次閱讀

    探究GDDR6給FPGA帶來的大帶寬存儲優(yōu)勢以及性能測試(下)

    接上一篇。。。。。。 5. GDDR6技術(shù)細(xì)節(jié)以及Clamshell模式 GDDR6它是采用16n Prefetch結(jié)構(gòu),一次寫操作或者讀操作的數(shù)據(jù)是16n。每個GDDR6顆粒有兩個獨立的通道,每個
    的頭像 發(fā)表于 12-03 11:49 ?6175次閱讀
    探究<b class='flag-5'>GDDR6</b>給FPGA帶來的大<b class='flag-5'>帶寬</b>存儲優(yōu)勢以及性能測試(下)

    Rambus推出提升GDDR6內(nèi)存接口性能的Rambus GDDR6

    憑借Rambus GDDR6 PHY所實現(xiàn)的新一級性能,設(shè)計人員可以為帶寬要求極為苛刻的工作負(fù)載提供所需的帶寬。和我們領(lǐng)先的HBM3內(nèi)存接口一樣,這項最新成就表明了我們不斷致力于開發(fā)最
    的頭像 發(fā)表于 05-17 14:22 ?787次閱讀

    為AI推理打造高達(dá)24Gb/s的GDDR6 PHY,Rambus全面支持中國市場的AI升級

    ,但對成本和功耗更為敏感。 ? 在AI推理應(yīng)用越來越多的趨勢下,Rambus率先研判與推出GDDR6 IP產(chǎn)品組合。Rambus IP核產(chǎn)品營銷高級總監(jiān)Frank Ferro先生表示,作為更加理想的方案,
    的頭像 發(fā)表于 05-26 16:38 ?1524次閱讀
    為AI推理打造高達(dá)24Gb/s的<b class='flag-5'>GDDR6</b> PHY,<b class='flag-5'>Rambus</b>全面支持中國市場的AI升級

    緩解AI推理算力焦慮,高帶寬GDDR6成殺手锏?

    據(jù) Rambus IP 核產(chǎn)品營銷高級總監(jiān) Frank Ferro 分享,AI 推理應(yīng)用對帶寬的需求通常在 200 到 500Gb/s 的范圍之間波動,每一個 GDDR6 設(shè)備的帶寬
    的頭像 發(fā)表于 06-02 15:49 ?550次閱讀
    緩解AI推理算力焦慮,高<b class='flag-5'>帶寬</b><b class='flag-5'>GDDR6</b>成殺手锏?