0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HBM3首發(fā)GPU,又要進軍自動駕駛

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2022-03-29 07:35 ? 次閱讀

人工智能的蓬勃發(fā)展促使產(chǎn)業(yè)對AI基礎(chǔ)設(shè)施提出了更高的性能要求,先進計算處理單元,尤其是ASICGPU,為了在機器學(xué)習(xí)、HPC提供穩(wěn)定的算力表現(xiàn),傳統(tǒng)的內(nèi)存系統(tǒng)已經(jīng)不太能滿足日益增加的帶寬了。與此同時,在我們報道的不少AI芯片、HPC系統(tǒng)中,HBM或類似的高帶寬內(nèi)存越來越普遍,為數(shù)據(jù)密集型應(yīng)用提供了支持。

提及HBM,不少人都會想到成本高、良率低等缺陷,然而這并沒有影響業(yè)內(nèi)對HBM的青睞,諸如AMD的RadeonPro5600M、英偉達的A100等消費級/企業(yè)級GPU,或是思科的路由ASIC芯片SiliconOneQ100、英特爾與AMD-Xilinx的FPGA,都用到了HBM內(nèi)存。就在今年1月底,JEDEC終于正式發(fā)布了HBM的第四代HBM3的標準。

HBM3性能未來可期

HBM2/2E與HBM3的架構(gòu)對比 / SK海力士


HBM3帶來的性能提升大家應(yīng)該都比較清楚了,傳輸速率是HBM2的兩倍,達到了6.4Gb/s,使得每個堆棧最高可達819GB/s的帶寬??捎玫莫毩⑼ǖ酪矎腍BM2的8個擴充至16個,加上每個通道兩個偽通道的設(shè)計,HBM3可以說支持到32通道了,提供更優(yōu)秀的時序來提升系統(tǒng)性能。

HBM3 8Hi和12Hi的機械結(jié)構(gòu)對比/ SK海力士


HBM3的TSV堆疊層數(shù)支持4-high、8-high和12-high,這倒是和HBM2e沒有什么差別。從SK海力士提供的機械結(jié)構(gòu)圖來看,無論是8Hi還是12Hi,其封裝大小和高度都是一樣的,只不過是減小了中間堆疊的裸片高度。這僅僅是第一代HBM3,未來HBM3會擴展至16-high的TSV堆棧,單設(shè)備的內(nèi)存密度范圍也將達到4GB至64GB,不過第一代HBM3設(shè)備的話,目前用到的依然是16GB的內(nèi)存層。

此外,在散熱上,通過增加dummybump、增加HBM3裸片大小并降低間隙高度,HBM3成功將溫度降低了25%,實現(xiàn)了更好的散熱性能。在7位ADC的支持下,HBM3的溫度傳感器也能以1℃的分辨率輸出0到127℃的溫度信息。

首個用上HBM3的平臺

以在GTC22上亮相的H100 GPU為例,這是全球首個支持PCIe5.0并利用HBM3的GPU,其內(nèi)存容量達到了80GB。這個容量與上一代A100一致,但帶寬卻有了質(zhì)的飛躍,與采用HBM2的A100相比,H100的內(nèi)存帶寬提升了兩倍,達到了3TB/s。

英偉達各個系列GPU加速卡的內(nèi)存帶寬 / 英偉達


你可能會感到疑惑,既然HBM3可以提供每個堆棧16GB以上的內(nèi)存,從H100的芯片圖上看來有6個HBM3,為何只有80GB呢?是不是英偉達為了成本有所閹割?

H100 GPU / 英偉達


其實原因很簡單,6個HBM3的其中一個為DummyDie,所以真正可用的HBM3內(nèi)存只有5x16也就是80GB,所以英偉達在H100的白皮書也明確提到了這80GB是由5Stacks的HBM3內(nèi)存組成。如此做的原因很可能是出于良率的考量,畢竟我們已經(jīng)提到了HBM良率低的包袱,而且上一代80GB HBM2e的A100也是如此設(shè)計的。

HBM找到了新的市場

根據(jù)SK海力士給出的市場預(yù)期,HBM市場正在以40%的年復(fù)合增長率席卷HPC、AI和CPU等應(yīng)用,如今這其中還多出來一個特殊的應(yīng)用,那就是ADAS和自動駕駛。如今的自動駕駛芯片上幾乎看不到HBM的存在,即便是英偉達的JetsonAGX Orin,用的也只是256位的LPDDR5內(nèi)存,帶寬最高只有204.8GB/s。

HBM3內(nèi)存 / SK海力士


這種情況再正常不過了,誰叫如今的ADAS或自動駕駛方案還用不到HBM的大帶寬?;ㄥX去設(shè)計HBM,還不如在芯片的計算性能上多下功夫。然而到了L4或L5的自動駕駛中,又是另外一幅光景了。低延遲和準確的數(shù)據(jù)處理對于激光雷達、攝像頭等傳感器來說,可謂至關(guān)重要,這兩大自動駕駛等級下的帶寬至少也要1TB/s。

據(jù)研究機構(gòu)的預(yù)測,到了2030年,L4以上的自動駕駛系統(tǒng)將占據(jù)20%的市場,到了2035年,這一比例將上升至45%。為了不在突破L3時遇到帶寬的瓶頸,引入HBM可以說是越早越好,甚至從L3就可以開始考慮了,畢竟現(xiàn)在不少自動駕駛芯片已經(jīng)標榜著L3乃至L4以上的能力。

比如L3級別的自動駕駛,帶寬要求在600GB/s到1TB/s之間,單車可以使用兩個HBM2e或者一個HBM3;而L4到L5級別的自動駕駛,帶寬要求在1TB/s到1.5TB之間,單車可用3個HBM2e或兩個HBM3。

結(jié)語

雖然HBM3標準已經(jīng)發(fā)布,芯片設(shè)計公司(英偉達、AMD、英特爾)、IP公司(新思、CadenceRambus)、晶圓代工廠的封裝技術(shù)(臺積電Cowos-S、三星H-Cube、英特爾EMIB)以及存儲廠商(三星、SK海力士)都開始了相關(guān)的部署,但HBM3的普及仍然需要時間。

預(yù)計2023年到2024年,我們可以見到第一代HBM3內(nèi)存在HPC上的普及,2025年到2026年第二代才會開始放量,屆時我們也能看到下一代HBM4的性能前瞻。至于HBM上自動駕駛芯片倒是不必急求,汽車產(chǎn)品的上市周期一向很長,從HBM3的推進速度來看,估計L4和L5才能充分利用HBM3乃至HBM4的全部優(yōu)勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4678

    瀏覽量

    128612
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29852

    瀏覽量

    268150
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    14683
  • HBM3
    +關(guān)注

    關(guān)注

    0

    文章

    74

    瀏覽量

    139
收藏 人收藏

    評論

    相關(guān)推薦

    HBM格局生變!傳三星HBM3量產(chǎn)供貨英偉達,國內(nèi)廠商積極布局

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)根據(jù)韓媒sedaily 的最新報道,三星華城17號產(chǎn)線已開始量產(chǎn)并向英偉達供應(yīng)HBM3內(nèi)存。同時,美光已經(jīng)為英偉達供應(yīng)HBM3E。至此,高端HBM內(nèi)存的供應(yīng)由SK海力士
    的頭像 發(fā)表于 07-23 00:04 ?3617次閱讀

    自動駕駛汽車安全嗎?

    隨著未來汽車變得更加互聯(lián),汽車逐漸變得更加依賴技術(shù),并且逐漸變得更加自動化——最終實現(xiàn)自動駕駛,了解自動駕駛汽車的安全問題變得非常重要,這樣你才能回答“自動駕駛汽車安全嗎”和“
    的頭像 發(fā)表于 10-29 13:42 ?412次閱讀
    <b class='flag-5'>自動駕駛</b>汽車安全嗎?

    自動駕駛HiL測試方案案例分析--ADS HiL測試系統(tǒng)#ADAS #自動駕駛 #VTHiL

    自動駕駛
    北匯信息POLELINK
    發(fā)布于 :2024年10月22日 15:20:19

    自動駕駛HiL測試方案 ——場景仿真3D演示#ADAS #自動駕駛 #VTHiL

    自動駕駛
    北匯信息POLELINK
    發(fā)布于 :2024年10月16日 10:55:35

    HBM上車?HBM2E被用于自動駕駛汽車

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)日前,韓媒報道SK海力士副總裁Kang Wook-sung透露,SK海力士HBM2E正用于Waymo自動駕駛汽車,并強調(diào)SK海力士是Waymo自動駕駛汽車這項先進內(nèi)存
    的頭像 發(fā)表于 08-23 00:10 ?6496次閱讀

    FPGA在自動駕駛領(lǐng)域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動駕駛領(lǐng)域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動駕駛技術(shù)中不可或缺的一部分。以下是FPGA在自動駕駛
    發(fā)表于 07-29 17:11

    FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動駕駛領(lǐng)域具有廣泛的應(yīng)用,其高性能、可配置性、低功耗和低延遲等特點為自動駕駛的實現(xiàn)提供了強有力的支持。以下
    發(fā)表于 07-29 17:09

    中國AI芯片和HBM市場的未來

     然而,全球HBM產(chǎn)能幾乎被SK海力士、三星和美光壟斷,其中SK海力士占據(jù)AI GPU市場80%份額,是Nvidia HBM3內(nèi)存獨家供應(yīng)商,且已于今年3月啟動
    的頭像 發(fā)表于 05-28 09:40 ?798次閱讀

    未來已來,多傳感器融合感知是自動駕駛破局的關(guān)鍵

    方面表示,這是L4級自動駕駛公司和車企為了打造Robotaxi量產(chǎn)車,在國內(nèi)成立的首個合資公司。款車型已完成產(chǎn)品定義,正在進行設(shè)計造型的聯(lián)合評審,計劃明年實現(xiàn)量產(chǎn)。未來已來,2024年是全球L3
    發(fā)表于 04-11 10:26

    HBM3E起飛,沖鋒戰(zhàn)鼓已然擂響

    HBM3自2022年1月誕生,便憑借其獨特的2.5D/3D內(nèi)存架構(gòu),迅速成為高性能計算領(lǐng)域的翹楚。HBM3不僅繼承了前代產(chǎn)品的優(yōu)秀特性,更在技術(shù)上取得了顯著的突破。它采用了高達1024位的數(shù)據(jù)路徑,并以驚人的6.4 Gb/s的速
    的頭像 發(fā)表于 03-30 14:34 ?2119次閱讀
    <b class='flag-5'>HBM3</b>E起飛,沖鋒戰(zhàn)鼓已然擂響

    SK海力士HBM3E正式量產(chǎn),鞏固AI存儲領(lǐng)域的領(lǐng)先地位

    SK海力士作為HBM3E的首發(fā)玩家,預(yù)計這款最新產(chǎn)品的大批量投產(chǎn)及其作為業(yè)內(nèi)首家供應(yīng)HBM3制造商所累積的經(jīng)驗,將進一步強化公司在AI存儲器市場的領(lǐng)導(dǎo)者地位。
    的頭像 發(fā)表于 03-19 15:18 ?941次閱讀

    英偉達斥資預(yù)購HBM3內(nèi)存,為H200及超級芯片儲備產(chǎn)能

    據(jù)最新傳聞,英偉達正在籌劃發(fā)布兩款搭載HBM3E內(nèi)存的新品——包括141GB HBM3E的H200 GPU及GH200超級芯片,這也進一步說明了對于HBM內(nèi)存的大量需求。
    的頭像 發(fā)表于 01-02 09:27 ?700次閱讀

    LabVIEW開發(fā)自動駕駛的雙目測距系統(tǒng)

    LabVIEW開發(fā)自動駕駛的雙目測距系統(tǒng) 隨著車輛駕駛技術(shù)的不斷發(fā)展,自動駕駛技術(shù)正日益成為現(xiàn)實。從L2級別的輔助駕駛技術(shù)到L3級別的受條件
    發(fā)表于 12-19 18:02

    Rambus通過9.6 Gbps HBM3內(nèi)存控制器IP大幅提升AI性能

    作為業(yè)界領(lǐng)先的芯片和 IP 核供應(yīng)商,致力于使數(shù)據(jù)傳輸更快更安全,Rambus Inc.(納斯達克股票代碼:RMBS)今日宣布 Rambus HBM3 內(nèi)存控制器 IP 現(xiàn)在可提供高達 9.6
    的頭像 發(fā)表于 12-07 14:16 ?700次閱讀

    Rambus通過9.6 Gbps HBM3內(nèi)存控制器IP大幅提升AI性能

    為增強AI/ML及其他高級數(shù)據(jù)中心工作負載打造的 Rambus 高性能內(nèi)存 IP產(chǎn)品組合 高達9.6 Gbps的數(shù)據(jù)速率,支持HBM3內(nèi)存標準的未來演進 實現(xiàn)業(yè)界領(lǐng)先的1.2 TB/s以上內(nèi)存吞吐量
    發(fā)表于 12-07 11:01 ?234次閱讀
     Rambus通過9.6 Gbps <b class='flag-5'>HBM3</b>內(nèi)存控制器IP大幅提升AI性能