0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

討論AI與存儲(chǔ)器互連的挑戰(zhàn)和解決方案

454398 ? 來源:電子工程專輯 ? 作者:Gary Hilson ? 2020-12-09 15:43 ? 次閱讀

位置、位置、位置,這并不只是房地產(chǎn)界的核心詞。為了滿足人工智能AI)和機(jī)器學(xué)習(xí)應(yīng)用的需求,這個(gè)詞被越來越多地應(yīng)用于數(shù)據(jù)存儲(chǔ),如數(shù)據(jù)存儲(chǔ)的位置以及存放數(shù)據(jù)的存儲(chǔ)器。

但解決這種位置的挑戰(zhàn)不只是存儲(chǔ)器供應(yīng)商應(yīng)做的工作,與AI相關(guān)的供應(yīng)商也扮演著重要角色。盡管存儲(chǔ)距離計(jì)算越來越近,但解決方案的很大一部分在于存儲(chǔ)互連。Rambus研究員Steve Woo最近在AI硬件峰會(huì)上主持了一次在線圓桌論壇,討論了存儲(chǔ)器互連的挑戰(zhàn)和解決方案,他說:“我們都在為AI的不同方面而工作?!?/p>

Marvell的ASIC事業(yè)部CTO Igor Arsovski在17年前曾經(jīng)做過SRAM設(shè)計(jì)工程師。他說,慕尼黑啤酒節(jié)(Oktoberfest)因?yàn)樾鹿诜窝滓咔槿∠耍汛鎯?chǔ)互連比做啤酒很合適。參加啤酒節(jié),可以很容易喝到啤酒?!岸鳶RAM就好像近在身邊的啤酒一樣。它隨手可得,不需要耗費(fèi)多少能量,而且只要您需要,它就在那兒,就像擁有一個(gè)不錯(cuò)的高性能加速器?!钡牵绻麤]有足夠的存儲(chǔ)空間,就需要走遠(yuǎn)一點(diǎn),同時(shí)也需要花費(fèi)更多能量來獲取它,就好像必須走更遠(yuǎn)才能買到大桶啤酒一樣。

Arsovski 說,對(duì)存儲(chǔ)器而言,大桶啤酒就好像高帶寬存儲(chǔ)器(HBM),它正越來越多地被AI所采用?!霸L問這種存儲(chǔ)器需要花費(fèi)約60倍的能量。那里容量雖然大得多,但訪問它的帶寬卻很少。”將啤酒類比擴(kuò)展到LPDDR之類的技術(shù),這種技術(shù)比SRAM更先進(jìn)。他說:“LPDDR功耗明顯更高,但容量更大。這就像沿著那條路走到您最喜愛的酒吧,在那里有幾桶啤酒等著您?!?/p>

Arsovski表示,下一代加速器的發(fā)展方向是將那些存儲(chǔ)器放在加速器正上方,讓存儲(chǔ)離計(jì)算更近。MLCommons執(zhí)行董事David Kanter補(bǔ)充說,這個(gè)啤酒類比概述了不同的封裝途徑以及在何處安放不同的硅片。MLCommons是一個(gè)提供機(jī)器學(xué)習(xí)標(biāo)準(zhǔn)和AI推理基準(zhǔn)的組織,其成員涵蓋學(xué)術(shù)界和工業(yè)界。他說道:“這使我們對(duì)不同的工作負(fù)載有非常全面的了解。MLCommons正在開始采取一些措施,其中重點(diǎn)之一就是建立咨詢委員會(huì),以吸收特定應(yīng)用領(lǐng)域的一些資深專家?!?/p>

Kanter說,對(duì)存儲(chǔ)器而言,整個(gè)系統(tǒng)環(huán)境至關(guān)重要?!澳仨毧紤]系統(tǒng)要實(shí)現(xiàn)什么,這將決定要考慮的問題?!彼f,當(dāng)涉及到存儲(chǔ)器的位置和連接時(shí),芯片、封裝和電路板都是必須考慮的要素?!霸陉嚵薪Y(jié)構(gòu)、單元類型以及距離方面,有很多地方可以優(yōu)化。”

Kanter說,明白哪里需要帶寬以及非易失性也是關(guān)鍵的考量因素?!跋M@將引導(dǎo)做出正確的選擇?!?/p>

對(duì)于那些傳統(tǒng)上并不屬于存儲(chǔ)系統(tǒng)構(gòu)建流程的公司而言,這些考量因素至關(guān)重要。Google軟件工程師Sameer Kumar花費(fèi)大量時(shí)間在編譯器和可擴(kuò)展系統(tǒng)上,這些系統(tǒng)的網(wǎng)絡(luò)和存儲(chǔ)帶寬對(duì)不同的機(jī)器學(xué)習(xí)模型非常重要,包括其大規(guī)模批量操作的能力。他說:“人工智能訓(xùn)練涉及許多存儲(chǔ)方面的優(yōu)化,”這是在編譯器中獲得極高效率的最關(guān)鍵步驟,它意味著存儲(chǔ)也需要更加智能。

Woo認(rèn)為,數(shù)據(jù)移動(dòng)實(shí)際上已經(jīng)開始主宰AI應(yīng)用的某些階段,所以存儲(chǔ)互連變得越來越重要?!靶阅芎湍苄С蔀槿找嬷匾膯栴}”,提高數(shù)據(jù)速率極具挑戰(zhàn)性,因?yàn)樗腥硕枷M麑?shù)據(jù)移動(dòng)速度加倍,能效也加倍?!拔覀円郧八蕾嚨脑S多技巧和技術(shù)都已不再適用,或者正在被慢慢淘汰。我們有極好的機(jī)會(huì)來思考新的體系架構(gòu),并在移動(dòng)數(shù)據(jù)的方式上進(jìn)行創(chuàng)新?!?/p>

Woo表示,創(chuàng)新不僅在存儲(chǔ)器件本身上,而且還包括封裝,以及堆疊等新技術(shù)。在創(chuàng)新的同時(shí),還要確保數(shù)據(jù)的安全性,這是Rambus目前越來越關(guān)注的。

Rambus感受到業(yè)界對(duì)3D堆棧的極大興趣,但如果帶寬不隨堆棧容量增加而相應(yīng)增加的話,其可用性會(huì)受到限制。(圖片來源:Rambus)

Arsovski表示,Marvell花費(fèi)了大量時(shí)間為客戶建立AI系統(tǒng),為客戶提供帶寬相關(guān)信息,如每個(gè)芯片邊緣有多少帶寬可以用于數(shù)據(jù)移動(dòng),以及有多少帶寬可以用于訪問存儲(chǔ)器。他說:“到目前為止,我們已經(jīng)可以看到,客戶需要更多的存儲(chǔ)帶寬和更多的I / O帶寬。如果看看封裝級(jí)別的互連,可以看到存在很大的不匹配。我們現(xiàn)在已經(jīng)到達(dá)瓶頸,高端芯片-芯片連接的需求壓力持續(xù)增大?!?/p>

Arsovski表示,從存儲(chǔ)器的角度來看,對(duì)于那些無法在裸片上直接構(gòu)建AI模型的設(shè)計(jì)師來說,其下一步考慮應(yīng)該是HBM或GDDR。但是也有很多轉(zhuǎn)而采用3D堆疊,以嘗試獲得更大的帶寬,因?yàn)樵谛酒吘壱苿?dòng)數(shù)據(jù)的容量有限?!翱蛻粝M玫皆絹碓蕉嗟腎/O帶寬,而我們?cè)谶吘墧?shù)據(jù)移動(dòng)上遇到了瓶頸。”

Kanter說,即使在機(jī)器學(xué)習(xí)的世界中,也存在著“很大的多樣性”,這對(duì)生態(tài)系統(tǒng)既有制約,也有促進(jìn),記住這一點(diǎn)很重要。對(duì)于常規(guī)DRAM來說,隨機(jī)查找龐大的數(shù)據(jù)結(jié)構(gòu)不適合單個(gè)節(jié)點(diǎn),這意味著如果您想將數(shù)據(jù)真正保存在存儲(chǔ)器中,則需要構(gòu)建一個(gè)非常大的系統(tǒng)集群。他說:“與傳統(tǒng)的面向視覺的模型相比,其特征和屬性完全不同。在存儲(chǔ)方面要牢記這一多樣性,這一點(diǎn)非常重要。”

Kanter說,當(dāng)需要將大量存儲(chǔ)和計(jì)算整合在一起時(shí),就需要互連了。“要進(jìn)行大規(guī)模訓(xùn)練,迫切需要既適合客戶又適合要解決問題的互連方案?!彼f,對(duì)于前沿應(yīng)用來說,互連將特別重要。“如果您只想為一個(gè)小型網(wǎng)絡(luò)訓(xùn)練一個(gè)GPU,那么關(guān)鍵因素可能就是存儲(chǔ)帶寬?!?/p>

Kumar說,更多的存儲(chǔ)帶寬可以實(shí)現(xiàn)不同種類的優(yōu)化,但是如果模型特別受存儲(chǔ)限制,就有必要引入更多的計(jì)算?!叭绻懈嗟拇鎯?chǔ)吞吐量可用,甚至有更多的互連吞吐量可用,將可能會(huì)使模型設(shè)計(jì)更加靈活,而且可以啟用新功能,并一起構(gòu)建各種類型的模型?!?/p>

Woo表示,Rambus感受到大家對(duì)3D堆棧興趣濃厚,但隨著堆棧越來越高,增加進(jìn)出堆棧的帶寬也變得越來越困難?!叭绻皇窃黾佣褩H萘?,但沒有增加相應(yīng)的帶寬,那方案的實(shí)用性就成問題了。”

他說,關(guān)鍵點(diǎn)在于尋找合適的方案,既能保持填充頻率,又能利用堆疊能效方面的優(yōu)勢,從而使帶寬與容量和堆疊之間具有相對(duì)恒定的比率。

Kumar和Arsovski都認(rèn)為需要一個(gè)平衡、可擴(kuò)展的系統(tǒng),這種系統(tǒng)具有精心設(shè)計(jì)的軟件堆棧。 Arsovski說,“我們所說的是一種可以良好擴(kuò)展的類腦結(jié)構(gòu)?!彼仨毜凸那揖哂写罅窟B接,而現(xiàn)在,3D堆疊是我們能做到最接近的結(jié)構(gòu),但仍然存在功耗、封裝和機(jī)械結(jié)構(gòu)方面的挑戰(zhàn)。 “我們需要研究出一個(gè)高度并行的系統(tǒng),其每個(gè)層級(jí)的功耗都極低,而不必?fù)?dān)心要為冷卻耗費(fèi)數(shù)千瓦的功率。”

他說,是時(shí)候開始尋找適合AI系統(tǒng)的下一個(gè)基本構(gòu)建模塊了。“一直以來,我們都采用晶體管作為基本單元,迄今為止,它們都發(fā)揮出色。我們通常會(huì)依賴我們所知道和喜愛的技術(shù),并且希望它持續(xù)發(fā)展。但現(xiàn)在我們需要重頭開始設(shè)計(jì)了。”

(參考原文:AI Drives Memory Interconnect Evolution)
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7430

    瀏覽量

    163514
  • 數(shù)據(jù)存儲(chǔ)

    關(guān)注

    5

    文章

    959

    瀏覽量

    50834
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268103
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5463

    瀏覽量

    120890
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI驅(qū)動(dòng)新型存儲(chǔ)器技術(shù),國內(nèi)新興存儲(chǔ)企業(yè)進(jìn)階

    為了加速AI的訓(xùn)練與推理應(yīng)用。但另一方面,新型存儲(chǔ)也在AI時(shí)代扮演越來越重要的角色,最近國內(nèi)新興存儲(chǔ)企業(yè)也將目光投向于此,并推出新產(chǎn)品等,以期緊跟新型
    發(fā)表于 10-16 08:10 ?818次閱讀
    <b class='flag-5'>AI</b>驅(qū)動(dòng)新型<b class='flag-5'>存儲(chǔ)器</b>技術(shù),國內(nèi)新興<b class='flag-5'>存儲(chǔ)</b>企業(yè)進(jìn)階

    大算力芯片面臨的技術(shù)挑戰(zhàn)和解決策略

    在灣芯展SEMiBAY2024《HBM與存儲(chǔ)器技術(shù)與應(yīng)用論壇》上,億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬發(fā)表了題為《超越極限:大算力芯片面臨的技術(shù)挑戰(zhàn)和解決策略》的演講。
    的頭像 發(fā)表于 10-23 14:50 ?249次閱讀

    內(nèi)存儲(chǔ)器分為隨機(jī)存儲(chǔ)器和什么

    內(nèi)存儲(chǔ)器是計(jì)算機(jī)系統(tǒng)中用于臨時(shí)存儲(chǔ)數(shù)據(jù)和程序的關(guān)鍵部件,它直接影響到計(jì)算機(jī)的運(yùn)行速度和性能。內(nèi)存儲(chǔ)器主要分為兩大類:隨機(jī)存儲(chǔ)器(RAM,Random Access Memory)和只讀
    的頭像 發(fā)表于 10-14 09:54 ?455次閱讀

    芯片和先進(jìn)封裝的制程挑戰(zhàn)和解決方案

    更多的晶體管,以滿足高性能計(jì)算的需求;人工智能對(duì)高性能計(jì)算的需求是無止盡的,然而,當(dāng)單位體積內(nèi)集成的晶體管數(shù)量受到物理極限的限制時(shí),我們必須尋找新的解決方案來延續(xù)其擴(kuò)展性。
    的頭像 發(fā)表于 09-25 10:16 ?384次閱讀
    芯片和先進(jìn)封裝的制程<b class='flag-5'>挑戰(zhàn)和解決方案</b>

    MCT8316A-設(shè)計(jì)挑戰(zhàn)和解決方案應(yīng)用說明

    電子發(fā)燒友網(wǎng)站提供《MCT8316A-設(shè)計(jì)挑戰(zhàn)和解決方案應(yīng)用說明.pdf》資料免費(fèi)下載
    發(fā)表于 09-13 09:52 ?0次下載
    MCT8316A-設(shè)計(jì)<b class='flag-5'>挑戰(zhàn)和解決方案</b>應(yīng)用說明

    MCF8316A-設(shè)計(jì)挑戰(zhàn)和解決方案應(yīng)用說明

    電子發(fā)燒友網(wǎng)站提供《MCF8316A-設(shè)計(jì)挑戰(zhàn)和解決方案應(yīng)用說明.pdf》資料免費(fèi)下載
    發(fā)表于 09-13 09:51 ?0次下載
    MCF8316A-設(shè)計(jì)<b class='flag-5'>挑戰(zhàn)和解決方案</b>應(yīng)用說明

    FPGA設(shè)計(jì)面臨的挑戰(zhàn)和解決方案

    設(shè)計(jì)可靠的可編程邏輯門陣列(FPGA)對(duì)于不容故障的系統(tǒng)來說是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。本文介紹FPGA設(shè)計(jì)的復(fù)雜性,重點(diǎn)關(guān)注如何在提高可靠性的同時(shí)管理隨之帶來的功耗增加、設(shè)計(jì)復(fù)雜性和潛在性能影響的關(guān)鍵平衡問題。
    的頭像 發(fā)表于 08-06 11:33 ?375次閱讀

    M31攜手高塔半導(dǎo)體,成功研發(fā)65納米低功耗存儲(chǔ)器解決方案

    出基于65納米制程的先進(jìn)SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器)和ROM(唯讀存儲(chǔ)器)IP產(chǎn)品。此次合作不僅標(biāo)志著雙方在半導(dǎo)體技術(shù)領(lǐng)域的深度合作邁出了堅(jiān)實(shí)的一步,也為市場帶來了更為高效、低功耗的存儲(chǔ)器
    的頭像 發(fā)表于 08-06 09:30 ?509次閱讀

    ram存儲(chǔ)器和rom存儲(chǔ)器的區(qū)別是什么

    定義: RAM(Random Access Memory):隨機(jī)存取存儲(chǔ)器,是一種易失性存儲(chǔ)器,主要用于計(jì)算機(jī)和其他設(shè)備的臨時(shí)存儲(chǔ)。 ROM(Read-Only Memory):只讀存儲(chǔ)器
    的頭像 發(fā)表于 08-06 09:17 ?535次閱讀

    探索通用互連解決方案的強(qiáng)大之處

    在雷迪埃,我們提供多樣化的通用互連解決方案,還可根據(jù)客戶需求設(shè)計(jì)定制化解決方案。雷迪埃的互連解決方案憑借可靠性、耐用性和出色的性能而被各行業(yè)
    的頭像 發(fā)表于 07-30 13:53 ?236次閱讀
    探索通用<b class='flag-5'>互連</b><b class='flag-5'>解決方案</b>的強(qiáng)大之處

    TPS65295完整 DDR4 存儲(chǔ)器電源解決方案數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TPS65295完整 DDR4 存儲(chǔ)器電源解決方案數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 03-06 10:17 ?0次下載
    TPS65295完整 DDR4 <b class='flag-5'>存儲(chǔ)器</b>電源<b class='flag-5'>解決方案</b>數(shù)據(jù)表

    TPS65296-完整 LPDDR4/LPDDR4X存儲(chǔ)器電源解決方案數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TPS65296-完整 LPDDR4/LPDDR4X存儲(chǔ)器電源解決方案數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 03-05 17:14 ?0次下載
    TPS65296-完整 LPDDR4/LPDDR4X<b class='flag-5'>存儲(chǔ)器</b>電源<b class='flag-5'>解決方案</b>數(shù)據(jù)表

    HDI 布線的挑戰(zhàn)和技巧

    HDI 布線的挑戰(zhàn)和技巧
    的頭像 發(fā)表于 12-07 14:48 ?477次閱讀

    借助人工智能,存儲(chǔ)器比重將進(jìn)一步增加

    SK海力士預(yù)測在人工智能(AI)領(lǐng)域,存儲(chǔ)器解決方案的比重將進(jìn)一步增加,可以通過類似AiMX的解決方案部分替代圖形處理單元(GPU)。
    發(fā)表于 12-04 09:52 ?394次閱讀
    借助人工智能,<b class='flag-5'>存儲(chǔ)器</b>比重將進(jìn)一步增加

    中科曙光推出AI大模型存儲(chǔ)解決方案

    11月29日,“數(shù)智創(chuàng)新 AI未來”2023中國數(shù)據(jù)與存儲(chǔ)峰會(huì)在北京舉辦。曙光存儲(chǔ)受邀發(fā)表主題演講,詳述面向AI大模型的數(shù)據(jù)存儲(chǔ)
    的頭像 發(fā)表于 11-30 10:58 ?735次閱讀