電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)日前,有外媒報(bào)道稱,英特爾計(jì)劃在韓國(guó)首爾設(shè)立科研實(shí)驗(yàn)室,通過(guò)擴(kuò)展和三星、SK海力士的合作,推進(jìn)適用于數(shù)據(jù)中心的DRAM芯片研發(fā)工作。
此前,我們?cè)趫?bào)道中已經(jīng)指出,英特爾由于內(nèi)部戰(zhàn)略的混亂,在AI計(jì)算芯片方面已經(jīng)落于人后,并且從時(shí)間上至少落后英偉達(dá)兩年。在英偉達(dá)高速發(fā)展的情況下,英特爾在AI算力芯片方面很難翻身。
不過(guò),對(duì)于AI計(jì)算來(lái)說(shuō),存儲(chǔ)的重要性同樣很高。目前,高性能計(jì)算芯片基本都是配HBM內(nèi)存幫助加快運(yùn)算,但是在算力系統(tǒng)里,計(jì)算和存儲(chǔ)的割裂還是比較嚴(yán)重的。如果英特爾能夠在內(nèi)存方面獲得突破,有望實(shí)現(xiàn)換道超車。
英特爾首爾研發(fā)實(shí)驗(yàn)室
根據(jù)報(bào)道,位于首爾的數(shù)據(jù)中心開發(fā)實(shí)驗(yàn)室將于今年年底前竣工開業(yè),主要負(fù)責(zé)為數(shù)據(jù)中心開發(fā)DDR5 DRAM內(nèi)存技術(shù)。在這個(gè)實(shí)驗(yàn)室里,英特爾將聯(lián)手三星和SK海力士為數(shù)據(jù)中心開發(fā)DDR5 DRAM內(nèi)存技術(shù),測(cè)試和評(píng)估DDR5和Compute eXpress Link等下一代內(nèi)存產(chǎn)品的性能。
不久前,三星宣布其采用12納米級(jí)工藝技術(shù)的16Gb DDR5 DRAM已開始量產(chǎn)。與14納米級(jí)DRAM相比,三星電子全新的12納米級(jí)DDR5 DRAM可將功耗降低約23%,將晶圓產(chǎn)能提高約20%,最高可支持7.2Gbps的速度。
另外,SK海力士也于近日宣布,已經(jīng)完成了現(xiàn)有DRAM中最為微細(xì)化的1bnm(第五代10nm級(jí)別)的技術(shù)研發(fā),并將適用其技術(shù)的DDR5服務(wù)器DRAM開始了“英特爾數(shù)據(jù)中心存儲(chǔ)器認(rèn)證程序(The Intel Data Center Certified memory program)”。據(jù)介紹,新工藝量產(chǎn)的DRAM運(yùn)行速度為6.4Gbps,數(shù)據(jù)處理速度提高了33%,相較于1αnm工藝產(chǎn)品,功耗降低了20%。
對(duì)于業(yè)界來(lái)說(shuō),三星和SK海力士的最新DRAM產(chǎn)品,除了應(yīng)用于LPDDR5T和HBM3E產(chǎn)品之外,和英特爾主導(dǎo)的CXL技術(shù)結(jié)合也是一個(gè)看點(diǎn),有望進(jìn)一步消除高性能計(jì)算的內(nèi)存墻效應(yīng)。
CXL內(nèi)存是重點(diǎn)
Compute eXpress Link(CXL)內(nèi)存擴(kuò)展是主要硬件供應(yīng)商和云提供商于2019年共同制定的開放標(biāo)準(zhǔn),被認(rèn)為是PCI-e(PCI Express)技術(shù)最主要的替代者,而英特爾是CXL聯(lián)盟牽頭人和主要推動(dòng)者。
CXL在PCIe 5.0物理層基礎(chǔ)上定義了三種協(xié)議,有效實(shí)現(xiàn)了內(nèi)存拓展,還引入了共享內(nèi)存池,達(dá)到CPU、存儲(chǔ)、FPGA、加速器之間的緩存一致性。
過(guò)去四年的時(shí)間里,CXL已經(jīng)連續(xù)更新了1.0/1.1、2.0、3.0三個(gè)版本,發(fā)展非常迅速。到了CXL 3.0時(shí)代,一個(gè)全新的理念已經(jīng)成型——共享內(nèi)存。CXL3.0建立在PCI-Express 6.0之上,將內(nèi)存?zhèn)鬏數(shù)膸捥嵘藘杀?,達(dá)到64GT/s。更為重要的是,CXL3.0提供標(biāo)準(zhǔn)邏輯能力,允許更復(fù)雜的連接拓?fù)?,使得?shù)據(jù)中心應(yīng)用能夠更靈活地分享內(nèi)存。
圖源:CXL聯(lián)盟
目前,無(wú)論是數(shù)據(jù)中心還是算力中心,實(shí)際上其基本結(jié)構(gòu)依然還是馮諾依曼結(jié)構(gòu),由計(jì)算、傳輸和存儲(chǔ)構(gòu)成。在這個(gè)結(jié)構(gòu)中,目前計(jì)算和存儲(chǔ)的對(duì)應(yīng)關(guān)系基本是一對(duì)一,一個(gè)物理內(nèi)存只能屬于某一臺(tái)服務(wù)器。在CXL3.0技術(shù)的加持下,如今計(jì)算和內(nèi)存已經(jīng)實(shí)現(xiàn)了解耦,因此內(nèi)存有望成為一個(gè)嶄新的系統(tǒng)。
首先,服務(wù)器之間將能夠直接訪問(wèn)彼此的內(nèi)存,無(wú)需再通過(guò)CPU,這樣就能夠顯著提升效率,降低系統(tǒng)運(yùn)算的延遲。其次,相較于CXL2.0,新版本協(xié)議將內(nèi)存池化的更加徹底,每個(gè)主機(jī)不再需要分配自己專屬內(nèi)存段,而是多個(gè)主機(jī)可以擁有一個(gè)共享內(nèi)存段的一致性副本。
我們都知道,在數(shù)據(jù)中心領(lǐng)域,目前CXL內(nèi)存已經(jīng)逐漸展露鋒芒,將塑造一種全新的服務(wù)器集群方式,顯著提高數(shù)據(jù)處理的效率。而在應(yīng)對(duì)ChatGPT為首的高算力需求應(yīng)用時(shí),正如三星內(nèi)存副總裁Kim Jae-joon所言,ChatGPT等基于自然語(yǔ)言技術(shù)的交互式AI應(yīng)用的發(fā)展有利于提升內(nèi)存需求。因此,CXL內(nèi)存也有用武之地。
數(shù)據(jù)顯示,在過(guò)去的20多年中,處理器的性能以每年大約55%速度快速提升,而內(nèi)存性能的提升速度則只有每年10%左右。在算力集群中,基于CXL協(xié)議的DRAM能夠有效減輕SRAM 的工作負(fù)擔(dān),極大地提升模型訓(xùn)練和推理的效率。
因此,在持續(xù)推動(dòng)CXL發(fā)展的過(guò)程中,英特爾有望摸索出一套計(jì)算和內(nèi)存更加均衡的算力集群方式,在整體效率方面超過(guò)英偉達(dá)計(jì)算芯片加主線內(nèi)存的方式,這也不失為一種破局之道。
后記
英特爾目前在數(shù)據(jù)中心和算力中心面臨的挑戰(zhàn)是全方面的,數(shù)據(jù)中心份額被逐漸蠶食,算力中心則遲遲無(wú)法打開局面。不過(guò),如果能夠借助CXL技術(shù)構(gòu)建一套全新的計(jì)算體系,英特爾有望重新奪回主動(dòng)權(quán)。
-
英特爾
+關(guān)注
關(guān)注
60文章
9861瀏覽量
171292 -
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268106
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論