(文章來源:cnBeta)
隨著人工智能和機(jī)器學(xué)習(xí)應(yīng)用的興起,研究者對于深度學(xué)習(xí)和訓(xùn)練的計(jì)算量需求也日漸提升。為滿足這種密集的運(yùn)算需求,通常需要相當(dāng)大規(guī)模的服務(wù)器集群。在今年早些時候的 Hot Chips 大會上,我們已經(jīng)見到過來自英特爾的 Nervana NNP-T Spring Crest 芯片。通過收購 Nervana,英特爾獲得了打造“大型訓(xùn)練芯片”所需的 IP 。
據(jù)悉,該芯片基于臺積電 16nm 工藝制造,輔以 CoWoS 和四層 HBM2 內(nèi)存,面積達(dá)到了 680 平方毫米。本周早些時候,Supermicro 已經(jīng)在超算大會上展示了最新的 Nervana NNP-T 服務(wù)器。
這些硬件均基于 PCIe 擴(kuò)展卡,可想象它們此前被設(shè)計(jì)為可容納 GPU 的傳統(tǒng)服務(wù)器。其采用了典型 2P 布局,可在 4U 機(jī)箱中插入 8 張擴(kuò)展卡,且計(jì)算卡之間可以互相通信。每顆芯片具有 3.58 Tbps 的總雙向帶寬,而片外連接則支持多達(dá) 1024 個節(jié)點(diǎn)的可伸縮性。從每張 PCIe 卡片的 8-pin 輔助供電來看,其峰值功率應(yīng)該在標(biāo)準(zhǔn)的 225W 。
本周晚些時候,Supermicro 告知其已獲準(zhǔn)展示該系列服務(wù)器的 8 路 OAM(OCP 加速器模塊)版本。其能夠通過底板的 PCB 保持芯片間的通信,而不是傳統(tǒng)的 PCIe 卡對卡之類的橋接器。
這使得擴(kuò)展卡之間能夠流通大量的空氣來散熱,并且兼容模塊化的 OCP 標(biāo)準(zhǔn)。作為英特爾首款支持 bfloat16 深度學(xué)習(xí)訓(xùn)練的芯片,每個芯片最多支持 119 個 TOP 。另有 60MB 片上存儲器和 24 個專用的“張量”處理器集群,后者具有雙 32×32 矩陣乘法陣列。該芯片共有 270 億個晶體管,內(nèi)核頻率 1.1 GHz、輔以 32GB HBM2-2400 內(nèi)存。
從技術(shù)上來講,PCIe 連接可以升級到 Gen 4.0 x16,但英特爾商務(wù) CPU 支持這項(xiàng)特性。有人表示,為展開此類計(jì)算,一些客戶正在將頭結(jié)點(diǎn)從 2P 升級到 4P(Facebook 更是用上了 8P)。Supermicro 聲明稱,其 NNP-T 系統(tǒng)已做好助推深度學(xué)習(xí)和訓(xùn)練的部署準(zhǔn)備。
(責(zé)任編輯:fqj)
-
芯片
+關(guān)注
關(guān)注
453文章
50254瀏覽量
421121 -
英特爾
+關(guān)注
關(guān)注
60文章
9866瀏覽量
171326
發(fā)布評論請先 登錄
相關(guān)推薦
評論