一级似看大片中文字母 ,亚洲色图五月天

在日前舉行的Computex 2018發(fā)布會(huì)上，AMD有些出人意料地進(jìn)行了高規(guī)格的產(chǎn)品發(fā)布，公開的產(chǎn)品包括下一代使用7nm工藝的VEGA GPU，以及使用7nm的Zen 2處理器。目前，7nm VEGA GPU是全球第一個(gè)使用7nm工藝的GPU，現(xiàn)在已經(jīng)開始樣品出貨，預(yù)計(jì)在今年下半年開始大規(guī)模出貨。這比之前預(yù)期的時(shí)間表提前了不少，也打了Nvidia一個(gè)措手不及，讓AMD以迅雷不及掩耳之勢(shì)搶得了“全球第一塊7nm GPU”。

除了GPU之外，AMD還公布了下一代使用7nm工藝的Zen 2處理器EPYC，該處理器目前已經(jīng)完成流片正處于實(shí)驗(yàn)室測(cè)試中，預(yù)計(jì)將于2018年下半年進(jìn)入工程樣品階段并于2019年進(jìn)入大規(guī)模出貨階段。

隨著桌面PC市場(chǎng)被移動(dòng)設(shè)備日漸蠶食，在本世紀(jì)初熱鬧非凡的Computex會(huì)議已經(jīng)幾乎被人遺忘。而AMD此次在Computex會(huì)議上舉行的高規(guī)格產(chǎn)品發(fā)布無(wú)疑是為之前有些疲軟的計(jì)算機(jī)市場(chǎng)和Computex會(huì)議帶來了一陣新風(fēng)。這也釋放了一個(gè)重要信號(hào)：以數(shù)據(jù)中心為主要應(yīng)用場(chǎng)景的高性能計(jì)算市場(chǎng)正在接過PC的接力棒，將會(huì)成為計(jì)算機(jī)在下一個(gè)十年發(fā)展的主要?jiǎng)恿Α?/p>

數(shù)據(jù)中心的想象空間

隨著大數(shù)據(jù)和深度學(xué)習(xí)的高速發(fā)展，數(shù)據(jù)正在成為新時(shí)代的原油而算力正在成為下一代的基礎(chǔ)設(shè)施。AMD在發(fā)布會(huì)上指出，到2025年的數(shù)據(jù)將會(huì)增長(zhǎng)50倍：可穿戴設(shè)備、IoT、5G設(shè)備正在普及，這些設(shè)備都會(huì)產(chǎn)生大量的數(shù)據(jù)。除此之外，我們對(duì)于這些數(shù)據(jù)的處理方式也越來越復(fù)雜，機(jī)器學(xué)習(xí)領(lǐng)域的新算法層出不窮，能夠從數(shù)據(jù)中提取更多有用信息，從而在智慧城市、醫(yī)療、金融、安保等領(lǐng)域引入革命性的變化。隨著數(shù)據(jù)量和算法復(fù)雜度的飛速提升，對(duì)于算力的需求也在高速增長(zhǎng)。

OpenAI公布的深度學(xué)習(xí)算法算力需求，6年增長(zhǎng)了30萬(wàn)倍

大數(shù)據(jù)算力的主要基礎(chǔ)設(shè)施在于數(shù)據(jù)中心。數(shù)據(jù)中心對(duì)于處理器的需求目前主要包括CPU和GPU。CPU是傳統(tǒng)計(jì)算硬件，可以支持通用計(jì)算，也是數(shù)據(jù)中心必不可少的一部分。AMD此次公布的EPYC CPU每個(gè)socket至多可以支持32個(gè)核。除了核心數(shù)多之外，CPU的內(nèi)存存取和CPU間通信在需要高效執(zhí)行分布式計(jì)算的數(shù)據(jù)中心也是重要要素，而EPYC每個(gè)CPU能支持至多8個(gè)內(nèi)存通道和128條PCIe通道，可謂性能強(qiáng)大。眾所周知，AMD在數(shù)據(jù)中心CPU領(lǐng)域并非傳統(tǒng)強(qiáng)項(xiàng)，在Intel牢牢把持著市場(chǎng)的情況下AMD如何打入數(shù)據(jù)中心CPU生態(tài)也就成了大家關(guān)注的要點(diǎn)之一。在本次發(fā)布會(huì)上，AMD宣布了EPYC已經(jīng)進(jìn)入了CISCO，HP和騰訊云等重要客戶的產(chǎn)品中。雖然比起Intel在數(shù)據(jù)中心的市場(chǎng)份額來說AMD還有很大的差距，但是這也是個(gè)不錯(cuò)的出發(fā)點(diǎn)。

除了CPU之外，GPU是數(shù)據(jù)中心想象空間更大的部分。在大數(shù)據(jù)時(shí)代，CPU并不能高效支持所有運(yùn)算：在CPU的芯片上，為了滿足通用算法的支持，有很大一部分芯片面積都用來做緩存和控制邏輯（如分支判斷等），而用于計(jì)算單元的面積并不大。而在大數(shù)據(jù)算法中，大量數(shù)據(jù)是可以并行處理的（例如來自不同設(shè)備產(chǎn)生的獨(dú)立數(shù)據(jù)就可以并行處理而不會(huì)互相影響），因此大數(shù)據(jù)算法往往比較規(guī)整，而CPU芯片上的許多控制邏輯對(duì)于大數(shù)據(jù)算法就顯得多余。這時(shí)候擅長(zhǎng)并行計(jì)算處理的GPU就脫穎而出。GPU的設(shè)計(jì)中控制邏輯比較簡(jiǎn)單，而絕大部分芯片面積都用來做計(jì)算單元，因此一個(gè)GPU往往包含了數(shù)千個(gè)計(jì)算核心，可以提供超高效并行計(jì)算，對(duì)于合適的大數(shù)據(jù)算法GPU的執(zhí)行速度比同代CPU要快兩到三個(gè)數(shù)量級(jí)。

GPU在數(shù)據(jù)中心中執(zhí)行大數(shù)據(jù)算法的標(biāo)志性事件是2012年的深度學(xué)習(xí)算法AlexNet的訓(xùn)練。AlexNet是深度學(xué)習(xí)的標(biāo)志性算法，其貢獻(xiàn)第一是證明在數(shù)據(jù)量足夠的情況下深度神經(jīng)網(wǎng)絡(luò)在圖像分類等任務(wù)中的性能遠(yuǎn)好于傳統(tǒng)的支持向量機(jī)（SVM）等算法，可謂是開啟了這一波深度學(xué)習(xí)熱潮；除此之外AlexNet還提出了使用GPU去訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)，相比CPU可以將訓(xùn)練時(shí)間降低兩到三個(gè)數(shù)量級(jí)從而進(jìn)入合理的范圍（時(shí)間從數(shù)年下降到了幾天）?？梢哉f以深度學(xué)習(xí)離不開GPU的支持，而隨著深度學(xué)習(xí)的繼續(xù)普及，數(shù)據(jù)中心對(duì)于GPU的需求也在持續(xù)上升。

深度學(xué)習(xí)的普及是GPU在數(shù)據(jù)中心需求量持續(xù)上升的一個(gè)要素。除此之外，深度學(xué)習(xí)以外的其他需要GPU的算法也在推動(dòng)GPU需求。眾所周知的是區(qū)塊鏈算法對(duì)于GPU也有很大的需求量，在區(qū)塊鏈和加密貨幣最火的2017年各大礦場(chǎng)對(duì)于GPU的需求甚至讓GPU賣到斷貨（AMD從中也是獲利頗豐），之后雖然加密貨幣逐漸回歸理性但是對(duì)于GPU的需求卻在穩(wěn)步上升。除了區(qū)塊鏈之外，數(shù)據(jù)庫(kù)等傳統(tǒng)應(yīng)用也在逐漸擁抱GPU加速?？梢哉f目前數(shù)據(jù)中心對(duì)于GPU的需求是以深度學(xué)習(xí)為首，而在其他領(lǐng)域也在逐漸跟上。Nvidia目前在數(shù)據(jù)中心GPU市場(chǎng)幾乎是處于壟斷地位，與之相應(yīng)數(shù)據(jù)中心業(yè)務(wù)在Nvidia的財(cái)報(bào)中也越來越重要，2017財(cái)年的數(shù)據(jù)中心業(yè)務(wù)增長(zhǎng)高達(dá)245%，在2018財(cái)年的增長(zhǎng)也有233%，收入接近20億美元。AMD當(dāng)然不會(huì)對(duì)數(shù)據(jù)中心這塊市場(chǎng)坐視不管，這次搶先Nvidia發(fā)布7nm VEGA GPU以及Radeon Instinct數(shù)據(jù)中心加速卡也是對(duì)Nvidia一個(gè)強(qiáng)烈的挑戰(zhàn)信號(hào)。

除了硬件之外，

開發(fā)生態(tài)同樣重要

在數(shù)據(jù)中心市場(chǎng)，事實(shí)上BAT等各大客戶也希望AMD能打破Nvidia的壟斷地位，從而讓高性能GPU的價(jià)格能回歸合理的范圍。AMD這次發(fā)布的7nm VEGA GPU以及Radeon Instinct加速卡可謂性能強(qiáng)大，Radeon Instinct加速卡使用了32GB HBM高速顯存，并且VEGA GPU對(duì)于人工智能和機(jī)器學(xué)習(xí)也加入了硬件支持，具體性能值得期待。

在硬件性能之外，開發(fā)者生態(tài)也是決定性因素。Nvidia的戰(zhàn)略眼光極其深遠(yuǎn)，在絕大部分人對(duì)于GPU的認(rèn)識(shí)還局限于游戲圖形加速的時(shí)候，Nvidia就已經(jīng)看到了GPU在其他領(lǐng)域的潛力，于是開始了GPGPU（通用GPU）戰(zhàn)略并開始了CUDA的開發(fā)。在經(jīng)過數(shù)年的開發(fā)積累之后，又遇到了深度學(xué)習(xí)的大熱，Nvidia的CUDA憑借著穩(wěn)定的性能，易用的API 接口，完整的文檔和多年的開發(fā)者社區(qū)運(yùn)營(yíng)成為了相關(guān)開發(fā)者的首選，配合其GPU因此成為了數(shù)據(jù)中心的標(biāo)配。另一方面，AMD對(duì)于GPGPU類的技術(shù)投入之前一直處于不溫不火的狀態(tài)，和高通等其他幾個(gè)合作廠商在推廣與CUDA相似的OpenCL但是其性能和易用性一直被開發(fā)者社區(qū)詬病。除此之外AMD在GPGPU領(lǐng)域的另一個(gè)舉措是推出異構(gòu)系統(tǒng)架構(gòu)HSA（heterogeneous system architecture），HSA的初衷是打通CPU和GPU的內(nèi)存空間，用于解決CPU和GPU之間內(nèi)存互訪造成的性能損失，然而至今HSA也只能說是普普通通并未引起太多波瀾。

AMD當(dāng)然也認(rèn)識(shí)到了其開發(fā)生態(tài)不足造成的問題，因此在這次發(fā)布會(huì)上也特意提到了其GPGPU的最新舉措即Radeon Open Ecosystem，可以支持TensorFlow，PyTorch，Caffe，MxNet等主流機(jī)器學(xué)習(xí)平臺(tái)并將提供優(yōu)化的庫(kù)支持。然而，在開發(fā)生態(tài)領(lǐng)域AMD仍然是處于追趕地位，尤其是在Nvidia在數(shù)據(jù)中心的生態(tài)已經(jīng)開始在探索GPU數(shù)據(jù)庫(kù)等藍(lán)海的情況下，AMD如何迎頭趕上值得我們關(guān)注。

7nm提升有限，

封裝技術(shù)同樣重要

從芯片角度，這次AMD的發(fā)布也讓我們看到了半導(dǎo)體制程發(fā)展的趨勢(shì)。

AMD發(fā)布了7nm VEGA GPU的數(shù)據(jù)。耐人尋味的是，其性能相對(duì)于上一代14nm的VEGA僅僅提升了35%。在特征尺寸縮小一半加上設(shè)計(jì)也有改善的情況下，其性能的提升幅度并不大：7nm半導(dǎo)體工藝節(jié)點(diǎn)中雖然特征尺寸縮小晶體管開關(guān)速度會(huì)加快但是金屬互聯(lián)線帶來的延遲也變大，因此對(duì)于芯片性能的幫助有限。另一方面，其晶體管密度和功耗改善有兩倍之多，這基本延續(xù)了之前摩爾定律的勢(shì)頭。

在特征尺寸對(duì)于芯片性能提升幫助有限的情況下，封裝技術(shù)將會(huì)成為芯片性能提升的另一個(gè)推力。在本次發(fā)布會(huì)上，AMD發(fā)布的Radeon Instinct加速卡中一個(gè)最重要的關(guān)鍵詞就是32GB HBM內(nèi)存。HBM使用高級(jí)封裝技術(shù)，將處理器和DRAM做在同一個(gè)封裝內(nèi)，可以大大降低走線長(zhǎng)度，增加走線密度和總線寬度，從而提供遠(yuǎn)高于傳統(tǒng)DDR標(biāo)準(zhǔn)的內(nèi)存帶寬。事實(shí)上，目前內(nèi)存帶寬已經(jīng)成為了阻礙處理器完全發(fā)揮峰值計(jì)算能力的重要瓶頸，因此HBM內(nèi)存將會(huì)成為處理器性能提升的重要技術(shù)。

AMD公開 VEGA GPU架構(gòu)使用 7nm 工藝

AMD在今年ISSCC發(fā)布的Zeppelin架構(gòu)

此外，AMD還宣布將會(huì)在7nm VEGA GPU中使用Infinity Fabric。Infinity Fabric與Nvidia的NVLink有相似也有不同的地方，NVLink主要是用于加速多塊GPU間的數(shù)據(jù)通信，而Infinity Fabric則即可以用于片上網(wǎng)絡(luò)（NoC），也可以用于封裝內(nèi)的互聯(lián)或者片外互聯(lián)。除了在VEGA GPU內(nèi)使用之外，AMD還將在其CPU中搭配Zeppelin架構(gòu)使用Infinity Fabric。Zeppelin是AMD今年在ISSCC會(huì)議上發(fā)布的新架構(gòu)，通過高級(jí)封裝技術(shù)和Infinity Fabric互聯(lián)技術(shù)可以在封裝內(nèi)高效集成多塊芯片，從而實(shí)現(xiàn)靈活的集成模式，根據(jù)需求可以集成多塊處理器芯片或者是多塊不同的芯片。在高級(jí)封裝領(lǐng)域，AMD非常重視，在幾年前的GPU中用上了HBM內(nèi)存，而隨著Zeppelin架構(gòu)的發(fā)展我們看到AMD正在往封裝方向繼續(xù)深挖潛力。當(dāng)然，Intel也并不落后，其EMIB高級(jí)封裝技術(shù)也處于領(lǐng)先位置。AMD、Intel和Nvidia在高級(jí)封裝領(lǐng)域的競(jìng)爭(zhēng)，我們還將繼續(xù)關(guān)注追蹤。

結(jié)語(yǔ)

AMD此次在Computex上發(fā)布的7nm產(chǎn)品彰顯了其進(jìn)軍數(shù)據(jù)中心應(yīng)用的決心，而數(shù)據(jù)中心應(yīng)用可望能接過PC的大旗成為計(jì)算機(jī)市場(chǎng)的下一個(gè)發(fā)展動(dòng)力。在芯片技術(shù)方面，7nm工藝提供的優(yōu)勢(shì)主要在于集成度和功耗，對(duì)于性能的提升除了特征尺寸縮小之外還得依靠封裝技術(shù)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴