11月11日,英特爾正式發(fā)布其全新服務(wù)器GPU,即首款數(shù)據(jù)中心的獨顯產(chǎn)品,該服務(wù)器基于Xe LP微架構(gòu),專為高密度、低時延的安卓云游戲和流媒體服務(wù)而設(shè)計。同時,英特爾還宣布將于12月正式交付相應(yīng)的軟件堆棧oneAPI Gold工具。
英特爾此次同時推出了全新服務(wù)器GPU和oneAPI軟件,意味著英特爾開始釋放XPU的強大實力。
英特爾率先定義XPU時代
10年前,美國數(shù)據(jù)科學(xué)家舍恩伯格在《大數(shù)據(jù)時代》一書中對“大數(shù)據(jù)時代”作出系統(tǒng)闡釋。
10年后,互聯(lián)網(wǎng)、人工智能、云計算的發(fā)展正飛速推動全球數(shù)據(jù)量的增長。國際數(shù)據(jù)公司IDC統(tǒng)計顯示,預(yù)計到2025年,全球數(shù)據(jù)量將比2016年的16.1 ZB(1 ZB=十萬億字節(jié))增加10倍,達(dá)到163 ZB。
盡管越來越多的數(shù)據(jù)讓現(xiàn)代人置身于信隱私泄露的恐慌之中,但不可否認(rèn)的是,大數(shù)據(jù)正為硬件、軟件乃至服務(wù)等市場帶來前所未有的經(jīng)濟(jì)增長。
中國通信院發(fā)布的《大數(shù)據(jù)白皮書(2019)》顯示,預(yù)計到2020年,全球大數(shù)據(jù)硬件、軟件和服務(wù)的市場規(guī)模將分別達(dá)到150億美元、200億美元和210億美元。這意味著基于大數(shù)據(jù),將產(chǎn)生一個全球范圍內(nèi)價值560億美元的市場。
但在這之前需要解決一個關(guān)鍵問題,在單一芯片算力受限的情況下,如何更好地發(fā)揮海量數(shù)據(jù)的真正價值?
對于這一問題,英特爾早已給出了答案。2015年,英特爾就開始斥資167億美元收購當(dāng)時全球第二大FPGA廠商Altera,此后,又接連收購主攻深度學(xué)習(xí)方向的Nervana Systems、計算視覺公司Movidius、自動駕駛視覺處理公司Mobileye和云端AI推理芯片已經(jīng)商用的Habana Labs。
英特爾成為業(yè)界唯一一家擁有全類別AI芯片的公司之后,緊接著吸納業(yè)界頂尖的芯片人才,并于2018年架構(gòu)日提出制程、封裝、架構(gòu)、存儲、互聯(lián)、安全、軟件的六大技術(shù)戰(zhàn)略。
2018年的架構(gòu)日在英特爾歷史上具有劃時代的意義,XPU異構(gòu)愿景就誕生于此,即由標(biāo)量(Scalar)、矢量(Vector)、矩陣(Matrix)、空間(Spatial)組成的SVMS架構(gòu),分別對應(yīng)CPU、GPU、加速器和FPGA,可以進(jìn)行多種異構(gòu)組合。
這是英特爾首次、也是業(yè)界首次明確將單一架構(gòu)之后的發(fā)展方向定義為XPU。
英特爾數(shù)據(jù)中心XPU產(chǎn)品和解決方案副總裁Jeff McVeigh表示:“XPU戰(zhàn)略的提出,在于我們意識到需要不同類型的架構(gòu)來服務(wù)于各種不同的工作負(fù)載,其中一些工作負(fù)載在本質(zhì)上是標(biāo)量的,另一些是向量、矩陣、空間等等?!?/p>
從Xe架構(gòu)到獨立顯卡,實現(xiàn)XPU愿景的重要一步
英特爾在XPU戰(zhàn)略上進(jìn)展迅速,在其它芯片公司還處于大規(guī)模并購階段時,就已經(jīng)基于其豐富的技術(shù)經(jīng)驗推出了自有的首款面向數(shù)據(jù)中心的獨顯產(chǎn)品。
英特爾表示,這款GPU采用的是英特爾能效最高的圖形架構(gòu),英特爾Xe LP微架構(gòu),擁有低功耗、獨立片上系統(tǒng)(SoC)設(shè)計,并配備128比特管道和8GB專用板載低功耗DDR4顯存。
另外,如果將英特爾服務(wù)器GPU同英特爾至強可擴展處理器組合,服務(wù)提供商可以在不改變服務(wù)器數(shù)量的情況下,單獨擴展顯卡容量,得以在每個系統(tǒng)上支持更多流和訂閱用戶,并且同時實現(xiàn)較低的總體擁有成本(TCO)。
通過在新華三3/4長、全高的x16 PCIe 3.0擴展卡內(nèi)封裝四個英特爾服務(wù)器GPU,即可在一個典型雙卡系統(tǒng)中支持超過100個安卓云游戲并發(fā)用戶。這一數(shù)量最高可擴展至160個并發(fā)用戶,實際數(shù)量取決于具體的游戲和服務(wù)器配。
之所以說英特爾XPU戰(zhàn)略進(jìn)展迅速,是因為其從2019年底發(fā)布Xe架構(gòu)到推出基于Xe架構(gòu)的集成GPU和獨立GPU產(chǎn)品,以及用于數(shù)據(jù)中心獨顯產(chǎn)品,間隔時間不到一年,就兌現(xiàn)了產(chǎn)品交付計劃。
事實上,Xe架構(gòu)作為一個基礎(chǔ)GPU架構(gòu),屬性靈活且擴展性強,能夠衍生出多種針對不同領(lǐng)域和場景的GPU產(chǎn)品。
在英特爾2020年架構(gòu)日上,英特爾官方首次詳細(xì)介紹了可實現(xiàn)全擴展的Xe圖形架構(gòu)。按照不同的應(yīng)用場景分,可將Xe架構(gòu)分成四個系列:Xe LP、Xe HP、Xe HPC和Xe HPG。
Xe LP屬于低功耗系列,是針對PC和移動計算平臺的最高效架構(gòu),最高配置EU單元多達(dá)96組,并具有新架構(gòu)設(shè)計,包括異步計算、視圖實例化 (view instancing)、采樣器反饋(sampler feedback)、帶有AV1的更新版媒體引擎以及更新版顯示引擎等。TigerLake SoC里集成的GPU、英特爾銳炬 Xe MAX 獨立顯卡和此次發(fā)布的面向數(shù)據(jù)中心的獨顯產(chǎn)品均采用這一架構(gòu)。
作為首批使用英特爾首款數(shù)據(jù)中心獨顯產(chǎn)品的客戶之一,騰訊先游云游戲總經(jīng)理方亮認(rèn)為:“SG1的編碼能力非常強,它能夠提供一個高密度、低延遲、靈活多樣的視頻編碼能力,另外在我們所測試的產(chǎn)品中,英特爾SG1的性價比高,英特爾技術(shù)團(tuán)隊的支持也非常給力?!?/p>
Xe HP屬于高性能系列,是業(yè)界首個多區(qū)塊(multi-tiled)、高度可擴展的高性能架構(gòu),可提供數(shù)據(jù)中心級、機架級媒體性能,GPU可擴展性和AI優(yōu)化。目前處于同客戶共同測試的階段,Xe HP產(chǎn)品將于明年推出。
Xe HPC屬于高性能計算系列,可用于超級計算機。Xe HPG是一種為游戲優(yōu)化的微架構(gòu),將具有加速的光線跟蹤支持,Xe HPG產(chǎn)品預(yù)計將于2021年開始發(fā)貨。
天下大同oneAPI,實現(xiàn)XPU的“靈魂互通”
一般而言,基于底層硬件架構(gòu)的不同,完成同一項開發(fā)往往需要開發(fā)者使用不同的代碼重寫一次,需要付出極大的人力成本和財力成本。如果將硬件層面XPU的實現(xiàn)比喻成一個語言互不相通的團(tuán)隊,那么要想更好地釋放團(tuán)體的真正實力,還需要一臺能夠降低隊員們溝通成本,甚至能夠?qū)崿F(xiàn)“靈魂互通”的機器。
雖然從生物算法的角度,目前還沒有辦法實現(xiàn)意識和“靈魂”的交換和交流,計算機應(yīng)用程序的跨平臺優(yōu)化也一直是業(yè)界難點,但對于XPU而言,英特爾已經(jīng)開發(fā)出幫助XPU團(tuán)隊釋放真正實力的工具,即英特爾軟件級oneAPI工具包。
英特爾官方表示,如果用上了oneAPI工具包,開發(fā)者就能夠訪問英特爾XPU的通用、開放且基于行業(yè)標(biāo)準(zhǔn)高的編程模型,釋放底層硬件性能的同時降低軟件開發(fā)和維護(hù)成本。
同時,Jeff也告訴雷鋒網(wǎng):“oneAPI能夠把人們熟悉的語言和庫上的代碼,比如所有目前已經(jīng)在至強處理器上運行的代碼,無縫地遷移到GPU和其他的架構(gòu)上。所以它確實有很多好處,比如代碼重用,能夠利用現(xiàn)有的庫等等。如果你已經(jīng)熟悉了一些庫,比如TBB和其他來自英特爾的庫,我們把它們進(jìn)行了擴展以支持多種架構(gòu)。這樣已經(jīng)使用過這些庫的開發(fā)者可以繼續(xù)做開源,支持GPU和其他XPU架構(gòu)?!?/p>
“oneAPI讓你不必有兩種不同的配置,兩種不同的構(gòu)建,但是能夠在設(shè)計點之間為完全相同的服務(wù)提供一些靈活性?!庇⑻貭枖?shù)據(jù)平臺事業(yè)部副總裁,視覺基礎(chǔ)架構(gòu)事業(yè)部和NPG戰(zhàn)略總經(jīng)理LynnComp補充道。
oneAPI是英特爾在SuperComputing2019大會上首次提出且為實現(xiàn)統(tǒng)一、簡化的跨架構(gòu)編程模型的一個愿景,即不受限于單一廠商專用的代碼構(gòu)建,且能實現(xiàn)源有代碼的集成。借助oneAPI,開發(fā)者可以針對他們要解決的特定問題選擇最佳的加速器架構(gòu),且無需為此一個架構(gòu)和平臺再重寫軟件。
英特爾初次提出這一愿景時,很多人認(rèn)為其實現(xiàn)難度大,能夠完成的可能性幾乎為零。但今天英特爾卻如期交付了oneAPI開發(fā)者工具包,足以證明其軟件實力。
英特爾宣布,英特爾oneAPI工具包將于12月在本地和英特爾DevCould上免費提供,同時還將提供包括英特爾技術(shù)咨詢工程師全球支持的商業(yè)版本。英特爾還會將英特爾Parallel Studio XE和英特爾System Studio工具套件遷移到oneAPI產(chǎn)品中。
值得一提的是,即便沒有使用英特爾的芯片,oneAPI也能包容和支持,具有實現(xiàn)“天下大同”的能力,擁有廣泛的生態(tài)系統(tǒng),這也促使oneAPI得到更加廣泛的業(yè)界支持。近期,微軟Azure和谷歌的TensorFlow已經(jīng)宣布支持oneAPI,眾多領(lǐng)先的研究機構(gòu)、公司和大學(xué)也支持oneAPI。
雷鋒網(wǎng)小結(jié)
從收購FPGA公司到吸納圖形處理器頂尖人才,從發(fā)展單一架構(gòu)到定義XPU時代,從Xe架構(gòu)提出到如期交付產(chǎn)品,近些年英特爾一直在釋放大數(shù)據(jù)潛力的產(chǎn)業(yè)領(lǐng)域探索,如今成長為業(yè)界唯一一家能夠提供XPU芯片的全能性公司,且能為其應(yīng)將提供相適配的軟件、應(yīng)用程序和生態(tài),英特爾在數(shù)據(jù)在數(shù)據(jù)中心擁有獨一無二的實力。
未來的英特爾,又會在實現(xiàn)XPU的路上取得什么樣的成績呢?
責(zé)編AJX
-
英特爾
+關(guān)注
關(guān)注
60文章
9862瀏覽量
171296 -
gpu
+關(guān)注
關(guān)注
28文章
4673瀏覽量
128594 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8963瀏覽量
85087
發(fā)布評論請先 登錄
相關(guān)推薦
評論