作為加速云數(shù)據(jù)中心的重要組件,FPGA已經(jīng)開始了它在數(shù)據(jù)中心領(lǐng)域的廣泛使用。除了像微軟、亞馬遜這樣的大型云服務(wù)提供商之外,F(xiàn)PGA也逐漸開始進(jìn)入其他類型和規(guī)模的數(shù)據(jù)中心,并在大數(shù)據(jù)處理、AI、網(wǎng)絡(luò)功能加速等領(lǐng)域扮演者重要的角色。
(圖片來自英特爾)
在這些基于大數(shù)據(jù)浪潮的全新應(yīng)用中,F(xiàn)PGA廠商也在不斷的探索和嘗試新的FPGA推廣方法。他們的最終目的非常簡單,就是讓更多的用戶使用自己的FPGA產(chǎn)品。但在這個過程中,我們可以發(fā)現(xiàn)一個重要的發(fā)展趨勢,那就是FPGA廠商正在逐漸的從單純的芯片提供商,轉(zhuǎn)變?yōu)橄到y(tǒng)級解決方案提供商。
回首過去,在傳統(tǒng)的FPGA業(yè)務(wù)模型里,FPGA廠商通常只負(fù)責(zé)賣給客戶兩樣?xùn)|西:一個是FPGA芯片,另外一個是FPGA的開發(fā)工具。兩件東西一旦售出,客戶開發(fā)何種應(yīng)用就與廠商無關(guān)。雖然廠商也會提供詳盡的技術(shù)支持,但主要的開發(fā)過程往往還是由客戶完成。
如今,F(xiàn)PGA廠商更傾向于提供給客戶一個完整的系統(tǒng)級解決方案。兩大FPGA廠商英特爾和賽靈思目前紛紛推出的各類FPGA加速卡,就是這個趨勢的典型代表。
總體而言,F(xiàn)PGA廠商在硬件層面已經(jīng)不單單提供芯片級的產(chǎn)品,而是進(jìn)一步提供板卡級的產(chǎn)品組合。與開發(fā)板不同,F(xiàn)PGA加速卡是針對特定領(lǐng)域和應(yīng)用的專業(yè)板卡,通常以PCIe擴(kuò)展卡的方式進(jìn)行部署。板卡上設(shè)計有豐富的高速I/O接口與存儲資源,但往往不會配備太多開發(fā)板上常見的調(diào)試功能與資源,例如通用I/O等。
在軟件層面,F(xiàn)PGA廠商除了提供傳統(tǒng)的開發(fā)套件之外,現(xiàn)在還會提供與FPGA加速卡配套的驅(qū)動、各類軟件庫、編程接口(API),甚至還有下文會提到的完整的軟件開發(fā)棧以及軟硬件參考設(shè)計。
通過提供這些完整的開發(fā)環(huán)境,大大簡化了FPGA的開發(fā)難度,使得軟件開發(fā)人員也能在短時間內(nèi)完成算法模型的FPGA實(shí)現(xiàn)。FPGA廠商的主要目的,是在不斷提供原廠軟硬件解決方案的同時,也在不斷吸收第三方的IP與應(yīng)用,從而構(gòu)建一個完整的FPGA生態(tài)系統(tǒng)。
同時我們也注意到,除了FPGA原廠的加速卡方案之外,很多第三方廠家,比如華為、浪潮和Mellanox等,也相繼推出了各自的FPGA加速卡產(chǎn)品。這些第三方加速卡雖然采用的都是英特爾或賽靈思的FPGA芯片,但都針對各自的細(xì)分領(lǐng)域做了優(yōu)化設(shè)計,以適應(yīng)目標(biāo)應(yīng)用的需要。
在下文中,我將詳細(xì)介紹一下當(dāng)前在市場上主要的FPGA加速卡產(chǎn)品,以及各個廠商基于加速卡的FPGA生態(tài)系統(tǒng)布局。
英特爾的FPGA加速卡布局
早在2017年10月,英特爾就官宣了旗下的首款FPGA加速卡產(chǎn)品,名為“Programmable Acceleration Card”,簡稱PAC。同時發(fā)布的,還有與之配套的軟硬件開發(fā)框架與加速棧系統(tǒng)。這不僅是英特爾FPGA的首款通用FPGA加速卡產(chǎn)品,也是當(dāng)時市場上的首款面向大數(shù)據(jù)、AI、高新能計算等新興領(lǐng)域的數(shù)據(jù)中心FPGA加速卡,因此PAC的意義非同小可。
(圖片來自英特爾)
在硬件規(guī)格方面,PAC使用了英特爾的Arria10 GX FPGA,它基于英特爾的20納米工藝制造,擁有115萬個可編程邏輯單元,是當(dāng)時性能和容量最強(qiáng)大的英特爾FPGA。PAC集成了8GB的DDR4內(nèi)存和128MB閃存,有一個QSFP+接口,能滿足最高40Gbps的網(wǎng)絡(luò)連接帶寬,同時有PCIe Gen3 x8接口與主機(jī)CPU互聯(lián)。
(圖片來自英特爾)
值得注意的是,PAC的板級功耗約為45W~60W,因此得以采用了被動散熱設(shè)計,從而將板卡的尺寸控制在了半高半長,方便在各類服務(wù)器的部署。
PAC的主要應(yīng)用場景是加速數(shù)據(jù)中心的各類應(yīng)用,作為英特爾的原廠產(chǎn)品,PAC在數(shù)據(jù)中心里有著得天獨(dú)厚的優(yōu)勢。它天生可以作為英特爾Xeon處理器的硬件加速單元,用于卸載和加速原本在CPU上實(shí)現(xiàn)的各類應(yīng)用,從而構(gòu)成英特爾CPU+FPGA的高性能數(shù)據(jù)處理組合。
作為生態(tài)系統(tǒng)構(gòu)建的重要組成部分,英特爾還發(fā)布了面向Xeon和FPGA的加速堆棧(Acceleration Stack),見下圖。這個加速堆棧本質(zhì)上是一個軟件開發(fā)框架,包含了FPGA板卡的驅(qū)動、API、接口管理、軟件庫與開發(fā)工具等,從而為CPU與FPGA的聯(lián)合開發(fā)提供了通用的編程接口,簡化了開發(fā)流程,縮短了開發(fā)時間。
(圖片來自英特爾)
為了向軟件開發(fā)者進(jìn)一步抽象底層的FPGA硬件資源,英特爾開源了名為“開放可編程加速引擎(Open Programmable Acceleration Engine - OPAE)”的技術(shù)。OPAE是一個層次化模型,提供了一系列標(biāo)準(zhǔn)的軟件接口,以及常見硬件功能的FPGA實(shí)現(xiàn),比如各類寄存器與內(nèi)存分配邏輯等等。同時,也提供了很多操作系統(tǒng)內(nèi)核空間的FPGA支持,使得開發(fā)者可以專注于用戶空間的應(yīng)用開發(fā)。
(圖片來自英特爾)
PAC發(fā)布一年后,英特爾在2018年10月發(fā)布了另一款基于Statix10 SX FPGA的加速卡。相比前一代產(chǎn)品,這款加速卡在硬件性能上有了質(zhì)的飛越。Stratix10作為英特爾的高端FPGA系列,基于英特爾的14納米工藝制造,并采用了3D系統(tǒng)級封裝技術(shù),有著更高的集成度。在這款PAC采用的Stratix10 FPGA上,有280萬可編程邏輯單元,244Mb片上內(nèi)存以及高達(dá)26Gbps的串行收發(fā)器。
(圖片來自英特爾)
板上資源方面,這款PAC包含32GB DDR4內(nèi)存、兩個最高支持100Gbps網(wǎng)絡(luò)帶寬的QSFP28接口,以及PCIe Gen3 x16接口。由于這個板卡面向更高性能的數(shù)據(jù)中心應(yīng)用,因此在功耗和尺寸方面都有所增加,其中板級功耗約為225W,尺寸為全高、3/4長的雙槽設(shè)計。
(圖片來自英特爾)
在2019年MWC大會的第一天,英特爾又推出了一款針對5G應(yīng)用的FPGA加速卡PAC N3000,見下圖。這款加速卡可以實(shí)現(xiàn)高達(dá)100Gbps的網(wǎng)絡(luò)流量的加速處理,同時支持9GB DDR4和144MB QDR IV板上內(nèi)存。
(圖片來自英特爾)
對于英特爾的FPGA加速卡產(chǎn)品而言,它們最大的優(yōu)勢之一就是英特爾在數(shù)據(jù)中心處理器領(lǐng)域的核心支配地位。由于英特爾Xeon處理器占據(jù)了數(shù)據(jù)中心市場的x86處理器的絕大部分市場份額,因此無論何家的FPGA加速卡都必須針對Xeon處理器做大量的兼容性設(shè)計和優(yōu)化,而英特爾FPGA在這方面有著先天的血統(tǒng)優(yōu)勢。這也使得英特爾成為目前唯一一個能夠提供全棧式數(shù)據(jù)中心解決方案的公司。
此外,英特爾與各大服務(wù)器制造商保持著良好的合作關(guān)系,因此包括戴爾、HPE、富士通等服務(wù)器制造商會很自然的在自家的服務(wù)器產(chǎn)品中加入并銷售基于英特爾FPGA的加速卡。然而,這對于其他FPGA廠商而言就沒有那么水到渠成,他們往往很難說服服務(wù)器廠商或者客戶在已經(jīng)內(nèi)置了FPGA的服務(wù)器中,再花費(fèi)額外的成本,并冒著兼容性的風(fēng)險去添加其他的FPGA加速器。
-
英特爾
+關(guān)注
關(guān)注
60文章
9866瀏覽量
171324 -
FPGA芯片
+關(guān)注
關(guān)注
3文章
246瀏覽量
39750
原文標(biāo)題:【歷史】從芯片到系統(tǒng):FPGA加速卡的發(fā)展歷程與展望
文章出處:【微信號:TechSugar,微信公眾號:TechSugar】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論