賽靈思在八月下旬發(fā)布了當(dāng)時世界上最大的 FPGA 器件:Virtex UltraScale+ VU19P。
這款 FPGA 基于臺積電的 16 納米工藝制造,它集成了 350 億個晶體管,并擁有當(dāng)時單器件最高的邏輯密度和 I/O 數(shù)量:超過 2000 個用戶可編程引腳、9 百萬可編程邏輯單元、224Mb 片上內(nèi)存以及 3800 個 DSP 單元。對比它的前一代產(chǎn)品,即基于 20 納米工藝的 Virtex UltraScale 440 FPGA,這款 VU19P 要更大 60%。
然而,賽靈思的 VU19P 只占據(jù)了“世界最大 FPGA”這個寶座不到三個月的時間。十一月上旬,英特爾宣布推出 Stratix10 GX 10M FPGA,并一躍成為當(dāng)前世界上最大的 FPGA 芯片。
與賽靈思 VU19P 的 350 億晶體管、900 萬可編程邏輯單元(LE)、2072 個可編程 I/O 引腳相比,英特爾 Stratix10 GX 10M 基于自家的 14 納米工藝制造,有著 433 億晶體管、1020 萬可編程邏輯單元,以及 2304 個可編程 I/O,在這幾個方面都完勝 VU19P。
在此之前,英特爾最大的 FPGA 器件是 Stratix 10 GX 2800,它有著 275 萬個可編程邏輯單元以及 1160 個可編程 I/O。另外,英特爾的器件 FPGA Agilex 也有兩百萬左右的可編程邏輯單元。與這兩款器件相比,Stratix10 GX 10M 的容量暴漲將近 4 倍。
關(guān)于“世界最大 FPGA”之爭,一方面是由于超大型 FPGA 在硬件仿真和原型驗(yàn)證領(lǐng)域有著不可或缺的作用,這在之前的文章已經(jīng)詳細(xì)分析過;另一方面,這更像是芯片廠商在“秀肌肉”,因?yàn)橹圃爝@種超大型芯片需要復(fù)雜的系統(tǒng)集成和封裝技術(shù)。
對于賽靈思而言,它們一直采用的是所謂的堆疊硅片互聯(lián)技術(shù)(SSI),這種技術(shù)的最主要缺點(diǎn)是多個硅片之間存在硬邊界,它們只能通過硅中間層進(jìn)行互聯(lián)和通信,從而導(dǎo)致明顯的性能瓶頸。這在《3D FPGA 技術(shù):延續(xù)摩爾定律的黑科技》中有過詳細(xì)闡述。在賽靈思最新的 ACAP 器件中,就針對性的對這個問題進(jìn)行了優(yōu)化。
相比之下,英特爾使用的是 3D 系統(tǒng)級封裝技術(shù),其核心就是 EMIB,也稱為嵌入式多管芯互聯(lián)橋接。EMIB 沒有引入額外的硅中介層,而是只在兩枚硅片邊緣連接處加入了一條硅橋接層(Silicon Bridge),并重新定制化硅片邊緣的 I/O 引腳以配合橋接標(biāo)準(zhǔn)。與 SSI 相比,EMIB 有兩個明顯的優(yōu)點(diǎn),即系統(tǒng)制造復(fù)雜度大幅降低,且硅片間傳輸延時大幅減少。?
EMIB 在 Stratix 10 FPGA 上早已有應(yīng)用,例如在 MX 系列中,就通過 EMIB 集成了所謂的“3D 堆棧式高帶寬內(nèi)存”,也就是常說的 HBM。此外,EMIB 還可以用來連接各類收發(fā)器單元(英特爾稱其為不同的 Tiles)。這種基于 EMIB 的異構(gòu)集成方式非常靈活,它使用芯片集的方式,使得相同的 FPGA 硅片可以搭配不同的收發(fā)器、HBM、CPU 等單元,進(jìn)行快速的系統(tǒng)級芯片集成。
在這次發(fā)布的 Stratix10 GX 10M 中,英特爾首次將兩個擁有 510 萬可編程邏輯單元的大型 FPGA 硅片通過 EMIB 相連,由此形成一個超大 FPGA。這兩個 FPGA 硅片通過 25920 個 EMIB 數(shù)據(jù)接口進(jìn)行互聯(lián),其中每個數(shù)據(jù)連接可以提供 2Gbps 的吞吐量,因此系統(tǒng)整體的通信吞吐量高達(dá) 6.5TBps。這事實(shí)上是在宣布 EMIB 技術(shù)完全可以處理超高帶寬的吞吐量需求。
英特爾 FPGA 采用的 3D 系統(tǒng)級封裝技術(shù)對芯片的良率有著較高的要求,因?yàn)樗m然是異構(gòu)集成技術(shù),但依賴于每個組成部分的同構(gòu)性。也就是說,F(xiàn)PGA 的可編程邏輯陣列本身是一整片硅片。但通過這次發(fā)布的 Stratix10 GX 10M 我們可以看到,EMIB 也可以開始用來作為同構(gòu)芯片的互聯(lián)技術(shù),這樣就大幅擴(kuò)展了這種 3D 封裝技術(shù)的適用程度。此外,單個 FPGA 硅片已經(jīng)可以做到 510 萬個邏輯單元,這也說明英特爾 14 納米工藝已經(jīng)非常成熟。
值得注意的是,EMIB 并不是英特爾唯一的 3D 互聯(lián)和集成技術(shù)。在今年初,英特爾就公布了一項(xiàng)名為 Foveros 的真*3D 封裝技術(shù),它可以將諸如 CPU、GPU、DRAM、Cache 等功能單元的裸片堆疊在一起,然后再封裝成為一枚完整的芯片。Foveros 將在英特爾基于 10 納米工藝的 Lakefiled 上采用。
結(jié)語
雖然很多人將 FPGA 比作積木,可以用來實(shí)現(xiàn)各種應(yīng)用,但制造 FPGA 本身并不像搭積木那樣簡單。從這個“世界上最大的 FPGA”里,我們可以看到太多蘊(yùn)含其中的尖端科技。老石相信,不久的將來必然會出現(xiàn)更大、更復(fù)雜的 FPGA 器件,而驅(qū)動它出現(xiàn)的技術(shù),也將不斷推動科技和文明的延續(xù)。
評論
查看更多