與大多數(shù)其他Layerscape處理器一樣,LX2160A處理器面向無頭嵌入式系統(tǒng)。它不適用于擁有強(qiáng)大CPU和流暢用戶界面的計(jì)算機(jī)。誠(chéng)然,它的大多數(shù)指標(biāo)得分都很高,但最突出的是驚人的網(wǎng)絡(luò)加速和I/O性能。它適用于無線傳輸卡和工業(yè)控制器等設(shè)計(jì)。為何要把LX2芯片連接到GPU上呢?
答案是,LX2對(duì)于計(jì)算機(jī)來說足夠強(qiáng)大,但它是為高要求的嵌入式應(yīng)用而設(shè)計(jì)。LX2擅長(zhǎng)利用16個(gè)CPU進(jìn)行通用計(jì)算。Cortex?-A72 CPU由Arm?授權(quán),可用于其他Layerscape處理器和其他公司的ASIC。例如特斯拉采用12核CPU的“FSD計(jì)算機(jī)”以及亞馬遜網(wǎng)絡(luò)服務(wù)公司采用16核CPU的Graviton(與LX2一樣)。我們的分析顯示,16核LX2的性能與競(jìng)爭(zhēng)對(duì)手架構(gòu)(通常針對(duì)PC和服務(wù)器)的16線程/8核處理器相當(dāng)。
需要這種性能的應(yīng)用范圍很廣。其中包括Layerscape及其Power Architecture?前身長(zhǎng)期瞄準(zhǔn)的通信設(shè)備類型中的數(shù)據(jù)平面功能:基站中的傳輸卡、數(shù)據(jù)中心服務(wù)器的智能網(wǎng)卡以及路由器的第2層/第3層加速度傳感器。這些應(yīng)用可采用LX2的眾多內(nèi)核以及每個(gè)Layerscape處理器內(nèi)置的連接和加密加速功能。
恩智浦在通信設(shè)備領(lǐng)域也有長(zhǎng)期目標(biāo),特別是利用通信設(shè)備的高單線程性能方面。在這一方面,LX2也大放異彩——但在這種情況下,是由于LX2的CPU速度很快,可以穿透軟件層。例如,網(wǎng)絡(luò)功能虛擬化(NFV)將軟件封裝在以前運(yùn)行在獨(dú)立物理硬件上的虛擬機(jī)中。雖然虛擬化起源于服務(wù)器和工作站,但它在恩智浦處理器上可高效運(yùn)行,這要?dú)w功于恩智浦的CPU內(nèi)核和SoC機(jī)箱的虛擬化功能。自2008年QorIQ P系列問世以來,我們一直致力于這類組件的設(shè)計(jì)。
盡管如此,在典型的NFV系統(tǒng)中,各種因素共同消耗著CPU時(shí)鐘周期。舊的物理系統(tǒng)是帶精益系統(tǒng)軟件的專用硬件。而虛擬化網(wǎng)絡(luò)功能(VNF)是在類似計(jì)算機(jī)的通用硬件和系統(tǒng)軟件上執(zhí)行的,本質(zhì)上效率較低。此外,這些平臺(tái)還托管了多個(gè)VNF,它們通過虛擬交換機(jī)(軟件上部署的以太網(wǎng)交換機(jī))相互通信。數(shù)據(jù)平面開發(fā)工具套件(DPDK)等庫減輕了操作系統(tǒng)開銷,但依賴高速內(nèi)核來運(yùn)行并完成任務(wù)。Lx2擁有所需的內(nèi)核,而恩智浦投資優(yōu)化網(wǎng)絡(luò)和虛擬化軟件,如DPDK和Linux內(nèi)核虛擬機(jī)(KVM)。恩智浦還投資容器化——成本更低的虛擬化替代方案。
然而,最重要的軟件是Linux。是的,恩智浦仍然與Wind River等嵌入式操作系統(tǒng)專家合作。對(duì)于希望獲得開源嵌入式體驗(yàn)的客戶,恩智浦提供了Yocto嵌入式Linux開發(fā)環(huán)境。但是,許多開發(fā)人員(尤其但不限于具有IT背景的開發(fā)人員)更喜歡在計(jì)算機(jī)上使用類似的環(huán)境。恩智浦的Layerscape開發(fā)套件(LSDK)很受歡迎。它是一個(gè)參考集成,示范了客戶如何將眾多組件融合到系統(tǒng)映像或個(gè)性化Linux發(fā)行版中。
為了構(gòu)建LSDK,恩智浦首先修改大量開源啟動(dòng)加載程序、內(nèi)核、庫和工具,以與特定器件(如LX2)配合使用。我們將這些修改作為補(bǔ)丁,提交給相關(guān)的開源項(xiàng)目。一旦上傳,LSDK組件就可從kernel.org和GitHub等公共存儲(chǔ)庫下載。恩智浦會(huì)不時(shí)更新這些補(bǔ)丁,定期發(fā)布新版本,并為最新的兩個(gè)長(zhǎng)期支持版(LTS)內(nèi)核提供支持。開發(fā)人員可以選擇自己集成所需的組件。無需下載大量ISO文件或tarball。
LSDK參考集成非常便捷,包含了一個(gè)用戶空間,其中包含從備受歡迎的Ubuntu發(fā)行版派生的文件和文件夾層次結(jié)構(gòu)。這為開發(fā)人員提供了熟悉的操作環(huán)境。重要的是,它還提供了對(duì)大量二進(jìn)制軟件庫的輕松訪問。這些應(yīng)用運(yùn)行順暢,因?yàn)長(zhǎng)X2和其他Layerscape處理器使用標(biāo)準(zhǔn)Arm內(nèi)核,最大限度地提高了兼容性。其他受歡迎的發(fā)行版也支持64位Arm處理器,使用LSDK打造自己發(fā)行版的開發(fā)人員可以調(diào)整這些用戶空間,而不是我們提供的Ubuntu示例。圖1是LX2上Linux桌面的截屏。
圖1 Layerscape LX2160A處理器上運(yùn)行的Linux桌面的截屏
LX2的性能和軟件生態(tài)合作體系正將其推向通信以外的市場(chǎng)。高端輔助駕駛自動(dòng)化系統(tǒng)(ADAS)中的服務(wù)器硬件通常會(huì)解決這類問題,即通過人工智能(AI)硬件集成從相機(jī)、激光雷達(dá)和其他傳感器提取的信息的問題。這種硬件體積龐大、價(jià)格昂貴且容易發(fā)熱。而LX2是個(gè)極具吸引力的替代方案,它具有相似的性能和更好的集成性,同時(shí)廠家在滿足汽車制造商對(duì)長(zhǎng)期供貨計(jì)劃、功能安全和惡劣環(huán)境耐受性的需求方面有著良好口碑。恩智浦與全球各大公司合作開展ADAS和自動(dòng)駕駛工作。同樣,客戶也在工業(yè)機(jī)器視覺、航空航天和數(shù)控切割機(jī)中使用LX2。
即使在通信中,LX2也可以處理在通用處理器上未運(yùn)行的工作負(fù)載。例如,5G移動(dòng)通信標(biāo)準(zhǔn)支持各種功能拆分,包括在稱為分布式單元(DU)的系統(tǒng)中而非傳統(tǒng)宏基站的信道卡上實(shí)現(xiàn)上層PHY功能,包括信道編碼、位操作、信道估計(jì)、均衡和預(yù)編碼,可以在通用處理器上的軟件中運(yùn)行。然而,該處理器必須能夠處理大量數(shù)據(jù)。恩智浦的分析表明,LX2可以勝任這項(xiàng)任務(wù)。
出于類似的原因,LX2甚至正進(jìn)入數(shù)據(jù)中心,也就是終極計(jì)算設(shè)備200W+服務(wù)器芯片的大本營(yíng)。LX2并沒有取代服務(wù)器,而是通過插入服務(wù)器的網(wǎng)絡(luò)接口卡與其進(jìn)行互補(bǔ)。LX2將網(wǎng)絡(luò)任務(wù)從那些昂貴且耗電的服務(wù)器內(nèi)核中分流。Xilinx開發(fā)的FPGA + LX2 NIC組合就是一個(gè)例子。
要了解LX2如何提供如此具有競(jìng)爭(zhēng)力的性能,我們先深入了解一下一般計(jì)算工作負(fù)載上影響其性能的一些因素。它有兩個(gè)受ECC保護(hù)的64位DDR4內(nèi)存接口,如圖2所示。雖然這比服務(wù)器處理器少,但LX2的DDR4接口運(yùn)行速度高達(dá)3200 GT/s,比市場(chǎng)上的其他處理器快約50%。因此不僅可以確保良好的內(nèi)存吞吐量,還能降低成本(與采用的寬DDR端口較少有關(guān))。
圖2 LX2160A處理器結(jié)構(gòu)框圖
這得益于8MB的平臺(tái)高速緩存,高速緩存緩沖CPU內(nèi)核訪問、網(wǎng)絡(luò)加速度傳感器和I/O控制器的片外內(nèi)存。片上還集成了2MB數(shù)據(jù)包快速緩沖區(qū),可最大限度地減少內(nèi)置以太網(wǎng)交換機(jī)對(duì)DRAM的訪問。每對(duì)CPU旁邊都有1MB的二級(jí)緩存。這與Graviton的每核數(shù)量相同,Graviton沒有L3緩存,比許多計(jì)算處理器都要多。與片外內(nèi)存相比,高速緩存的訪問速度更快,因此對(duì)于向CPU提供指令和數(shù)據(jù)來說,高速緩存必不可少。
如上所述,LX2使用Arm Cortex-A72 CPU。這些CPU屬于該公司的“大”A系列內(nèi)核。有些Layerscape使用“小”Arm Cortex-A53 CPU。這兩種CPU相互兼容,可實(shí)現(xiàn)相同版本的Arm 64位指令集。在相同的時(shí)鐘頻率下,A72的速度大約是原來的兩倍。它每個(gè)周期可解碼三條指令,并且可以在八條管道的任意一條無序執(zhí)行。A53一次只解碼和執(zhí)行兩條指令,可以降低功耗和成本。A72以性能為導(dǎo)向,還擁有更快的浮點(diǎn)單元和更廣泛的Neon SIMD執(zhí)行單元,增強(qiáng)了其分割數(shù)學(xué)密集型計(jì)算工作負(fù)載(例如無線DU中的上層PHY函數(shù))的能力。A72 的每個(gè)Neon單元(共兩個(gè))的每個(gè)周期都可以進(jìn)行兩個(gè)復(fù)雜的16位乘積累加運(yùn)算。
總之,恩智浦Layerscape LX2160A處理器在計(jì)算方面表現(xiàn)出色。我們與一位希望更換其嵌入式系統(tǒng)PC處理器的客戶取得了聯(lián)系。他們想要類似的性能,但不想放棄他們的軟件生態(tài)合作體系。LX2正好符合要求。工程師將得到一張標(biāo)準(zhǔn)GPU卡,插入系統(tǒng)的PCIe插槽。因?yàn)橛虚_源社區(qū)和LSDK,軟件安裝輕而易舉。LX2專為解決嵌入式系統(tǒng)的環(huán)境挑戰(zhàn)而設(shè)計(jì),并針對(duì)通信應(yīng)用進(jìn)行了優(yōu)化,在計(jì)算工作負(fù)載方面也大放異彩?;蛟S恩智浦已經(jīng)找到了新的宣傳口號(hào):Layerscape LX2160A:小體積大算力。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
18927瀏覽量
227230 -
cpu
+關(guān)注
關(guān)注
68文章
10702瀏覽量
209371 -
gpu
+關(guān)注
關(guān)注
27文章
4591瀏覽量
128144
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論