CPU是底層硬件基礎(chǔ)設(shè)施中的核心,當(dāng)前主流芯片架構(gòu)為 ARM 和 X86,均為國外主導(dǎo),芯片國產(chǎn)化率較低。國家啟動發(fā)展國產(chǎn) CPU 的泰山計劃,863 計劃也提出自主研發(fā) CPU。2006 年核高基專項啟動,國產(chǎn) CPU領(lǐng)域迎來新一輪的國家支持,鯤鵬、飛騰、龍芯、兆芯、海光、申威等一批優(yōu)質(zhì)國產(chǎn) CPU 廠商快速崛起。 ? 本文內(nèi)容來自“中流擊水:六大國產(chǎn)CPU廠商分析(2022)”以及六大國產(chǎn)CPU分析。
1、國內(nèi)CPU廠商概述
海光信息和兆芯采用 x86 架構(gòu) IP 內(nèi)核授權(quán)模式,可基于公版 CPU 核進行優(yōu)化或修改,優(yōu)點是性能起點高、生態(tài)壁壘低,缺點是需要支付授權(quán)費、自主創(chuàng)新程度較低。海光最新一代 CPU 已接近國際同類高端產(chǎn)品水平,并兼容x86 指令集。 ? 鯤鵬和天津飛騰采用 ARM 指令集架構(gòu)授權(quán),可自行設(shè)計 CPU 內(nèi)核和 SOC,也可擴充指令集,自主化程度相對較高。華為鯤鵬 920 處理器是業(yè)內(nèi)首款 7nm 數(shù)據(jù)中心 ARM 處理器,非 X86 架構(gòu)芯片中鯤鵬 920 芯片在算力維度方面優(yōu)勢領(lǐng)先,且發(fā)展至今已經(jīng)達到可以與 X86 芯片相匹配的性能。 ? 龍芯中科采用自研的 LoongArch 指令集,擁有較強的自主性和可靠性,其秉承獨立自主和開放合作的運營模式,從指令集/IP 核授權(quán)、到芯片級/主板級開發(fā)以及系統(tǒng)內(nèi)核應(yīng)用等方面對生態(tài)伙伴進行全方位的開放支持。
申威采用自研的申威 64 位指令集,重點應(yīng)用于特種領(lǐng)域,努力實現(xiàn)在國防和網(wǎng)絡(luò)安全領(lǐng)域芯片的自主可控。隨著其產(chǎn)品技術(shù)的日益成熟,其生態(tài)也不斷趨于完善。 ? 海思、飛騰均已經(jīng)獲得 ARMv8 永久授權(quán),盡管 ARM 此前表態(tài) ARMv9 架構(gòu)不受美國出口管理條例約束,華為海思等國內(nèi)CPU產(chǎn)商依然可獲授權(quán),但是ARMv9不再提供永久授權(quán),采用 ARM 架構(gòu)仍有長期隱患。
RISC-V 因其相對精簡的指令集架構(gòu)(ISA)以及開源寬松的 BSD 協(xié)議近年來發(fā)展較快,國內(nèi)阿里平頭哥、國芯科技等企業(yè)推出了該架構(gòu)相關(guān)產(chǎn)品。MIPS 和 ALPHA 指令架構(gòu)相對小眾,對應(yīng)國產(chǎn) CPU 的代表性企業(yè)分別是龍芯和申威。
2、鯤鵬920處理器
鯤鵬920處理器。該芯片支持 ARMv8.2 指令集,是行業(yè)內(nèi)首款 7nm數(shù)據(jù)中心 ARM 處理器,專為大數(shù)據(jù)處理以及分布式存儲等應(yīng)用而設(shè)計。鯤鵬 920 采用多發(fā)射、亂序執(zhí)行、優(yōu)化分支預(yù)測等多種手段提升單核性能。 ? 鯤鵬920 擁有 64 個內(nèi)核,集成 8 通道 DDR4,可以提供多個接口,主頻可達 2.6GHz,總內(nèi)存帶寬最高可達 1.5Tb/s,支持 PCIe 4.0 及 CCIX 接口,總帶寬 640Gbps。華為 Cache一致性總線(HCCS)的 480Gbps 片間互聯(lián)支持最多四顆鯤鵬 920 互聯(lián)和最高 256 個物理核的 NUMA 架構(gòu),保證了鯤鵬 920 超強算力的高效輸出。此外,在 Memory 子系統(tǒng)上也進行了大量的優(yōu)化,采用當(dāng)前典型的 3 級 Cache 的架構(gòu),對 Cache 大小以及延時進行了優(yōu)化設(shè)計。
鯤鵬 920 不同核心下與競品芯片的對比,其在 48 核的時候,整數(shù)打平 intel 至強 8180,功耗低 20%。而 64 核心的鯤鵬 920,則比過 intel至強 8180 33%左右。其中至強 8180 是 intel 用于服務(wù)器的旗艦芯片,采用 28 核心,2.5GHz 頻率,廣泛應(yīng)用于 X86 服務(wù)器中。
3、飛騰處理器
飛騰對高性能服務(wù)器 CPU、高效能桌面 CPU、高端嵌入式 CPU 三條產(chǎn)業(yè)線進行了全面的品牌升級。高性能服務(wù)器CPU產(chǎn)品線統(tǒng)一以飛騰騰云S系列進行命名,高性能桌面 CPU 產(chǎn)品線以飛騰騰銳 D 系列進行命名,高端嵌入式 CPU 產(chǎn)品線統(tǒng)一以飛騰騰瓏 E 系列進行命名,提供定制化、契合各行各業(yè)嵌入式應(yīng)用的解決方案。
PKS 體系最早由飛騰 CPU(Phytium)和麒麟操作系統(tǒng)(Kylin)的“PK 體系”發(fā)展而來。依托飛騰全新的硬件級安全機制,以相關(guān)可信技術(shù)為支撐,PK 體系融合“S-Security”的立體防護安全鏈,升級為 PKS體系,并全球首創(chuàng)將“可信計算 3.0”技術(shù)融入到 CPU、操作系統(tǒng)和存儲控制器中,實現(xiàn)底層構(gòu)架的本質(zhì)安全,并成為國內(nèi)首個計算機軟硬件基礎(chǔ)體系標(biāo)準。
4、海光處理器
海光信息與 AMD 公司合作密切,授權(quán)海光微電子 x86 指令集和Zen 架構(gòu),AMD 獲得 2.93 億美元的授權(quán)費。海光集成電路購買海光微電子的 IP 授權(quán),以此為基礎(chǔ)開發(fā) CPU。海光集成電路與海光微電子的股權(quán)結(jié)構(gòu)保證了公司在規(guī)避了英特爾的 x86 授權(quán)限制的同時,又使得海光 x86 CPU 成為內(nèi)資公司開發(fā)的產(chǎn)品,滿足了國家產(chǎn)業(yè)政策和創(chuàng)新的需求。
基于 AMD Zen1 架構(gòu),產(chǎn)品性能起點較高。選取 Intel 在 2020 年(與海光7285 同期)發(fā)布的 6 款至強鉑金系列產(chǎn)品(能夠反映 Intel 2020 年發(fā)布的主流 CPU產(chǎn)品的性能)與海光 7285 進行性能對比可以發(fā)現(xiàn),在典型場景下,公司最新一代 CPU相關(guān)產(chǎn)品均已接近國際同類高端產(chǎn)品水平。
5、兆芯“開先、開勝”處理器
兆芯自主研發(fā)的通用處理器產(chǎn)品涵蓋“開先”、“開勝”兩大系列,具備良好的操作系統(tǒng)和軟硬件兼容性,生態(tài)體系成熟,支持構(gòu)建臺式機、筆記本、一體機、云終端等多種類型的桌面整機以及服務(wù)器、存儲等產(chǎn)品。此外,在嵌入式領(lǐng)域,也已經(jīng)有不同規(guī)格基于兆芯通用處理器的工業(yè)主板、模塊化電腦、工業(yè)整機、Box PC、工業(yè)級服務(wù)器、網(wǎng)絡(luò)安全平臺等產(chǎn)品陸續(xù)推出。
開先 KX-6000/開勝 KH-30000 系列處理器是業(yè)內(nèi)第一款完整集成 CPU、GPU、芯片組的SoC 單芯片國產(chǎn)通用處理器,這為整機系統(tǒng)的開發(fā)提供了較大的便利條件,同時也更利于控制成本。 ? 通過 KX-6000 系列處理器橫向?qū)Ρ龋? 核心的 KX-U6780A 產(chǎn)品性能與第七代的 4 核心英特爾 i5 整體水平仍存在差距,尤其是單核性能不足 7 代 i5 一半,但整數(shù)性能方面對英特爾 i5 實現(xiàn)了反超。
6、龍芯LoongISA 指令系統(tǒng)
龍芯中科采用自主LoongISA 指令系統(tǒng),兼容 MIPS 指令,所有 IP 模塊皆為自主設(shè)計,擁有片內(nèi)安全機制,可信性高。龍芯處理器以 32 位核 64 位單核及多核 CPU/SOC 為主,主要面向高端嵌入式、個人電腦、服務(wù)器和高性能機等應(yīng)用。2002 年 8 月誕生的“龍芯一號”是我國首枚擁有自主知識產(chǎn)權(quán)的通用高性能微處理芯片。 ? 龍芯 1 號系列為低功耗、低成本的專用嵌入式 SoC 或MCU 處理器;龍芯 2 號系列為低功耗通用處理器,采用單芯片 SoC 設(shè)計,應(yīng)用場景面向工業(yè)控制與終端等領(lǐng)域;龍芯 3 號系列為高性能通用處理器,通常集成 4 個及以上 64 位高性能處理器核,與橋片配套使用,應(yīng)用場景面向桌面和服務(wù)器等信息化領(lǐng)域,對標(biāo) Intel的酷睿/至強系列。
LoongArch 具有較強的擴展性和自主性。LoongArch 包括基礎(chǔ)架構(gòu)部分和向量指令、虛擬化、二進制翻譯等擴展部分近 2000 條指令,具有較好的擴展性。自主性方面,LoongArch 指令系統(tǒng)從整個架構(gòu)的頂層規(guī)劃,到各部分的功能定義,再到每條指令的編碼、名稱、含義,都進行了自主設(shè)計,具有充分的自主可靠性。
基于自主指令系統(tǒng)(LoongArch)的 3A5000/3B5000 是龍芯當(dāng)前重點發(fā)展產(chǎn)品。龍芯3A5000/3B5000 是面向個人計算機、服務(wù)器等信息化領(lǐng)域的通用處理器,基于龍芯自主指令系統(tǒng)(LoongArch)的 LA464 微結(jié)構(gòu),并進一步提升頻率,降低功耗,優(yōu)化性能。
從 3A5000 在 SPEC CPU 2006 BASE 性能測試中的表現(xiàn)來看,龍芯 3A5000 單核定點為25.1 分,單核浮點為 26 分。相比 intel i5 9500 六核 14nm 的確有不小的差距,但單核定點與國產(chǎn) ARM V8 四核 7nm 處理器不相上下,單核浮點略優(yōu)于國產(chǎn) ARM V8 四核 7nm 處理器。龍芯 3A5000 對比國產(chǎn) ARM V8 八核 14nm 處理器的單核定點則高出近 10 分,單核浮點則高出近一倍。多線程測試中,intel i5 9500 六核 14nm 處理器依然表現(xiàn)最佳,而龍芯 3A5000 的多核定點與多核浮點均高于國產(chǎn) ARM V8 四核 7nm處理器,由于國產(chǎn) ARM V8 八核 14nm 處理器核心數(shù)量上具有一定的優(yōu)勢,因此定點和浮點的分數(shù)要高于龍芯 3A5000 和國產(chǎn) ARM V8 四核 7nm 處理器。
7、申威Alpha 指令處理器
申威處理器以 Alpha 指令集為基礎(chǔ)進行拓展,高度自主可控。Alpha 指令集由美國 DEC公司研制,主要用于 64 位的 RISC 微處理器。 ? 江南計算所基于原來的 Alpha 指令集,開發(fā)出了更多的自主知識產(chǎn)權(quán)的指令集,并研制了申威指令系統(tǒng),推出了申威處理器。申威處理器是在國家"核高基"重大專項支持下,由上海高性能集成電路中心研制的全國產(chǎn)處理器。首顆申威處理器代號“SW-1”,于 2006 年研制成功,“SW-1”基于 DEC公司 Alpha 架構(gòu),130nm 制程,主頻為 900MHz。
申威在研發(fā)出第一代基于 Alpha 指令集的 CPU 后,將指令集替換為自研的自主可控申威 64 位指令集,完全區(qū)別于原有 Alpha 指令集。申威處理器專注于高性能計算,尤其是在服務(wù)器領(lǐng)域,浮點運算算力與同期外國處理器相當(dāng)。申威 SW26010 是中國首個采用國產(chǎn)自研架構(gòu)且性能強大的計算機芯片。
申威 26010 處理器的峰值性能大于每秒 12.5 萬萬億次浮點運算結(jié)果,峰值速度、持續(xù)性能、性能功耗比排在世界前列。 ? 2016 年,搭載了 40960 顆申威 SW26010 并運行國產(chǎn)操作系統(tǒng)神威睿思的神威太湖之光獲得全球超級計算機第一名,神威太湖之光峰值計算速度達每秒 12.54 億億次,是全球首臺峰值計算速度超過十億億次的超級計算機,持續(xù)性能為每秒 9.3 億億次,軟件硬件并行,均為申威自主設(shè)計。
申威 8A 芯片采用最新的第四代申威處理器核心(簡稱 Core4)。Core4 核心繼續(xù)采用超標(biāo)量流水線結(jié)構(gòu),支持亂序發(fā)射、亂序執(zhí)行、推測執(zhí)行,并首次采用 SMT 技術(shù),支持每個核心同時運行兩個線程。申威 831 相比上一代 4 核 CPU 申威 421 在功耗相當(dāng)?shù)那疤嵯拢阅芴嵘?2 倍以上,下一代產(chǎn)品申威 4E 相比申威 831 性能再提升 50%以上,與 Intel 中端桌面處理器相當(dāng);申威下一代服務(wù)器產(chǎn)品威鑫 8A 與 Intel 中端服務(wù)器處理器相當(dāng)。 ? ?
編輯:黃飛
?
評論
查看更多