x86仍是主力,ARM奮起直追。2018年前,x86架構的服務器占據(jù)全球服務器99%以上市場份額;2020年,采用ARM架構服務器的市場份額快速提升至2.7%。
在x86領域里,Intel仍是王者,AMD挑戰(zhàn)勢頭正盛。Intel在全球服務器市場的份額一直保持在90%以上,AMD自從推出基于Zen架構的EYPC系列服務器后開始不斷侵蝕Intel的地盤,截至2021年H1,AMD服務器出貨量占比超過10%。 基于x86架構的王者Intel與挑戰(zhàn)者AMD;基于ARM架構的挑戰(zhàn)者Apple。 本章亦詳細梳理了三家廠商在UMA(Unified Memory Architecture,統(tǒng)一內存架構)方向的嘗試與布局,探討CPU未來演進的方向——眾核、異構、集成。 1、X86領域:Intel和AMD占領市場 X86架構目前占據(jù)服務器、桌面及移動PC的主要市場份額,非X86架構產品不斷發(fā)起進攻。2018-2019年,在X86領域,AMD市場規(guī)模增長了1.0%,Intel市場份額小幅度下滑,但仍然呈現(xiàn)出主導態(tài)勢。
在服務器領域,Intel市占率仍然高達96%以上,同時AMD公司正在努力提升自己的市場份額,從2018年的1.8%增長到2019年的3.9%,同比增長117.0%。 在筆記本電腦領域,AMD市占率大幅上升,從2018年的10%增長到2019年的14.6%,Intel則下降了5.1%。 在桌上型電腦領域中,AMD市占率持續(xù)上升,兆芯也占據(jù)了一定市場份額。 2、非X86領域:ARM占據(jù)絕對優(yōu)勢 在非X86領域,ARM以低能耗、高效率、發(fā)展時間長的優(yōu)勢占據(jù)移動終端市場的主導地位,使用最廣泛、發(fā)展最成熟,市占率達到43.2%;RISC-V發(fā)展時間短且更加靈活,在物聯(lián)網領域備受關注,近幾年以其開源性質被重點關注發(fā)展,后續(xù)有望在新興領域嶄露頭角;MIPS主要應用在網關、機頂盒等網絡設備中,市占率達到9%;Power所代表的小型機是企業(yè)IT基礎設施的核心,但在相關市場的占有率僅1%左右;Alpha指令集基本已退出國際主流應用;SPARC早先被Sun公司開源,后被Oracle公司并購,如今已消失。
在移動終端方面,ARM占據(jù)絕對優(yōu)勢,通過授權占據(jù)移動設備端90%以上的市場,構成市場上的標準架構; 在服務器方面,非X86目前參與者有華為、飛騰、高通、亞馬遜等,華為的鯤鵬服務器是ARM服務器的重要參與者,而國產龍芯是基于MIPS的服務器重要廠商;
在桌面PC市場,ARM正逐漸被跟多企業(yè)應用,2011年微軟開始采用ARM的Windows系統(tǒng),ARM開始進入X86的傳統(tǒng)優(yōu)勢領域,如今蘋果MacOS、新版Windows等均采用了ARM。
1、CPU廠商:Intel (1)X86:英特爾在服務器CPU領域的布局,自首款產品Pentium Pro推出以來,已經有25年之久。近12年來,英特爾服務器CPU的平臺包括:Thurley 、 Romley、Grantley、Purley和Whitley,公司預計2021年發(fā)布全新的Eagle Stream。這些服務器CPU的演化幾乎采用了和桌面CPU相同的“Tick-Tock”(鐘擺)戰(zhàn)略,即在“Tick”時升級CPU的制程,而在“Tock”時升級微架構。 2017年以來,英特爾將服務器CPU的原有的E7、E5、E3產品線由高到低細分為Platinum(鉑金)、Gold(金)、Silver(銀)、Bronze(銅),滿足從低階的中小企業(yè)到高階的人工智能,不同的性能需求。 2020年6月,英特爾發(fā)布了最新的Whirley平臺的CooperLake服務器CPU,使用14nm++制程,支持8通道DDR4 ECC內存和PCIE3.0協(xié)議。 (2)ARM/MIPS/Power:為了保證電腦能繼續(xù)運行以往開發(fā)的各類應用程序以保護和繼承豐富的軟件資源,所以很長一段時間內Intel公司所生產的所有CPU仍然繼續(xù)使用X86指令集。 (3)RISC-V?:2021年10月英特爾就已推出了基于RISC-V架構的Nios V處理器。2022年2 月 ,以X86架構為主的英特爾宣布加入RISC-V 國際基金會,并設立了10億美元基金用于扶持初創(chuàng)和成熟企業(yè)進行代工生態(tài)的創(chuàng)新,其中很大一部分資金將用于RISC-V。 (4)Intel的單核到多核之路:自Intel在1978年推出第一顆x86處理器8086后,CPU的發(fā)展方向一直都是整合更多的指令集與外部控制器,以及更高的主頻。當CPU的單核效能與頻率都到瓶頸之后,Intel與AMD都開始向多核發(fā)展。
?
自Intel在1978年推出第一顆x86處理器8086后,CPU的發(fā)展方向一直都是整合更多的指令集與外部控制器,以及更高的主頻。當CPU的單核效能與頻率都到瓶頸之后,Intel與AMD都開始向多核發(fā)展。 (5)Intel的UMA嘗試 UMA(Unified Memory Architecture):傳統(tǒng)的CPU和GPU雖位于同一個SoC芯片上,但由于于內存的不同訪問習慣和數(shù)據(jù)結構,導致它們雖使用相同的內存RAM,但其存取空間仍然是分開的。而UMA基于異構計算,將CPU、GPU、NPU、FPGA等通用、專用處理器集成到一起,協(xié)同計算、各司其職,從而提升帶寬、延遲和性能表現(xiàn)。 Intel第六代酷睿處理器(Skylake,2015年)i7-6700K的ring互聯(lián)架構集成了Intel Gen9核顯。CPU核心、LLC(last?level cache)、GPU和System Agent之間通過SoC Ring Interconnect相連,而且每個連接對象都有專門的本地接口。所有來自或者去往CPU核心,以及來自或者去往Intel GPU的(片外)系統(tǒng)內存數(shù)據(jù)交換事務,都經由這條互聯(lián)ring實施,通過System Agent以及統(tǒng)一DRAM內存控制器。該LLC也與GPU共享。對于CPU核心與GPU而言,LLC著力于降低訪問系統(tǒng)DRAM的延遲,提供更高的有效帶寬。Intel處理器內部的核顯其實是連片內的LLC cache都是可以訪問的,和CPU核心算是平起平坐。也就是說,從很多年前開始,Intel就開始嘗試UMA架構。
2、CPU廠商:AMD (1)X86:AMD 2022年的旗艦產品將是EPYC Genoa服務器,它基于Zen 4架構,擁有龐大的96核。此外,AMD還計劃在2022年底發(fā)布基于Zen 4c的128核EPYC Bergamo服務器。AMD在發(fā)布7nm產品之后得到許多公有云服務商采用,如Google Cloud Platform、Microsoft Azure與Tencent,占比逐漸在2021年提升,目前滲透率已達一成以上。TrendForce集邦咨詢預估,2022年AMD滲透率在全球服務器領域可望達到約15%。 (2)ARM/MIPS/Power/RISC-V:ADM在CPU市場中是堅定的X86追隨者?;邶嫶蟮能浖鶖?shù)以及所掌握的工具技術資源,X86可以最快速度、最便捷途徑去優(yōu)化提高。
AMD在很早就發(fā)現(xiàn)在以游戲為代表的多媒體體驗上,比起CPU,更強的GPU才是大勢所趨。考慮到Intel有自家的集成顯卡技術,AMD另辟蹊徑,以GPU作為突破口,在筆記本領域取代Intel成為市場的主流。
?
(3)AMD的UMA嘗試
在2017年以前,雖然AMD APU和英特爾酷睿都經歷了七次更新迭代,但能被消費者口熟能詳?shù)膮s大都為酷睿家族,作為首創(chuàng)Fusion融聚理念的APU卻逐漸被邊緣化。AMD的APU產品如今集成的GPU核顯,在性能上并未能如十多年前剛誕生之時預期的那樣,顯著優(yōu)于競爭對手。
(4)APU逐漸邊緣化的原因
強勁的競爭對手:在AMD籌備第一代Llano APU之際,Intel搶先一步推出了第一代酷睿處理器(Westmere架構),將CPU和GPU打包封裝,在物理結構上實現(xiàn)了“二合一”。2011年,第二代酷睿處理器(Sandy Bridge)進一步實現(xiàn)了CPU和GPU的融合。雖然AMD的融合理念提出的最早,但在落實方面卻還是落在了Intel后面。隨后,歷代酷睿家族不斷強化集成顯卡性能,最終導致APU在GPU性能上的優(yōu)勢逐漸被稀釋。 落后的工藝:生產工藝是制約處理器性能發(fā)揮的最核心指標,AMD的上游晶圓公司廠Globalfounderies的生產效率難以跟上,使第一代Llano APU就因GF 32nm量產遇阻而從2010年延期到了2011年。給Intel搶先一步融合CPU和GPU的機會。 落伍的核心架構:AMD APU從誕生之初,核心架構經歷了K10→Bulldozer(推土機)→Piledriver(打樁機)→Steamroller(壓路機)→Excavator(挖掘機),就AMD自身來看的確是越來越先進,但與同期的英特爾酷睿家族相比,AMD的核心架構卻早已落伍。受制于工藝和TDP的限制,APU在3D性能上幾乎沒什么提升。近些年AMD移動顯卡和NVIDIA同期產品相比性能也是明顯落后的,這就導致AMD筆記本在高端游戲市場的集體失利。
(5)AMD的UMA嘗試——HSA的成立與沒落
2012年6月,AMD聯(lián)合ARM、Imagination、聯(lián)發(fā)科、德州儀器共同組建了非營利組織“異構系統(tǒng)架構基金會”(HSA Foundation),隨后吸引了三星電子、高通以及大批行業(yè)公司、科研機構的加盟。 異構系統(tǒng)架構(HSA)聯(lián)盟的目標:1) 實現(xiàn)節(jié)能,提高性能;2) 提高異構處理器的可編程性;3) 增加處理器和平臺之間代碼的可移植性;4) 增加整個行業(yè)中異構解決方案的普遍性 HSA的結局:除了游戲主機這個主場完整踐行了APU思路,在PC領域APU完全體的HSA聯(lián)盟和生態(tài)基本處于荒廢狀態(tài)。如今應用于PC的APU更像是單純將CPU、GPU放在同一顆die上的普通處理器;而且AMD的APU產品如今集成的GPU核顯,在性能上也沒能像剛誕生之時預期的那樣,顯著優(yōu)于競爭對手。
HSA失敗的原因:1)AMD對這個方向不再看好,對生態(tài)疏于維護;2)在PC領域,HSA需要開發(fā)者響應,鑒于AMD在PC市場上的號召力不足,HSA難以真正實現(xiàn);3)AMD如今的Zen架構處理器,在性能和效率上與推土機大相逕庭,也實現(xiàn)了對Intel酷睿處理器的超越,不再需要運用APU概念進行競爭。
3、CPU廠商:Apple (1)ARM:蘋果在2020年11月發(fā)布會中推出了新的面向Mac計算機的M1芯片,將為其新一代基于A的Mac提供動力。M1擁有160億個晶體管,包括CPU、GPU、神經引擎和統(tǒng)一的內存架構,5納米制程。蘋果表示,新處理器將專注于電源效率,它有一組八核CPU,提供了世界上最好的CPU每瓦特的性能,能以四分之一的功耗提供與典型筆記本電腦CPU相同的峰值性能。
(2)Apple的UMA嘗試
M1的誕生:Apple M1是由蘋果公司研發(fā)的處理器芯片,基于UMA統(tǒng)一內存架構。于2020年11月11日在蘋果新品發(fā)布會上發(fā)布,適用于部分Mac、iPad設備。
為什么研發(fā)M1:1) 擁有核心技術是蘋果的重要戰(zhàn)略;2)Intel的制造能力相對落后;3)不僅能延長電池壽命,還有可能提升性能,甚至讓筆記本電腦像手機一樣工作。 Apple研發(fā)M1的優(yōu)勢:1)蘋果公司采用垂直整合的封閉系統(tǒng),不受兼容性需求的限制;2)蘋果在過去Ax系列處理器自行定義獨特功能,使蘋果累計了雄厚的軟件資產,布局了相對成熟的生態(tài)系統(tǒng);3)蘋果的強勁的技術實力和自主研發(fā)能力;4)蘋果在移動領域和PC領域的號召力。這些優(yōu)勢使得蘋果雖然晚于其他市場競爭者很久才進入市場,但卻有著得天獨厚的發(fā)展基礎。 M1的基本思想:將RAM作為處理器的所有部分都可以訪問的單個內存池。當GPU需要更多的系統(tǒng)內存,則可以提高使用率,而SoC的其他部分則可以降低。
另外,GPU,CPU和處理器的其他部分可以在相同的內存地址訪問相同的數(shù)據(jù)。無需為SoC的每個部分分配部分內存,然后在處理器的不同部分的兩個空間之間穿梭數(shù)據(jù)。 M1的未來展望:蘋果在3月9日的發(fā)布會上推出自研的M1 Ultra芯片,通過UltraFusion架構將兩個M1 Max芯片拼在一起,使芯片的各項硬件指標翻倍,性能也得到大幅提升。蘋果的UltraFusion技術充分結合封裝互連技術、半導體制造和電路設計技術,為整合面積更大、性能更高的算力芯片提供巨大的想象空間。
編輯:黃飛
?
評論
查看更多