說起近年來(lái)CPU領(lǐng)域的進(jìn)展,很多人都知道蘋果的M1系列芯片、以及它取得了多少多少提升。相比之下,老牌CPU廠商英特爾的關(guān)注度卻越來(lái)越低,最主要的原因就是這個(gè)牙膏廠擠牙膏的速度太慢了。
不過,在英特爾發(fā)布了最新的12代酷睿處理器之后,事情就完全不一樣了。 國(guó)內(nèi)外很多知名UP主都對(duì)它做了極其深入的性能測(cè)試,并且有點(diǎn)出乎意料地收獲了幾乎一邊倒的好評(píng)。很多人甚至說,英特爾這次把牙膏擠爆了、12代酷睿會(huì)幫助英特爾重新走回巔峰。
如果你對(duì)電腦或者數(shù)碼產(chǎn)品不是特別熟悉,可能會(huì)問:一個(gè)產(chǎn)品的正常升級(jí)換代,取得性能提升不是很正常的嗎? 升級(jí)帶來(lái)性能提升是正常的,但取得這么大的性能提升就不那么“正?!绷耍⑻貭柋厝蛔鰧?duì)了什么事情。
所以問題來(lái)了,12代酷睿究竟做對(duì)了什么?究竟是一不小心走運(yùn)擠爆了牙膏,還是發(fā)現(xiàn)了能夠源源不斷產(chǎn)生新牙膏的方法?
先說結(jié)論,我認(rèn)為英特爾找到了一個(gè)新配方,能持續(xù)大幅提升芯片的性能。這個(gè)配方的名字,叫芯片架構(gòu)的創(chuàng)新。而這個(gè)配方最重要的那味藥,就是異構(gòu)。 問題又來(lái)了,異構(gòu)究竟是什么東西?它為什么能幫助12代酷睿取得了如此大的提升?更重要的是對(duì)于普通消費(fèi)者來(lái)說,怎么才能用得上這種創(chuàng)新?對(duì)于我們來(lái)說又有什么具體的意義?今天的文章我們就來(lái)好好說說這些問題。
什么是異構(gòu)
先來(lái)看看“異構(gòu)”這個(gè)詞到底是什么意思。從字面意思來(lái)看,異就是不同,構(gòu)就是架構(gòu)或者結(jié)構(gòu),所以異構(gòu)其實(shí)就是“不同的結(jié)構(gòu)”。它的反義詞是同構(gòu),也就是“相同的結(jié)構(gòu)”。
如果你沒聽說過這兩個(gè)詞也完全沒關(guān)系,其實(shí)在我們?nèi)粘I钪嘘P(guān)于異構(gòu)和同構(gòu)的例子是有很多的。就拿我們家里的裝修和收納舉例,以前很多房屋裝修都是同樣的風(fēng)格,看起來(lái)像是一個(gè)模子印出來(lái)的。收納也很簡(jiǎn)單,比如廚房里都用一樣的四四方方的櫥柜,去收納各種鍋碗瓢盆。這其實(shí)就是同構(gòu)。
但是我們?cè)趯?shí)際應(yīng)用中就發(fā)現(xiàn),這種結(jié)構(gòu)并不好用。因?yàn)槲覀冇懈鞣N各樣的鍋碗瓢盆,放在同樣的櫥柜里就會(huì)導(dǎo)致有的地方放不下,有的地方卻太空了。所以很多現(xiàn)代化的裝修,都是針對(duì)不同的廚具去針對(duì)性的設(shè)計(jì)收納空間,并且能最大限度的利用空間。這種方式其實(shí)就是異構(gòu)。 同樣的例子還有很多,比如一列火車?yán)镉幸坏榷炔蛙嚺P鋪這樣不同的車廂,而不全都是相同的座位,這就是一種異構(gòu)。我們吃的飯也有川菜粵菜漢堡炸雞這樣不同的菜系和品種,而不都是大鍋飯,所以這也是一種異構(gòu)。
所以從廣義上來(lái)看,只要不是同構(gòu),就是異構(gòu)。 但是,異構(gòu)其實(shí)還有更進(jìn)一步的意思。比如機(jī)場(chǎng)的行李管理系統(tǒng),會(huì)把行李按照不同的航班進(jìn)行調(diào)度,同一個(gè)航班,也會(huì)按艙位的不同進(jìn)行先后處理。比如我們?cè)诘刃欣畹臅r(shí)候,頭等艙的行李會(huì)先出來(lái),而我們坐經(jīng)濟(jì)艙的往往要等很久才能等到自己的行李。這里其實(shí)就是在異構(gòu)這個(gè)概念里,增加了優(yōu)先級(jí)和調(diào)度的概念。也就是說,由于結(jié)構(gòu)的不同,對(duì)它的處理和應(yīng)用的方式也是不同的。
再拿前面的廚房收納來(lái)舉例,我們會(huì)把盤子放在櫥柜的抽屜里,但是應(yīng)該先放大盤子、再放小盤子,這樣才不會(huì)倒。放玻璃杯的時(shí)候,抽屜肯定就放不下了,所以應(yīng)該放在杯具專用的地方,可能很窄很高,正好能放下杯子。所以這些不同結(jié)構(gòu)的櫥柜和抽屜,就組成了一個(gè)異構(gòu)的收納體系。 回到前面的問題,我們?yōu)槭裁匆卯悩?gòu)呢?和同構(gòu)相比,異構(gòu)更加高效,每個(gè)部分各司其職,就像玩游戲的時(shí)候用的一套連招,能夠最大限度地發(fā)揮它的力量。
但使用異構(gòu)的另一方面原因,其實(shí)是由于當(dāng)技術(shù)發(fā)展到一定程度的時(shí)候,不可避免的遇到很多限制。很多年前,傳統(tǒng)地提升CPU性能的方法,就是堆料,也就是不斷增加CPU核心的數(shù)量,從而讓性能隨著核心數(shù)的增加而線性增加。多核架構(gòu)在十幾年前就是非常熱門的研究方向,人們認(rèn)為,只要能夠編寫和運(yùn)行并行軟件,就可以將處理器架構(gòu)直接擴(kuò)展到數(shù)千個(gè)核心。
當(dāng)然了現(xiàn)實(shí)總是非常殘酷。在之前的文章里介紹過,當(dāng)時(shí)還在德州大學(xué)奧斯丁分校的道格博格爾教授寫了一篇文章,研究并提出了所謂的“暗硅效應(yīng)”。
它說的是雖然可以不斷增加核心數(shù)量,但由于功耗的限制,我們卻無(wú)法讓這些核心同時(shí)工作。這就像一個(gè)大樓有很多房間,但由于供電量有限,我們無(wú)法同時(shí)開啟每個(gè)房間的燈,這就讓這個(gè)大樓在夜里看起來(lái)有很多黑暗的部分,這也是暗硅這個(gè)詞得名的原因。
暗硅效應(yīng)的提出,完全改變了芯片產(chǎn)業(yè)發(fā)展的方向。人們意識(shí)到即使不斷的堆核,并且開發(fā)出了并行軟件,這種同構(gòu)的方法帶來(lái)的性能提升也會(huì)非常有限。所以異構(gòu)計(jì)算就應(yīng)運(yùn)而生了。事實(shí)上,在計(jì)算機(jī)領(lǐng)域,異構(gòu)計(jì)算是一個(gè)近年來(lái)非常熱門的方向,就是因?yàn)楫悩?gòu)計(jì)算能夠充分利用CPU、GPU、FPGA、ASIC等等不同芯片結(jié)構(gòu)的特點(diǎn),相互取長(zhǎng)補(bǔ)短,從而實(shí)現(xiàn)更加高性能低功耗的計(jì)算系統(tǒng)。
對(duì)于CPU設(shè)計(jì)本身,也慢慢出現(xiàn)了異構(gòu)的方法。比如手機(jī)的處理器絕大多數(shù)都是基于ARM的架構(gòu),它就采用了大小核的設(shè)計(jì)。在蘋果的M1芯片里,也采用了類似的設(shè)計(jì)方法。這些都不是新鮮事兒了。
但是新鮮的是,在x86架構(gòu)的CPU里,12代酷睿Alder Lake是第一次嘗試了這種性能核+能效核的異構(gòu)方法,結(jié)構(gòu)就取得了非常好的效果。
硬件異構(gòu):兩種不同的內(nèi)核
Alder Lake最主要的特點(diǎn),就是采用了性能核+能效核的架構(gòu)設(shè)計(jì)。它最大的特點(diǎn)就是有很強(qiáng)的擴(kuò)展性和靈活性。
比如全系列Alder Lake都是采用了相似的設(shè)計(jì),不管是臺(tái)式機(jī)、筆記本還是超輕薄的商務(wù)本,CPU架構(gòu)都是相同的,只不過兩種類型的核心數(shù)量有區(qū)別。比如桌面端CPU最高可以支持8個(gè)性能核、8個(gè)能效核,面向筆記本的12代酷睿又分成了HPU三個(gè)子系列:H系列面向高性能移動(dòng)平臺(tái),可以支持4~6個(gè)性能核、4~8個(gè)能效核,最多14核20線程;面向高性能筆記本的P系列也是如此,性能核支持2~6個(gè),能效核都為8個(gè);而主打輕薄筆記本的U系列,最多支持2個(gè)性能核、8個(gè)能效核。使用這樣的設(shè)計(jì),就能根據(jù)特定的應(yīng)用場(chǎng)景,針對(duì)性的配置芯片核心的數(shù)量和種類,以取得性能和功耗的平衡和優(yōu)化。
Alder Lake的能效核代號(hào)為Gracemont。值得注意的是,它并沒有采用業(yè)界通用的“低功耗”內(nèi)核的這個(gè)說法,而是稱為“高能效”,這其實(shí)代表著Gracemount能夠很好的平衡性能和功耗這兩個(gè)非常重要但貌似相互矛盾的性能指標(biāo)。
在之前架構(gòu)日的文章里詳細(xì)介紹過,Gracemount在架構(gòu)設(shè)計(jì)上也有很多創(chuàng)新和進(jìn)步,比如在前端設(shè)計(jì)里采用了64KB指令緩存,并且進(jìn)一步優(yōu)化了分支預(yù)測(cè)單元。此外它還包含了兩個(gè)3寬度的亂序解碼器,這也是英特爾能效核的主要特點(diǎn),它不僅可以單周期完成高達(dá)六個(gè)指令的解碼,也可以在兩個(gè)解碼器集群之間做負(fù)載均衡和亂序執(zhí)行,進(jìn)一步提升操作的并行性,從而提升性能。能效核的后端也提升了寬度,并且集成了多種整型、浮點(diǎn)型、還有向量運(yùn)算單元,支持不同形式的運(yùn)算和指令集擴(kuò)展。
對(duì)于性能核來(lái)說,提升就更明顯了。Alder Lake里的性能核代號(hào)為Goldencove,它的設(shè)計(jì)目標(biāo)非常明確,就是對(duì)單線程性能的極致擴(kuò)展。比如它前后端的流水線、執(zhí)行單元、亂序窗口、片上緩存和存儲(chǔ)系統(tǒng)都采用了更寬和更深的設(shè)計(jì),它還集成了機(jī)器學(xué)習(xí)的方法,來(lái)更智能的做分支預(yù)測(cè)和流水線資源的釋放,進(jìn)一步提升系統(tǒng)的吞吐量。
打個(gè)簡(jiǎn)單的比方,如果我們把CPU比作水龍頭,指令和數(shù)據(jù)就是水龍頭里流的水。這次性能核就把水龍頭的水管做的更寬了,口做的更大了,而且加入了很多智能化的水量控制系統(tǒng),就讓整體的流量變的更大了。
12代酷睿是英特爾首個(gè)采用混合架構(gòu)的CPU產(chǎn)品,除了性能核與能效核之外,它還集成了對(duì)DDR4和DDR5等種內(nèi)存架構(gòu)的支持,也支持Wifi6E、Thunderbolt4、PCIe5.0x16等等這些最新的接口和數(shù)據(jù)傳輸技術(shù)。所有的這些單元都是以模塊化的方式進(jìn)行集成,這樣和異構(gòu)的內(nèi)核一起,進(jìn)一步提升了CPU架構(gòu)的擴(kuò)展性,也能非常靈活的應(yīng)對(duì)不同終端的實(shí)際需求。
對(duì)異構(gòu)的軟硬件支持
有了不同的處理器內(nèi)核和硬件模塊其實(shí)還不夠,為了組成一個(gè)高效運(yùn)轉(zhuǎn)的異構(gòu)芯片,同樣重要的其實(shí)是如何把它們充分利用起來(lái)。 再拿我們裝修房子的例子,就算按現(xiàn)代的標(biāo)準(zhǔn)裝修了整間屋子,如果住的人不知道怎么用,把東西到處亂放,那么到頭來(lái)屋子里肯定還是一團(tuán)糟。這個(gè)時(shí)候我們可以咨詢專門的收納師,或者直接請(qǐng)他們來(lái)幫忙進(jìn)行收納。 芯片設(shè)計(jì)也是這樣,這里的收納師,其實(shí)有兩層,一個(gè)是調(diào)度器,另一個(gè)是操作系統(tǒng)。在12代酷睿里,英特爾特別提出了一個(gè)叫做線程調(diào)度器的結(jié)構(gòu)。這也是一個(gè)全新的結(jié)構(gòu),我總結(jié)了它的3個(gè)主要特點(diǎn)。
首先,它存在于操作系統(tǒng)和內(nèi)核架構(gòu)之間,能在納秒級(jí)別、非常精確地監(jiān)測(cè)線程和內(nèi)核的運(yùn)行情況。然后根據(jù)這些信息,它能為操作系統(tǒng)提供動(dòng)態(tài)反饋,從而幫助操作系統(tǒng)做出最優(yōu)的調(diào)度決定。最后,它可以可以對(duì)工作負(fù)載做實(shí)時(shí)分析,確保第一時(shí)間把正確的線程分配到正確的核心。
比如對(duì)于性能要求比較高的應(yīng)用,就會(huì)被優(yōu)先放在性能核上運(yùn)行,一些后臺(tái)任務(wù)就會(huì)被放在能效核上運(yùn)行,從而實(shí)現(xiàn)多任務(wù)的并行處理。如果這個(gè)時(shí)候有優(yōu)先級(jí)更高的高性能應(yīng)用出現(xiàn),線程調(diào)度器也可以幫助操作系統(tǒng)來(lái)決定,將性能核上的哪些線程轉(zhuǎn)移到能效核上運(yùn)行。整個(gè)調(diào)度的過程都是動(dòng)態(tài)完成的,可以根據(jù)不同的應(yīng)用靈活變化,不依賴某種固定的調(diào)度算法。
有了硬件調(diào)度器,軟件開發(fā)者就不需要糾結(jié)如何進(jìn)行線程調(diào)度和資源分配了,也不需要修改已有的代碼去支持12代酷睿的異構(gòu)架構(gòu)。同時(shí),使用專門的硬件單元去做線程和內(nèi)核的調(diào)度,也可以更好的保證調(diào)度的性能和準(zhǔn)確性。
當(dāng)然了,操作系統(tǒng)還是需要對(duì)這個(gè)硬件調(diào)度器進(jìn)行深度適配的。微軟新推出的Windows11,就有對(duì)線程調(diào)度器的優(yōu)化支持,這個(gè)其實(shí)也是windows11的一個(gè)重要特性。 所以有了軟硬件對(duì)異構(gòu)的支持,就可以充分發(fā)揮異構(gòu)的優(yōu)勢(shì)。就像前面提到的機(jī)場(chǎng)的行李管理系統(tǒng)一樣,這其實(shí)是一種進(jìn)化版的異構(gòu),可以根據(jù)優(yōu)先級(jí)進(jìn)行任務(wù)的合理調(diào)度和資源分配,并且?guī)?lái)多任務(wù)的處理優(yōu)勢(shì)。
除了H系列之外,12代酷睿還有兼顧性能和功耗的P系列、以及面向低功耗的U系列,分別適合輕內(nèi)容制作和對(duì)移動(dòng)辦公有剛需的人群。
結(jié)語(yǔ)
總之,異構(gòu)就是12代酷睿取得大幅能效提升的最主要原因。它不僅有能效核+性能核的混合設(shè)計(jì)模式,還有配合它進(jìn)行性能釋放的線程調(diào)度器和操作系統(tǒng)的支持。有理由相信,這種異構(gòu)的模式也將會(huì)成為未來(lái)CPU芯片設(shè)計(jì)的主流趨勢(shì)。
審核編輯 :李倩
-
芯片
+關(guān)注
關(guān)注
453文章
50254瀏覽量
421121 -
異構(gòu)計(jì)算
+關(guān)注
關(guān)注
2文章
99瀏覽量
16253
原文標(biāo)題:異構(gòu)計(jì)算,只是大小核罷了?
文章出處:【微信號(hào):bdtdsj,微信公眾號(hào):中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論