60 多年來——從早期的大型計算機到 1980 年代的 PC 革命,再到今天智能移動設備的爆炸式增長——處理器技術一直在發(fā)展以滿足用戶的期望,有時會推動計算行業(yè)的不可預見的創(chuàng)新。鑒于每天上市的新移動設備的多樣性,處理器創(chuàng)新仍然是推動變革的強大力量。
隨著主流移動計算的出現(xiàn),處理器架構已經(jīng)從傳統(tǒng)的由性能驅(qū)動的桌面模型轉(zhuǎn)變,而不管所需的功率如何。需要全天甚至數(shù)天電池壽命的設備將需要更緊湊的能量包絡,同時將處理器性能提升到新的水平。
一開始,性能為王
由微處理器驅(qū)動的第一臺消費類計算機是簡單、耗電的固定設備,它們被拴在電源(普通墻上插座)上。這意味著微處理器的設計可以只考慮性能,這很快成為開發(fā)人員的“圣杯”。
早期的 PC 包含一個運行單個應用程序的單線程 CPU。很快,這些早期的 8 位微處理器發(fā)展到 16 位,到 1980 年代中期最終發(fā)展為 32 位處理。然后市場開始看到能夠同時運行多個應用程序的 PC。隨著晶體管數(shù)量按照摩爾定律翻倍,性能不斷提高,每一種新的處理器設計都提供了開發(fā)新特性和功能的能力,無論是播放 DVD 還是編輯家庭相冊,這反過來又激發(fā)了消費者對更強大功能的需求設備。
最終,消費者對不同外形尺寸的需求和對性能改進的期望推動對處理器的需求超出了單核的能力。與此同時,對移動設備的需求開始爆炸式增長,隨著需求的增長,對更節(jié)能處理的呼聲也越來越高。
ARM 于 1990 年推出時,其創(chuàng)始人的主要目標是為手持設備創(chuàng)建一種節(jié)能處理器架構。采用 RISC CPU 架構,ARM 的方法簡化了指令,簡化了任務執(zhí)行,并降低了每條指令所需的功率。
一些特性對于開發(fā)更節(jié)能的微處理器至關重要,其中最重要的一點是將功耗限制在盡可能低的水平。將功率包絡保持在盡可能小的占地面積不僅可以延長電池壽命,還可以限制為設備供電所需的電池重量,從而減少材料清單并降低總體成本。
多核:移動之外的好處
如今,這種高性能、高能效處理架構的優(yōu)勢正在數(shù)字電視和機頂盒等設備、打印機和復印機等辦公設備以及平板電腦、便攜式游戲機等移動設備中取得成果。智能手機。
自 2000 年代中期以來,人們普遍認為構建越來越大的 CPU 以實現(xiàn)單線程性能提升不僅變得越來越困難,而且與移動設備的能效限制背道而馳。這是因為性能每提高幾個百分點,就需要成倍增加的能量。
多核解決方案可以在與單核設計相當?shù)念l率下提供更高的性能,同時在成本和能效方面顯著節(jié)省。此外,多核解決方案可以利用具有高晶體管數(shù)量的內(nèi)核,并通過僅在需要時為其供電來優(yōu)化系統(tǒng)。本質(zhì)上,這可以被認為是智能負載均衡。系統(tǒng)不僅需要考慮哪種處理器最適合執(zhí)行特定任務,而且還必須考慮該任務所需的性能,并將其分配給最節(jié)能的可用處理器。
根據(jù)需要使用核心,同時讓其他核心保持空閑,這有助于盡可能降低能耗,同時對性能的影響有限。由于任務分布在多個處理器內(nèi)核上,單個處理器可能無法滿負荷運行,從而降低了多核處理器的電壓和頻率。這可以顯著節(jié)省與系統(tǒng)總體性能相關的功耗。
為了用一個常見的用例來說明這個想法,請考慮當今的智能手機,它必須足夠強大,才能呈現(xiàn)復雜的網(wǎng)頁和玩游戲應用程序,通常與基本的電子郵件同步和電話管理功能并行。憑借僅在需要時為內(nèi)核供電的能力,多核智能手機與單核、全油門的前代產(chǎn)品相比可以提供更長的電池壽命。市場對可擴展性能的需求導致當前大多數(shù)智能手機都包含多核 CPU,以及當今許多領先的移動視頻和游戲設備中的多核 GPU。
多核處理的“多核”方法需要在許多較小的處理器(例如 Cortex-A5)之間共享性能負載,而不是在單核處理器上共享多個單線程工作負載。設計人員越來越多地部署旨在協(xié)同工作的處理器集群,在緩存或同一處理器的多個實例之間共享數(shù)據(jù)和任務。
與處理相同工作負載的大型處理器相比,較小的處理器協(xié)同工作以提供更低功耗的綜合性能水平,許多內(nèi)核變得更加有趣。如前所述,與提高單線程性能相關的成本是指數(shù)級的。然而,隨著多核處理,成本在規(guī)模上變得更加線性。設計人員正在使用許多內(nèi)核來顯著降低總體系統(tǒng)成本。
隨著硬件設計人員開始實施這些多核系統(tǒng),軟件開發(fā)人員將需要生成能夠使用多核處理解決方案的代碼。在此之前,設備必須具備執(zhí)行高性能任務的能力。一個同時包含高單線程性能多核和更高功率效率的系統(tǒng)的一個示例是當前部署的 CPU 和 GPU,其中多核 GPU 可以使用比多核 CPU 更少的功率提供圖形計算。由于 GPU 與 CPU 保持一致并共享其緩存,因此可以降低對 CPU 的外部內(nèi)存帶寬和性能需求。OpenCL 和 CUDA 等語言正在努力為更通用的應用程序解決這些問題。
優(yōu)化未來性能
我們的行業(yè)正處于平衡性能和功率的十字路口。通過利用特定領域的處理器和異構通用計算,設計人員可以優(yōu)化有限的硬件資源和占用空間??缢蓄愋偷亩嗪似舷到y(tǒng) (SoC) 優(yōu)化設計和設計過程也可以實現(xiàn)這些收益。
雖然優(yōu)化可能不像多核處理那樣受到關注,但它同樣重要,尤其是在具有更大一致性挑戰(zhàn)的小尺寸應用程序中。緩存一致性是多核計算應用程序的關鍵,可確保正確維護存儲在共享資源中的數(shù)據(jù)。諸如 AMBA 4 總線之類的標準和規(guī)范正在朝著跨多核處理器集群提供系統(tǒng)級緩存支持以及在復雜 SoC 中保持最佳性能和能效方面邁出令人鼓舞的一步。
未來的設備將繼續(xù)需要更強大的處理性能,很可能是在越來越嚴格的功率限制下。通過在整個設計過程中開發(fā)更有針對性的處理、優(yōu)化和差異化,開發(fā)人員可以將不僅支持多核概念,而且還包含軟件支持的系統(tǒng)推向市場。
審核編輯:郭婷
-
處理器
+關注
關注
68文章
19118瀏覽量
228864 -
cpu
+關注
關注
68文章
10813瀏覽量
210880 -
soc
+關注
關注
38文章
4108瀏覽量
217790
發(fā)布評論請先 登錄
相關推薦
評論