Arm推出新一代指令集架構(gòu)Armv9,以越來越強大的安全性和人工智能能力,應對無處不在的專業(yè)處理需求,這是Arm十年來最大的技術(shù)革新,上一代的Armv8發(fā)布于2011年10月。Arm表示,Armv9架構(gòu)將在安全性和人工智能方面與英特爾相抗衡。
基于Arm架構(gòu)的芯片出貨量持續(xù)增長,過去五年出貨超過1000億顆。按照這個增長速度,全球100%的共享數(shù)據(jù)將很快在Arm芯片上進行處理,包括端點,數(shù)據(jù)網(wǎng)絡(luò)或云中。隨著AI,物聯(lián)網(wǎng)和5G在全球范圍內(nèi)蓬勃發(fā)展,Armv9中的新功能將加速在每個應用程序中從通用計算向更專業(yè)的計算轉(zhuǎn)變。
Arm首席執(zhí)行官Simon Segars表示,Armv9在基于通用計算的經(jīng)濟性,設(shè)計自由度和可訪問性的基礎(chǔ)上,對普遍的專業(yè)/安全和強大的處理需求的推動下,它將在接下來的3000億個基于Arm架構(gòu)的芯片中處于最前沿。
據(jù)悉,Armv9可以動態(tài)建立Realms(領(lǐng)域),以保護重要數(shù)據(jù)和代碼不受系統(tǒng)其余部分的影響。Armv9將包括SVE2(類似于英特爾的AVX指令集),以協(xié)助機器學習和數(shù)字信號處理任務(wù)。
Arm承諾將在Armv9基礎(chǔ)上提高整體性能,預計在接下來的兩代移動和基礎(chǔ)架構(gòu)CPU中,CPU性能將提高30%以上,而硬、軟件改善將進一步提高性能。Arm強調(diào),所有現(xiàn)有軟件都可以在基于Armv9的處理器上運行,而不會出現(xiàn)任何問題。但是,隨著行業(yè)從通用計算向普遍存在的專用處理轉(zhuǎn)變,每年兩位數(shù)的CPU性能提升還遠遠不夠。除了增強專業(yè)處理能力外,Arm的Total Compute設(shè)計方法還將通過針對性的系統(tǒng)級硬件和軟件優(yōu)化以及用例(use-case)性能的提高來加快總體計算性能。
Arm還表示,Armv9將為圖像和語音識別等任務(wù)增加人工智能芯片的功能,在該領(lǐng)域,英偉達公司的芯片表現(xiàn)已經(jīng)超過了英特爾,并幫助其市值超過了英特爾。
對于與英偉達的合并案,Simon Segars強調(diào),“我們對與英偉達合并未來感到振奮,將我們無處不在的計算平臺與他們深厚的人工智能專業(yè)知識結(jié)合在一起,將帶來更強的工程能力。 ”
Arm預計,第一批基于Armv9的處理器將在今年年底之前上市。
與Armv8 區(qū)別:延續(xù) AArch64 基準指令集 ,全面性能提升,還有重要擴展
安全性升級對于 Armv9 來說,其重要性相當于 64 位對于 Armv8。
自 2011 年 10 月 Arm 首次公布 Armv8 架構(gòu)以來,已經(jīng)有近 10 年的時間了,這是計算領(lǐng)域相當多變的 10 年,因為指令集架構(gòu)通過移動領(lǐng)域到服務(wù)器領(lǐng)域的應用越來越多,現(xiàn)在開始在筆記本電腦和即將到來的臺式機等消費設(shè)備市場上普及。這些年來,Arm 對 ISA 進行了各種更新和擴展,有些是重要的,有些也許很容易被忽略。
全新的 Armv9 架構(gòu),為 Arm 希望在未來十年成為下一代 3000 億顆芯片的計算平臺奠定基礎(chǔ)。
Armv9 與 Armv8 到底有什么區(qū)別,才會在 ISA 的命名上有如此大的跳躍?
外媒分析稱,說實話,單純從 ISA 的角度來看,v9 可能并不像 v8 相比 v7 那樣有根本性的跳躍,v8 曾用 AArch64 引入了完全不同的執(zhí)行模式和指令集,而 AArch64 比 AArch32 有更大的微觀架構(gòu)影響,比如擴展寄存器、64 位虛擬地址空間等許多改進。
Armv9 延續(xù)了 AArch64 作為基準指令集的使用,然而在功能上增加了一些非常重要的擴展,值得在架構(gòu)編號上做一個增量,可能讓 Arm 也實現(xiàn)了一種軟件的重新壘砌,不僅是新的 v9 功能,也包括我們這些年看到的各種 v8 擴展的發(fā)布。
獲悉,Armv9 擁有三大新支柱,Arm 認為新架構(gòu)的主要目標是:安全、AI 以及改進矢量和 DSP 能力。安全性是 v9 的一個非常大的話題,值得更深入地介紹新的擴展和功能細節(jié),但談到 DSP 和 AI 功能,可以是很直接的。
承諾與 Armv9 兼容的新 CPU 最大的新特性可能是開發(fā)者和用戶馬上就能看到的,那就是 SVE2 作為 NEON 的后續(xù)產(chǎn)品的基線。
可伸縮矢量擴展,也就是 SVE,在第一次實現(xiàn)的時候,早在 2016 年就宣布了,并首次在富士通的 A64FX CPU 核心中實現(xiàn),現(xiàn)在日本的世界第一超級計算機Fukagu就采用了 SVE。SVE 的問題在于,這個新的可變向量長度 SIMD 指令集的首次迭代范圍相當有限,而且更多的是針對 HPC 工作負載,缺少了許多通用性較強的指令,而這些指令仍然被 NEON 所覆蓋。
SVE2 早在 2019 年 4 月就公布了,希望通過補充新的可擴展 SIMD 指令集所需的指令來解決這個問題,以服務(wù)于目前仍在使用 NEON(指 128 位 SIMD 單指令多數(shù)據(jù)擴展結(jié)構(gòu))的更多樣的 DSP 類工作負載。
SVE 和 SVE2 除了增加各種現(xiàn)代 SIMD(單指令多數(shù)據(jù))能力之外,好處在于它們的可變向量大小,從 128b 到 2048b 不等,允許可變 128b 粒度的向量,而不管實際硬件運行在什么地方。純粹從矢量處理和編程的角度來看,這意味著軟件開發(fā)者只需要編譯一次代碼,如果未來 CPU 會出現(xiàn)比如原生 512b 的 SIMD 執(zhí)行流水線,代碼就已經(jīng)可以利用單位的全部寬度了。
另外,同樣的代碼也能在更保守的設(shè)計上運行,并具有更低的硬件執(zhí)行寬度能力,這對 Arm 公司來說非常重要,因為他們設(shè)計了從物聯(lián)網(wǎng)、移動設(shè)備到數(shù)據(jù)中心的 CPU。此外,它還能在 Arm 架構(gòu)的 32b 編碼空間內(nèi)完成所有這些工作,而在 x86 上的其他實現(xiàn)則必須根據(jù)向量大小增加新的擴展和指令。
機器學習也被視為 Armv9 的一個重要部分,因為 Arm 看到未來幾年越來越多的 ML 工作負載將變得普遍。在專用加速器上運行 ML 工作負載自然仍然是性能或能效關(guān)鍵的要求,然而,仍然會有大量新的較小范圍的 ML 工作負載采用,這些工作負載將在 CPU 上運行。
矩陣乘法指令是這里的關(guān)鍵,并將代表著在整個生態(tài)系統(tǒng)中看到更大規(guī)模采用的重要一步,作為 v9 CPU 的基線功能。
一般來說,SVE2 可能是保證跳轉(zhuǎn)到 v9 命名法的最重要因素,因為它是一個更明確的 ISA 功能,在日常使用中區(qū)別于 v8 CPU,這將保證軟件生態(tài)系統(tǒng)去實際分化現(xiàn)有的 v8 堆棧。這其實已經(jīng)成為 Arm 在服務(wù)器領(lǐng)域的一個相當大的問題,因為軟件生態(tài)系統(tǒng)仍然是以 v8.0 為基礎(chǔ)的軟件包,可惜缺少了最重要的 v8.1 大系統(tǒng)擴展。
讓整個軟件生態(tài)系統(tǒng)向前發(fā)展,并且能夠假設(shè)新的 v9 硬件具有新架構(gòu)擴展的能力,這將有助于推動事情的發(fā)展,可能會解決目前的一些情況。
然而 v9 不僅僅是 SVE2 和新的指令,它還有一個非常大的重點就是安全,在這里我們會看到一些比較徹底的變化。
新的 Arm 保密計算架構(gòu) (CCA)試圖通過基于硬件的安全環(huán)境保護敏感數(shù)據(jù)。這些所謂的 “領(lǐng)域”可以動態(tài)創(chuàng)建,以保護重要數(shù)據(jù)和代碼不受系統(tǒng)其余部分的影響。
除了這些更具體的改進外,Arm 還承諾在 Armv9 基礎(chǔ)上進行更全面的性能提升。該公司預計,在未來兩次迭代中,CPU 性能將提高 30% 以上,并通過軟件和硬件優(yōu)化進一步提升性能。Arm 表示,所有現(xiàn)有軟件都可以在基于 Armv9 的處理器上運行,沒有任何問題。
編輯:jq
-
cpu
+關(guān)注
關(guān)注
68文章
10804瀏覽量
210829 -
CCA
+關(guān)注
關(guān)注
0文章
2瀏覽量
7869 -
ML
+關(guān)注
關(guān)注
0文章
144瀏覽量
34580 -
富士通
+關(guān)注
關(guān)注
2文章
191瀏覽量
54525
發(fā)布評論請先 登錄
相關(guān)推薦
評論