0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Neoverse V1–性能分析和遙測規(guī)范的自頂向下方法

jf_9aVl32Dp ? 來源:Arm軟件開發(fā)者 ? 2023-03-02 13:48 ? 次閱讀

Arm Neoverse V1 性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf)現(xiàn)在可以下載了,它可以幫助您為基于V1的產(chǎn)品系統(tǒng)優(yōu)化應(yīng)用程序代碼。

白皮書是對上一篇“Arm Neoverse N1:性能分析方法”(https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/arm-neoverse-n1-performance-analysis-methodology)的更新,涵蓋了從N1到V1內(nèi)核的新功能和更新。此資源可用于了解和優(yōu)化V1平臺上應(yīng)用程序的性能。

為了充分利用您花費的分析和優(yōu)化時間,選擇正確的PMU事件并遵循具有用戶友好軟件度量的結(jié)構(gòu)化方法是非常重要的。在白皮書中,我們介紹了Neoverse V1的Arm自頂向下分析方法。

在本博客中,我們概述了從N1到V1內(nèi)核的更新,并概述了本白皮書的內(nèi)容。我們還引用了其他有用的資源,以充分利用Neoverse V1平臺。

ArmNeoverse V1支持自上而下的1級指標。

Arm Neoverse V1平臺是第一個Arm核心,為自上而下的方法學1級指標支持全套事件和指標。這些指標對于性能分析和優(yōu)化是一個巨大的增值。

這些指標提供了SLOT級別處理器流水線利用率的詳細細分,從而能夠評估處理器效率和識別瓶頸。該功能是Arm Neoverse V1平臺性能分析功能的一個主要增強,此外還有其他可用于進一步分析的微架構(gòu)探索指標。

Arm Neoverse V1遙測規(guī)范:性能分析的事件和指標。

Arm Neoverse V1遙測規(guī)范,包括軟件產(chǎn)品特定事件描述和衍生分析指標,可在Arm Neovere V1性能分析方法白皮書附錄B和C中找到。

Arm遙測解決方案庫

白皮書中引用的機器可讀JSON文件中提供的遙測數(shù)據(jù)和壓力工作負載套件現(xiàn)在可以在GitLab遙測解決方案庫(https://gitlab.arm.com/telemetry-solution/telemetry-solution)中找到。

Neoverse V1 PMU事件和指標備忘單

在這個過程中,熟悉Arm Neoverse微體系結(jié)構(gòu),包括其復雜的管道和多級內(nèi)存層次結(jié)構(gòu),可能會有所幫助。由于Neoverse內(nèi)核提供了100多個硬件計數(shù)器可供選擇,因此確定重點關(guān)注的事件的優(yōu)先級非常重要。為了幫助完成這項任務(wù),我們創(chuàng)建了列出事件及其相應(yīng)派生度量的備忘單。

5d7bda8a-b06d-11ed-bfe3-dac502259ad0.jpg

表1。Neoverse V1核心活動備忘單

主要參考文獻

以下兩份文件提供了對Neoverse V1進行性能分析所需的所有信息,是我們推薦的參考文件:

1) Arm Neoverse V1性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf):本白皮書介紹了一種性能分析方法,并介紹了如何在Arm Neovere V1平臺上進行工作負載表征。這是對上一篇Neoverse N1白皮書的更新,該白皮書介紹了性能分析方法,并展示了如何在Arm Neoverse N1平臺上進行工作負載表征。如果您是Arm平臺和性能分析工具(如Linuxperf)的新手,我們建議您先閱讀本白皮書。

2) Arm Neoverse V1 PMU指南(直接下載):本文檔全面概述了所有硬件PMU事件,包括在性能分析中有效使用事件所需的微架構(gòu)和架構(gòu)細節(jié)。

Arm Neoverse V1核心

Arm Neoverse V1是一個核心,旨在為苛刻的云、HPC和AI/ML輔助工作負載提供最大的單線程性能。Neoverse V1是第一個包含可擴展向量擴展(SVE)的Neoverse處理器,可實現(xiàn)最大向量性能、HPC代碼重用和使用壽命。Neoverse V1支持Bfloat16和Int8 MatMul指令。與Neoverse N1相比,這些指令可以為TensorFlow、PyTorch、OneDNN等機器學習框架提供高達3倍的性能。Neoverse V1 CPU目前可用于AWS EC2實例,由AWS Graviton3和AWS Graviton 3E處理器提供支持。

結(jié)論

我們自上而下的方法分析和遙測規(guī)范現(xiàn)在可用于Neoverse V1平臺。我們將很快開始將這些信息上傳到Linux perf工具。V系列內(nèi)核,如V1,旨在在Neoverse系列CPU IP中提供最大的單線程性能。Neoverse V1性能分析方法白皮書和V1 PMU指南可以幫助開發(fā)人員從V1架構(gòu)中獲得最大性能。我們鼓勵所有使用基于V1的平臺(包括AWS Graviton3和Graviton3E)的開發(fā)人員學習和使用它。

白皮書下載地址:https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19100

    瀏覽量

    228806
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9027

    瀏覽量

    366474
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    37

    文章

    3237

    瀏覽量

    57546

原文標題:Arm Neoverse V1–性能分析和遙測規(guī)范的自頂向下方法

文章出處:【微信號:Arm軟件開發(fā)者,微信公眾號:Arm軟件開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    深度解析Neoverse V1Arm的重要意義

    2018年10月,Arm首次宣布推出面向云到邊緣基礎(chǔ)設(shè)施產(chǎn)品Neoverse及其初步路線圖,并承諾平臺效能30%的年增長率指標將持續(xù)到2022年及以后。 根據(jù)Neoverse平臺PPA設(shè)計原則,N
    的頭像 發(fā)表于 05-19 17:49 ?5271次閱讀
    深度解析<b class='flag-5'>Neoverse</b> <b class='flag-5'>V1</b>對<b class='flag-5'>Arm</b>的重要意義

    Arm Neoverse家族新增V1和N2兩大平臺,突破高性能計算瓶頸

    帶來 50%和 40%的性能提升。此外,Arm也同時發(fā)布了CMN-700,作為構(gòu)建基于Neoverse V1和 N2 平臺高性能SoC的關(guān)鍵
    的頭像 發(fā)表于 04-30 16:20 ?9092次閱讀

    基于向下技術(shù)的工程機械Digital Prototyping設(shè)計方法及應(yīng)用

    【作者】:劉雪冬【來源】:《華南理工大學》2009年【摘要】:向下的設(shè)計方法及裝配建模技術(shù)是在消費品行業(yè)應(yīng)用比較成熟的一種設(shè)計方法和理論
    發(fā)表于 04-24 09:20

    如何實現(xiàn)擴頻通信調(diào)制器向下的設(shè)計?

    如何實現(xiàn)擴頻通信調(diào)制器向下的設(shè)計?如何實現(xiàn)擴頻通信調(diào)制器的仿真測試?
    發(fā)表于 04-29 06:46

    Arm Neoverse V1的AWS Graviton3在深度學習推理工作負載方面的作用

    ) 與 AWS Graviton2 (c6g) 的性能特點AWS Graviton3 (c7g) 引入了 Arm Neoverse V1 CPU,與 AWS Graviton2 (c6
    發(fā)表于 08-31 15:03

    ARM Neoverse N1 Core性能分析方法

    使用Neoverse N1 CPU上的性能監(jiān)測單元(PMU)功能來確定和消除性能瓶頸的工作負載表征方法。目標受眾是從事軟件優(yōu)化、調(diào)優(yōu)和開發(fā)的
    發(fā)表于 08-09 06:01

    Arm Neoverse V1 PMU指南

    ?體系結(jié)構(gòu)參考手冊。有關(guān)Neoverse V1的更多詳細描述,請請參閱Arm?Neoverse? V1技術(shù)參考手冊。 本文檔不討論使用軟件開
    發(fā)表于 08-09 07:30

    Arm Neoverse? N1 PMU指南

    ARMv8-A。 有關(guān)Neoverse N1的更多詳細說明,請參閱ARM?Neoverse?N1技術(shù)參考手冊。 本文檔不討論使用軟件開發(fā)工具
    發(fā)表于 08-12 07:10

    ARM Neoverse?N1核心技術(shù)參考手冊

    Neoverse?N1內(nèi)核是一款高性能、低功耗的ARM產(chǎn)品,采用ARM?V8-A架構(gòu)。
    發(fā)表于 08-29 08:05

    ARM Neoverse?V1參考設(shè)計軟件開發(fā)人員指南

    支持兩種RD-V1配置: ·RD-V1 FVP型號配置-M,這是一款單芯片系統(tǒng),具有16個ARM?Neoverse?V1內(nèi)核。 ·RD-
    發(fā)表于 08-29 06:59

    通過模塊之間的調(diào)用實現(xiàn)向下的設(shè)計

    通過模塊之間的調(diào)用實現(xiàn)向下的設(shè)計目的:學習狀態(tài)機的嵌套使用實現(xiàn)層次化、結(jié)構(gòu)化設(shè)計。
    發(fā)表于 02-11 05:53 ?2437次閱讀
    通過模塊之間的調(diào)用實現(xiàn)<b class='flag-5'>自</b><b class='flag-5'>頂</b><b class='flag-5'>向下</b>的設(shè)計

    互聯(lián)網(wǎng)巨頭紛紛啟用Arm CPU架構(gòu),Arm最新Neoverse V1和N2平臺加速云服務(wù)器芯片

    V1平臺。 NeoverseN2 和V1,較N1性能分別提升40%和50% Neoverse V1
    發(fā)表于 09-30 14:46 ?1174次閱讀

    計算機網(wǎng)絡(luò):向下

    本文檔包含Jim Kurose和Keith Ross編寫的《計算機網(wǎng)絡(luò):向下方法(第7版)》復習題和問題的參考答案。這些答案只對指導老師有效。請不要復制或者分發(fā)給其他人(即使是其他指導老師)。請
    發(fā)表于 03-13 14:23 ?0次下載

    eda向下的設(shè)計方法 eda自頂向下設(shè)計優(yōu)點

    EDA(Electronic Design Automation,電子設(shè)計自動化)向下的設(shè)計方法是一種常見的電子電路設(shè)計方法。該
    發(fā)表于 04-10 16:49 ?3693次閱讀

    ArmArm Neoverse計算子系統(tǒng)(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    3和Neoverse CSS N3代表了Arm計算子系統(tǒng)產(chǎn)品組合的最新進展。 Neoverse CSS V3是高性能
    的頭像 發(fā)表于 04-24 17:53 ?950次閱讀
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>計算子系統(tǒng)(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS <b class='flag-5'>V</b>3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3