0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于Arm架構(gòu)的珠峰芯片加速極致視頻體驗

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-11-01 13:54 ? 次閱讀

作者:安謀科技 (Arm China) 高級軟件產(chǎn)品經(jīng)理 楊喜樂

視頻編解碼技術(shù)作為支撐超高清視頻及泛音視頻產(chǎn)業(yè)發(fā)展的基石,其重要性愈發(fā)凸顯。H.264/AVC 是目前廣泛使用的編解碼標(biāo)準(zhǔn),能夠在較低的數(shù)據(jù)速率下提供高質(zhì)量的視頻流,是在線視頻和移動端視頻的理想選擇;H.265/HEVC 進一步提高了壓縮效率,在傳輸高清視頻流和 4K 視頻時所需的帶寬大約是 H.264 的一半。然而,新一代編解碼技術(shù)在節(jié)省帶寬的同時,也對算力提出了更高的要求。

盡管專用視頻加速卡(如 ASICs)和 GPU 在特定任務(wù)上展現(xiàn)出卓越性能,但通用服務(wù)器 CPU 因其出色的靈活性、廣泛的適用性以及更高的性價比,正在成為視頻轉(zhuǎn)碼場景中的主流選擇。隨著多核 CPU 架構(gòu)和視頻編解碼技術(shù)的不斷進步,可以預(yù)見 CPU 在視頻轉(zhuǎn)碼領(lǐng)域的應(yīng)用將更加廣泛。

在本文中,我們將探討基于 Armv9 架構(gòu)的中興微電子“珠峰 1.0”芯片在 x264/x265 視頻轉(zhuǎn)碼場景下,所展現(xiàn)的可擴展算力和穩(wěn)定核心,并通過與主流 x86 架構(gòu)產(chǎn)品相比,展示珠峰芯片所具備的性能和能效優(yōu)勢。

x264/x265 基準(zhǔn)測試

“珠峰 1.0”是中興微電子發(fā)布的首顆領(lǐng)域定制融合處理器,搭載 128 個核心,主頻最高達到 3.1GHz。該芯片可提供指令集加速,比如 SVE/SVE2 等向量計算技術(shù)等,并在視頻轉(zhuǎn)碼等高算力場景中能夠讓工作負(fù)載以可預(yù)測的方式穩(wěn)定運行。與此同時,依托于 Arm 成熟堅實的軟件生態(tài)和主流視頻編解碼庫中基于最新 Arm 架構(gòu)指令的優(yōu)化,珠峰芯片可以為視頻轉(zhuǎn)碼和其他云工作負(fù)載提供卓越的性能和能效收益。

x264 和 x265 作為主流的開源編解碼器實現(xiàn)在業(yè)界得到了廣泛的認(rèn)可和應(yīng)用,我們將通過實測 x264/x265 轉(zhuǎn)碼場景下的編碼速度(每秒幀數(shù),F(xiàn)PS)來對比珠峰芯片和主流 x86 產(chǎn)品(英特爾 IceLake[1]、英特爾 Sapphire Rapids (SPR)[2] 和 AMD Milan[3])在多線程和整個 socket 配置下的性能和吞吐。

93b52a6a-9802-11ef-a511-92fbcf53809c.png

表 1:珠峰芯片和主流 x86 架構(gòu)產(chǎn)品平臺配置

(配置: 內(nèi)核: 6.0; GCC 編譯器: 12.2;

x86 開啟 turbo,1 線程 = 1 邏輯 CPU)

測試視頻:

https://ultravideo.fi/video/Bosphorus_1920x1080_120fps_420_8bit_YUV_Y4M.7z

測試命令腳本:

x264:

for cpu in ${cpulist[@]};do

cmd = numactl -C $cpu ${x264_DIR}/x264 -o output_${cpu}.mkv

${input_video_DIR}/Bosphorus_1920x1080_120fps_420_8bit_YUV.y4m --preset medium --

frames 600 --threads 1 &

done

x265:

for cpu in ${cpulist[@]};do

cmd = numactl -C $cpu ${x265_DIR}/x265 -o output_${cpu}.mkv

${input_video_DIR}/Bosphorus_1920x1080_120fps_420_8bit_YUV.y4m --preset medium --

frames 600 --no-wpp --pools ',' --frame-threads 1 &

done

<<< 左右滑動查看完整腳本 >>>

八線程轉(zhuǎn)碼測試

93e7f4f4-9802-11ef-a511-92fbcf53809c.png

圖 1:單線程下 x264 的平均轉(zhuǎn)碼速率對比

940f86d6-9802-11ef-a511-92fbcf53809c.png

圖 2:單線程下 x265 的平均轉(zhuǎn)碼速率對比

我們可以看到,在八線程的配置下,珠峰芯片在 x264/x265 轉(zhuǎn)碼場景中相比 x86 架構(gòu)芯片平均每線程分別有 1.34 倍和 1.17 倍的性能優(yōu)勢。

單 socket 轉(zhuǎn)碼測試

942d53f0-9802-11ef-a511-92fbcf53809c.png

圖 3:單 socket 下 x264 轉(zhuǎn)碼速率對比

945a4996-9802-11ef-a511-92fbcf53809c.png

圖 4:單 socket 下 x265 轉(zhuǎn)碼速率對比

在單 socket 的配置下,珠峰芯片在 x264/x265 轉(zhuǎn)碼場景中相比 x86 架構(gòu)芯片單 socket 分別有 2.96 倍和 2.54 倍的性能優(yōu)勢。

轉(zhuǎn)碼能效比

除了擁有最佳的轉(zhuǎn)碼性能外,基于 Armv9 架構(gòu)的珠峰芯片非常注重性能和功耗的平衡,卓越的能效可以極大地減少視頻轉(zhuǎn)碼中產(chǎn)生的碳足跡。下面是珠峰芯片和主流 x86 架構(gòu)產(chǎn)品 (IceLake、SPR 和 Milan)熱設(shè)計功耗 (TDP) 的比較:

946b22a2-9802-11ef-a511-92fbcf53809c.png

圖 5:熱設(shè)計功耗 (TDP) 對比

結(jié)論

在 x264/x265 視頻轉(zhuǎn)碼的場景下,我們可以清楚地看到基于 Armv9 架構(gòu)的中興微電子珠峰芯片具備強勁的可擴展算力和穩(wěn)定核心,測試結(jié)果顯示,與主流 x86 架構(gòu)產(chǎn)品選擇相比(如英特爾至強第四代 Sapphire Rapids),該芯片提供了卓越的性能和能效,在運行 x264 時性能優(yōu)勢高達 2.08 倍,而在運行 x265 時性能優(yōu)勢高達 1.79 倍;此外,能效提升高達 1.35 倍。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19111

    瀏覽量

    228858
  • 芯片
    +關(guān)注

    關(guān)注

    453

    文章

    50239

    瀏覽量

    421091
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9029

    瀏覽量

    366535
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10809

    瀏覽量

    210874

原文標(biāo)題:基于 Arm 架構(gòu)的珠峰芯片加速極致視頻體驗

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    40分鐘教你學(xué)會什么是ARM架構(gòu)

    門老大Chris Shore 做了一個最短小精悍的視頻,用40分鐘教會大家到底什么是ARM架構(gòu),并且ARM公司的Video Team團隊幫忙制作了中文字幕,方便大家學(xué)習(xí)觀看。請大家看這
    發(fā)表于 10-14 16:07

    ARM架構(gòu)是什么

    從單片機轉(zhuǎn)到ARM,主要需要學(xué)習(xí)ARM架構(gòu)ARM相比單片機多了一些外設(shè)和總線。在僅僅是裸奔的情況下,如果熟悉了ARM
    發(fā)表于 07-01 09:23

    arm架構(gòu)芯片有哪些

    arm架構(gòu)芯片有哪些一、芯片架構(gòu)模式原文馮諾依曼架構(gòu)自己理解,不需要執(zhí)行的程序存儲在硬盤/F
    發(fā)表于 07-21 08:47

    ARM芯片架構(gòu)

    ARM芯片ARM 歷史ARM架構(gòu) (Advanced RISC Machine)64/32位架構(gòu)
    發(fā)表于 07-28 08:16

    ARM架構(gòu)

    ARM架構(gòu)ARM架構(gòu)如圖所示,ARM公司只提供內(nèi)核技術(shù),而其他外設(shè)則為芯片商設(shè)計并使用,
    發(fā)表于 08-04 06:18

    ARM架構(gòu)芯片講解其相關(guān)的指令集

    匯編和處理器架構(gòu)、指令集有什么關(guān)系呢?ARM架構(gòu)芯片有哪些相關(guān)的指令集呢?
    發(fā)表于 11-29 06:28

    什么叫arm架構(gòu)_X86架構(gòu)ARM架構(gòu)有什么區(qū)別

    本文首先介紹了arm架構(gòu)的概念,其次介紹了ARM架構(gòu)圖與ARM的技術(shù)實現(xiàn),最后介紹了X86架構(gòu)
    發(fā)表于 04-24 08:45 ?8.7w次閱讀
    什么叫<b class='flag-5'>arm</b><b class='flag-5'>架構(gòu)</b>_X86<b class='flag-5'>架構(gòu)</b>與<b class='flag-5'>ARM</b><b class='flag-5'>架構(gòu)</b>有什么區(qū)別

    ARM架構(gòu)是什么 限制ARM對華為的影響

    成立于1990年,ARM是全球最大的移動IP提供商,ARM本身是不制造計算機芯片的,主要是對外授權(quán)其半導(dǎo)體技術(shù),把相關(guān)技術(shù)和工具打包售賣,而這個技術(shù)就是大名鼎鼎的ARM
    的頭像 發(fā)表于 08-14 15:29 ?7817次閱讀

    巨頭加速切換ARM架構(gòu),芯片行業(yè)格局將"改朝換代"?

    近日有外媒透露,AMD實際上已經(jīng)研制出與蘋果M1處理器對標(biāo)的ARM芯片。而且該芯片的原型共有兩款,一款采用集成RAM,另一款則沒有。 湊巧的是,此前雙十一凌晨,蘋果才發(fā)布了首款采用了ARM
    的頭像 發(fā)表于 12-07 18:06 ?1891次閱讀

    (網(wǎng)盤)國嵌ARM架構(gòu)嵌入式培訓(xùn)視頻

    (網(wǎng)盤)國嵌ARM架構(gòu)嵌入式培訓(xùn)視頻(嵌入式開發(fā)工程師需要學(xué)什么)-(網(wǎng)盤)國嵌ARM架構(gòu)嵌入式培訓(xùn)視頻
    發(fā)表于 08-04 12:33 ?14次下載
    (網(wǎng)盤)國嵌<b class='flag-5'>ARM</b><b class='flag-5'>架構(gòu)</b>嵌入式培訓(xùn)<b class='flag-5'>視頻</b>

    阿里Arm架構(gòu)服務(wù)器芯片或于近期發(fā)布

    近日,根據(jù)知情人士的報道消息,阿里研發(fā)已久的Arm架構(gòu)服務(wù)器芯片或于近期發(fā)布,Arm架構(gòu)服務(wù)器芯片
    的頭像 發(fā)表于 10-18 10:43 ?3452次閱讀

    Arm架構(gòu)科普解讀 Arm架構(gòu)的底層邏輯和Arm架構(gòu)的頂層設(shè)計

    本文主要探討了 Arm 架構(gòu)的底層邏輯,介紹了Arm 架構(gòu)的頂層設(shè)計;以處理器核心架構(gòu)為基礎(chǔ),以系統(tǒng)架構(gòu)
    的頭像 發(fā)表于 02-06 05:33 ?5946次閱讀
    <b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b>科普解讀  <b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b>的底層邏輯和<b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b>的頂層設(shè)計

    介紹三大主流芯片架構(gòu):X86、ARM、RISC-V

    我們主要應(yīng)用的三大芯片架構(gòu):X86、ARM和RISC-V架構(gòu)
    發(fā)表于 07-25 09:35 ?3.9w次閱讀
    介紹三大主流<b class='flag-5'>芯片</b><b class='flag-5'>架構(gòu)</b>:X86、<b class='flag-5'>ARM</b>、RISC-V

    Arm v9芯片架構(gòu)揭秘

    從中長期來看,隨著單芯片 ARM 核數(shù)增加、基于 ARM 架構(gòu)芯片數(shù)量的上升以及ARM 應(yīng)用場景
    發(fā)表于 02-27 14:14 ?5255次閱讀
    <b class='flag-5'>Arm</b> v9<b class='flag-5'>芯片</b>新<b class='flag-5'>架構(gòu)</b>揭秘

    蘋果M3芯片ARM架構(gòu)

    蘋果M3芯片采用的是ARM架構(gòu)。這種架構(gòu)具有高效能和低功耗的特點,使得M3芯片在提供出色性能的同時,也能保持較低的能耗。
    的頭像 發(fā)表于 03-08 16:03 ?1830次閱讀