0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

硬件加速器提升下一代SHARC處理器的性能

星星科技指導(dǎo)員 ? 來源:ADI ? 作者:Paul Beckmann ? 2023-03-03 14:46 ? 次閱讀

SHARC ADSP-2146x處理器集成了硬件加速器,可實(shí)現(xiàn)三種廣泛使用的信號處理操作:FIR(有限脈沖響應(yīng))、IIR(無限脈沖響應(yīng))和FFT(快速傅里葉變換)。加速器卸載了核心處理器,并有可能使處理器的計(jì)算吞吐量增加一倍以上。本文以加速器在下一代音頻系統(tǒng)中的應(yīng)用為例。?

為什么選擇硬件加速器

數(shù)字信號處理中常用的FIR濾波器、IIR濾波器和FFT操作具有常規(guī)結(jié)構(gòu),允許在硬件(特別是硬件加速器)中直接實(shí)現(xiàn)。這些加速器是專用的固定功能外設(shè),旨在反復(fù)執(zhí)行單個(gè)計(jì)算密集型任務(wù)。它們卸載了主處理器,使其能夠執(zhí)行結(jié)構(gòu)幾乎沒有規(guī)律性的通用任務(wù)。

使用硬件加速器提供了一種經(jīng)濟(jì)高效的方法來提高處理器的整體計(jì)算能力,因?yàn)橄到y(tǒng)設(shè)計(jì)人員獲得了通用處理器的靈活性以及專用硬件的計(jì)算優(yōu)勢。

因此,這種加速器是滿足許多應(yīng)用領(lǐng)域中越來越復(fù)雜系統(tǒng)需求的寶貴資產(chǎn)。其中之一是音頻系統(tǒng),其中通道的數(shù)量正在增加。家庭影院系統(tǒng)從 5.1 聲道增加到 6.1 聲道,現(xiàn)在是 7.1 聲道。高端汽車放大器通常使用 12 個(gè)或更多揚(yáng)聲器來讓聽眾沉浸在聲音中。

此外,音頻源材料現(xiàn)在以高清 (HD) 格式提供,其關(guān)聯(lián)的解碼器可擴(kuò)展系統(tǒng)資源。此外,高清算法以更高的采樣率提供內(nèi)容。以前,內(nèi)容的峰值采樣率很少高于48 kHz。使用HD算法,采樣率通常為96 kHz,在某些情況下甚至高達(dá)192 kHz。

為了更好地了解計(jì)算需求是如何增加的,請考慮采用復(fù)雜房間均衡算法的最先進(jìn)的家庭影院接收器。這些算法可補(bǔ)償驅(qū)動器響應(yīng)和揚(yáng)聲器位置的變化。算法首先使用麥克風(fēng)和實(shí)時(shí)傳遞函數(shù)測量來分析房間。智能組合多個(gè)位置的測量值,然后為每個(gè)揚(yáng)聲器設(shè)計(jì)補(bǔ)償濾波器。

更精確的房間均衡算法使用FIR濾波器來校正整個(gè)頻率范圍內(nèi)的響應(yīng)。所需濾波器的長度與采樣率成正比,需要更長的濾波器來精確控制低頻。256點(diǎn)的濾波器長度在48 kHz時(shí)很常見,而在96 kHz下實(shí)現(xiàn)相同的頻率分辨率需要512點(diǎn)的濾波器長度。采樣率和濾波器長度的加倍導(dǎo)致所需的計(jì)算量增加四倍。

SHARC ADSP-2146x中的加速器

ADI公司的SHARC處理器有著悠久的歷史,可在眾多應(yīng)用中實(shí)現(xiàn)復(fù)雜的信號處理功能。處理器功能豐富的內(nèi)核和外設(shè)使其成為產(chǎn)品開發(fā)人員的合理選擇。ADI公司最近推出的SHARC ADSP-2146x處理器通過更高的時(shí)鐘速度(450 MHz)和擴(kuò)展的片上存儲器(5 Mb)鞏固了這一領(lǐng)導(dǎo)地位。

此外,該處理器還具有一組用于實(shí)現(xiàn)常見信號處理操作的硬件加速器:FIR 濾波器、IIR 濾波器和 FFT。這些操作構(gòu)成了通信系統(tǒng)、醫(yī)療設(shè)備、消費(fèi)產(chǎn)品以及工業(yè)測量和控制應(yīng)用的基礎(chǔ)。這些加速器是對SHARC ADSP-2136x處理器中引入的板載采樣速率轉(zhuǎn)換器的補(bǔ)充,也可以被視為硬件加速器。

加速器架構(gòu)

SHARC ADSP-2146x的所有三個(gè)加速器都具有相似的設(shè)計(jì),這使得下面顯示的FIR加速器很好地說明了硬件加速器架構(gòu)。FIR 加速器具有以下組件:

控制寄存器集 - 配置加速器的操作。

DMA 控制器 — 在主內(nèi)存和加速器的本地內(nèi)存之間移動數(shù)據(jù)。也可用于配置控制寄存器。

兩個(gè)本地內(nèi)存塊 — 存儲系數(shù)和狀態(tài)變量(或延遲內(nèi)存),并減少主內(nèi)存的帶寬。

計(jì)算單元 - 包含為加速器定制的算術(shù)運(yùn)算。FIR 計(jì)算單元有四個(gè)并行 MAC。

poYBAGQBmfaABdNTAACf-pFBpKQ621.png

加速器的操作使用鏈?zhǔn)?DMA 自動執(zhí)行。FIR 加速器通常通過以下步驟進(jìn)行:

將此通道的系數(shù)數(shù)據(jù)從內(nèi)部存儲器加載到本地加速器系數(shù)存儲。

將此通道的狀態(tài)變量從內(nèi)部存儲器加載到本地加速器狀態(tài)變量存儲。這包括第一個(gè)輸入樣本。

使用四個(gè) MAC 單元計(jì)算輸出樣本。

存儲結(jié)果。

如果還有樣本需要處理,則獲取下一個(gè)輸入樣本并寫入狀態(tài)變量存儲。

重復(fù)步驟3至5,直到計(jì)算出通道中的所有輸出樣本。

對所有輸入通道重復(fù)步驟 1 到 6。

ADSP-2146x內(nèi)核的最大時(shí)鐘速率為450 MHz。通過使用 SIMD(單指令多數(shù)據(jù)),內(nèi)核可以在每個(gè)時(shí)鐘周期執(zhí)行兩次 MAC(乘法累加)運(yùn)算,峰值速率為 900 MMAC/秒。相比之下,該加速器以225 MHz的SHARC外設(shè)時(shí)鐘速率運(yùn)行。 FIR加速器使用其四個(gè)專用MAC單元,實(shí)現(xiàn)了900 MMAC/sec的峰值理論吞吐量。配置 FIR 加速器控制寄存器和將數(shù)據(jù)移入和移出本地內(nèi)存會產(chǎn)生一些開銷。

實(shí)現(xiàn)給定FIR濾波器所需的外設(shè)時(shí)鐘周期總數(shù)由公式給出

pYYBAGQBl9mARZX5AAASLYD328Y435.png

其中 N 是過濾器抽頭的數(shù)量,B 是塊大小。周期計(jì)數(shù)可以進(jìn)一步細(xì)分為:

49 = DMA 傳輸控制塊初始化。

4N = 假設(shè)每個(gè)載荷有兩個(gè)周期,則加載系數(shù)和狀態(tài)值(延遲線)。

poYBAGQBmguAYDcaAAAQC77YJVs540.png

在實(shí)踐中使用加速器

應(yīng)用軟件的設(shè)計(jì)必須能夠充分利用硬件加速器。請記住,加速器必須配置為與主 CPU 并行運(yùn)行,因?yàn)槿绻?CPU 處于空閑狀態(tài)等待加速器完成,則沒有任何好處。

加速器通常是在實(shí)時(shí)環(huán)境中運(yùn)行的較大信號鏈的一部分。與加速器的接口需要雙緩沖輸入和輸出數(shù)據(jù),系統(tǒng)設(shè)計(jì)人員應(yīng)記住加速器會引入延遲塊。

考慮一個(gè)家庭影院系統(tǒng),該系統(tǒng)具有 7.1 個(gè) 96 kHz 的音頻通道,以 32 個(gè)樣本的塊大小運(yùn)行。假設(shè)房間均衡由八個(gè)FIR濾波器應(yīng)用,每個(gè)濾波器長512點(diǎn)。如果核心CPU要執(zhí)行濾波,則至少需要96 kHz×8×512 = 393 MMAC/秒或44 MHz SHARC處理器的450%。這種FIR處理代表了整個(gè)計(jì)算的很大一部分,幸運(yùn)的是,可以卸載到加速器。FIR濾波器的輸入和輸出是雙緩沖的,允許加速器與音頻信號鏈的其余部分并行工作。雙緩沖在處理過程中引入了32個(gè)延遲樣本,在333 kHz時(shí)為可接受的96 μs。

使用前面的公式,加速器需要 50,056 個(gè)外圍循環(huán)才能完成操作。在225 MHz的速率下,這是223 μs,這完全在333 μs的阻塞時(shí)間內(nèi)。

結(jié)論

音頻處理技術(shù)的不斷進(jìn)步對音頻DSP提出了更高的要求。下一代SHARC ADSP-2146x處理器中的硬件加速器可顯著提高整體處理能力。加速器將常見的信號處理操作(FIR 濾波器、IIR 濾波器和 FFT 操作)從核心處理器中卸載出來,使其能夠?qū)W⒂谄渌蝿?wù)。這種經(jīng)濟(jì)高效的方法使處理器的計(jì)算吞吐量增加了一倍以上。雖然本文側(cè)重于音頻應(yīng)用,但內(nèi)核和加速器是通用的,非常適合各種信號處理任務(wù)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    18924

    瀏覽量

    227195
  • 濾波器
    +關(guān)注

    關(guān)注

    158

    文章

    7593

    瀏覽量

    176556
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10698

    瀏覽量

    209324
收藏 人收藏

    評論

    相關(guān)推薦

    ADI推出Blackfin和SHARC處理器下一代軟件開發(fā)平臺CCES

    ADI全球領(lǐng)先的高性能信號處理解決方案供應(yīng)商,最近推出適用于Blackfin?和SHARC?處理器下一代軟件開發(fā)平臺CrossCore?
    發(fā)表于 09-24 08:57 ?2172次閱讀

    無法導(dǎo)入硬件加速器

    嗨!我已經(jīng)創(chuàng)建了個(gè)硬件加速器(在vhdl中)并且合成成功完成。但是,當(dāng)我使用創(chuàng)建和導(dǎo)入外圍設(shè)備向?qū)r(shí),它向我顯示我的包在庫中不可用,盡管它是。我能做什么 ???L'enfer,c'est l
    發(fā)表于 02-27 14:15

    如何充分利用數(shù)字信號處理器上的片內(nèi)FIR和IIR硬件加速器?

    上的片內(nèi)FIR和IIR硬件加速器也分別稱為FIRA和IIRA,我們可以利用這些硬件加速器來分擔(dān)FIR和IIR處理任務(wù),讓內(nèi)核去執(zhí)行其他處理任務(wù)。在本文中,我們將借助不同的使用模型以及實(shí)
    發(fā)表于 12-28 06:26

    性能提升1倍,成本直降50%!基于龍蜥指令加速下一代云原生網(wǎng)關(guān)

    日益增長的速度,CPU 硬件加速成為業(yè)界個(gè)通用的解決方案。CPU 新特性不久前發(fā)布的第三英特爾 ^?^ 至強(qiáng) ^?^ 可擴(kuò)展處理器(代號 Ice Lake),單核
    發(fā)表于 08-31 10:46

    高通下一代手機(jī)處理器3D與視頻性能展示

    高通下一代手機(jī)處理器3D與視頻性能展示 來自Armdevices網(wǎng)站的報(bào)道,高通公司日前展示了其下一代智能手機(jī)平臺MSM7X30,整體性能
    發(fā)表于 03-04 12:03 ?672次閱讀

    添加硬件加速器可以加快處理器的正弦計(jì)算

    如果修改軟件不能實(shí)現(xiàn)所需速度,那么你可能順理成章的想到在你的設(shè)計(jì)中加入硬件加速模塊。 作 有很多種算法可對單精度浮點(diǎn)數(shù)字的正弦值進(jìn)行計(jì)算,但添加硬件加速器是功能最為強(qiáng)大的方法之。之所以得出這
    發(fā)表于 11-24 18:38 ?2080次閱讀
    添加<b class='flag-5'>硬件加速器</b>可以加快<b class='flag-5'>處理器</b>的正弦計(jì)算

    利用硬件加速器提高處理器性能

    超過兩倍。本文以下一代音頻系統(tǒng)為例,說明硬件加速器在這方面的應(yīng)用。 為什么使用硬件加速器 FIR濾波、IIR濾波和FFT操作在數(shù)字信號
    發(fā)表于 12-04 15:22 ?1218次閱讀

    基于Xilinx FPGA的Memcached硬件加速器的介紹

    本教程討論基于Xilinx FPGA的Memcached硬件加速器的技術(shù)細(xì)節(jié),該硬件加速器可為10G以太網(wǎng)端口提供線速M(fèi)emcached服務(wù)。
    的頭像 發(fā)表于 11-27 06:41 ?3630次閱讀

    毫米波傳感1443硬件加速器的簡單介紹

    2.6 mmWave波形傳感簡介1443硬件加速器
    的頭像 發(fā)表于 05-08 06:20 ?3199次閱讀
    毫米波傳感<b class='flag-5'>器</b>1443<b class='flag-5'>硬件加速器</b>的簡單介紹

    硬件加速器提升下一代SHARC處理器性能

    硬件加速器提升下一代SHARC處理器性能
    發(fā)表于 04-23 13:06 ?6次下載
    <b class='flag-5'>硬件加速器</b><b class='flag-5'>提升</b><b class='flag-5'>下一代</b><b class='flag-5'>SHARC</b><b class='flag-5'>處理器</b>的<b class='flag-5'>性能</b>

    用于 AI 應(yīng)用的硬件加速器設(shè)計(jì)師指南

    當(dāng) AI 設(shè)計(jì)人員將硬件加速器整合到用于訓(xùn)練和推理應(yīng)用的定制芯片中時(shí),應(yīng)考慮以下四個(gè)因素
    發(fā)表于 08-19 11:35 ?1510次閱讀
    用于 AI 應(yīng)用的<b class='flag-5'>硬件加速器</b>設(shè)計(jì)師指南

    利用數(shù)字信號處理器上的片上FIR和IIR硬件加速器

    處理器上的片上FIR和IIR硬件加速器(也稱為FIRA和IIRA)可用于卸載FIR和IIR處理任務(wù),從而騰出內(nèi)核用于其他處理。在本文中,我們將討論如何借助經(jīng)過測試的實(shí)時(shí)示例說明的不同使
    的頭像 發(fā)表于 12-20 11:39 ?1246次閱讀
    利用數(shù)字信號<b class='flag-5'>處理器</b>上的片上FIR和IIR<b class='flag-5'>硬件加速器</b>

    借助硬件加速器開發(fā)您的設(shè)計(jì)

    借助硬件加速器開發(fā)您的設(shè)計(jì)
    的頭像 發(fā)表于 01-03 09:45 ?811次閱讀

    數(shù)據(jù)中心 AI 加速器:當(dāng)前下一代

    數(shù)據(jù)中心 AI 加速器:當(dāng)前下一代演講ppt分享
    發(fā)表于 07-14 17:15 ?0次下載

    瑞薩發(fā)布下一代動態(tài)可重構(gòu)人工智能處理器加速器

    瑞薩最新發(fā)布的動態(tài)可重構(gòu)人工智能處理器(DRP-AI)加速器,在業(yè)界引起了廣泛關(guān)注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統(tǒng)技術(shù),效率提升了驚人的10倍。其獨(dú)特之處在
    的頭像 發(fā)表于 03-08 13:45 ?585次閱讀