0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用 ARC VPX 嵌入式DSP IP實現(xiàn)高性能傳感器融合

842221752 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:陳泳詩 ? 2023-01-31 11:03 ? 次閱讀

推動傳感器融合需求的主要趨勢

傳感器融合智能移動設(shè)備、自動駕駛智能家居設(shè)備、工業(yè)控制機器人等應(yīng)用中具有很多優(yōu)勢。

傳感器融合是指組合來自多個傳感器的數(shù)據(jù),以獲得更為完整和準確的結(jié)果。通過使用由多個感測裝置提供的信息,可以實現(xiàn)更好的環(huán)境感知。人體是傳感器融合的一個最好例證,人通過組合從各種“傳感器”(眼睛、耳朵、鼻子、舌頭、皮膚)中收集的信息,來了解我們周圍的環(huán)境,從而決定如何應(yīng)對各種情況。因此,傳感器融合和人工智能 (AI) 很自然地同時成為了關(guān)鍵趨勢。

傳感器融合成功有三個要求:傳感器的小型化、從傳感器產(chǎn)生的數(shù)據(jù)流中提取相關(guān)信息的復(fù)雜算法,以及在可用功耗和成本預(yù)算內(nèi)提供執(zhí)行算法所需性能的 SoC。

為了讓尺寸更小,同時成本更低,以適用于大規(guī)模應(yīng)用,傳感器通常通過微機電系統(tǒng) (MEMS) 來實現(xiàn)。因此,在許多消費設(shè)備中,都可以看到加速度計、陀螺儀、磁力計等MEMS傳感器,以及攝像頭和麥克風的身影。雷達傳感器很快就會亮相于眾多的消費類設(shè)備,從而以超低功耗預(yù)算實現(xiàn)手勢控制。雷達,當然還有攝像頭,是當今汽車應(yīng)用中頗為成熟的傳感器,其數(shù)量逐代增加,而 LiDAR 有望在下一代先進駕駛輔助系統(tǒng) (ADAS) 中實現(xiàn)應(yīng)用。需要多個不同的傳感器才能獲得完整準確的結(jié)果。

人體中的每個“傳感器”具有互補優(yōu)勢并提供獨特的信息,而嵌入式系統(tǒng)中的傳感器也必須如此。以 ADAS 為例,雷達在不同光線和天氣條件下性能穩(wěn)健,LiDAR 可提供具有良好視角分辨率的廣闊視野,而基于攝像頭的視覺功能則可對物體實現(xiàn)快速準確的分類(圖 1)。

pYYBAGPYiE2AA7rWAAVni86JC34370.png

圖 1:ADAS 系統(tǒng)中的多個不同傳感器


復(fù)雜的算法主要有兩個功能, (1) 從傳感器信號中提取信息,(2) 組合來自不同傳感器流的信息。根據(jù)應(yīng)用的不同,性能要求會大不相同,算法的復(fù)雜程度可能也會有很大差異。只有當檢測到某個語音命令時,始終在線的智能家居設(shè)備才會醒來,但 ADAS 系統(tǒng)必須持續(xù)監(jiān)控其環(huán)境。

復(fù)雜的算法需要能夠提供執(zhí)行算法所需性能的 SoC。與任何設(shè)計一樣,它需要滿足可用功耗和面積的限制,因為這將在很大程度上影響總體盈利能力。散熱和有限的電池容量是兩個主要驅(qū)動因素,具體情況視應(yīng)用而定。理想情況下,這類 SoC 完全可編程,以實現(xiàn)最大的靈活性。算法在產(chǎn)品的生命周期內(nèi)可能發(fā)生演進,傳感器在其生命周期內(nèi)可能需要不同的校準,而且非常希望在可通過軟件進行區(qū)分的情況下,對產(chǎn)品的多個版本使用相同的 Soc。

讓我們看看幾個應(yīng)用示例。目前,任何一款手機中可能都安裝有計步器。它包含多個傳感器,例如加速度計、陀螺儀、磁力計,有時還有壓力和溫度傳感器(用于海拔跟蹤)。這些傳感器的生產(chǎn)成本相對低廉,而且生成的信息流是恒定的。需要 10-50 MIPS 來處理數(shù)據(jù),并將其合并為有意義的輸出,此類融合信息通過小型 MCU 處理即可。

對于始終在線的智能家居設(shè)備,用戶可能還會看到麥克風、攝像頭和雷達的組合。這些設(shè)備可以在檢測到用戶存在時與用戶進行智能交互,然后響應(yīng)命令。“智能”傳感器將用于限制功耗,例如僅在檢測到某個面部(簡單算法、低性能要求)之后,才進行啟動面部識別(復(fù)雜算法、高性能要求)。計算要求會隨著時間的推移而出現(xiàn)巨大的差異。該系統(tǒng)必須在有需要時提供峰值性能,但需要動態(tài)地管理計算資源及其消耗的功率。隨著來自視覺、語音和雷達傳感器的數(shù)據(jù)量增加,處理數(shù)據(jù)需要數(shù)十億次操作/秒 (GOPS)。

高效實現(xiàn)傳感器融合所需的關(guān)鍵特性

如前所述,傳感器融合包含兩個主要階段:(1) 提取信息,(2) 結(jié)合信息以得出結(jié)果。這在圖 2 中加以說明。

poYBAGPYiFiAC2eDAAGra38xcSQ121.png

圖 2:傳感器融合處理鏈


第 1 階段也可以稱為傳感器融合的前端。根據(jù)傳感器和相關(guān)的信息,應(yīng)用不同的數(shù)字信號處理算法。對于語音,這可能是計算梅爾頻率倒譜系數(shù) (MFCC),其應(yīng)用傅里葉變換和其它各種 DSP 操作從語音信號提取頻譜特征。數(shù)據(jù)將以整數(shù)格式,很可能以 16 比特表示。

對于攝像頭,它是具有圖像縮放、色彩空間轉(zhuǎn)換、過濾或特征檢測等功能的圖像信號處理。此處數(shù)據(jù)表示為像素,數(shù)據(jù)格式為 8 比特,最多 16 比特。 最后,對于雷達,此類前端處理包括范圍和速度 FFT 以及用于閾值的恒定虛警率 (CFAR)。由于動態(tài)范圍和精度要求,數(shù)據(jù)類型為半精度或全精度浮點。 第二階段是信息結(jié)合(后端處理)。要使用的算法與應(yīng)用息息相關(guān)。任務(wù)可以包括對象檢測、識別、跟蹤以及預(yù)測,例如,使用卡爾曼濾波的遞歸估計器??梢詰?yīng)用基于 AI 的機器學(xué)習算法以及線性代數(shù)操作。當然,數(shù)據(jù)類型將非常依賴于算法。

由于這些特定但不同的要求,傳感器融合需要一款滿足下列關(guān)鍵要求的數(shù)字信號處理器 (DSP)。

多功能性

算法和數(shù)據(jù)類型在很大程度上取決于應(yīng)用。因此,DSP 架構(gòu)必須支持豐富的指令集,以便高效實現(xiàn)不同的算法,并特別關(guān)注 FFT 或線性代數(shù)等性能關(guān)鍵型操作。DSP 必須支持不同精度的整數(shù)和浮點數(shù)據(jù)類型。

這種 DSP 需要成為合格的靈活計算資源,這意味著它需要能夠執(zhí)行通常與 DSP 相關(guān)聯(lián)的“經(jīng)典”過濾操作,以及機器學(xué)習和計算機視覺算法。

可擴展性

為了避免一次性投資,可擴展性是關(guān)鍵。雖然對不同傳感器的要求不同,但對于不同設(shè)計的所有信號處理要求,非常希望使用相同的基準架構(gòu),以限制系統(tǒng)集成工作,并最大限度地提高整體軟件開發(fā)效率??蓴U展性讓設(shè)計師能夠選擇配置,從而為目標應(yīng)用提供最佳 PPA。

可擴展性不僅僅關(guān)乎硬件。針對特定架構(gòu)進行內(nèi)核優(yōu)化,是軟件方面的一項重大投入。重要的是,此類軟件可以在這些 SoC 上重復(fù)使用,從而能夠重復(fù)使用不同版本的 SoC(例如低端/中端/高端版本)。

PPA 優(yōu)化

就性能/功耗/面積而言,有諸多方面可進行優(yōu)化。從性能開始,它關(guān)乎核心本身的循環(huán)效率(即執(zhí)行特定功能所需的循環(huán)次數(shù)),以及可用的處理引擎和能夠利用這些引擎的 ISA。這直接關(guān)系到對數(shù)據(jù)移動的有效支持,與數(shù)據(jù)處理并行,然后連接到一組豐富(最好是可配置的)接口,例如,將加速器和外圍設(shè)備直接連接到核心,而不通過系統(tǒng)存儲器。

DSP 的最大時鐘頻率體現(xiàn)出另一方面的性能。它決定 DSP 可以提供多少馬力(以每秒周期為單位),但也影響物理 SoC 設(shè)計中時序收斂所需的工作量。 低功耗與性能效率以及僅在需要時喚醒某些內(nèi)核的選項直接相關(guān)(如智能家居應(yīng)用中所述:等待喚醒信息)。 最后,小面積對成本以及漏電有直接影響。

高效的軟件開發(fā)

軟件開發(fā)必須高效,因為對于幾乎所有項目來說,大筆的投資(以及相關(guān)人員)都耗費在了軟件開發(fā)和測試上。這需要一個具有優(yōu)化編譯器的高級編程模型,以及一組豐富的庫,其中包含用于濾波、轉(zhuǎn)換(例如 FFT)、矢量數(shù)學(xué)、線性代數(shù)和機器學(xué)習的現(xiàn)成優(yōu)化內(nèi)核。當然,還需要驅(qū)動程序、DMA 處理程序、中斷處理程序等低級模塊。隨著對軟件的大量投資,務(wù)必要讓此類軟件可移植到廣泛的體系架構(gòu)選項中,例如,支持不同的向量長度,無需重新編碼。

DesignWare? ARC? VPX DSP IP助力傳感器融合

VPX DSP IP 是 在VLIW/SIMD 處理器系列中,適用于從永遠在線設(shè)備到汽車 ADAS ,再到視覺、機器學(xué)習和高性能計算等廣泛的信號處理應(yīng)用。圖 3 提供了概述。

pYYBAGPYiGKAZNplAAHf_2hxP8o951.png

圖 3:DesignWare ARC VPX DSP IP 塊狀圖


VPX 系列非常適合傳感器融合要求,因為它可提供可擴展性和多功能性,以實現(xiàn)最佳的 PPA 和軟件開發(fā)效率,從而提高整體生產(chǎn)效率。

所有 VPX 系列產(chǎn)品均基于相同的 VLIW/SIMD 架構(gòu)?,F(xiàn)實中,設(shè)計人員常會遇到,在選擇了某個向量長度后,卻發(fā)現(xiàn) PPA 的要求需要不同配置的情況。而在VPX系列產(chǎn)品中,客戶可以根據(jù)自己的需求擴展解決方案,從 128 位到 512 位的不同矢量長度中進行自由選擇,非常方便。得益于可變矢量長度 (VLA) 編程模型,代碼可以在VPX系列之間遷移,因此執(zhí)行起來非常容易。VLA 編程可確保軟件投資的安全性,既可為當前項目提供靈活性,又可為未來項目提供可重用性。除矢量長度外,客戶可以從單核、雙核或四核配置中進行選擇,多核配置已預(yù)先集成并準備好用于緩存一致性和共享的多通道 DMA。

除了不同的矢量長度外,每個 VPX 內(nèi)核都高度可配置,從而可定制架構(gòu)以獲得最佳性能,同時擁有最小的面積。以不需要浮點、但極其受限于面積和功率的應(yīng)用為例:使用 ARChitect 配置工具,用戶可以選擇不包括(標量和最多兩個矢量)浮點單元。此可選單元的另一實例是專用矢量數(shù)學(xué)單元,用于非常高效地執(zhí)行例如 sin(x)、cos(x)、2^x、div、sqrt、1/sqrt、log_2(x) 等操作。 如上文所解釋,依傳感器和應(yīng)用于傳感器數(shù)據(jù)的算法而定,需要不同的數(shù)據(jù)類型。VPX 支持的數(shù)據(jù)類型范圍廣泛,從浮點到覆蓋應(yīng)用(如高分辨率雷達)所需的動態(tài)范圍,再到用于 AI 應(yīng)用的小規(guī)模整數(shù)類型。

VPX 指令集架構(gòu) (ISA) 已調(diào)整為高效執(zhí)行關(guān)鍵信號處理內(nèi)核,例如 FFT 或矩陣操作。以 FFT 操作為例,通過矢量負載/雙倍存儲(指從內(nèi)存?zhèn)鬏敂?shù)據(jù)達矢量長度的兩倍)和專用 FFT 指令相結(jié)合,可以在軟件中執(zhí)行所有 FFT 操作,甚至對于多傳感器雷達場景也不例外。這避免了采用專用硬件加速器而帶來的成本開支,也因而實現(xiàn)了功率和面積的節(jié)省。

ISA 和微架構(gòu)(即實施不同功能單元的方式)是實現(xiàn)最佳 PPA 的關(guān)鍵要素。但是,需要一個軟件開發(fā)環(huán)境來釋放硬件的功能。VPX 配有 MetaWare 工具套件,其包括優(yōu)化 C/C++ 編譯器、模擬工具和復(fù)雜的調(diào)試環(huán)境。它包括一組豐富的庫,可為信號處理、線性代數(shù)和機器學(xué)習提供優(yōu)化的內(nèi)核。這些內(nèi)核是以與矢量長度無關(guān)的方式編寫的,因此代碼在 VPX 系列產(chǎn)品中都保持便攜。為了支持對 AI 日益增長的需求,MetaWare 還提供 NN SDK 和先進的圖形映射工具(支持 TensorFlow、Caffe、ONNX)。

pYYBAGPYiG2ADF8qAAPMVZAbNmY163.png

圖 4:隨 MetaWare 一起提供的庫,針對 VPX 進行了優(yōu)化


VPX 系列包括為功能安全 (FuSa) 認證量身定制的 VPXxFS 變體(VPX2FS、VPX3FS 和 VPX5FS)。這些核心滿足隨機故障檢測和系統(tǒng)功能安全開發(fā)流程要求,完全符合 ASIL D ISO 26262 合規(guī)性。VPXxFS DSP 集成了硬件安全功能,例如存儲器和接口的 ECC 保護、安全監(jiān)測器和鎖步機制。一套全面的安全文檔可幫助汽車設(shè)計師獲得 ISO 26262 功能安全認證。此外,VPXxFS DSP 還提供“混合”選項,使用戶可以在硅后軟件中選擇高達 ASIL D 的安全級別。

總結(jié)

傳感器融合是一個快速增長的市場,已進入幾乎任何應(yīng)用領(lǐng)域。得益于低成本傳感器的可用性,以及先進的算法,它可以在不同市場實現(xiàn)新的用戶體驗,包括智能移動設(shè)備、汽車、健康或工業(yè)控制。傳感器融合導(dǎo)致不同的信號處理工作負載,因為不同的傳感器需要不同的數(shù)據(jù)類型來表示數(shù)據(jù),并且需要不同的 DSP 算法來提取與實際融合過程相關(guān)的信息。融合過程(即組合各種傳感器信息流并從中產(chǎn)生有意義的決策)在很大程度上是特定于應(yīng)用程序的。要處理這些不同的工作負載,需要一個可擴展的處理器來處理不同的數(shù)據(jù)格式和性能要求,并且需要通用和可配置的架構(gòu),包括儲存器和接口,以滿足 PPA 要求。DesignWare ARC VPX IP 系列是傳感器融合應(yīng)用的理想解決方案:其矢量長度為 128 位、256 位或 512 位,可滿足各種信號處理工作負載的需求。憑借定制的指令集和專用的數(shù)學(xué)硬件引擎,它可通過無與倫比的 PPA 提供卓越的循環(huán)效率。其可變矢量長度編程模型可確保軟件可在 VPX 系列的所有產(chǎn)品之間重復(fù)使用,從而保護這一重大投資。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2546

    文章

    50498

    瀏覽量

    751195
  • 嵌入式
    +關(guān)注

    關(guān)注

    5060

    文章

    18980

    瀏覽量

    302246
收藏 人收藏

    評論

    相關(guān)推薦

    為何嵌入式控制首選ARMxy?深度解析

    嵌入式ARM控制是一種基于ARM架構(gòu)的嵌入式系統(tǒng)控制,廣泛應(yīng)用于各種嵌入式系統(tǒng)中,包括工業(yè)物聯(lián)網(wǎng)關(guān)、邊緣計算網(wǎng)關(guān)、智慧城市、智能設(shè)備、工
    的頭像 發(fā)表于 09-21 10:09 ?249次閱讀
    為何<b class='flag-5'>嵌入式</b>控制<b class='flag-5'>器</b>首選ARMxy?深度解析

    嵌入式熱門領(lǐng)域有哪些?

    通過物聯(lián)網(wǎng)連接各種物理設(shè)備和傳感器,促使它們之間實現(xiàn)信息的交換和數(shù)據(jù)的共享。從智能家居到智能城市,物聯(lián)網(wǎng)的應(yīng)用不斷擴展,為嵌入式系統(tǒng)工程師帶來了廣泛的就業(yè)機會和發(fā)展前景。 自動駕駛 自動駕駛技術(shù)作為
    發(fā)表于 07-16 09:23

    嵌入式系統(tǒng)怎么學(xué)?

    嵌入式系統(tǒng)之間或與外部設(shè)備的數(shù)據(jù)通信。 7、傳感器和執(zhí)行:了解各種傳感器(如溫度傳感器、加速度傳感器
    發(fā)表于 07-02 10:10

    Altera SOPC 嵌入式系統(tǒng)設(shè)計(一)

    32 位 RISC 嵌入式處理器具有超過 200 DMIP 的性能,在低成本 FPGA 中實現(xiàn)成本只有 35 美分。由于處理是軟核形式,具有很大的靈活性,可以在多種系統(tǒng)設(shè)置組合中進
    發(fā)表于 06-25 20:39

    如何提升嵌入式編程能力?

    代碼以提高性能,包括減少內(nèi)存使用、提高處理速度等。 16. 調(diào)試技巧:掌握嵌入式系統(tǒng)的調(diào)試技巧,包括使用調(diào)試、日志記錄和性能分析工具。 17. 參加競賽和挑戰(zhàn):參加編程競賽或黑客馬拉
    發(fā)表于 06-21 10:01

    簡談Xilinx Zynq-7000嵌入式系統(tǒng)設(shè)計與實現(xiàn)

    今天給大俠帶來簡談Xilinx Zynq-7000嵌入式系統(tǒng)設(shè)計與實現(xiàn),話不多說,上貨。 Xilinx的ZYNQ系列FPGA是二種看上去對立面的思想的融合,ARM處理的串行執(zhí)
    發(fā)表于 05-08 16:23

    dsp嵌入式微處理器的一種設(shè)備嗎 ARM嵌入式微處理器有何特點?

    DSP(Digital Signal Processor)不是一種嵌入式微處理器的設(shè)備。DSP是一種專門用于數(shù)字信號處理的微處理,它具有高性能
    的頭像 發(fā)表于 04-21 09:37 ?888次閱讀

    dsp嵌入式微處理器的區(qū)別和聯(lián)系

    是一種專門用于數(shù)字信號處理(Digital Signal Processing)的處理。數(shù)字信號處理是一種通過對數(shù)字信號進行算法運算來處理和分析信號的技術(shù)。DSP廣泛應(yīng)用于音頻、視頻、通信等領(lǐng)域,如音頻信號的降噪、音頻編解碼、實時圖像處理等。
    的頭像 發(fā)表于 04-21 09:35 ?889次閱讀

    嵌入式熱門發(fā)展方向有哪些?

    ,嵌入式人工智能可以運用機器學(xué)習技術(shù)對圖像、視頻進行高精度解析,從而實現(xiàn)圖像識別、視頻剪輯、視頻智能關(guān)聯(lián)應(yīng)用等。在傳感器網(wǎng)絡(luò)系統(tǒng)中,嵌入式人工智能主要是將人工智能技術(shù)應(yīng)用于
    發(fā)表于 04-11 14:17

    簡談Xilinx Zynq-7000嵌入式系統(tǒng)設(shè)計與實現(xiàn)

    今天給大俠帶來簡談Xilinx Zynq-7000嵌入式系統(tǒng)設(shè)計與實現(xiàn),話不多說,上貨。 Xilinx的ZYNQ系列FPGA是二種看上去對立面的思想的融合,ARM處理的串行執(zhí)
    發(fā)表于 04-10 16:00

    KU115+ZU19EG+DSP6678的雙FMC 6U VPX處理板

    VPX 數(shù)字處理板是一款高性能的 6U VPX 載板。主要芯片為 1 片 Xilinx 公司的 Kintex UltraScale 系列 FPGA 家族中的 XCKU115-2FLVA1517I
    的頭像 發(fā)表于 04-08 11:11 ?558次閱讀
    KU115+ZU19EG+<b class='flag-5'>DSP</b>6678的雙FMC 6U <b class='flag-5'>VPX</b>處理板

    Cadence擴充Tensilica IP產(chǎn)品陣容,強化汽車傳感器融合計算能力

    全球電子設(shè)計自動化和半導(dǎo)體IP解決方案的領(lǐng)先企業(yè)楷登電子(Cadence)近日宣布,其進一步擴展了Tensilica IP產(chǎn)品系列,以滿足汽車行業(yè)中日益增長的傳感器融合應(yīng)用計算需求。新
    的頭像 發(fā)表于 03-14 11:38 ?802次閱讀

    嵌入式工控機性能特點 嵌入式工控機應(yīng)用場景

    嵌入式工控機性能特點 嵌入式工控機應(yīng)用場景 嵌入式工控機是一種專門設(shè)計用于工業(yè)控制系統(tǒng)的計算機設(shè)備。它具有與傳統(tǒng)計算機不同的性能特點,并且在
    的頭像 發(fā)表于 02-04 11:35 ?608次閱讀

    嵌入式學(xué)習步驟

    語言編寫。但是,有些嵌入式系統(tǒng)也使用其他編程語言,例如Python或Java。 (3).了解硬件:深入了解您要控制的硬件設(shè)備的功能和特性。您需要了解嵌入式系統(tǒng)的處理、內(nèi)存、I/O端口、傳感器
    發(fā)表于 02-02 15:24

    嵌入式霍爾效應(yīng)傳感器IC FD2157H一般說明

    電子發(fā)燒友網(wǎng)站提供《嵌入式霍爾效應(yīng)傳感器IC FD2157H一般說明》資料免費下載
    發(fā)表于 01-10 16:45 ?0次下載