1.概述

DSP有相關(guān)的專業(yè)芯片，能夠?qū)ｉT實(shí)現(xiàn)計(jì)算功能，相比于通用處理器，DSP芯片專門用于計(jì)算，可以在一個(gè)周期內(nèi)執(zhí)行多條計(jì)算。隨著單片機(jī)對計(jì)算功能的需求越來越多，如果用傳統(tǒng)的通用處理器去執(zhí)行大數(shù)據(jù)的計(jì)算，將會(huì)消耗許多的機(jī)器周期，導(dǎo)致系統(tǒng)的實(shí)時(shí)性變低。于是，一些通用芯片上也開始集成DSP擴(kuò)展，比如常見的ARM Cortex-R和ARM Cortex-M內(nèi)核。

有了這些DSP擴(kuò)展支持，其功能更加強(qiáng)大，使用上，許多的辦法都可以進(jìn)行。比如常用的CMSIS-DSP。就是arm提供的DSP的編程庫。

https://arm-software.github.io/CMSIS_5/DSP/html/deprecated.html

使用上可以只需要將lib庫和頭文件包含到項(xiàng)目中即可。這樣就可以使用CMSIS里面的函數(shù)功能，比如求正余弦函數(shù)。

arm_cos_f32(radians);

如果用標(biāo)準(zhǔn)的數(shù)學(xué)庫中的cos函數(shù)，同樣也能夠達(dá)到目的，標(biāo)準(zhǔn)庫函數(shù)則需要消耗更多的機(jī)器周期，而使用了DSP庫，則更加方便高效的進(jìn)行計(jì)算。

上述是ARM對DSP支持的使用，RISCV也支持DSP擴(kuò)展，在RISCV的架構(gòu)手冊上，就對DSP擴(kuò)展有著一些描述。

https://github.com/riscv/riscv-p-spec

目前的支持riscv dsp的riscv core已經(jīng)有了，但是實(shí)際的硬件芯片，市面上還沒有見到。目前riscv 的 p擴(kuò)展還是處于沒有穩(wěn)定的階段，通過文檔的閱讀，也能夠大致的描述最終的模型。

首先其特點(diǎn)如下：

RISCV DSP擴(kuò)展是采用的通用寄存器進(jìn)行數(shù)據(jù)的存儲(chǔ)，這意味著SIMD的寄存器的單位是以通用寄存器的寬度作為標(biāo)準(zhǔn)，如果是RV32，寄存器的長度是32，如果是RV64，則寄存器的長度為64。

相比于RISCV 的RVV，DSP擴(kuò)展其寄存器的長度有限，但是對于并不復(fù)雜的計(jì)算來說，已經(jīng)足夠，特別是簡單的音頻，圖形編解碼，電機(jī)控制等等，都是非常好用的。

下面來描述一下具體如何在RISCV上進(jìn)行DSP的編程。

2.RISCV P擴(kuò)展編程實(shí)踐（內(nèi)聯(lián)匯編）

riscv-p-spec規(guī)定了P擴(kuò)展的一些常用的函數(shù)功能。

ADD16 （SIMD 16-bit Addition）

Type： SIMD

Format：

31 2524 2019 1514 1211 76 0

ADD16 0100000Rs2Rs1000RdOP-P 1110111

Syntax：

ADD16 Rd， Rs1， Rs2

Purpose： Perform 16-bit integer element additions in parallel.

Description： This instruction adds the 16-bit integer elements in Rs1 with the 16-bit integer elements in Rs2， and then writes the 16-bit element results to Rd.

Operations：

Rd.H[x]=Rs1.H[x]+Rs2.H[x];
forRV32:x=1..0,
forRV64:x=3..0

Exceptions: None

Privilege level: All

Note: This instruction can be used for either signed or unsigned addition.

Intrinsic functions:

Required:

uintXLEN_t__rv__add16(uintXLEN_ta,uintXLEN_tb);

Optional (e.g., GCC vector extensions):

RV32:
uint16x2_t__rv__v_uadd16(uint16x2_ta,uint16x2_tb);
int16x2_t__rv__v_sadd16(int16x2_ta,int16x2_tb);
RV64:
uint16x4_t__rv__v_uadd16(uint16x4_ta,uint16x4_tb);
int16x4_t__rv__v_sadd16(int16x4_ta,int16x4_tb);

在上述的指令中，規(guī)定了add16的編碼規(guī)則，對于RV32來說，一個(gè)寄存器的位寬是16，那么可以將一個(gè)寄存器拆分成兩個(gè)單元，一個(gè)機(jī)器周期，同時(shí)執(zhí)行兩條加法。同樣的指令，在RV64上，則可以拆分成四個(gè)單元，一個(gè)機(jī)器周期，可以執(zhí)行四條加法。

通過對編譯出來的程序進(jìn)行反匯編，可以得到對應(yīng)的匯編代碼。

當(dāng)然，如果要實(shí)現(xiàn)dsp指令的擴(kuò)展，目前官方的編譯器還沒有完全支持riscv的dsp擴(kuò)展。如果要完成帶有dsp指令的支持的gcc編譯器，需要對編譯器進(jìn)行一定的定制。因?yàn)槟壳皉iscv的p擴(kuò)展，并未完全定稿，如果完善后，應(yīng)該會(huì)被合并到主線主線。

其中編程的方式采用gcc內(nèi)部的內(nèi)聯(lián)函數(shù)的方式進(jìn)行，在《P-ext-proposal.adoc》中，規(guī)定了Intrinsic functions的形式，比如add16。

uintXLEN_t__rv__add16(uintXLEN_ta,uintXLEN_tb);

RV32:
uint16x2_t__rv__v_uadd16(uint16x2_ta,uint16x2_tb);
int16x2_t__rv__v_sadd16(int16x2_ta,int16x2_tb);
RV64:
uint16x4_t__rv__v_uadd16(uint16x4_ta,uint16x4_tb);
int16x4_t__rv__v_sadd16(int16x4_ta,int16x4_tb);

那么有上述函數(shù)可以供調(diào)用，不需要任何的庫文件的支持，因?yàn)樵趃cc編譯器中，內(nèi)部自己可以根據(jù)這些內(nèi)聯(lián)函數(shù)進(jìn)行匯編實(shí)現(xiàn)。

使用時(shí)，只需要包含gcc自帶的dsp相關(guān)的頭文件即可。

#include

static__attribute__((noinline))
unsignedlongadd16(unsignedlongra,unsignedlongrb)
{
return__rv__add16(ra,rb);
}

使用技巧上并未特殊方法，但是目前，這基本上是比直接寫匯編更加高效的dsp編程方式了。

3.RISCV P擴(kuò)展編程實(shí)踐（庫函數(shù)）

在很多情況下，底層的DSP指令雖然可以完成很多功能，不同的組合方式將能夠帶來不同效果，但是這些基礎(chǔ)庫的使用，在很多方面也需要編程人員有很強(qiáng)的數(shù)學(xué)基礎(chǔ)，并不能提供通用的math計(jì)算方法，這時(shí)使用庫函數(shù)將能夠在很大程度上解決這個(gè)問題。類似ARM的CMSIS-DSP。RISCV生態(tài)上也有一個(gè)NMSIS。

https://github.com/Nuclei-Software/NMSIS

可以將riscv的標(biāo)準(zhǔn)的dsp指令通過組合，形成更加通用的數(shù)學(xué)庫，比如sin或者cos，fft，matrix等等，一些常用的標(biāo)準(zhǔn)庫函數(shù)，都可以在里面找到。對于做嵌入式 AI來說，已經(jīng)十分完善。

使用方法上，首先需要添加NMSIS的的lib文件，然后包含頭文件。

#include"riscv_math.h"

直接調(diào)用NMSIS庫中暴露出來的函數(shù)即可。

float32_txx=riscv_cos_f32(float32_tcos);

這種方式更加直接，也能減少編程人員對DSP函數(shù)的使用不熟悉，帶來的一些人為的錯(cuò)誤，所以NMSIS可以說是DSP指令的上層軟件。使用該庫可以很容易的進(jìn)行高效的數(shù)據(jù)運(yùn)算。

4.總結(jié)

在riscv的芯片中，如果要使用DSP，首先需要該芯片的硬件設(shè)計(jì)實(shí)現(xiàn)了riscv的p擴(kuò)展，硬件支持的情況下，再適配編譯器，編譯器也將DSP的支持添加進(jìn)去。這樣可以直接使用DSP擴(kuò)展的指令了。然而直接使用DSP提供的指令進(jìn)行計(jì)算，工作量還是很大，同時(shí)優(yōu)化也不一定非常的好，此時(shí)使用NMSIS庫提供的函數(shù)，直接利用優(yōu)化好的數(shù)學(xué)函數(shù)進(jìn)行數(shù)據(jù)計(jì)算，這樣才是高效最簡單的方式。

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19100

瀏覽量
228814
dsp

dsp

+關(guān)注

關(guān)注
552

文章
7959

瀏覽量
347926
芯片

芯片

+關(guān)注

關(guān)注
452

文章
50206

瀏覽量
420884
函數(shù)

函數(shù)

+關(guān)注

關(guān)注
3

文章
4277

瀏覽量
62323

原文標(biāo)題：教你在RISCV中使用DSP指令!

文章出處：【微信號(hào)：Embeded_IoT，微信公眾號(hào)：嵌入式IoT】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

如何在Linux中使用htop命令

本文介紹如何在 Linux 中使用 htop 命令。

發(fā)表于 12-04 14:45 ?1828次閱讀

如<b class='flag-5'>何在</b>Linux<b class='flag-5'>中使</b>用htop命令

RISCV的主流指令集有哪些？

如題，就像X86中指令集有MMX,SSE,SSE2等，就像ARM指令集有ARM和Thumb等，但是總是感覺RISCV特別亂，可能是廠商比較多的緣故吧，我知道的有WCH的青稞RISC-V，玄鐵

發(fā)表于 08-29 13:49

如何在RISC-V中使用DSP指令？

如何在RISC-V中使用DSP指令？

發(fā)表于 02-16 07:43

RISCV自定義指令編譯報(bào)錯(cuò)怎么解決？

各位老師好，本人在學(xué)習(xí)riscv指令時(shí)，在指令編譯過程中遇到如下問題，希望老師能夠不吝賜教，非常感謝！

發(fā)表于 08-12 07:40

riscv實(shí)現(xiàn)自定義指令并用qemu運(yùn)行的過程

1.說明 riscv支持指令集自定義擴(kuò)展，這大大增加了riscv的可性，同時(shí)對于一些實(shí)際應(yīng)用中，自己通過一條指令來實(shí)現(xiàn)特定的功能，效率非常高，當(dāng)然，前提是硬件平臺(tái)需要對該

發(fā)表于 08-16 07:27

DSP匯編指令-典型指令

輕松學(xué)會(huì)DSP——DSP匯編指令。很不錯(cuò)的教程

發(fā)表于 06-17 14:59 ?23次下載

如何在典型的DSP應(yīng)用（框架）中使用IRTC接口的詳細(xì)資料概述

本應(yīng)用筆記從兩個(gè)角度描述了IRTC接口。生產(chǎn)者（算法開發(fā)者）透視處理算法中嵌入DSP/BIOS API和實(shí)現(xiàn)IRTC接口的方法。消費(fèi)者（用戶）的角度討論了如何在典型的DSP應(yīng)用（框架）中使

發(fā)表于 05-03 11:10 ?3次下載

如何在System Generator中使用多個(gè)時(shí)鐘域?qū)崿F(xiàn)復(fù)雜的DSP系統(tǒng)

了解如何在System Generator中使用多個(gè)時(shí)鐘域，從而可以實(shí)現(xiàn)復(fù)雜的DSP系統(tǒng)。

發(fā)表于 11-27 06:42 ?3714次閱讀

riscv如何實(shí)現(xiàn)自定義指令并用qemu運(yùn)行詳解

本文主要利用qemu模擬硬件平臺(tái)，實(shí)現(xiàn)特定指令解析，同時(shí)寫裸機(jī)代碼來測試該指令的運(yùn)行情況。當(dāng)然，如果實(shí)現(xiàn)的很好，是需要修改riscv的gcc的，讓自己的擴(kuò)展指令加入。這里不做修改，后面

發(fā)表于 05-02 10:24 ?7676次閱讀

RISCV該如何開啟和使用V擴(kuò)展指令？

機(jī)制 6.RVV使用體驗(yàn) 1.前言 RISCV V擴(kuò)展即向量指令擴(kuò)展（RVV），這部分作為研究AI加速計(jì)算領(lǐng)域有著非常關(guān)鍵的作用。既然的D1支持了rvv擴(kuò)展（0.7.1，最新的版本已經(jīng)0.10版本

發(fā)表于 06-18 16:28 ?9426次閱讀

如何在PHP代碼中使用HTTP代理IP

如何在PHP代碼中使用HTTP代理IP。

發(fā)表于 08-04 16:08 ?2399次閱讀

如何在Arduino中使用LDR

電子發(fā)燒友網(wǎng)站提供《如何在Arduino中使用LDR.zip》資料免費(fèi)下載

發(fā)表于 10-31 09:50 ?0次下載

如何在Arduino中使用Modbus

電子發(fā)燒友網(wǎng)站提供《如何在Arduino中使用Modbus.zip》資料免費(fèi)下載

發(fā)表于 11-22 11:21 ?14次下載

如何在Arduino中使用微型伺服

電子發(fā)燒友網(wǎng)站提供《如何在Arduino中使用微型伺服.zip》資料免費(fèi)下載

發(fā)表于 11-28 09:50 ?1次下載

如何在測試中使用ChatGPT

Dimitar Panayotov 在 2023 年 QA Challenge Accepted 大會(huì) 上分享了他如何在測試中使用 ChatGPT。

發(fā)表于 02-20 13:57 ?711次閱讀

搜索歷史

如何在在RISCV中使用DSP指令

1.概述

評論

如何在Linux中使用htop命令

RISCV的主流指令集有哪些？

如何在RISC-V中使用DSP指令？

RISCV自定義指令編譯報(bào)錯(cuò)怎么解決？

riscv實(shí)現(xiàn)自定義指令并用qemu運(yùn)行的過程

DSP匯編指令-典型指令

如何在典型的DSP應(yīng)用（框架）中使用IRTC接口的詳細(xì)資料概述

如何在System Generator中使用多個(gè)時(shí)鐘域?qū)崿F(xiàn)復(fù)雜的DSP系統(tǒng)

riscv如何實(shí)現(xiàn)自定義指令并用qemu運(yùn)行詳解

RISCV該如何開啟和使用V擴(kuò)展指令？

如何在PHP代碼中使用HTTP代理IP

如何在Arduino中使用LDR

如何在Arduino中使用Modbus

如何在Arduino中使用微型伺服

如何在測試中使用ChatGPT