最近的視覺AI模型必須處理動態(tài)和復雜的環(huán)境,因此在實時應用中需要更高的能效和速度。
為了滿足市場需求,瑞薩發(fā)布了下一代動態(tài)可重構人工智能處理器(DRP-AI)加速器。DRP-AI加速器提供10 TOPS/W的高功率效率,比傳統(tǒng)技術高出10倍,它可以在低功耗的傳統(tǒng)嵌入式處理器(MPU)上面運行復雜的圖像AI模型,而不需要像以前一樣采用高功耗的GPU來運行。
除了這個AI加速器外,高端RZ/V2H MPU還配備了使用動態(tài)可重構處理器(DRP)的圖像處理加速器、運行頻率高達1.8GHz的四核Linux處理器Arm Cortex-A55、雙核800MHz Arm Cortex-R8高速實時處理器和I/O處理Arm Cortex-M33子內核,采用異構多處理器配置。
動態(tài)可重構處理器(DRP)
七個基于Arm的CPU內核、下一代DRP-AI和DRP的組合,可以立即處理機械控制中的圖像識別和AI判斷結果,使其成為下一代自主機器人、自主移動機器人、無人機和其他應用的理想AI處理器。
下一代AI加速器DRP-AI
RZ/V2M、RZ/V2L和RZ/V2MA嵌入了瑞薩電子獨創(chuàng)的DRP-AI加速器,但瑞薩已將其獨創(chuàng)的AI加速器DRP-AI升級為下一代,以滿足最近的市場需求。
為了大幅提高電源效率,DRP-AI應用了INT8量化和硬件支持,用于非結構化修剪,這是傳統(tǒng)AI加速器難以實現的,以實現高達80 TOPS的推理性能和10 TOPS/W的電源效率。
下一代高能效AI加速器(DRP-AI3):自治系統(tǒng)高級AI中的嵌入式處理速度提高10倍”白皮書
下圖1顯示了AI推理性能與其他RZ/V產品的比較。以ResNet-50為例,典型的分類卷積神經網絡(CNN)的性能比不修剪的RZ/V2L高14倍(密集模型),采用模型修剪后的RZ/V2H比RZ/V2L(密集模型)性能高45倍。
圖1 RZ/V系列AI推理性能(不包括前/后處理)
通過動態(tài)可重構處理器DRP打開CV加速
甚至在深度學習出現之前,各種方法就已被用于圖像識別和決策的應用中。OpenCV這個開源的計算機視覺庫就是這樣一個例子。即使現在有了AI圖像處理,OpenCV仍然是一項非常有用的技術。Vision AI和OpenCV現在都在適當的場景一起使用。
為了加速AI和OpenCV等各種圖像處理算法,RZ/V2H MPU設計了與DRP-AI分離的動態(tài)可重構處理器,為OpenCV加速器提供DRP庫,充分利用其靈活性。
圖2比較了具有DRP的OpenCV加速器與RZ/V2H四核CPU的性能。例如,通過使用DRP加速,用于圖像邊緣檢測的Sobel濾波器從7.6fps提高到123fps的速度,提高了16倍。
圖2 OpenCV加速器性能基準測試
AI異構配置+高速實時控制
雖然快速多核Linux處理器是圖像AI的最佳選擇,但它需要大量的內存資源,并且很難實現機械控制所需的亞毫秒級實時性能。
為了解決這個問題,RZ/V2H使用四核Cortex-A55來運行包括AI處理在內的Linux程序,并使用專用的高速實時處理器在需要高實時性能的應用(如電機控制)中進行RTOS處理。
通過使用OpenAMP進行處理器間不同操作系統(tǒng)的通信連接,DRP-AI和Linux處理器做出的決策結果可以反映在RTOS處理器的實時機械控制中。
圖3 RZ/V2H框圖
具有這些獨特功能的RZ/V2H嵌入式AI微處理器已投入量產,RZ/V2H評估板也可用于快速啟動您的下一個視覺AI開發(fā)。
審核編輯:劉清
-
處理器
+關注
關注
68文章
19100瀏覽量
228807 -
機器人
+關注
關注
210文章
28102瀏覽量
205843 -
加速器
+關注
關注
2文章
790瀏覽量
37674 -
MPU
+關注
關注
0文章
340瀏覽量
48699 -
人工智能
+關注
關注
1789文章
46652瀏覽量
237060
原文標題:RZ/V2H MPU提高了機器人和自主應用中的AI性能和實時控制
文章出處:【微信號:瑞薩MCU小百科,微信公眾號:瑞薩MCU小百科】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論