在线视频国产99,国产一级婬片A片免费黈

介紹

本文中所涉及的AI邊緣推斷視覺處理芯片的實際用例都較為復雜，而且也需要牽扯到多個模塊參與，例如攝像頭輸入、多通道數據的媒體編解碼、圖像處理、多顯示支持等。要去協調這么多的模塊，還要將它們與神經網絡算法結合構建用例。

由于對系統(tǒng)中各個硬件要素的協調調度要求較多，AI視覺處理芯片需要更多使用固件去進行測試，這對于從IP/子系統(tǒng)層的測試用例到系統(tǒng)層的移植、以及在早期階段獲得較為準確的性能數據和功耗數據都提出了要求。這篇論文提供了一個作者在功能、性能和功耗這三個方面的硬件加速驗證方案。

問題闡述

不同于常見的SoC在數據傳輸和控制上的測試方案，AI視覺處理芯片往往需要結合多個高帶寬的多媒體控制器發(fā)起多個數據幀，模擬真實應用。而這么大的數據處理量，仿真往往會受制于仿真性能無法有較好的表現，所以在AI芯片驗證方面，如果想要測試真實場景，那么就需要將固件在硬件加速器（emulator）上去處理。

由于功能、性能、功耗三個方面的驗證在工具層面都缺少統(tǒng)一的平臺做處理，而且不同形式的測試向量和方法學也讓這些測試場景無法做到自動化映射。從工程實現角度考慮，一個需求是把功能測試的數據能夠給到性能分析和功耗評估，另外一個需求是將IP/子系統(tǒng)層面的測試用例能夠給到SoC層面測試。

功能驗證方案

下方給出了在采用固件驗證的情況下的測試方案。固件在早期驗證中，可能使用的是例如SystemC/C++這類的純軟件測試平臺，在此基礎上他們可以提供早期的固件和十六進制文件（在后期的硬件加速測試中使用）。同時，在IP/子系統(tǒng)硬件加速測試中，可以根據測試文件（二進制文件和log文件）做后處理繼而獲得測試中的硬件配置數據和圖形文件。

在接下來的SoC emulation，可以將從早期軟件測試中固件、IP/子系統(tǒng)emulation中提取的硬件配置、圖形文件共同作為SoC測試中的元素，讓他們用來盡可能實現從IP/子系統(tǒng)到SoC的測試場景移植。接下來可以利用emulator中的總線監(jiān)測組件，獲得總線傳輸數據，并將這些數據信息交由Python腳本去做處理，以便達到數據比較、性能監(jiān)測等目的。

這個方案意味著測試從大的層面來看，是以最終通過固件測試為目的，也就是說從一開始構建測試場景時，就需要固件的人參與其中。這就不得不考慮在開發(fā)AI視覺芯片時的驗證分工協作的場景不單單是simulation、emulation參與在內，也同樣需要固件。盡管一開始硬件可能還不穩(wěn)定，需要simulation/emulation讓硬件逐步穩(wěn)定，但固件的人只要前期有SystemC/C++這樣的模型在的話也可以在早期做固件有關的測試準備。

這一點挺重要的，如果固件的人直到emulation階段才參與進來的話，那么也就沒有上面方案里的Software Testbench部分了，所有的信息都只能等到IP/子系統(tǒng)emulation階段得出。更甚至，如果在IP/子系統(tǒng)emulation階段沒有固件參與的話，那么在SoC層面去做固件相關的測試，從開發(fā)固件測試用例到做參考比較都會延緩測試進度。更為推薦的是固件也有條件在某個測試平臺（software testbench、IP/subsys emulation testbench）完成測試。

還有一點，在IP/subsys階段的測試，方案中是通過測試中的bin文件、log文件來做后處理，繼而生成SoC層面可以使用的配置。這一點不同于我們以往所理解的將測試文件從IP/subsys到SoC階段的修改移植?？赡苁菫榱藢崿F準確的、自動化的配置參數，它是按照后處理的方式，提取出來對目標硬件做的各項配置，這些提取的信息可能按照某個格式做了中間信息的保存，并且結合SoC的結構特征，做了自動化的配置測試生成。

在SoC emulation階段，利用的是內置的總線監(jiān)測（可能有多個），周期性地獲得數據，并完成數據完整性檢查（可能在測試中或者測試后通過Python腳本完成）。

性能分析方案

在性能分析時，也需要利用測試場景的移植（porting）和分析時的多個深度。從IP/subsys到SoC的移植，就性能分析而言分為了3個階段。第1階段即是將IP/subsys的傳輸數據移植到SoC層面，這一點可以利用IP/subsys emulation過程中l(wèi)og文件的后處理來獲得。第2階段是將IP/subsys的固件移植到SoC層面，這一點也可以利用“功能驗證方案”中已有的“software testbench”信息。第3階段是為了讓多個多媒體控制器、接口的數據信息能夠并行運行以期達到真實的、大規(guī)模的數據吞吐。這種場景需要文中提到的一個特殊的混合方法（unique hybrid methodology），共同利用數據網絡（network）和固件，將多個多媒體控制器充分并行調動，構建復雜的測試場景。

?

功耗估測方案

在功耗估測中，需要考慮的是相比于通常在仿真中收集功耗有關數據，如何在emulation中收集數據，并且做到準確的、快速的功耗分析。在下面的方案中，利用了波形數據獲得開關信息文件SAIF，并結合power engine去獲得平均功耗和峰值功耗（論文并沒有就power engine給出詳細的信息）。這里附贈一篇文章：《Using Emulators For Power/Performance Tradeoffs》 https://semiengineering.com/using-emulators-for-power-performance-tradeoffs/

結果分析

受益于可以從IP/subsys層將測試用例有關的數據自動遷移到SoC級，使得與VPU（視覺處理單元）、DMA、ISP（Image Signal Processing）有關的測試用例能夠在4周的時間完成交付。這里的測試用例遷移我們應該吸取文章中的經驗，那就是它不是從測試用例自身文本的遷移去實現的，而是通過log/bin文件的后處理，獲得某種中間型的標準信息文件，再結合系統(tǒng)測試的環(huán)境配置數據，最終生成SoC測試用例。

從發(fā)現的bug類型來看，有接近40%來自于固件級別的測試，這也突出了AI類芯片在測試時需要結合實際場景的需求，畢竟整個系統(tǒng)的調動牽扯很多模塊，需要固件人員在早期就能夠參與進來。這也進一步突出了如何規(guī)劃一個跨平臺的方案在系統(tǒng)級測試上面有多么重要，我們不應該被SV/UVM/C所限制，也應該考慮如何讓這個測試平臺能夠被更多的人所使用。

相比于SoC仿真動輒需要用2天左右的時間完成某一個固件級的測試用例，emulation僅需要大概90分鐘的時間即能夠完成測試，并且更快地將性能數據反饋給架構組合設計組。在將simulation與emulation對比過程中，無論是固件測試用例數量、可支持數據幀的數目還是數據保存時間窗口，emulation的優(yōu)勢都更為明顯。

而在功耗評估中，emualtion的功耗評估數據準確度與傳統(tǒng)的功耗分析工具差別大致在5%以內，而所消耗的時間則顯著縮短（大致是傳統(tǒng)功耗分析工具的125倍）。論文這里仍然沒有給出消耗時間的計算方式，是否包含了每個測試用例在simulation與emulation的耗時差別，還是只是包含了兩種工具用于功耗評估的時間。如果是后者的話，那么文中的power engine可能是內部開發(fā)的工具了，線索在文章的引文中（有一篇“pre-silicon power estimation methodology using emulation”，也一并在論文下載鏈接中提供）。

給出的參考論文來自于SNUG India 2020，而在2021年的時候Synopsys推出了業(yè)界第一款用來對運行真實軟件做功耗驗證（hardware+software）的工具ZeBu Empower。 https://www.synopsys.com/verification/emulation/zebu-empower.html

Fastest Power Emulation for Hardware-Software Power Verification

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯系本站處理。舉報投訴

控制器

控制器

+關注

關注
112

文章
16111

瀏覽量
177085
soc

soc

+關注

關注
38

文章
4100

瀏覽量
217782
AI

AI

+關注

關注
87

文章
29824

瀏覽量
268116
硬件加速器

硬件加速器

+關注

關注
0

文章
41

瀏覽量
12749
視覺處理芯片

視覺處理芯片

+關注

關注
2

文章
10

瀏覽量
6586

原文標題：DVCon文賞-2023w14 一種用于AI視覺處理芯片的驗證加速方案

文章出處：【微信號：Rocker-IC，微信公眾號：路科驗證】歡迎添加關注！文章轉載請注明出處。

BitEnergy AI公司開發(fā)出一種新AI處理方法

BitEnergy AI公司，一家專注于人工智能（AI）推理技術的企業(yè)，其工程師團隊創(chuàng)新性地開發(fā)了一種名為線性復雜度乘法（L-Mul）的AI

發(fā)表于 10-22 15:15 ?307次閱讀

什么是AI服務器？AI服務器的優(yōu)勢是什么？

AI服務器是一種專門為人工智能應用設計的服務器，它采用異構形式的硬件架構，通常搭載GPU、FPGA、ASIC等加速芯片，利用CPU與加速

發(fā)表于 09-21 11:43 ?502次閱讀

EPSON差分晶振SG3225VEN頻點312.5mhz應用于AI加速卡

AI加速卡，通常也被稱為AI算力卡，是一種專為加速人工智能（AI）應用和算法而設計的硬件設備。

發(fā)表于 09-10 14:56 ?0次下載

AI視覺芯片技術升級，加速智能終端設備迭代

AR眼鏡。行業(yè)人士認為，AR眼鏡有望成為AI落地的理想載體。 ? AI 眼鏡對視覺芯片的要求 ? AI智能眼鏡作為新型可穿戴設備，既強調眼鏡

發(fā)表于 08-21 00:22 ?3536次閱讀

基于瑞薩RZ/V2H AI微處理器的解決方案：高性能視覺AI系統(tǒng)

復雜的實時物體識別及推理，同時功耗可與傳統(tǒng)的嵌入式MPU相媲美，無需冷卻風扇。這里介紹基于RZ/V2H的解決方案：高性能視覺AI系統(tǒng)。

發(fā)表于 07-02 18:36 ?429次閱讀

基于瑞薩RZ/V2H <b class='flag-5'>AI</b>微<b class='flag-5'>處理</b>器的解決<b class='flag-5'>方案</b>：高性能<b class='flag-5'>視覺</b><b class='flag-5'>AI</b>系統(tǒng)

AI視覺檢測系統(tǒng)在多方面實現技術創(chuàng)新

電子發(fā)燒友網報道（文/李彎彎）AI視覺檢測系統(tǒng)是一種基于AI技術的視覺分析系統(tǒng)，它通過模擬人類視覺

發(fā)表于 05-24 00:16 ?3229次閱讀

NVIDIA發(fā)布DeepStream 7.0，助力下一代視覺AI開發(fā)

NVIDIA DeepStream 是一款功能強大的 SDK，能夠提供用于構建端到端視覺 AI 管線的 GPU 加速構建模塊。

發(fā)表于 05-23 10:09 ?523次閱讀

如何通過視覺檢測確保eMMC存儲芯片質量？

eMMC（嵌入式多媒體卡）存儲芯片是一種集成式的存儲解決方案，通常用于嵌入式系統(tǒng)、智能手機、平板電腦、相機和其他便攜式設備中。eMMC存儲芯片

發(fā)表于 05-22 17:33 ?641次閱讀

risc-v多核芯片在AI方面的應用

得RISC-V多核芯片能夠更好地適應AI算法的不同需求，包括深度學習、神經網絡等，從而提高芯片的性能和效率，降低成本，使AI邊緣計算晶片更具競爭力。再者，RISC-V的多核設計可以進

發(fā)表于 04-28 09:20

是德科技推出AI數據中心測試平臺旨在加速AI/ML網絡驗證和優(yōu)化的創(chuàng)新

2024年2月29日，是德科技（Keysight Technologies,Inc.）宣布，針對人工智能（AI）和機器學習（ML）基礎設施生態(tài)系統(tǒng)，推出了 AI數據中心測試平臺，旨在加速AI

發(fā)表于 02-29 09:32 ?570次閱讀

家居智能化，推動AI加速器的發(fā)展

電子發(fā)燒友網報道（文/黃山明）AI加速芯片，也稱為人工智能加速器（AI Accelerator），是一種

發(fā)表于 02-23 00:18 ?4509次閱讀

【國產FPGA+OMAPL138開發(fā)板體驗】（原創(chuàng)）5.FPGA的AI加速源代碼

OMAP-L138（定點/浮點DSP C674x+ARM9）+ FPGA處理器的開發(fā)板。編寫一個用于AI加速的FPGA程序是

發(fā)表于 02-12 16:18

研究人員設計出一款脈沖型人工視覺芯片

人工視覺芯片是一種感算一體化的圖像傳感器，能夠單芯片完成圖像獲取和原位實時智能圖像處理等任務，是

發(fā)表于 01-17 09:17 ?804次閱讀

加速計算卡與AI顯卡有什么區(qū)別？

與原理 1. 加速計算卡：加速計算卡是一種用于高性能計算的硬件設備，主要用于加速復雜計算任務，如

發(fā)表于 01-09 14:10 ?1286次閱讀

PCIe在AI加速器中的作用

從線上購物時的“猜你喜歡”、到高等級自動駕駛汽車上的實時交通信息接收，再到在線視頻游戲，所有的這些都離不開人工智能（AI）加速器。AI加速器是一種

發(fā)表于 11-18 10:36 ?1992次閱讀