0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當(dāng)深度學(xué)習(xí)遇上TDA4

星星科技指導(dǎo)員 ? 來源:TI ? 作者:Fredy Zhang;Kangjia ? 2023-03-15 10:09 ? 次閱讀

深度學(xué)習(xí)機(jī)器學(xué)習(xí)的一個(gè)子集,常用于自然語言處理,計(jì)算機(jī)視覺等領(lǐng)域,與眾不同之處在于,DL(Deep Learning )算法可以自動(dòng)從圖像、視頻或文本等數(shù)據(jù)中學(xué)習(xí)數(shù)據(jù)特征。DL可以直接從數(shù)據(jù)中學(xué)習(xí),這比較類似于人腦的運(yùn)行方式,獲得更多數(shù)據(jù)后,準(zhǔn)確度也會(huì)越來越高。TIDL(TI Deep Learning Library) 是TI平臺(tái)基于深度學(xué)習(xí)算法的軟件生態(tài)系統(tǒng),可以將一些常見的深度學(xué)習(xí)算法模型快速的部署到TI嵌入式平臺(tái)。 TDA4擁有TI最新一代的深度學(xué)習(xí)加速模塊C7x DSP與MMA矩陣乘法加速器,可以運(yùn)行TIDL進(jìn)行卷積等基本計(jì)算,從而快速地進(jìn)行前向推理,得到計(jì)算結(jié)果。 當(dāng)深度學(xué)習(xí)遇上TDA4,你的模型部署流程將變得簡單,你的模型將高效地運(yùn)行在TDA4上。

TI 最新一代的汽車處理器TDA4VM集成了高性能計(jì)算單元C7x DSP(Digital Signal Processor)和Deep-learning Matrix Multiply Accelerator(MMA),可以高效地進(jìn)行卷積計(jì)算、矩陣變換等一些基本地深度學(xué)習(xí)算子。TIDL 是TI的針對(duì)于嵌入式平臺(tái)部署深度學(xué)習(xí)不方便,計(jì)算效率低下而設(shè)計(jì)的一個(gè)軟件生態(tài)系統(tǒng),用于加速 TI 嵌入式設(shè)備上的深度神經(jīng)網(wǎng)絡(luò)Deep Neural Networks (DNN)計(jì)算加速。 上一代產(chǎn)品 TDA2/3 系列處理器,集成了計(jì)算單元 DSP(Digital Signal Processor)和 EVE(Embedded Vision/Vector Engine),用于加速計(jì)算深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。相比于上一代TDA2/TDA3系列處理器,最新一代的TDA4處理器在算例上得到了大幅提高的同時(shí),在軟件方面提供了更好地支持,同時(shí)提供了更多的深度學(xué)習(xí)模型的部署示例,方便開發(fā)人員快速開發(fā)迭代產(chǎn)品,極大地縮短的產(chǎn)品開發(fā)周期。

pYYBAGQRKMqAH9FhAAFvNQDUgPE901.png

圖1. TIDL SW Framework

基于深度神經(jīng)網(wǎng)絡(luò) (DNN) 的機(jī)器學(xué)習(xí)算法用于許多行業(yè),例如機(jī)器人工業(yè)和汽車。越來越多的基于 DNN 的機(jī)器學(xué)習(xí)算法被應(yīng)用于 ADAS 產(chǎn)品中,如車道線檢測(cè),交通信號(hào)燈識(shí)別,行人識(shí)別等ADAS基礎(chǔ)功能均采用DNN算法實(shí)現(xiàn)。這些DNN神經(jīng)網(wǎng)絡(luò)算法通常需要大量的計(jì)算,而TI TDA4系列處理器中的C7x和MMA可以將一些DNN中的算子進(jìn)行加速計(jì)算,以實(shí)現(xiàn)快速推理得到識(shí)別結(jié)果。RTOS SDK 中集成了眾多的Demo展示TIDL在TDA4處理器上對(duì)實(shí)時(shí)的語義分割和 SSD 目標(biāo)檢測(cè)的能力。如下圖2:AVP的demo展示了使用TIDL對(duì)泊車點(diǎn)、車輛的檢測(cè)。

pYYBAGQRKMuAeg4sAAEMaFGB14E810.png

圖2. TIDL SW Framework

TIDL當(dāng)前支持的訓(xùn)練框架有Tensorflow、Pytorch、Caffe等,用戶可以根據(jù)需要選擇合適的訓(xùn)練框架進(jìn)行模型訓(xùn)練。TIDL可以將PC端訓(xùn)練好的模型導(dǎo)入編譯生成TIDL可以識(shí)別的模型格式,同時(shí)在導(dǎo)入編譯過程中進(jìn)行層級(jí)合并以及量化等操作,方便導(dǎo)入編譯后的模型高效的運(yùn)行在具有高性能定點(diǎn)數(shù)據(jù)感知能力TDA4硬件加速器上。 TIDL提供了一些的工具,如模型導(dǎo)入工具,模型可視化工具等,非常便捷地可以對(duì)訓(xùn)練好地模型進(jìn)行導(dǎo)入。

poYBAGQRKMyADFmTAABsREPFg54349.png

圖3. TIDL Tools

TIDL Runtime 是運(yùn)行在TDA4端的實(shí)時(shí)推理單元,同時(shí)提供了TIDL的運(yùn)行環(huán)境,對(duì)于input tensor,TIDL TIOVX Node 調(diào)用TIDL 的深度學(xué)習(xí)加速庫進(jìn)行感知,并將結(jié)果進(jìn)行輸出。

pYYBAGQRKM2AJiObAABamsWM3iI992.png

圖4. TIDL Runtime

如圖5所示,是TIDL的軟件框架。在TIDL上,深度學(xué)習(xí)網(wǎng)絡(luò)應(yīng)用開發(fā)主要分為三個(gè)大的步驟(以TI Jacinto7TM TDA4VM處理器為例):

pYYBAGQRKM6AbMypAABOgWqM8K8253.png

圖5. TIDL SW Framework

基于Tensorflow、Pytorch、Caffe 等訓(xùn)練框架,訓(xùn)練模型:選擇一個(gè)訓(xùn)練框架,然后定義模型,最后使用相應(yīng)的數(shù)據(jù)集訓(xùn)練出滿足需求的模型。

基于TI Jacinto7TM TDA4VM處理器導(dǎo)入模型: 訓(xùn)練好的模型,需要使用TIDL Importer工具導(dǎo)入成可在TIDL上運(yùn)行的模型。導(dǎo)入的主要目的是對(duì)輸入的模型進(jìn)行量化、優(yōu)化并保存為TIDL能夠識(shí)別的網(wǎng)絡(luò)模型和網(wǎng)絡(luò)參數(shù)文件。

基于TI Jacinto7TM SDK 驗(yàn)證模型,并在應(yīng)用里面部署模型:

PC 上驗(yàn)證并部署

在PC上使用TIDL推理引擎進(jìn)行模型測(cè)試。

在PC上使用OpenVX框架開發(fā)程序,在應(yīng)用上進(jìn)行驗(yàn)證。

EVM上驗(yàn)證并部署

在EVM上使用TIDL推理引擎進(jìn)行模型測(cè)試。

在EVM上使用OpenVX框架開發(fā)程序,在應(yīng)用上進(jìn)行驗(yàn)證

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5046

    文章

    18817

    瀏覽量

    298535
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7174

    瀏覽量

    87153
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120591
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    芯品#TDA4AEN-Q1 具有AI功能的汽車級(jí) ADAS SoC

    VEN/TDA4AEN 具有嵌入式深度學(xué)習(xí) (DL)、視頻、視覺處理和 3D 圖形加速、顯示接口和廣泛的汽車外設(shè)和網(wǎng)絡(luò)選項(xiàng),專為一系列成本和功耗敏感型汽車應(yīng)用(例如 NCAP 前置攝像頭或入門級(jí)泊車輔助系統(tǒng))而構(gòu)建
    的頭像 發(fā)表于 05-08 12:00 ?4537次閱讀
    芯品#<b class='flag-5'>TDA4</b>AEN-Q1 具有AI功能的汽車級(jí) ADAS SoC

    spark和深度學(xué)習(xí)的基本原理

    當(dāng)Spark遇上TensorFlow分布式深度學(xué)習(xí)框架原理和實(shí)踐
    發(fā)表于 09-09 08:46

    TDA4對(duì)深度學(xué)習(xí)的重要性

    快速的部署到TI嵌入式平臺(tái)。 TDA4擁有TI最新一代的深度學(xué)習(xí)加速模塊C7x DSP與MMA矩陣乘法加速器,可以運(yùn)行TIDL進(jìn)行卷積等基本計(jì)算,從而快速地進(jìn)行前向推理,得到計(jì)算結(jié)果。 當(dāng)
    發(fā)表于 11-03 06:53

    超異構(gòu)芯片TDA4內(nèi)核解析

    1、超異構(gòu)芯片TDA4內(nèi)核解析超異構(gòu)芯片最近是比較火的一個(gè)名詞,其集中特性是將各類不同的芯片內(nèi)核進(jìn)行融合,這種集成式芯片設(shè)計(jì)可以充分整合芯片資源,進(jìn)一步提升數(shù)據(jù)計(jì)算效率。并且由于芯片在設(shè)計(jì)之初就打
    發(fā)表于 12-09 16:29

    基于深度學(xué)習(xí)算法的軟件生態(tài)系統(tǒng)

    模型快速的部署到TI嵌入式平臺(tái)。 TDA4擁有TI最新一代的深度學(xué)習(xí)加速模塊C7x DSP與MMA矩陣乘法加速器,可以運(yùn)行TIDL進(jìn)行卷積等基本計(jì)算,從而快速地進(jìn)行前向推理,得到計(jì)算結(jié)果。 當(dāng)
    的頭像 發(fā)表于 06-30 17:01 ?1991次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>算法的軟件生態(tài)系統(tǒng)

    TDA4行泊一體,打開智能駕駛的新篇章

    TDA4行泊一體,打開智能駕駛的新篇章
    發(fā)表于 10-28 11:59 ?13次下載
    單<b class='flag-5'>TDA4</b>行泊一體,打開智能駕駛的新篇章

    當(dāng)深度學(xué)習(xí)遇上TDA4

    當(dāng)深度學(xué)習(xí)遇上TDA4
    發(fā)表于 10-28 11:59 ?2次下載
    <b class='flag-5'>當(dāng)</b><b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>遇上</b><b class='flag-5'>TDA4</b>

    TDA4動(dòng)態(tài)熱檢測(cè)與控制方案

    TDA4動(dòng)態(tài)熱檢測(cè)與控制方案
    發(fā)表于 10-28 11:59 ?1次下載
    <b class='flag-5'>TDA4</b>動(dòng)態(tài)熱檢測(cè)與控制方案

    德州儀器TDA4背后的OpenVX介紹

    近年來行泊一體大行其道,德州儀器的TDA4占了行泊一體大約70%的市場(chǎng)。其背后關(guān)鍵的就是OpenVX。
    的頭像 發(fā)表于 02-16 09:18 ?7844次閱讀

    TDA4 SPL SBL啟動(dòng)流程簡析

    TDA4是TI推出的一款高性能、超異構(gòu)的多核SoC,擁有ARM Cortex-R5F、ARM Cortex-A72、C66以及C71內(nèi)核,可以部署AUTOSAR CP系統(tǒng)、HLOS(Linux或
    的頭像 發(fā)表于 10-24 16:37 ?1960次閱讀
    <b class='flag-5'>TDA4</b> SPL SBL啟動(dòng)流程簡析

    TDA4刷寫技術(shù)

    電子發(fā)燒友網(wǎng)站提供《TDA4刷寫技術(shù).pdf》資料免費(fèi)下載
    發(fā)表于 08-23 10:15 ?2次下載
    <b class='flag-5'>TDA4</b>刷寫技術(shù)

    TDA4:定制電路板啟動(dòng)指南

    電子發(fā)燒友網(wǎng)站提供《TDA4:定制電路板啟動(dòng)指南.pdf》資料免費(fèi)下載
    發(fā)表于 08-28 11:50 ?0次下載
    <b class='flag-5'>TDA4</b>:定制電路板啟動(dòng)指南

    TDA4系列的SPI啟用和驗(yàn)證

    電子發(fā)燒友網(wǎng)站提供《TDA4系列的SPI啟用和驗(yàn)證.pdf》資料免費(fèi)下載
    發(fā)表于 09-04 10:50 ?0次下載
    <b class='flag-5'>TDA4</b>系列的SPI啟用和驗(yàn)證

    基于Pytorch訓(xùn)練并部署ONNX模型在TDA4應(yīng)用筆記

    電子發(fā)燒友網(wǎng)站提供《基于Pytorch訓(xùn)練并部署ONNX模型在TDA4應(yīng)用筆記.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 09:24 ?0次下載
    基于Pytorch訓(xùn)練并部署ONNX模型在<b class='flag-5'>TDA4</b>應(yīng)用筆記

    TDA4 Edge AI處理器的性能和效率基準(zhǔn)測(cè)試

    電子發(fā)燒友網(wǎng)站提供《TDA4 Edge AI處理器的性能和效率基準(zhǔn)測(cè)試.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 09:21 ?0次下載
    <b class='flag-5'>TDA4</b> Edge AI處理器的性能和效率基準(zhǔn)測(cè)試