0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何手動編程將其無縫部署到TI處理器上

科技綠洲 ? 來源:德州儀器 ? 作者:德州儀器 ? 2022-04-08 11:41 ? 次閱讀

如果在沒有嵌入式處理器供應(yīng)商提供的合適工具和軟件的支持下,既想設(shè)計高能效的邊緣人工智能AI) 系統(tǒng),同時又要加快產(chǎn)品上市時間,這項工作難免會冗長乏味。面臨的一系列挑戰(zhàn)包括選擇恰當?shù)?a href="http://www.ttokpm.com/v/tag/448/" target="_blank">深度學習模型、針對性能和精度目標對模型進行訓練和優(yōu)化,以及學習使用在嵌入式邊緣處理器上部署模型的專用工具。

從模型選擇到在處理器上部署,TI 可免費提供相關(guān)工具、軟件和服務(wù),為您深度神經(jīng)網(wǎng)絡(luò) (DNN) 開發(fā)工作流程的每一步保駕護航。下面讓我們來了解如何不借助手動工具或手動編程來選擇模型、隨時隨地訓練模型并將其無縫部署到 TI 處理器上,從而實現(xiàn)硬件加速推理。

poYBAGJPq4-AEd3YAAFFGYKB5rA470.png

圖 1:邊緣 AI 應(yīng)用的開發(fā)流程

第一步:選擇模型

邊緣 AI 系統(tǒng)開發(fā)的首要任務(wù)是選擇合適的 DNN 模型,同時要兼顧系統(tǒng)的性能、精度和功耗目標。GitHub 上的 TI 邊緣 AI Model Zoo 等工具可助您加速此流程。

Model Zoo 廣泛匯集了 TensorFlow、PyTorch 和 MXNet 框架中常用的開源深度學習模型。這些模型在公共數(shù)據(jù)集上經(jīng)過預(yù)訓練和優(yōu)化,可以在 TI 適用于邊緣 AI 的處理器上高效運行。TI 會定期使用開源社區(qū)中的新模型以及 TI 設(shè)計的模型對 Model Zoo 進行更新,為您提供性能和精度經(jīng)過優(yōu)化的廣泛模型選擇。

Model Zoo 囊括數(shù)百個模型,TI 模型選擇工具(如圖 2 所示)可以幫助您在不編寫任何代碼的情況下,通過查看和比較性能統(tǒng)計數(shù)據(jù)(如推理吞吐量、延遲、精度和雙倍數(shù)據(jù)速率帶寬),快速比較和找到適合您 AI 任務(wù)的模型。

poYBAGJPq5eAWBo5AAEqrY8VgWA161.png

圖 2:TI 模型選擇工具

第二步:訓練和優(yōu)化模型

選擇模型后,下一步是在 TI 處理器上對其進行訓練或優(yōu)化,以獲得出色的性能和精度。憑借我們的軟件架構(gòu)和開發(fā)環(huán)境,您可隨時隨地訓練模型。

從 TI Model Zoo 中選擇模型時,借助訓練腳本可讓您在自定義數(shù)據(jù)集上為特定任務(wù)快速傳輸和訓練模型,而無需花費較長時間從頭開始訓練或使用手動工具。訓練腳本、框架擴展和量化感知培訓工具可幫助您優(yōu)化自己的 DNN 模型。

第三步:評估模型性能

在開發(fā)邊緣 AI 應(yīng)用之前,需要在實際硬件上評估模型性能。

TI 提供靈活的軟件架構(gòu)和開發(fā)環(huán)境,您可以在 TensorFlow Lite、ONNX RunTime 或 TVM 和支持 Neo AI DLR 的 SageMaker Neo 運行環(huán)境引擎三者中選擇習慣的業(yè)界標準 PythonC++ 應(yīng)用編程接口 (API),只需編寫幾行代碼,即可隨時隨地訓練自己的模型,并將模型編譯和部署到 TI 硬件上。在這些業(yè)界通用運行環(huán)境引擎的后端,我們的 TI 深度學習 (TIDL) 模型編譯和運行環(huán)境工具可讓您針對 TI 的硬件編譯模型,將編譯后的圖或子圖部署到深度學習硬件加速器上,并在無需任何手動工具的情況下實現(xiàn)卓越的處理器推理性能。

在編譯步驟中,訓練后量化工具可以自動將浮點模型轉(zhuǎn)換為定點模型。該工具可通過配置文件實現(xiàn)層級混合精度量化(8 位和 16 位),從而能夠足夠靈活地調(diào)整模型編譯,以獲得出色的性能和精度。

不同常用模型的運算方式各不相同。同樣位于 GitHub 上的 TI 邊緣 AI 基準工具可幫助您為 TI Model Zoo 中的模型無縫匹配 DNN 模型功能,并作為自定義模型的參考。

評估 TI 處理器模型性能的方式有兩種:TDA4VM 入門套件評估模塊 (EVM) 或 TI Edge AI Cloud,后者是一項免費在線服務(wù),可支持遠程訪問 TDA4VM EVM,以評估深度學習推理性能。借助針對不同任務(wù)和運行時引擎組合的數(shù)個示例腳本,五分鐘之內(nèi)便可在 TI 硬件上編程、部署和運行加速推理,同時收集基準測試數(shù)據(jù)。

第四步:部署邊緣 AI 應(yīng)用程序

您可以使用開源 Linux? 和業(yè)界通用的 API 來將模型部署到 TI 硬件上。然而,將深度學習模型部署到硬件加速器上只是難題的冰山一角。

為幫助您快速構(gòu)建高效的邊緣 AI 應(yīng)用,TI 采用了 GStreamer 框架。借助在主機 Arm? 內(nèi)核上運行的 GStreamer 插件,您可以自動將計算密集型任務(wù)的端到端信號鏈加速部署到硬件加速器和數(shù)字信號處理內(nèi)核上。

圖 3 展示了適用于邊緣 AI 的 Linux Processor SDK 的軟件棧和組件。

pYYBAGJPq6GAKmGUAAD7bEKICUM646.png

圖 3:適用于邊緣 AI 的 Linux Processor SDK 組件

結(jié)語

如果您對本文中提及的工具感到陌生或有所擔憂,請放寬心,因為即使您想要開發(fā)和部署 AI 模型或構(gòu)建 AI 應(yīng)用,也不必成為 AI 專家。TI Edge AI Academy 能夠幫助您在自學、課堂環(huán)境中通過測驗學習 AI 基礎(chǔ)知識,并深入了解 AI 系統(tǒng)和軟件編程。實驗室提供了構(gòu)建“Hello World” AI 應(yīng)用的分步代碼,而帶有攝像頭捕獲和顯示功能的端到端高級應(yīng)用使您能夠按照自己的節(jié)奏順利開發(fā) AI 應(yīng)用。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    18927

    瀏覽量

    227224
  • ti
    ti
    +關(guān)注

    關(guān)注

    112

    文章

    7919

    瀏覽量

    211570
  • 嵌入式處理器
    +關(guān)注

    關(guān)注

    0

    文章

    253

    瀏覽量

    30664
  • 軟件編程
    +關(guān)注

    關(guān)注

    1

    文章

    37

    瀏覽量

    11167
收藏 人收藏

    評論

    相關(guān)推薦

    2014年9月TI處理器深圳研討會火熱籌展啦

    親愛的嵌入式愛好者們:從傳感服務(wù),TI 處理器擁有可擴展的 ARM 和 DSP 的最廣泛產(chǎn)品組合,只需一個軟件平臺就可以簡化您的模塊開
    發(fā)表于 09-15 17:19

    【MangoTree】Atom-RIO的OEM版,適用于批量部署,無縫支持LabVIEW FPGA編程開發(fā)

    `【MangoTree】Atom-RIO的OEM版,適用于批量部署,無縫支持LabVIEW FPGA編程開發(fā)Atom-RIO的OEM版,便于Atom-RIO的批量部署。高性價比。程序?qū)?/div>
    發(fā)表于 06-14 16:44

    使多種TI處理器實現(xiàn)統(tǒng)一的單個軟件平臺

    憑借全新的處理器軟件開發(fā)套件(SDK),TI 已經(jīng)統(tǒng)一了開發(fā)并簡化了遷移過程,范圍覆蓋了最新的 Sitara 處理器和數(shù)字信號處理器系列。所有受支持的器件均可共享一個具有圖形導航、工具
    發(fā)表于 09-04 14:39

    什么是ARM處理器 ARM處理器有哪些系列

    ARM 處理器是一種低功耗高性能的 32 位 RISC(精簡指令系統(tǒng))處理器。從結(jié)構(gòu) 入手對其進行分析,并針對目前流行的 ARM920T 核詳細描述其硬件結(jié)構(gòu)和編程。ARM 處理器共有
    發(fā)表于 09-24 17:47

    怎么使用ARM處理器的GPU進行編程工作呢

    怎么使用ARM處理器的GPU進行編程工作呢?有哪位大神可以解釋一下
    發(fā)表于 08-04 14:17

    嵌入式邊緣AI應(yīng)用開發(fā)指南

    保駕護航。下面讓我們來了解如何不借助手動工具或手動編程來選擇模型、隨時隨地訓練模型并將其無縫部署
    發(fā)表于 11-03 06:53

    ARM微處理器編程模型

    簡介ARM微處理器編程模型的一些基本概念,包括工作狀態(tài)切換、數(shù)據(jù)的存儲格式、處理器異常等,通過對本章的閱讀,希望讀者能了解ARM微處理器的基本工作原理和一些與程序設(shè)計
    發(fā)表于 09-09 14:54 ?382次下載

    ARM微處理器編程模型

    ARM微處理器編程模型 目錄ARM微處理器的工作狀態(tài)ARM體系結(jié)構(gòu)的存儲格式指令長度及數(shù)據(jù)類型ARM微處理器的工作模式ARM體系結(jié)構(gòu)的
    發(fā)表于 02-21 09:14 ?50次下載

    固定圖形管線編程處理器的演變

    從圖形學算法圖形庫函數(shù)再到硬件圖形管線,圖形處理器用硬件固化算法,加速數(shù)據(jù)流處理;從固定圖形管線編程圖形管線,圖形
    發(fā)表于 11-18 10:22 ?705次閱讀
    固定圖形管線<b class='flag-5'>到</b>可<b class='flag-5'>編程</b>流<b class='flag-5'>處理器</b>的演變

    完全可擴展的軟件開發(fā)套件提供TI TI處理器產(chǎn)品組合的簡化開發(fā)

    ?處理器和數(shù)字信號處理器(DSP)系列,允許客戶在各種終端產(chǎn)品中使用TI處理器系列,并提供從一個設(shè)備下一個設(shè)備的簡化遷移。直觀的開發(fā)環(huán)境
    的頭像 發(fā)表于 08-09 16:20 ?1988次閱讀

    EE-294:Blackfin處理器的節(jié)能編程

    EE-294:Blackfin處理器的節(jié)能編程
    發(fā)表于 04-20 20:40 ?0次下載
    EE-294:Blackfin<b class='flag-5'>處理器</b><b class='flag-5'>上</b>的節(jié)能<b class='flag-5'>編程</b>

    EE-350:MEMS麥克風與Blackfin處理器無縫接口

    EE-350:MEMS麥克風與Blackfin處理器無縫接口
    發(fā)表于 04-29 14:44 ?4次下載
    EE-350:MEMS麥克風與Blackfin<b class='flag-5'>處理器</b>的<b class='flag-5'>無縫</b>接口

    EE-266:在ADSP-2136x和ADSP-21371 SHARC?處理器編程S/PDIF

    EE-266:在ADSP-2136x和ADSP-21371 SHARC?處理器編程S/PDIF
    發(fā)表于 05-08 10:14 ?7次下載
    EE-266:在ADSP-2136x和ADSP-21371 SHARC?<b class='flag-5'>處理器</b><b class='flag-5'>上</b><b class='flag-5'>編程</b>S/PDIF

    EE-223:SHARC?處理器的在線閃存編程

    EE-223:SHARC?處理器的在線閃存編程
    發(fā)表于 05-19 09:51 ?1次下載
    EE-223:SHARC?<b class='flag-5'>處理器</b><b class='flag-5'>上</b>的在線閃存<b class='flag-5'>編程</b>

    EE-280:ADSP-2106x SHARC?處理器的在線閃存編程

    EE-280:ADSP-2106x SHARC?處理器的在線閃存編程
    發(fā)表于 05-19 10:06 ?2次下載
    EE-280:ADSP-2106x SHARC?<b class='flag-5'>處理器</b><b class='flag-5'>上</b>的在線閃存<b class='flag-5'>編程</b>