0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一文了解Intel?Developer Cloud之DL Workbench深度學習工作臺

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2023-05-12 09:37 ? 次閱讀

文章作者:周兆靖

DL Workbench 深度學習工作臺

是 OpenVINO軟件棧中非常重量級的一個工具

涉及到的內(nèi)容和操作比較多

決定還是另起一篇來介紹!

1.概述介紹

如果您對深度學習感興趣,DL Workbench 提供了更為直觀的學習平臺:帶您了解什么是神經(jīng)網(wǎng)絡,神經(jīng)網(wǎng)絡是如何工作的,以及如何檢查它們的架構。您可以在開發(fā)產(chǎn)品之前,學習神經(jīng)網(wǎng)絡的分析和優(yōu)化網(wǎng)絡的基礎知識,以及熟悉 OpenVINO生態(tài)系統(tǒng)及其主要組件。如果您是資深的 AI 工程師,DL Workbench 將為您提供一個方便的 web 界面,以實時優(yōu)化您的模型并可以為您的產(chǎn)品落地進行加速。

DL Workbench 可以很方便地測量和分析模型性能,同時在實驗中調整模型以提高性能,最終分析模型的拓撲結構并產(chǎn)生可視化輸出。DL Workbench 的工作流程如下圖所示:

1d52eaa2-f005-11ed-90ce-dac502259ad0.png

圖1-1 DL Workbench 的工作流程

英特爾提供了兩種運行 DL workbench(DLWB)環(huán)境?;诒镜?a href="http://www.ttokpm.com/v/tag/1751/" target="_blank">硬件的 DLWB 環(huán)境,訪問的算力僅限本地現(xiàn)有的算力資源;基于 IntelDeveloper Cloud 的 DLWB 提供了豐富的算力選項用于模型的橫向對比和分析,同時提供了類似本地化的用戶操作體驗。

IntelDeveloper Cloud 平臺上運行 DLWB 方法:

Run DL Workbench in Intel DevCloud

https://docs.openvino.ai/latest/workbench_docs_Workbench_DG_Start_DL_Workbench_in_DevCloud.html

(復制鏈接到瀏覽器打開)

本地硬件運行 DLWB 的方法:

Run DL Workbench on Local System

https://docs.openvino.ai/latest/workbench_docs_Workbench_DG_Run_Locally.html

(復制鏈接到瀏覽器打開)

接下來我們在 Intel Developer Cloud 平臺來運行 DLWB,無需安裝,直接運行。

2. 啟動DL Workbench

在 Intel Developer Cloud 平臺上啟動 DL Workbench 的步驟如下:

1打開 Work with Intel Distribution of OpenVINO Toolkit 頁面:

https://www.intel.com/content/www/us/en/developer/tools/devcloud/edge/overview.html

(復制鏈接到瀏覽器打開)

劃到頁面下半部分,點擊 Deep Learning Workbench:

https://www.intel.com/content/www/us/en/developer/tools/devcloud/edge/build/overview.html

(復制鏈接到瀏覽器打開)

1d85c1de-f005-11ed-90ce-dac502259ad0.png

圖2-1 DL Workbench啟動一

2運行第一個 Cell 里的代碼,之后會出現(xiàn)“Start Application”,點擊“Start Application”并等待初始化完成,進入點擊“Launch DL Workbench”啟動 DL Workbench( 以下簡稱 DLWB):

1db419f8-f005-11ed-90ce-dac502259ad0.png

圖2-2 DL Workbench 啟動二

3. 使用DL Workbench評估模型性能

DLWB 的主界面如下圖所示,點擊 “Create Project” 進行模型評估:

1dd92e6e-f005-11ed-90ce-dac502259ad0.png

圖3-1 創(chuàng)建 Project

步驟一

模型選擇

首先點擊“import model”,導入需要評估的模型。Open Model Zoo 是我們提供的一個在線模型庫,你可以直接從庫中下載需評估的模型,當然,你也可以上傳你的本地的模型文件,既可以是 IR 格式,也可以是原生的模型格式:

1dfbf192-f005-11ed-90ce-dac502259ad0.png

圖3-2 選擇模型

步驟二

設備選擇

單擊選定模型完成之后,請點擊“Select an Environment”,這里可以選定你部署的設備節(jié)點,Intel DevCloud 平臺的設備都可以進行實驗:

1e4f87b2-f005-11ed-90ce-dac502259ad0.png

圖3-3 選擇設備一

你可以在”Device” 下拉菜單里選擇該模型運行在 CPU 上還是集成 GPU 上:

1e71180a-f005-11ed-90ce-dac502259ad0.png

圖3-3 選擇設備二

步驟三

數(shù)據(jù)集選擇

點擊“Next Step”之后進入數(shù)據(jù)集選擇頁面,點擊“import Dataset”,你可以選擇使用 DLWB 提供的圖像創(chuàng)建一個數(shù)據(jù)集,或者通過本地上傳已有的數(shù)據(jù)集,例如 COCO,VOC,ImageNET 等格式的數(shù)據(jù)集:

1e8854f2-f005-11ed-90ce-dac502259ad0.png

圖3-4 選擇數(shù)據(jù)集

步驟四

推理性能測試

點擊“Create Project”之后,開始運行推理,等待推理完成之后,可以直觀的看到模型的 FPS 指標,以 FPS 值來判斷這個模型的性能水平:

1ea5f214-f005-11ed-90ce-dac502259ad0.png

圖3-5 推理性能測試

4. DL Workbench 模型調試

4.1模型單層運行時間統(tǒng)計

在模型網(wǎng)絡分析板塊,DLWB 可以計算出模型中每一層的消耗時間,可以以此進行網(wǎng)絡分析,從而決定下一步的優(yōu)化策略。

1ebfde72-f005-11ed-90ce-dac502259ad0.png

圖4-1 模型單層運行時間統(tǒng)計

4.2模型層各精度占比統(tǒng)計

根據(jù)這個圖表,你可以很直觀的看到該模型層中每種精度的占比情況。若你覺得你可以降低 FP32 精度層的占比,你可以根據(jù)自己的需求,對高精度層實行量化操作,使其精度下降,并確保模型準確度下降在可接受的范圍內(nèi),這樣可以使得模型推理速度更為快速。

1eedc4b8-f005-11ed-90ce-dac502259ad0.png

圖4-2 模型層各精度占比統(tǒng)計

4.3模型網(wǎng)絡拓撲展示

這個部分通過直接展示模型的拓撲結構圖和模型的層屬性,讓開發(fā)者對此模型能有一個更清晰與直觀的認識。

1f0b062c-f005-11ed-90ce-dac502259ad0.png

圖4-3 模型網(wǎng)絡拓撲展示

4.4模型優(yōu)化建議

下拉頁面,可以看到 DLWB 會自動針對你的模型提供性能提升的建議。比如在這個模型中,它檢測到該模型有0%的層運行在 INT8 整型精度上,所以它建議我們對模型進行 INT8 精度校驗。

1f33b298-f005-11ed-90ce-dac502259ad0.png

圖4-4 DLWB 對模型性能提升的優(yōu)化建議

4.5校準模型成為 INT8 精度模型

在“Perform”選項中,包含了對于模型優(yōu)化評估的多種策略。例如,通過校驗模型層從 FP32 到 INT8 來優(yōu)化推理性能:優(yōu)化步驟會將原本 FP32 精度格式的模型層校準量化成精度為 INT8 的模型層,不用重訓練并且可以控制精度下降不超過1%的范圍。

1f73533a-f005-11ed-90ce-dac502259ad0.png

圖4-5 校準為 INT8 模型層介紹頁面

選擇默認模式,點擊啟動優(yōu)化,即可完成低精度優(yōu)化:

1fa40e76-f005-11ed-90ce-dac502259ad0.png

圖4-6 選擇校準為 INT8 模型層的算法

完成以后,你可以在模型主頁看到已優(yōu)化的模型和未優(yōu)化的模型,可以看到模型推理吞吐量獲得了巨大的提升:

1fd28e40-f005-11ed-90ce-dac502259ad0.png

圖4-7 精度為 FP32 精度與 INT8 精度模型的性能對比

4.6創(chuàng)建模型準確度報告

在“Perform”標簽下,選擇“Create Accuracy Report”,點擊創(chuàng)建報告,就可以得到當前模型校驗當前數(shù)據(jù)集獲得的識別準確度。

1ff88a32-f005-11ed-90ce-dac502259ad0.png

圖4-8 創(chuàng)建模型識別準確度報告

當你同時有 FP32 精度模型和 INT8 精度模型時,你可以通過準確度測算報告來獲得詳細的準確度信息。標注于“Accuracy”一欄中。

201d2d06-f005-11ed-90ce-dac502259ad0.png

圖4-9 對比 INT8 模型與 FP32 模型識別準確度與推理性能數(shù)據(jù)

最終,我們發(fā)現(xiàn)同樣一個拓撲結構的模型,模型各層主要精度分別為 FP32 和 INT8,實測 FPS 的數(shù)據(jù)為 FP32 的 135.5FPS,而 INT8 精度的模型高達 450.46FPS,且前提是在準確度下降在百分之一的范圍內(nèi)。說明低精度推理對于模型推理計算的性能提升還是非??捎^的。

4.7設置多組推理參數(shù),獲取最優(yōu)推理參數(shù)

優(yōu)化策略中也包含了對于推理參數(shù)的組合設定,通過“Group Inference”實現(xiàn):

2044d45a-f005-11ed-90ce-dac502259ad0.png

圖4-10 Group Inference 設置

在此選擇你需要測試的多個 Stream 數(shù)值,以及 Batch 的數(shù)值,組合推理測試結果將會以圖表的方式展現(xiàn),以幫助你找到該模型的在此設備上的最佳推理參數(shù):

206475d0-f005-11ed-90ce-dac502259ad0.png

圖4-11 推理測試結果展示

4.8橫向/縱向模型性能評估

完成了單個模型的性能評估,可以使用不同的設備對此模型進行多次深入評估。

2084986a-f005-11ed-90ce-dac502259ad0.png

圖4-12 橫向模型性能對比

由此可知,你可以從橫向(精度格式,batch size,steam)對模型進行評估,也可以從縱向(不同的設備,CPU/iGPU)來比較同一個模型的性能水平。當然也可以在相同的機器上選擇測試兩個不一樣的模型來評估兩個模型的性能優(yōu)劣。

20b60a8a-f005-11ed-90ce-dac502259ad0.png

圖4-13 縱向模型性能對比

5.總結

DL workbench 工具集成了非常多的功能,方便開發(fā)者的調用。由于篇幅的限制,本篇的介紹并不能全部覆蓋,僅就 DL workbench 功能做分享。更多功能,請登陸Intel Developer Cloud 平臺來嘗試吧!

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    60

    文章

    9748

    瀏覽量

    170644
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4717

    瀏覽量

    100006
  • intel
    +關注

    關注

    19

    文章

    3474

    瀏覽量

    185356
  • Developer
    +關注

    關注

    0

    文章

    24

    瀏覽量

    6386
  • 深度學習
    +關注

    關注

    73

    文章

    5422

    瀏覽量

    120591

原文標題:一文了解Intel? Developer Cloud 之DL Workbench深度學習工作臺 | 開發(fā)者實戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    模具工作臺檢測應用案例

    、需求描述某模具商有種模具設備的工作臺,他們想要對該模具工作臺進行檢測,獲取精確數(shù)據(jù)來比對偏差。之前檢測手段十分局限,用卡尺等測量手段,檢測精度完全達不到要求,并且結果不直觀。為了獲取完整的模具
    發(fā)表于 08-10 14:18

    使用SPC5 studio作為工作臺調試收到警告

    嗨我使用SPC5 studio作為工作臺,UDE STK作為調試器。調試時收到以下警告。請幫我配置UDE STK。以上來自于谷歌翻譯以下為原文 Hi I am using SPC5 studio
    發(fā)表于 09-25 17:13

    工作臺生成不完整的源代碼怎么處理?

    使用針對 IHM001 的最新 MCSDK Workbench(在 Windows 10 上)和隨附的 BR2804 電機:MC 工作臺:5.3.2.18569WB_to_Mx
    發(fā)表于 01-03 08:49

    工作臺

    基于FLASH軟件設計的動畫,演示工作臺的正反轉過程。
    發(fā)表于 05-27 16:44 ?0次下載

    深度學習是什么?了解深度學習難嗎?讓你快速了解深度學習的視頻講解

    深度學習是什么?了解深度學習難嗎?讓你快速了解深度
    發(fā)表于 08-23 14:36 ?16次下載

    多功能焊接工作臺的制作

    焊接工作臺是指為焊接小型焊件而設置的工作臺。焊接工作臺的表面般有T型槽或孔,方便使用。焊接平臺材質般為HT200或HT250,這兩種材質
    的頭像 發(fā)表于 04-26 14:51 ?7492次閱讀

    防靜電工作臺接地方法

    防靜電工作臺具有防靜電功能,不只是因為桌面采用防靜電臺墊,還有個很重要的因素是防靜電接地線。沒有防靜電接地線的工作臺是起不到防靜電的作用的。防靜電接地線是將整個防靜電工作臺產(chǎn)生的靜電
    的頭像 發(fā)表于 05-17 15:23 ?2.5w次閱讀

    關于深度強化學習的概念以及它的工作原理

    深度學習DL是機器學習種基于對數(shù)據(jù)進行表征學習的方法。
    發(fā)表于 01-30 09:53 ?5730次閱讀
    關于<b class='flag-5'>深度</b>強化<b class='flag-5'>學習</b>的概念以及它的<b class='flag-5'>工作</b>原理

    人工智能深度強化學習DRL的解析

    深度學習DL是機器學習種基于對數(shù)據(jù)進行表征學習的方法。
    發(fā)表于 01-24 10:46 ?4948次閱讀

    電機控制工作臺的中文資料介紹

    電機控制工作臺(MotorControl Workbench):款 PC 代碼生成器工具,可減少設計人員在所有 ST 電機控制 FW 庫(STM32 PMSM FOC FW 庫 5.0 或更高版本
    發(fā)表于 10-23 16:10 ?33次下載
    電機控制<b class='flag-5'>工作臺</b>的中文資料介紹

    什么是深度學習(Deep Learning)?深度學習工作原理詳解

    ? 本文將帶您了解深度學習工作原理與相關案例。 什么是深度學習?
    的頭像 發(fā)表于 04-01 10:34 ?9869次閱讀

    AN5796_STM32WL 系列射頻工作臺

    AN5796_STM32WL 系列射頻工作臺
    發(fā)表于 11-21 08:11 ?0次下載
    AN5796_STM32WL 系列射頻<b class='flag-5'>工作臺</b>

    如何借助TigerGraph機器學習工作臺加速企業(yè)BI

    在高級設置部分,確保啟用機器學習工作臺,然后在入門套件中選擇圖機器學習,這樣它就包括在你的配置集群中。(注意:對于這個版本,我們將只支持單服務器配置,即分區(qū)因子=1)
    的頭像 發(fā)表于 11-29 10:24 ?484次閱讀

    Intel Developer Cloud Telemetry數(shù)據(jù)分析()

    Telemetry(遙測)是指Intel Developer Cloud 幫助開發(fā)者收集應用程序執(zhí)行時開發(fā)者指定的信息,并通過 UI 的形式展現(xiàn)的功能,該功能可以被啟動或關閉。
    的頭像 發(fā)表于 06-05 15:57 ?578次閱讀
    <b class='flag-5'>Intel</b> <b class='flag-5'>Developer</b> <b class='flag-5'>Cloud</b> Telemetry數(shù)據(jù)分析(<b class='flag-5'>一</b>)

    Intel Developer CloudTelemetry數(shù)據(jù)分析

    在上篇文章中介紹了 Intel Developer Cloud Telemetry 的概念和功能,通過該功能的數(shù)據(jù)分析,可以更好地優(yōu)化產(chǎn)品方案。有關 Telemetry 的
    的頭像 發(fā)表于 07-07 10:55 ?506次閱讀
    <b class='flag-5'>Intel</b> <b class='flag-5'>Developer</b> <b class='flag-5'>Cloud</b><b class='flag-5'>之</b>Telemetry數(shù)據(jù)分析