三体在线高清免费观看完整版,好色先生黄色软件在线

動作識別網(wǎng)絡(luò)

深度學習在人體動作識別領(lǐng)域有兩類主要的網(wǎng)絡(luò)，一類是基于姿態(tài)評估，基于關(guān)鍵點實現(xiàn)的動作識別網(wǎng)絡(luò)；另外一類是直接預(yù)測的動作識別網(wǎng)絡(luò)。關(guān)于姿態(tài)評估相關(guān)的網(wǎng)絡(luò)模型應(yīng)用，我們在前面的文章中已經(jīng)介紹過了。OpenVINO2021.2版本中支持的動作識別網(wǎng)絡(luò)都不是基于關(guān)鍵點輸出的，而是基于Box直接預(yù)測，當前支持動作識別的預(yù)訓練模型與識別的動作數(shù)目支持列表如下：

表-1

這些網(wǎng)絡(luò)的輸出都是基于SSD 檢測頭實現(xiàn)對象檢測與動作預(yù)測。

輸入與輸出格式

以person-detection-action-recognition-0005模型為例說明它們的輸入與輸出數(shù)據(jù)格式支持，我也不知道什么原因（個人猜測因為Caffe框架的原因），網(wǎng)絡(luò)的輸出居然都是SSD原始檢測頭，怎么解析，我有妙招，稍后送上！先看一下輸入與輸出格式說明：

輸入格式：

格式 NCHW=［1x3x400x680］，Netron實際查看：

注意：OpenVINO2021.2安裝之后的文檔上格式說明是NHWC

輸出格式：

輸出有七個分支頭的數(shù)據(jù)，它們的名稱跟維度格式列表如下：

表-2

關(guān)于輸出格式的解釋，首先是num_priors值是多少，骨干網(wǎng)絡(luò)到SSD輸出頭，是實現(xiàn)了16倍的降采樣，最終輸出的h x w=25x43然后每個特征點預(yù)測4個PriorBox，每個特征點預(yù)測動作，總計有三類的動作，所以動作預(yù)測輸出為：［b， 3， h， w］ = ［1x3x25x43］，總計PriorBoxes數(shù)目為：num_priors=25x43x4=4300，這些都是SSD檢測頭的原始輸出，沒有非最大抑制，沒有經(jīng)過轉(zhuǎn)換處理，所以想直接解析它們對開發(fā)應(yīng)用的人來說是一個大麻煩！

輸出數(shù)據(jù)解析與處理問題

person-detection-action-recognition-0005網(wǎng)絡(luò)推理之后的輸出數(shù)據(jù)解析跟后處理特別的復雜，怎么解析原始輸出頭是個技術(shù)活，我從示例代碼中提取跟整理出來兩個C++文件，它們是：

action_detector.h

cnn.h

以及它們的實現(xiàn)文件：

action_detector.cpp

cnn.cpp

這個其中最重要的就是有個ActionDetection類，它有幾個方法，分別是：

void enqueue（const cv：：Mat &frame）

void submitRequest（）

void wait（）

DetectedActions fetchResults（）

這幾個方法的解釋分別如下：

enqueue方法的就是實現(xiàn)了推理請求創(chuàng)建與圖像數(shù)據(jù)的輸入設(shè)置，它的代碼實現(xiàn)如下：

if （！request） {

request = net_.CreateInferRequestPtr（）;

}

width_ = static_cast《float》（frame.cols）;

height_ = static_cast《float》（frame.rows）;

Blob：：Ptr inputBlob = request-》GetBlob（input_name_）;

matU8ToBlob《uint8_t》（frame， inputBlob）;

enqueued_frames_ = 1;

submitRequest方法，就是執(zhí)行推理，支持同步與異步推理執(zhí)行模型，它的代碼實現(xiàn)如下：

if （request == nullptr） return;

if （isAsync） {

request-》StartAsync（）;

}

else {

request-》Infer（）;

}

wait方法，當同步推理時候無需調(diào)用，異步推理調(diào)用

fetchResults方法，該方法是推理過程中最復雜的部分，負責解析輸出的七個分支數(shù)據(jù)，生成Box與action標簽預(yù)測。簡單的說它的執(zhí)行過程是這樣，首先獲取輸出的七個輸出數(shù)據(jù)，然后轉(zhuǎn)換為基于Mat的數(shù)據(jù)，然后循環(huán)每個特征圖的特征點預(yù)測Box與置信得分，大于閾值的置信得分對應(yīng)的預(yù)測Box與PriorBox計算真實的BOX坐標，同時閾值化處理Action的置信得分，最終對結(jié)果完整非最大抑制之后輸出，得到數(shù)據(jù)結(jié)構(gòu)為：

struct DetectedAction {

/** @brief BBox of detection */

cv：：Rect rect;

/** @brief Action label */

int label;

/** @brief Confidence of detection */

float detection_conf;

/** @brief Confidence of predicted action */

float action_conf;

這樣就完成了對輸出的數(shù)據(jù)解析。

這個就是上述四個相關(guān)依賴文件，我已經(jīng)把其他不相關(guān)的或者非必要的依賴全部去掉，基于這四個相關(guān)文件，就可以實現(xiàn)對表-1中動作識別模型的推理與解析輸出顯示。

動作識別代碼演示

動作識別代碼演示基于person-detection-action-recognition-0005網(wǎng)絡(luò)模型完成，該模型是基于室內(nèi)場景數(shù)據(jù)訓練生成的，適合于教育智慧教室應(yīng)用場景。首先需要初始化動作檢測類與初始化推理引擎加載，然后配置動作檢測類的相關(guān)參數(shù)，這些參數(shù)主要包括以下：

- 模型的權(quán)重文件路徑

- 推理引擎的計算設(shè)備支持

- 對象檢測閾值

- 動作預(yù)測閾值

- 支持動作類別數(shù)目

- 是否支持異步推理

等等。

配置完成之后設(shè)置與初始化ActionDetection類，然后就可以直接調(diào)用上述提到幾個類方法完成整個推理與輸出，根據(jù)輸出結(jié)果繪制與顯示即可，這部分的代碼如下：

cv：：Mat frame = cv：：imread（“D:/action_001.png”）;

InferenceEngine：：Core ie;

std：：unique_ptr《AsyncDetection《DetectedAction》》 action_detector;

// Load action detector

ActionDetectorConfig action_config（model_xml）;

action_config.deviceName = “CPU”;

action_config.ie = ie;

action_config.is_async = false;

action_config.detection_confidence_threshold = 0.1f;

action_config.action_confidence_threshold = 0.1f;

action_config.num_action_classes = 3;

action_detector.reset（new ActionDetection（action_config））;

action_detector-》enqueue（frame）;

action_detector-》submitRequest（）;

DetectedActions actions = action_detector-》fetchResults（）;

std：：cout 《《 actions.size（）《《 std：：endl;

for （int i = 0; i 《 actions.size（）; i++） {

std：：cout 《《 actions［i］.rect 《《 std：：endl;

std：：cout 《《 actions［i］.label 《《 std：：endl;

cv：：rectangle（frame， actions［i］.rect， cv：：Scalar（0， 0， 255）， 2， 8， 0）;

putText（frame， action_text_labels［actions［i］.label］， actions［i］.rect.tl（）， cv：：FONT_HERSHEY_SIMPLEX， 0.75， cv：：Scalar（0， 0， 255）， 2， 8）;

}

cv：：imshow（“動作識別演示”， frame）;

cv：：waitKey（0）;

return 0;

責任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

深度學習

深度學習

+關(guān)注

關(guān)注
73

文章
5466

瀏覽量
120891

原文標題：OpenVINO? 室內(nèi)動作識別

文章出處：【微信號：英特爾物聯(lián)網(wǎng)，微信公眾號：英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

GPU深度學習應(yīng)用案例

GPU在深度學習中的應(yīng)用廣泛且重要，以下是一些GPU深度學習應(yīng)用案例：一、圖像識別圖像

發(fā)表于 10-27 11:13 ?292次閱讀

AI大模型與深度學習的關(guān)系

AI大模型與深度學習之間存在著密不可分的關(guān)系，它們互為促進，相輔相成。以下是對兩者關(guān)系的介紹：一、深度學習是AI大模型的基礎(chǔ) 技術(shù)支撐：深度

發(fā)表于 10-23 15:25 ?308次閱讀

基于Python的深度學習人臉識別方法

基于Python的深度學習人臉識別方法是一個涉及多個技術(shù)領(lǐng)域的復雜話題，包括計算機視覺、深度學習、以及圖像處理等。在這里，我將概述一個基本的

發(fā)表于 07-14 11:52 ?1131次閱讀

深度學習中的時間序列分類方法

時間序列分類（Time Series Classification, TSC）是機器學習和深度學習領(lǐng)域的重要任務(wù)之一，廣泛應(yīng)用于人體活動識別、系統(tǒng)監(jiān)測、金融預(yù)測、醫(yī)療診斷等多個領(lǐng)域。隨

發(fā)表于 07-09 15:54 ?654次閱讀

深度學習中的無監(jiān)督學習方法綜述

應(yīng)用中往往難以實現(xiàn)。因此，無監(jiān)督學習在深度學習中扮演著越來越重要的角色。本文旨在綜述深度

發(fā)表于 07-09 10:50 ?388次閱讀

深度學習在視覺檢測中的應(yīng)用

深度學習是機器學習領(lǐng)域中的一個重要分支，其核心在于通過構(gòu)建具有多層次的神經(jīng)網(wǎng)絡(luò)模型，使計算機能夠從大量數(shù)據(jù)中自動

發(fā)表于 07-08 10:27 ?579次閱讀

深度學習與nlp的區(qū)別在哪

深度學習和自然語言處理（NLP）是計算機科學領(lǐng)域中兩個非常重要的研究方向。它們之間既有聯(lián)系，也有區(qū)別。本文將介紹深度學習與NLP的區(qū)別。深度

發(fā)表于 07-05 09:47 ?749次閱讀

深度學習中的模型權(quán)重

在深度學習這一充滿無限可能性的領(lǐng)域中，模型權(quán)重（Weights）作為其核心組成部分，扮演著至關(guān)重要的角色。它們不僅是模型學習的基石，更是模型智能的源泉。本文將從模型權(quán)重的定義、作用、優(yōu)化、管理以及應(yīng)用等多個方面，深入探討

發(fā)表于 07-04 11:49 ?823次閱讀

深度學習與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

隨著人工智能技術(shù)的飛速發(fā)展，深度學習和卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network, CNN）作為其中的重要分支，已經(jīng)在多個領(lǐng)域取得了顯著的應(yīng)用成果。從圖像識別

發(fā)表于 07-02 18:19 ?748次閱讀

深度學習在自動駕駛中的關(guān)鍵技術(shù)

隨著人工智能技術(shù)的飛速發(fā)展，自動駕駛技術(shù)作為其中的重要分支，正逐漸走向成熟。在自動駕駛系統(tǒng)中，深度學習技術(shù)發(fā)揮著至關(guān)重要的作用。它通過模擬人腦的學習過程，實現(xiàn)對車輛周圍環(huán)境的感知、理解

發(fā)表于 07-01 11:40 ?620次閱讀

深度解析深度學習下的語義SLAM

隨著深度學習技術(shù)的興起，計算機視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進展，例如目標的檢測、識別和分類等領(lǐng)域。近年來，研究人員開始在視覺SLAM算法中引入深

發(fā)表于 04-23 17:18 ?1227次閱讀

詳解深度學習、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

在如今的網(wǎng)絡(luò)時代，錯綜復雜的大數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境，讓傳統(tǒng)信息處理理論、人工智能與人工神經(jīng)網(wǎng)絡(luò)都面臨巨大的挑戰(zhàn)。近些年，深度學習逐漸走進人們的視線

發(fā)表于 01-11 10:51 ?1841次閱讀

目前主流的深度學習算法模型和應(yīng)用案例

深度學習在科學計算中獲得了廣泛的普及，其算法被廣泛用于解決復雜問題的行業(yè)。所有深度學習算法都使用不同類型的神經(jīng)

發(fā)表于 01-03 10:28 ?1656次閱讀

GPU在深度學習中的應(yīng)用與優(yōu)勢

人工智能的飛速發(fā)展，深度學習作為其重要分支，正在推動著諸多領(lǐng)域的創(chuàng)新。在這個過程中，GPU扮演著不可或缺的角色。就像超級英雄電影中的主角一樣，GPU在

發(fā)表于 12-06 08:27 ?1188次閱讀

深度學習在人工智能中的 8 種常見應(yīng)用

深度學習簡介深度學習是人工智能（AI）的一個分支，它教神經(jīng)網(wǎng)絡(luò)學習和推理。近年來，它解決復雜問題

發(fā)表于 12-01 08:27 ?3194次閱讀