0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在目前深度學(xué)習(xí)中比較普及的“物件檢測”應(yīng)用

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2021-06-09 15:46 ? 次閱讀

接下來的重點,就是在目前深度學(xué)習(xí)中比較普及的“物件檢測”應(yīng)用,重點主要有以下三部分:

1. 簡單說明“物件檢測”的內(nèi)容。

2. 使用本項目的 detecnet 物件分類指令,進(jìn)行多樣化的推理識別測試。

3. 深入說明 jetson.inference 模塊的 detectNet() 以及相關(guān)的函數(shù)用法。

如此讓大家能快速掌握這項物件檢測功能,以及開發(fā)代碼的重點。

物件檢測(object detection)簡單說明

這是比圖像分類更進(jìn)一步的應(yīng)用,因為日常生活中,在絕大部分可看到的畫面中,不會只存在一個物體,通常是多種類別的多個物體,左圖識別出有“四個人”、右圖識別出“一個人與一匹馬”,當(dāng)然真的要細(xì)部再探索的話,還有其他類別的物體也可以被識別,這是視覺類深度學(xué)習(xí)中使用頻率最高的一種應(yīng)用。

在物件檢測的識別中,還只是比較“概略性”地將物體用“矩形框”的方式來標(biāo)識,那能不能將物體的“實際形狀”更細(xì)膩地標(biāo)識出來呢?當(dāng)然可以,這就是更高階的“語義分割”應(yīng)用,留在下一篇文章里面說明。

前面的圖像分類是以“一張圖像”為單位,這里的物件檢測則是以“物件框”為單位,因此所需要的數(shù)據(jù)集就不僅僅是圖像了,還要將圖像中所需要的類別加以標(biāo)注,然后存成特定格式之后,提供給訓(xùn)練框架去進(jìn)行模型訓(xùn)練,這是相當(dāng)耗費人力的一個過程,而且標(biāo)注的細(xì)膩程度也會對最終的精確度產(chǎn)生影響。

關(guān)于這個模型的訓(xùn)練過程,會在后面的文章中帶著大家動手做一次,這也是整個 Hello AI World 項目中的一部分,而且也提供非常好用的工具,協(xié)助大家采集數(shù)據(jù)、標(biāo)注物件框、進(jìn)行模型訓(xùn)練等。

以上就是物件檢測的簡單說明,接下去直接使用項目提供的 detectnet 指令來進(jìn)行實驗。

detectnet 指令的使用

與 imagenet 的調(diào)用邏輯是一樣的,當(dāng)系統(tǒng)編譯好之后,就生成 detectnet 指令,可以在 Jetson 設(shè)備中任何地方調(diào)用。同樣的,項目也為 detectnet 準(zhǔn)備了幾個預(yù)訓(xùn)練好的網(wǎng)絡(luò)模型,可以非常輕松地調(diào)用,預(yù)訓(xùn)練模型。

系統(tǒng)預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)是 “SSD-Mobilenet-v2”,基于 91 種分類的 COCO 數(shù)據(jù)集進(jìn)行模型訓(xùn)練,詳細(xì)的類別內(nèi)容可以參考 ~/jetson-inference/data/networks 目錄下的ssd_coco_labels.txt,事實上能識別的物件有 90 種,另外加一個 “unlabeled” 種類。

detectnet 的參數(shù)調(diào)用與 imagenet 幾乎一致,輸入源與輸出標(biāo)的的支持方式完全相同,因此我們可以執(zhí)行下面指令,直接看看得到怎樣的效果:

cbee2fd4-c46c-11eb-9e57-12bb97331649.png

在執(zhí)行過程中,會看到命令終端不斷出現(xiàn)類似下圖的信息,里面顯示一些重要的信息,包括“使用的網(wǎng)絡(luò)模型文件”、“4 個執(zhí)行階段占用時間”、“檢測到滿足閾值的物件數(shù)”、“物件類別/置信度”,以及“物件位置”等信息。

cc1e55e2-c46c-11eb-9e57-12bb97331649.png

detectnet 也能導(dǎo)出 RTP 視頻流到指定的電腦,詳細(xì)用法請參考前面 “Utils的videoOutput 工具”一文中有詳細(xì)說明,這個用法的實用度非常高,可以讓你將 Jetson Nano 2GB 設(shè)備放置在任何能接網(wǎng)絡(luò)的角落,不斷讀取攝像頭內(nèi)容在 Jetson 上執(zhí)行物件識別,然后將結(jié)果傳輸?shù)侥愕淖烂骐娔X或筆記本上,這樣你就可以非常輕松地進(jìn)行監(jiān)控。

輸入 “detectnet --help” 可以得到完整的幫助信息,由于內(nèi)容太多,我們在這里不占用篇幅去說明,多嘗試一些指令的組合,會讓你進(jìn)一步掌握這個指令的重點。

接下來看看如何在 Python 代碼中,調(diào)用這個項目的物件檢測函數(shù),來開發(fā)自己的物件檢測應(yīng)用。

detectNet()函數(shù)的用法

與前面圖像分類的邏輯一樣,作者雖然在 ~/jetson-inference/python/examples 下面提供了一個 my-detection.py 范例,這個就是我們一開始所示范的“ 10 行代碼威力”的內(nèi)容,這個范例的好處是“代碼量最少”,但對應(yīng)的缺點就是“彈性小、完整度不夠”,因此從務(wù)實的角度,我們還是推薦以 /usr/local/bin/detect.py 這只代碼為主,這只代碼能執(zhí)行的功能,與 detectnet 指令幾乎一致。

與 imagenet.py 代碼相同的,一開始有一段“參數(shù)解析”的指令,如下截圖:

cc9cf1f4-c46c-11eb-9e57-12bb97331649.png

這部分同樣請參考先前的“參數(shù)解析功能”文章,在這里不重復(fù)贅述。接下來我們將與物件檢測有關(guān)的指令挑出來說明,這樣可以讓讀者更加容易將焦點集中在有關(guān)的部分:

51 行:net = jetson.inference.detectNet(opt.network, sys.argv, opt.threshold)

用 jetson.inferene.detectNet() 函數(shù)建立 net 這個物件檢測對象,與前面的 imageNet() 的邏輯是一樣的,不過這里所輸入的參數(shù),除了 network(網(wǎng)絡(luò)模型類別)之外,還多了一個 threshold(閾值)。因為物件檢測的功能,是要在圖像中識別出“所有可能”的物件,如果沒有一個“最低門檻”的限制,就會滿屏都是物件。

系統(tǒng)已經(jīng)給這兩個參數(shù)都提供預(yù)設(shè)值,network 預(yù)設(shè)為 “SSD-Mobilenet-v2”、threshold 預(yù)設(shè)值為 0.5。

如果要在代碼外部利用參數(shù)去改變設(shè)定,就可以如以下方式:

--network=multiped,表示要使用“Multiped-500”這個網(wǎng)絡(luò)模型

--threshold=0.3,表示將閾值改成0.3

這樣 net 對象就具備了執(zhí)行物件檢測的相關(guān)功能,然后再繼續(xù)以下的步驟。

63 行:detections = net.Detect(img, overlay=opt.overlay)

這道指令,就是將 input.Capture() 獲取的一幀圖形,傳入 net.Detect() 函數(shù)去執(zhí)行物件檢測的推理識別計算,另一個參數(shù) “overlay” 的功能是“檢測覆蓋”的一個標(biāo)識,只影響顯示輸出的方式,與檢測結(jié)果并沒有關(guān)系,大部分時候都不需要去改變。

這里最重要的是 detections 這個數(shù)組變量,由于每幀圖像所檢測出來物件數(shù)量是不固定的,數(shù)組的結(jié)構(gòu)在說明文件中并未完整表達(dá),因此需要從執(zhí)行的代碼中去找到蛛絲馬跡,這個部分在下一道指令中可以找到答案。

66~69 行:

print(“detected {:d} objects in image”.format(len(detections)))

for detection in detections:

print(detection)

這部分執(zhí)行完之后,會在命令終端上顯示兩個很重要的信息:

本幀圖像所找到滿足閾值的物件數(shù)量。

前面變量detections的數(shù)據(jù)結(jié)構(gòu)。

在命令終端執(zhí)行以下指令,

看看所顯示的信息,如下截屏:

ccc09b36-c46c-11eb-9e57-12bb97331649.png

這里可以看到,代碼最后面 “l(fā)en(detections)” 的值,就是本幀圖像所檢測到的物件數(shù)量,而 detections 的數(shù)據(jù)結(jié)構(gòu)就是:

ClassID:類別編號

Confidence:置信度

Left:標(biāo)框左坐標(biāo)

Top:標(biāo)框上坐標(biāo)

Right:標(biāo)框右坐標(biāo)

Bottom:標(biāo)框下坐標(biāo)

Width:框的寬度 = Right - Left

Height:框的高度 = Bottom - Top

Area:面積 = Width x Height

Center:中心點坐標(biāo) = ( (Left+Right)/2, (Top+Bottom)/2 )

確認(rèn)了 net.Detect() 返回值之后,就能很輕易地以這些數(shù)據(jù)去開發(fā)滿足特定要求的應(yīng)用。

至于后面的 output.Render(img)、output.Status() 這些函數(shù),在前面的文章里面都講解的很清楚,這里不再重復(fù)。

到這里,要利用 Hello AI World 這個項目所提供的庫資源,去開發(fā)自己的應(yīng)用程序,就顯得非常簡單了。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4286

    瀏覽量

    62337
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4728

    瀏覽量

    68251
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1201

    瀏覽量

    24622
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5471

    瀏覽量

    120904

原文標(biāo)題:Jetson Nano 2GB 系列文章(23): “Hello AI World 的物件識別應(yīng)用

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識別 圖像識別是深度
    的頭像 發(fā)表于 10-27 11:13 ?297次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    今天給大俠帶來FPAG技術(shù)交流群里平時討論的問題答疑合集(十四),以后還會多推出本系列,話不多說,上貨。 FPGA技術(shù)交流群目前已有十多個群,QQ和微信均覆蓋,有需要的大俠可以進(jìn)群,一起交流學(xué)習(xí)
    發(fā)表于 09-27 20:53

    深度學(xué)習(xí)算法嵌入式平臺上的部署

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)算法各個領(lǐng)域的應(yīng)用日益廣泛。然而,將深度學(xué)習(xí)算法部署到資源受限的嵌入式平臺上,仍然是一個具有挑戰(zhàn)性的任
    的頭像 發(fā)表于 07-15 10:03 ?1110次閱讀

    深度學(xué)習(xí)工業(yè)機器視覺檢測中的應(yīng)用

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,其工業(yè)機器視覺檢測中的應(yīng)用日益廣泛,并展現(xiàn)出巨大的潛力。工業(yè)機器視覺檢測是工業(yè)自動化領(lǐng)域的重要組成部分,通過圖
    的頭像 發(fā)表于 07-08 10:40 ?930次閱讀

    基于AI深度學(xué)習(xí)的缺陷檢測系統(tǒng)

    工業(yè)生產(chǎn)中,缺陷檢測是確保產(chǎn)品質(zhì)量的關(guān)鍵環(huán)節(jié)。傳統(tǒng)的人工檢測方法不僅效率低下,且易受人為因素影響,導(dǎo)致誤檢和漏檢問題頻發(fā)。隨著人工智能技術(shù)的飛速發(fā)展,特別是深度
    的頭像 發(fā)表于 07-08 10:30 ?1095次閱讀

    深度學(xué)習(xí)視覺檢測中的應(yīng)用

    能力,還使得機器能夠模仿人類的某些智能行為,如識別文字、圖像和聲音等。深度學(xué)習(xí)的引入,極大地推動了人工智能技術(shù)的發(fā)展,特別是圖像識別、自然語言處理、語音識別等領(lǐng)域取得了顯著成果。
    的頭像 發(fā)表于 07-08 10:27 ?592次閱讀

    基于深度學(xué)習(xí)的小目標(biāo)檢測

    計算機視覺領(lǐng)域,目標(biāo)檢測一直是研究的熱點和難點之一。特別是小目標(biāo)檢測方面,由于小目標(biāo)圖像中所占比例小、特征不明顯,使得
    的頭像 發(fā)表于 07-04 17:25 ?708次閱讀

    TensorFlow與PyTorch深度學(xué)習(xí)框架的比較與選擇

    深度學(xué)習(xí)作為人工智能領(lǐng)域的一個重要分支,在過去十年中取得了顯著的進(jìn)展。構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型的過程中,
    的頭像 發(fā)表于 07-02 14:04 ?857次閱讀

    深度解析深度學(xué)習(xí)下的語義SLAM

    隨著深度學(xué)習(xí)技術(shù)的興起,計算機視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進(jìn)展,例如目標(biāo)的檢測、識別和分類等領(lǐng)域。近年來,研究人員開始視覺SLAM算法中引入
    發(fā)表于 04-23 17:18 ?1228次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>下的語義SLAM

    深度學(xué)習(xí)檢測小目標(biāo)常用方法

    深度學(xué)習(xí)的效果在某種意義上是靠大量數(shù)據(jù)喂出來的,小目標(biāo)檢測的性能同樣也可以通過增加訓(xùn)練集中小目標(biāo)樣本的種類和數(shù)量來提升。
    發(fā)表于 03-18 09:57 ?668次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>檢測</b>小目標(biāo)常用方法

    基于機器視覺和深度學(xué)習(xí)的焊接質(zhì)量檢測系統(tǒng)

    基于機器視覺和深度學(xué)習(xí)的焊接質(zhì)量檢測系統(tǒng)是一種創(chuàng)新性的技術(shù)解決方案,它結(jié)合了先進(jìn)的計算機視覺和深度學(xué)習(xí)算法,用于實時監(jiān)測和評估焊接過程中的焊
    的頭像 發(fā)表于 01-18 17:50 ?725次閱讀

    目前主流的深度學(xué)習(xí)算法模型和應(yīng)用案例

    深度學(xué)習(xí)科學(xué)計算中獲得了廣泛的普及,其算法被廣泛用于解決復(fù)雜問題的行業(yè)。所有深度學(xué)習(xí)算法都使用
    的頭像 發(fā)表于 01-03 10:28 ?1687次閱讀
    <b class='flag-5'>目前</b>主流的<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>算法模型和應(yīng)用案例

    如何基于深度學(xué)習(xí)模型訓(xùn)練實現(xiàn)圓檢測與圓心位置預(yù)測

    Hello大家好,今天給大家分享一下如何基于深度學(xué)習(xí)模型訓(xùn)練實現(xiàn)圓檢測與圓心位置預(yù)測,主要是通過對YOLOv8姿態(tài)評估模型自定義的數(shù)據(jù)集上訓(xùn)練,生成一個自定義的圓
    的頭像 發(fā)表于 12-21 10:50 ?1679次閱讀
    如何基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>模型訓(xùn)練實現(xiàn)圓<b class='flag-5'>檢測</b>與圓心位置預(yù)測

    GPU深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢

    人工智能的飛速發(fā)展,深度學(xué)習(xí)作為其重要分支,正在推動著諸多領(lǐng)域的創(chuàng)新。在這個過程中,GPU扮演著不可或缺的角色。就像超級英雄電影中的主角一樣,GPU深度
    的頭像 發(fā)表于 12-06 08:27 ?1190次閱讀
    GPU<b class='flag-5'>在</b><b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>中的應(yīng)用與優(yōu)勢

    深度學(xué)習(xí)植物病害目標(biāo)檢測研究進(jìn)展

    關(guān)注。 中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所/農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)大數(shù)據(jù)重點實驗室聯(lián)手甘肅農(nóng)業(yè)大學(xué)機電工程學(xué)院,組成科研團隊,針對深度學(xué)習(xí)植物葉部病害檢測與識別展開研究, 植物病害目標(biāo)
    的頭像 發(fā)表于 11-20 17:19 ?531次閱讀