0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

經(jīng)典多目標(biāo)跟蹤算法DeepSORT的基本原理和實(shí)現(xiàn)

英特爾物聯(lián)網(wǎng) ? 來源:OpenVINO中文社區(qū) ? 2023-04-23 09:43 ? 次閱讀

目標(biāo)檢測 vs 目標(biāo)跟蹤

在開始介紹DeepSORT的原理之前呢,我們先來了解下目標(biāo)檢測,和目標(biāo)跟蹤之間的區(qū)別:

目標(biāo)檢測:在目標(biāo)檢測任務(wù)中,我們需要利用AI模型識別出單張畫面中,物體的位置和類別信息,每一幀畫面之間檢測結(jié)果相對獨(dú)立,沒有依賴關(guān)系。這也意味著目標(biāo)檢測算法可以被應(yīng)用于單張圖片的檢測,也可以用于視頻中每一幀畫面的檢測。

目標(biāo)跟蹤而目標(biāo)跟蹤則是在目標(biāo)檢測的基礎(chǔ)上加入的跟蹤機(jī)制,他需要追蹤視頻中同一物體在不同時刻的位置信息,因此他需要判斷相鄰幀之間的被檢測到對象是否是同一個物體,并且為同一物體分配唯一的編號ID,用來區(qū)別不同的目標(biāo)對象。

例如下面短跑運(yùn)動員比賽的例子中,目標(biāo)檢測任務(wù)只需要識別到畫面中所有人體的位置即可,而目標(biāo)跟蹤任務(wù)則需要區(qū)分畫面中相同的對象和不同對象。

d6d5b338-e033-11ed-bfe3-dac502259ad0.png

圖:目標(biāo)檢測與目標(biāo)跟蹤比較

DeepSORT

DeepSORT的前身是SORT算法,SORT算法是由目標(biāo)檢測器以及跟蹤器所構(gòu)成,其跟蹤器的核心是卡爾曼濾波算法和匈牙利算法。利用卡爾曼濾波算法預(yù)測檢測框在下一幀的狀態(tài),將該狀態(tài)與下一幀的檢測結(jié)果利用匈牙利算法進(jìn)行匹配,實(shí)現(xiàn)追蹤。一旦物體受到遮擋或者其他原因沒有被檢測到,卡爾曼濾波預(yù)測的狀態(tài)信息將無法和檢測結(jié)果進(jìn)行匹配,該追蹤片段將會提前結(jié)束。

而DeepSORT則引入了深度學(xué)習(xí)中的重識別算法來提取被檢測物體(檢測框物體中)的外觀特征(低維向量表示),在每次(每幀)檢測+追蹤后,進(jìn)行一次物體外觀特征的提取并保存。后面每執(zhí)行一步時,都要執(zhí)行一次當(dāng)前幀被檢測物體外觀特征與之前存儲的外觀特征的相似度計(jì)算,依次來避免遇到漏檢的情況,將失去身份ID的情況,可以說DeepSORT不光使用了物體的速度和方向趨勢來對目標(biāo)進(jìn)行跟蹤,同時也利用物體的外觀特征鞏固對是否為同一物體的判斷。

這里我們可以將DeepSORT跟蹤算法歸納為以下幾個步驟:

d7398cc8-e033-11ed-bfe3-dac502259ad0.png

圖:DeepSORT方法流程圖

1. 目標(biāo)檢測

使用常規(guī)的目標(biāo)檢測模型,對單幀畫面進(jìn)行識別,并過濾出待跟蹤對象,例如這個任務(wù)中我們的跟蹤對象為人體,那其他被檢測到的對象,例如桌子,椅子將被全部丟棄。

2. 目標(biāo)預(yù)測

在這一步中,我們將使用卡爾曼濾波算法。基于當(dāng)前的一系列運(yùn)動變量去預(yù)測下一時刻的運(yùn)動變量,但是第一次的檢測結(jié)果用來初始化卡爾曼濾波的運(yùn)動變量。預(yù)測結(jié)果分為確認(rèn)態(tài) (confirmed),和不確認(rèn)態(tài) (unconfirmed),新產(chǎn)生的 Tracks 是不確認(rèn)態(tài)的;不確認(rèn)態(tài)的 Tracks 必須要和 Detections 連續(xù)匹配一定的次數(shù)才可以轉(zhuǎn)化成確認(rèn)態(tài)。確認(rèn)態(tài)的Tracks必須和Detections連續(xù)適配一定次數(shù)才會被刪除。

3. 數(shù)據(jù)關(guān)聯(lián)和更新

接下來需要把檢測到的物體和預(yù)測的物體進(jìn)行關(guān)聯(lián), 此處DeepSORT將使用匈牙利算法,并根據(jù)不同的代價函數(shù)來尋找最大匹配。如果卡爾曼濾波輸出確認(rèn)態(tài)的預(yù)測結(jié)果,DeepSORT將采用馬氏距離加余弦距離的級聯(lián)方法對相關(guān)信息進(jìn)行關(guān)聯(lián),通過馬氏距離我們可以獲取運(yùn)動物體在兩個不同狀態(tài)的距離信息,如果某次關(guān)聯(lián)的馬氏距離小于指定的閾值,則設(shè)置運(yùn)動狀態(tài)的關(guān)聯(lián)成功,但是DeepSORT不僅看框與框之間的距離,還要看框內(nèi)的表觀特征才能更好的進(jìn)行關(guān)聯(lián)匹配,所以DeepSORT還引入了表觀特征余弦距離度量,這里會使用一個重識別模型來獲取不同物體的特征向量,然后再通過余弦距離構(gòu)建代價函數(shù),計(jì)算預(yù)測對象與檢測對象的相似度。這兩個代價函數(shù)結(jié)果都盡量的小,框也接近、特征也接近的話,就認(rèn)為兩個預(yù)測框中是同一個東西。

DeepSORT之所以引入這樣的級聯(lián)方法,是因?yàn)槿绻谶\(yùn)動狀態(tài)變化比較劇烈的場景下,基于目標(biāo)狀態(tài)之間的關(guān)聯(lián)很可能是不可靠的(舉個例子,當(dāng)一個人在跑步時,如果相機(jī)是靜止的或者與人的運(yùn)動方向相反,那么相機(jī)中的人在每幀之間的運(yùn)動狀態(tài)就會差異較大),在這樣的情況下,運(yùn)動的不確定性變高,先驗(yàn)狀態(tài)與目標(biāo)檢測之間的匹配差異較大,而彌補(bǔ)這個缺陷的方法就是使用特征相似距離關(guān)聯(lián);但是在目標(biāo)運(yùn)動狀態(tài)變化并不劇烈的情況下,這時候幀與幀之間,馬氏距離就成為了很好的數(shù)據(jù)關(guān)聯(lián)度量的選擇。

數(shù)據(jù)關(guān)聯(lián)的第二步則是計(jì)算不確認(rèn)態(tài)下的預(yù)測框和未被上一步級聯(lián)方法匹配檢測框的IOU交并比,DeepSORT使用匈牙利算法尋找最大匹配的IOU結(jié)果,如果預(yù)測框和檢測框的IOU低于閾值,我們將刪除兩者的關(guān)聯(lián)性。

最后利用當(dāng)前幀的關(guān)聯(lián)結(jié)果更新預(yù)測器中所有被分配ID的跟蹤對象狀態(tài)。

DeepSORT任務(wù)實(shí)現(xiàn)

接下來我們來看DeepSORT的基本實(shí)現(xiàn),這里我們可以直接使用DeepSORT作者提供的跟蹤器對象模塊實(shí)現(xiàn)卡爾曼濾波算法預(yù)測以及匈牙利算法匹配等多種功能,開發(fā)者可以直接替換其中目標(biāo)檢測模型與重識別模型,并修改最大匹配次數(shù)等參數(shù),以提升在目標(biāo)場景下的識別跟蹤準(zhǔn)確性。推理部分使用OpenVINO做為推理引擎。這里有幾個關(guān)鍵的模塊:

1. 模型初始化

本次任務(wù)中會使用兩個深度學(xué)習(xí)模型,都是來自于OpenVINO官方的Open Model Zoo模型倉庫。這里可以提前定義一個通用的OpenVINO的模型類來對這兩個模型進(jìn)行初始化,并設(shè)置他的預(yù)測推理函數(shù)。由于目標(biāo)檢測任務(wù)的輸出數(shù)量往往不固定,同時我們又需要利用重識別模型為每一個目標(biāo)檢測任務(wù)的輸出構(gòu)建特征向量,因此為了提升模型的執(zhí)行效率,我們將重識別模型的batachsize初始化為“-1”,以動態(tài)匹配不斷變化的目標(biāo)數(shù)量。

d74d8d4a-e033-11ed-bfe3-dac502259ad0.png

圖:OpenVINO模型對象

2. 余弦距離

本次任務(wù)采用余弦距離作為匹配算法的代價函數(shù)之一,因此我們需要首先定義余弦距離的計(jì)算方法(如下圖所示),其中x1,x2分別為重識別模型輸出的特征向量。

d7789cb0-e033-11ed-bfe3-dac502259ad0.png

圖:余弦距離計(jì)算方法

接下來我們可以測試下這個方案的效果,我們將兩個不同人體對象的圖片進(jìn)行特征向量化后,將模型輸出的結(jié)果直接送入余弦距離模塊中,計(jì)算相關(guān)性的置信度,可以看到當(dāng)兩張圖片屬于同一對象的情況下,置信度較高,兩個圖片不屬于同一對象的情況下置信度就會低于閾值。

d789bcc0-e033-11ed-bfe3-dac502259ad0.png

圖:不同人體對象余弦距離計(jì)算結(jié)果

d79855aa-e033-11ed-bfe3-dac502259ad0.png

圖:相同人體對象余弦距離計(jì)算結(jié)果

3. Tracker跟蹤器

Tracker是DeepSORT方法的核心對象,在具體調(diào)用方法里,第一步先要定義一個Tracker對象,并聲明關(guān)鍵參數(shù)里,例如考慮到內(nèi)存占用情況,我們需要定義NN_BUDGET,用于限制同屏中最大跟蹤對象的數(shù)量,同時使用cosine最大余弦距離作為代價函數(shù),并且指定IOU和余弦距離的閾值,以及max_age描述最大多少次無匹配會刪除追蹤對象, n_init描述確認(rèn)狀態(tài)需要的最少匹配次數(shù)。

d7b4ef80-e033-11ed-bfe3-dac502259ad0.png

圖:Tracker跟蹤器初始化方法

然后進(jìn)入到主函數(shù)部分,在開始track任務(wù)之前,會先將目標(biāo)檢測模型和重識別模型的輸出結(jié)果打包成Detection對象,一起送入Tracker中進(jìn)行匹配,當(dāng)目標(biāo)對象轉(zhuǎn)化為確認(rèn)狀態(tài)后,可以從Tracker對象中獲取每一個目標(biāo)的唯一ID用于在原始畫面中進(jìn)行標(biāo)注。

d7c5aae6-e033-11ed-bfe3-dac502259ad0.png

圖:調(diào)用跟蹤器的預(yù)算和update關(guān)聯(lián)方法

4. 最終實(shí)現(xiàn)效果

在完成主函數(shù)定義后,我們可以給他輸入一段視頻流,或者使用身邊的網(wǎng)絡(luò)攝像頭獲取實(shí)時影像進(jìn)行驗(yàn)證。

可以看到DeepSORT方法非常精確的識別并跟蹤了畫面中每一個人體對象的位置,并且在僅在普通酷睿系列的CPU上就可以實(shí)現(xiàn)60FPS左右的流暢表現(xiàn)。

d802fa4a-e033-11ed-bfe3-dac502259ad0.png

圖:最終實(shí)現(xiàn)效果

小結(jié)

本文分享多目標(biāo)跟蹤算法的經(jīng)典算法DeepSORT,它是一個兩階段的算法,作為SORT 的升級版,它整合了外觀信息 (appearance information) 從而提高 SORT 的性能,這使得我們在遇到較長時間的遮擋時,也能夠正常跟蹤目標(biāo),并有效減少 ID 轉(zhuǎn)換的發(fā)生次數(shù)。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    857

    瀏覽量

    47625
  • 卡爾曼濾波
    +關(guān)注

    關(guān)注

    3

    文章

    162

    瀏覽量

    24624
  • sort
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    2601

原文標(biāo)題:經(jīng)典多目標(biāo)跟蹤算法DeepSORT的基本原理和實(shí)現(xiàn)丨開發(fā)者實(shí)戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    視頻跟蹤目標(biāo)跟蹤算法簡介(上海凱視力成信息科技有限...

    本帖最后由 shkslc 于 2013-10-10 10:25 編輯 跟蹤算法簡介AVT21提供了多種跟蹤算法:質(zhì)心跟蹤
    發(fā)表于 09-29 08:59

    基于QT+OpenCv的目標(biāo)跟蹤算法實(shí)現(xiàn)

    的粒子分布而來,如下圖2所示,是一種典型的基于粒子濾波算法實(shí)現(xiàn)的視頻目標(biāo)跟蹤。圖1 基于粒子濾波算法實(shí)現(xiàn)
    發(fā)表于 09-21 10:42

    PID算法基本原理及其執(zhí)行流程

    景。1、PID算法基本原理PID算法是控制行業(yè)最經(jīng)典、最簡單、而又最能體現(xiàn)反饋控制思想的算法。對于一般的研發(fā)人員來說,設(shè)計(jì)和
    發(fā)表于 12-21 08:22

    視頻圖像動態(tài)跟蹤算法的設(shè)計(jì)與實(shí)現(xiàn)

    設(shè)計(jì)內(nèi)容:1.了解視頻圖像動態(tài)跟蹤的應(yīng)用背景2.了解視頻圖像動態(tài)跟蹤算法基本原理3.掌握camshift和Meanshift跟蹤
    發(fā)表于 11-16 01:03 ?42次下載

    多傳感器多目標(biāo)跟蹤的JPDA算法

    文中提出了一種適用于多傳感器多目標(biāo)跟蹤的JPDA算法,它以極大似然估計(jì)完成對來自多傳感器的測量集合進(jìn)行同源最優(yōu)分劃,然后采用JPDA方法對多目標(biāo)進(jìn)行
    發(fā)表于 02-03 10:38 ?47次下載
    多傳感器<b class='flag-5'>多目標(biāo)</b><b class='flag-5'>跟蹤</b>的JPDA<b class='flag-5'>算法</b>

    改進(jìn)霍夫森林框架的多目標(biāo)跟蹤算法

    針對單目視覺對多個相似的目標(biāo)跟蹤因遮擋等因素影響而失效的問題,提出一種基于改進(jìn)霍夫森林框架的多目標(biāo)跟蹤算法。在將
    發(fā)表于 12-14 17:09 ?0次下載

    簡單粗暴的多對象目標(biāo)跟蹤神器–DeepSort

    對象跟蹤問題一直是計(jì)算機(jī)視覺的熱點(diǎn)任務(wù)之一,簡單的可以分為單目標(biāo)跟蹤多目標(biāo)跟蹤,最常見的目標(biāo)
    的頭像 發(fā)表于 12-08 23:31 ?1073次閱讀

    如何更好地實(shí)現(xiàn)視頻多目標(biāo)軌跡的連續(xù)跟蹤?

    針對多伯努利濾波方法在多目標(biāo)跟蹤時,難以檢測新生目標(biāo),且當(dāng)目標(biāo)岀現(xiàn)互相遮擋等千擾時,跟蹤精度下降,甚至岀現(xiàn)
    發(fā)表于 04-07 14:27 ?5次下載
    如何更好地<b class='flag-5'>實(shí)現(xiàn)</b>視頻<b class='flag-5'>多目標(biāo)</b>軌跡的連續(xù)<b class='flag-5'>跟蹤</b>?

    基于卷積特征的多伯努利視頻多目標(biāo)跟蹤算法

    目標(biāo)漏跟。針對該問題,在多伯努利濾波框架下,深度分析目標(biāo)的特征信息,引λ抗干擾的卷積特征,提出基于卷積特征的多伯努利視頻多目標(biāo)跟蹤算法,并在
    發(fā)表于 05-12 15:18 ?11次下載

    最常見的目標(biāo)跟蹤算法

    對象跟蹤問題一直是計(jì)算機(jī)視覺的熱點(diǎn)任務(wù)之一,簡單的可以分為單目標(biāo)跟蹤多目標(biāo)跟蹤,最常見的目標(biāo)
    的頭像 發(fā)表于 09-14 16:20 ?2656次閱讀

    基于MobileNet的多目標(biāo)跟蹤深度學(xué)習(xí)算法

    針對深度學(xué)習(xí)算法多目標(biāo)跟蹤中的實(shí)時性問題, 提出一種基于MobileNet的多目標(biāo)跟蹤算法.
    的頭像 發(fā)表于 11-09 10:23 ?1031次閱讀
    基于MobileNet的<b class='flag-5'>多目標(biāo)</b><b class='flag-5'>跟蹤</b>深度學(xué)習(xí)<b class='flag-5'>算法</b>

    經(jīng)典多目標(biāo)跟蹤算法DeepSORT基本原理實(shí)現(xiàn)

    在開始介紹DeepSORT的原理之前呢,我們先來了解下目標(biāo)檢測,和目標(biāo)跟蹤之間的區(qū)別。
    的頭像 發(fā)表于 06-10 16:08 ?3367次閱讀
    <b class='flag-5'>經(jīng)典</b><b class='flag-5'>多目標(biāo)</b><b class='flag-5'>跟蹤</b><b class='flag-5'>算法</b><b class='flag-5'>DeepSORT</b>的<b class='flag-5'>基本原理</b>和<b class='flag-5'>實(shí)現(xiàn)</b>

    基于DeepSORT YOLOv4的目標(biāo)跟蹤

    電子發(fā)燒友網(wǎng)站提供《基于DeepSORT YOLOv4的目標(biāo)跟蹤.zip》資料免費(fèi)下載
    發(fā)表于 06-27 11:20 ?0次下載
    基于<b class='flag-5'>DeepSORT</b> YOLOv4的<b class='flag-5'>目標(biāo)</b><b class='flag-5'>跟蹤</b>

    目標(biāo)跟蹤初探(DeepSORT

    目前主流的目標(biāo)跟蹤算法都是基于Tracking-by-Detecton策略,即基于目標(biāo)檢測的結(jié)果來進(jìn)行目標(biāo)
    的頭像 發(fā)表于 08-07 15:37 ?823次閱讀
    <b class='flag-5'>目標(biāo)</b><b class='flag-5'>跟蹤</b>初探(<b class='flag-5'>DeepSORT</b>)

    多目標(biāo)跟蹤算法總結(jié)歸納

    多目標(biāo)跟蹤是計(jì)算機(jī)視覺領(lǐng)域中的一個重要任務(wù),它旨在從視頻或圖像序列中準(zhǔn)確地檢測和跟蹤多個移動目標(biāo)。不過在落地部署時,有一些關(guān)鍵點(diǎn)需要解決。
    的頭像 發(fā)表于 04-28 09:42 ?1583次閱讀
    <b class='flag-5'>多目標(biāo)</b><b class='flag-5'>跟蹤</b><b class='flag-5'>算法</b>總結(jié)歸納