0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么mAP已成為目標檢測的首選指標?

新機器視覺 ? 來源:小白學(xué)視覺 ? 2023-04-10 09:50 ? 次閱讀

計算機視覺界已經(jīng)集中在度量 mAP 上,來比較目標檢測系統(tǒng)的性能。在這篇文章中,我們將深入了解平均精度均值 (mAP) 是如何計算的,以及為什么 mAP 已成為目標檢測的首選指標。

目標檢測的快速概述

在我們考慮如何計算平均精度均值之前,我們將首先定義它正在測量的任務(wù)。目標檢測模型試圖識別圖像中相關(guān)對象的存在,并將這些對象劃分為相關(guān)類別。例如,在醫(yī)學(xué)圖像中,我們可能希望能夠計算出血流中的紅細胞 (RBC)、白細胞 (WBC) 和血小板的數(shù)量,為了自動執(zhí)行此操作,我們需要訓(xùn)練一個對象檢測模型來識別這些對象并對其進行正確分類。

f6de048e-d6e0-11ed-bfe3-dac502259ad0.gif

EfficientDet(綠色)與 YOLOv3(黃色)的示例輸出

這兩個模型都預(yù)測了圖片中細胞周圍的邊界框,然后他們?yōu)槊總€邊界框分配一個類。對于每個任務(wù),網(wǎng)絡(luò)都會對其預(yù)測的置信度進行建模,可以在此處看到我們共有三個類別(RBC、WBC 和Platelets)。

我們應(yīng)該如何決定哪個模型更好?查看圖像,看起來 EfficientDet(綠色)繪制了過多的 RBC 框,并且在圖像邊緣漏掉了一些細胞。這當然是從事物表面來看——但是我們可以相信圖像和直覺嗎?

如果我們能夠直接量化每個模型在測試集中的圖像、類和不同置信閾值下的表現(xiàn),那就太好了。要理解平均精度均值,我們必須花一些時間來研究精度-召回曲線。

精確-召回曲線

精確是“模型猜測它正確猜測的次數(shù)?” 的一個衡量標準,召回是一種衡量“模型每次應(yīng)該猜到的時候都猜到了嗎?” 。假設(shè)一個具有有 10 個紅細胞的圖像,模型只找到這 10 個中正確標記的一個,因為“RBC”具有完美的精度(因為它做出的每一個猜測都是正確的),但并不同時具有完美的召回(僅發(fā)現(xiàn)十個 RBC 細胞中的一個)。

包含置信元素的模型可以通過調(diào)整進行預(yù)測所需的置信水平來權(quán)衡召回的精確度。也就是,如果模型處于避免假陽性(當細胞是白細胞時說明存在紅細胞)比避免假陰性更重要的情況下,它可以將其置信閾值設(shè)置得更高,以鼓勵模型只產(chǎn)生以降低其覆蓋率(召回)為代價的高精度預(yù)測。

精度-召回曲線是繪制模型精度和以召回率作為模型置信閾值函數(shù)的過程。它是向下傾斜的,因為隨著置信度的降低,會做出更多的預(yù)測,進而預(yù)測的準確性會降低(影像精確度)。

f7408046-d6e0-11ed-bfe3-dac502259ad0.png

一個 NLP 項目中不同模型的精度、召回率和置信度

隨著模型越來越不穩(wěn)定,曲線向下傾斜,如果模型具有向上傾斜的精度和召回曲線,則該模型的置信度估計可能存在問題。

人工智能研究人員偏向于指標,并且可以在單個指標中捕獲整個精確召回曲線。第一個也是最常見的是 F1,它結(jié)合了精度和召回措施,以找到最佳置信度閾值,其中精度和召回率產(chǎn)生最高的 F1 值。接下來是 AUC(曲線下面積),它集成了精確性和召回曲線下的繪圖量。

f761ce40-d6e0-11ed-bfe3-dac502259ad0.png

精確召回匯總指標圖

最終的精確-召回曲線指標是平均精度 (AP),它被計算為在每個閾值處實現(xiàn)的精度的加權(quán)平均值,并將前一個閾值的召回率增加用作權(quán)重。

AUC 和 AP 都捕獲了精確-召回曲線的整個形狀,選擇一個或另一個進行目標檢測是一個選擇問題,研究界已經(jīng)將注意力集中在AP 的可解釋性上。

通過并集上的交點測量正確性

目標檢測系統(tǒng)根據(jù)邊界框和類標簽進行預(yù)測。

f77863e4-d6e0-11ed-bfe3-dac502259ad0.png

真正的目標檢測圖

在實踐中,X1、X2、Y1、Y2 坐標中預(yù)測的邊界框肯定會偏離地面真實標簽(即使稍微偏離)。我們知道如果邊界框預(yù)測是錯誤的類,我們應(yīng)該將其視為不正確的,但是我們應(yīng)該在哪里繪制邊界框重疊的線?

Intersection over Union (IoU) 提供了一個度量來設(shè)置這個邊界,與地面真實邊界框重疊的預(yù)測邊界框的數(shù)量除以兩個邊界框的總面積。

f78bab34-d6e0-11ed-bfe3-dac502259ad0.png?

真正對 IoU 指標的圖形描述。

為 IoU 指標選擇正確的單個閾值似乎是任意的,一位研究人員可能會證明 60% 的重疊是合理的,而另一位則認為 75% 似乎更合理,那么為什么不在一個指標中考慮所有閾值呢?

繪制mAP精度-召回曲線

為了計算 mAP,我們繪制了一系列具有不同難度級別的 IoU 閾值的精確-召回曲線。

f79ab746-d6e0-11ed-bfe3-dac502259ad0.png

我們真正繪制的 mAP 精確召回曲線圖

在上圖中,紅色繪制的是對 IoU 的最高要求(可能是 90%),橙色線繪制的是對 IoU 的最低要求(可能是 10%),要繪制的線數(shù)通常由挑戰(zhàn)設(shè)置。例如,COCO 挑戰(zhàn)設(shè)置了十個不同的 IoU 閾值,從 0.5 開始,以 0.05 的步長增加到 0.95。

最后,我們?yōu)榘搭愋蛣澐值臄?shù)據(jù)集繪制這些精度-召回曲線。

f7b243e8-d6e0-11ed-bfe3-dac502259ad0.png

由我們真正按對象類別劃分的 mAP 圖

該指標在所有 IoU 閾值上單獨計算每個類的平均精度 (AP),然后該指標對所有類別的 mAP 進行平均以得出最終估計值。

在實驗中使用平均精度均值(mAP)

我最近在一篇文章中使用了mAP,比較了最先進的EfficientDet和YOLOv3檢測模型,我想看看哪個模型在識別血液中的細胞表現(xiàn)更好。

在對測試集中的每個圖像進行推理后,我導(dǎo)入了一個 python 包來計算Colab筆記本中的mAP,結(jié)果如下!

EfficientDet 對細胞物體檢測的評價:

78.59% = Platelets AP 
77.87% = RBC AP 
96.47% = WBC AP 
mAP = 84.31%

YOLOv3對細胞物體檢測的評價:

72.15% = Platelets AP 
74.41% = RBC AP 
95.54% = WBC AP 
mAP = 80.70%

因此,與本文開頭的單一推斷圖片相反,事實證明EfficientDet在建模細胞目標檢測方面做得更好!我們還將注意該指標是按對象類劃分的,這告訴我們,白細胞比血小板和紅細胞更容易檢測,這是有道理的,因為它們比其他細胞大得多,并且不同。

地圖也經(jīng)常被分成小、中、大對象,這有助于識別模型(和/或數(shù)據(jù)集)可能出現(xiàn)錯誤的地方。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • MAP
    MAP
    +關(guān)注

    關(guān)注

    0

    文章

    48

    瀏覽量

    15106
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1685

    瀏覽量

    45811
  • AUC
    AUC
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    6640
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    481

    瀏覽量

    21932

原文標題:什么是目標檢測中的平均精度均值(mAP)?

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    電子信息產(chǎn)業(yè)已成為我國的國民經(jīng)濟支柱產(chǎn)業(yè)

      電子信息產(chǎn)業(yè)已成為我國的國民經(jīng)濟支柱產(chǎn)業(yè),如今電子制造業(yè)的六大亮點:總體規(guī)模逐步擴大,企業(yè)實力增強;產(chǎn)業(yè)集中度不斷提升;區(qū)域集中效應(yīng)日益顯現(xiàn);結(jié)構(gòu)調(diào)整取得較大的進展,高端產(chǎn)品在
    發(fā)表于 07-02 16:40

    公眾WiFi服務(wù)已成為商家的“標配”

    已成為普通市民日常生活中,必不可少的一部分。商家紛紛提供免費wifi服務(wù),應(yīng)對顧客對無線上網(wǎng)的需求。既能夠向顧客提供高質(zhì)量的wifi免費服務(wù),還能同時提升商家的品牌形象,通過短信關(guān)懷和營銷、微信微博營銷
    發(fā)表于 04-10 10:44

    雷達回波發(fā)生器的主要技術(shù)指標有什么?

    難以在完全真實的環(huán)境中進行。因此,通過數(shù)字模擬的方法真實地模擬雷達回波信號很有意義。雷達回波發(fā)生器是數(shù)字仿真技術(shù)和雷達技術(shù)相結(jié)合的產(chǎn)物,它通過仿真模擬的方法產(chǎn)生目標和環(huán)境信息的回波信號。利用這種回波信號對雷達信號處理機進行調(diào)試、分析和*估,已成為現(xiàn)代雷達信號處理機研制和生
    發(fā)表于 08-21 06:33

    目標檢測和圖像語義分割領(lǐng)域性能評價指標

    目標檢測和圖像語義分割領(lǐng)域的性能評價指標
    發(fā)表于 05-13 09:57

    一種基于Kalman濾波器的運動目標檢測和跟蹤算法

    視頻或圖像序列中的運動目標檢測與跟蹤已成為計算機視覺領(lǐng)域研究的重要方向之一。本文實現(xiàn)了視頻序列中的運動目標檢測,使用了背景差法和幀間差分法
    發(fā)表于 10-09 16:01 ?78次下載

    Alignment已成為Inphi公司在中國的授權(quán)廠家代表

    Alignment已成為Inphi公司在中國的授權(quán)廠家代表 Alignment (緣隆)宣布,Alignment已成為Inphi公司在中國的授權(quán)廠家代表。 Inphi公司是一家美國高速模擬半導(dǎo)體公司。
    發(fā)表于 09-07 07:04 ?1228次閱讀

    區(qū)塊鏈技術(shù)已成為電商的新風(fēng)口

    區(qū)塊鏈技術(shù)儼然已成為電商的新風(fēng)口,其先進性也毋庸置疑,但也因為落地場景不多而顯得不夠“接地氣”。而跨境電商與區(qū)塊鏈技術(shù)能否有效進行結(jié)合、成功落地,業(yè)內(nèi)認為還尚待觀察。
    發(fā)表于 01-14 14:13 ?611次閱讀

    FLIR紅外熱像儀已成為火山研究者檢測和分析火山熱活動不可或缺的工具

    通過FLIR紅外熱像儀獲得火山熱成像圖,進行觀察分析。FLIR紅外熱像技術(shù)已成為火山研究者可視化火山熱的重要方法。
    的頭像 發(fā)表于 08-14 11:14 ?3308次閱讀

    無線電技術(shù)已成為信息通信技術(shù)中的創(chuàng)新活力和發(fā)展?jié)摿?/a>

    中國移動已成為全球5G發(fā)展的核心力量

    “中國移動已成為全球5G發(fā)展的核心力量”水波表示,中國移動是5G需求目標的“定義者”、技術(shù)標準的“引領(lǐng)者”、端到端產(chǎn)業(yè)的“構(gòu)建者”和5G賦能各行業(yè)的“開拓者”。
    發(fā)表于 11-07 08:54 ?1262次閱讀

    海信75L9S激光電視成銷冠 激光電視已成為消費者的大屏首選

    消費者正在“用腳投票”證明:激光電視已成為消費者的大屏首選。中怡康第49周(12月2-8日)監(jiān)測數(shù)據(jù)顯示,剛上市一周的海信75L9S全色激光電視,就登頂暢銷榜首。而海信80L5也持續(xù)熱銷,穩(wěn)坐年度第一位置。
    發(fā)表于 12-12 10:30 ?1800次閱讀

    VPN已成為了攻擊入口,安全訪問該何去何從

    在過去十多年,SSL VPN已成為眾多企業(yè)的IT基礎(chǔ)設(shè)施。近期利用SSL VPN設(shè)備發(fā)起的APT攻擊事件并非孤案。
    發(fā)表于 04-13 17:37 ?2096次閱讀

    日經(jīng)亞洲:中國已成為新興技術(shù)制定國際規(guī)則的核心參與者

    日經(jīng)亞洲評論稱,中國已成為新興技術(shù)制定國際規(guī)則的核心參與者,特別是5G。
    發(fā)表于 07-26 11:35 ?771次閱讀

    WSL中運行Linux GUI應(yīng)用已成為現(xiàn)實

    在 WSL 中運行 Linux GUI 應(yīng)用已成為現(xiàn)實,微軟 WSL 團隊產(chǎn)品經(jīng)理 Craig Loewen 在推特展示了其團隊為 WSL 添加對 Linux GUI 應(yīng)用的支持,并表示越來越接近初始預(yù)覽階段,將會在未來幾個月內(nèi)發(fā)布的 Windows Insiders 預(yù)覽版本中引入。
    的頭像 發(fā)表于 10-10 14:40 ?3515次閱讀

    天翼云領(lǐng)跑政務(wù)云駛?cè)肟燔嚨溃毺貎?yōu)勢成為政府上云首選

    當前,上云已成為普遍共識。在眾多的云服務(wù)商中,天翼云何以脫穎而出,成為政務(wù)上云的首選?
    的頭像 發(fā)表于 12-09 14:09 ?2392次閱讀