0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何讓分類器預(yù)測(cè)目標(biāo)是否為“背景”的概率

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-10-24 09:01 ? 次閱讀

很多機(jī)器學(xué)習(xí)分類器都需要對(duì)背景或其他類別的物體進(jìn)行具體分類。這種分類器最大的難題就是在對(duì)背景進(jìn)行分類時(shí)能否達(dá)到較高的準(zhǔn)確率。它沒有可辨別特征,并且可用的訓(xùn)練數(shù)據(jù)可能不會(huì)覆蓋所有的輸入分布。在這篇文章中,我們提出了幾種解決這一問題的方法。

在這篇文章里,我們將圖像樣本分類問題看做“狗狗種類的區(qū)分”問題(總共有9種狗狗):

我們解決了三個(gè)難題:

如何讓分類器預(yù)測(cè)目標(biāo)是否為“背景”的概率

如何得到背景訓(xùn)練數(shù)據(jù)之外的、并不符合真實(shí)背景分布的數(shù)據(jù)

如何修復(fù)背景分類的不平衡性

使用背景類別數(shù)據(jù)

想創(chuàng)建這個(gè)狗狗分類器,有兩種方法可用:

得到這些狗狗圖像和背景的所有數(shù)據(jù)(將背景也看作是可識(shí)別的一類對(duì)象),共有10類

創(chuàng)建一個(gè)能辨別9種狗狗種類的模型,如果模型在9個(gè)種類上都沒有足夠高的置信度,那么就將其判定為“背景”

從我的經(jīng)驗(yàn)來看,第二種方法表現(xiàn)不佳。我發(fā)現(xiàn)這樣的模型學(xué)會(huì)了以狗狗為中心進(jìn)行嵌入(logit層和softmax之前的最后一層),并且閾值通常會(huì)將各種類別的邊界附近的嵌入映射到“背景”一類中:

但是事實(shí)上,狗狗們只是圖片的一個(gè)子空間,也許接近一個(gè)極值(與分類器需要學(xué)習(xí)的毛發(fā)特征等其他特征不同):

這樣的分類器在沒有狗狗的圖像上可以任意工作。接下來,我們會(huì)介紹只能預(yù)測(cè)背景概率的分類器。

控制背景分類的學(xué)習(xí)

假設(shè)我們現(xiàn)在已經(jīng)收集到了足夠的有關(guān)背景分類的數(shù)據(jù)了,通常,我們的背景數(shù)據(jù)都是圖片的不完全分布。下面是一些家用電器和廚房用具:

如果我們僅在這些圖片上訓(xùn)練一個(gè)模型,讓它把背景當(dāng)做另外一個(gè)類別的東西,那么嵌入示意圖看起來很不完美:

我有一種能顯著改善這種情況的方法:不讓背景類別學(xué)習(xí)特征,只讓它學(xué)習(xí)一種可訓(xùn)練變量,即它的logit。這樣一來,背景類別不會(huì)被嵌入到某個(gè)具體的區(qū)域中,給那些真正屬于背景的圖片更多的嵌入圖空間:

當(dāng)然了,這種方法仍不完美。在某種程度上,狗狗分類可以學(xué)習(xí)在電器圖片上表現(xiàn)較弱,但在實(shí)際中一定比這種更好。

我用上面的9種狗和6種電器的數(shù)據(jù)訓(xùn)練了一個(gè)模型,并完全的ImageNet驗(yàn)證集上對(duì)它們進(jìn)行驗(yàn)證。我在訓(xùn)練和驗(yàn)證時(shí)加入了權(quán)重,以減輕分類的不平衡性(下一節(jié)我們會(huì)講到如何處理真正分布的不平衡)。在下方的驗(yàn)證圖表中,綠色的折線是模型將所有類別都相同對(duì)待的結(jié)果,藍(lán)色折線是模型在學(xué)習(xí)時(shí)沒有學(xué)習(xí)背景類型的結(jié)果:

驗(yàn)證精度vs訓(xùn)練次數(shù)

沒有學(xué)習(xí)背景特征的模型在大多數(shù)訓(xùn)練中都保持領(lǐng)先,在沒有訓(xùn)練背景的情況下,精確度在15個(gè)類別的數(shù)據(jù)集上都有了提升(9種狗狗類別、6種電器類別和其中的背景類別),同時(shí)在有1000種數(shù)據(jù)集分類上也有進(jìn)步(9個(gè)狗狗類別、991種電器類別和其中一個(gè)背景類別):

注意,這一結(jié)果表明這10種類別在驗(yàn)證時(shí)都是一樣重要。

背景分類不平衡

最后,我們要考慮另一種情況,即背景類別實(shí)際上比測(cè)試時(shí)狗狗圖片的數(shù)量要多。假設(shè)測(cè)試時(shí)的分布都來源于ImageNet,我們的分類器在這些情況下表現(xiàn)較差,因?yàn)樗谟?xùn)練時(shí)認(rèn)為所有類別都是平均分布的。

解決這一問題最簡(jiǎn)單的方法就是在每個(gè)肯定預(yù)測(cè)中加入更高的閾值,從而當(dāng)概率超過這一值并且是最高的時(shí),我們才能判斷這是某種類型的狗狗。由此,我們得到了以下的精確度與反饋曲線,如果分類器從9種狗狗中預(yù)測(cè)出了一種,那么每個(gè)樣本都都被看作是“正的”,如果預(yù)測(cè)結(jié)果為“背景”,那么就是“負(fù)的”。

例如,如果我們需要對(duì)狗狗的預(yù)測(cè)結(jié)果達(dá)到90%的置信度,我們會(huì)對(duì)85%的圖片進(jìn)行正確標(biāo)簽,大約有7%的預(yù)測(cè)是正確的。

不過,這一結(jié)果還能提高。我們可以用先驗(yàn)和下面的貝葉斯公式,將概率分布從“統(tǒng)一”改變成“shifted”,前提是假設(shè)每個(gè)類別x都符合P(image|x,shifted) = P(image|x,uniform):

這樣做的好處是,它并不需要收集更多數(shù)據(jù),甚至重新訓(xùn)練模型,只需要一個(gè)簡(jiǎn)單的數(shù)據(jù)公式,就能得出更好地預(yù)測(cè)結(jié)果。

結(jié)語

總的來說,在這篇文章中我提出了三種能夠在有背景的圖片中提高分類器精確度的技術(shù):

在背景類別中添加一些數(shù)據(jù),讓模型對(duì)其進(jìn)行概率預(yù)測(cè)(而不是僅僅訓(xùn)練一個(gè)無背景的類別,對(duì)背景類別映射低概率)

避免模型使用任何特征了解背景類別的活動(dòng)

使用先驗(yàn)調(diào)整類別不平衡問題

這些技術(shù)能改變模型對(duì)背景圖片的預(yù)測(cè),從此前的混亂預(yù)測(cè),到可以推斷出大量信息。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 分類器
    +關(guān)注

    關(guān)注

    0

    文章

    152

    瀏覽量

    13149
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131838

原文標(biāo)題:如何用機(jī)器學(xué)習(xí)精準(zhǔn)辨別“背景”和“目標(biāo)”

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    激光雷達(dá)距離像背景抑制算法研究

    的直方圖劃分為描述目標(biāo)區(qū)像素和背景像素的兩個(gè)概率分布,而將使這些概率分布熵最大的灰度值作為分割閾值。將此算法應(yīng)用于實(shí)際圖像處理,結(jié)果表明對(duì)于大目標(biāo)
    發(fā)表于 08-08 09:40

    目標(biāo)檢測(cè) | 已開源!全新水下目標(biāo)檢測(cè)算法SWIPENet+IMA框架

    ,包含了一個(gè)殘差單元,主路和旁路進(jìn)行逐元素相加,然后再接到分類與回歸的預(yù)測(cè)模塊中??梢钥闯?,DSSD通過多個(gè)上采樣反卷積層增強(qiáng)了SSD目標(biāo)檢測(cè)框架,以提高特征圖的分辨率。在DSSD體系結(jié)構(gòu)中,首先
    發(fā)表于 07-24 11:05

    YOLOv5全面解析教程之目標(biāo)檢測(cè)模型精確度評(píng)估

    1、目標(biāo)檢測(cè)模型精確度評(píng)估  指標(biāo)評(píng)估(重要的一些定義)  指標(biāo)的一些基本概念:  TP(True Postives):分類把正例正確的分類-預(yù)測(cè)
    發(fā)表于 11-21 16:40

    基于YOLOX目標(biāo)檢測(cè)算法的改進(jìn)

    最小化預(yù)測(cè)框和真實(shí)框面積差距的 同時(shí)優(yōu)化其形狀相似性,這對(duì)于遮擋目標(biāo)和小目標(biāo) 等困難目標(biāo)檢測(cè)有重要意義,更合理的檢測(cè)框形狀 將減小該框在后處理過程中被過濾掉的
    發(fā)表于 03-06 13:55

    紅外背景抑制與小目標(biāo)分割檢測(cè)

    紅外背景抑制與小目標(biāo)分割檢測(cè) 紅外尋的導(dǎo)引頭小目標(biāo)圖像的分割與檢測(cè)是地空導(dǎo)彈和艦空導(dǎo)彈的關(guān)鍵技術(shù).本文研究用六種高通濾波抑制大面積
    發(fā)表于 10-21 18:43 ?1294次閱讀
    紅外<b class='flag-5'>背景</b>抑制與小<b class='flag-5'>目標(biāo)</b>分割檢測(cè)

    基于概率預(yù)測(cè)的虛擬機(jī)動(dòng)態(tài)遷移機(jī)制改進(jìn)

    基于概率預(yù)測(cè)的虛擬機(jī)動(dòng)態(tài)遷移機(jī)制改進(jìn)
    發(fā)表于 01-08 14:47 ?0次下載

    基于Copula理論的條件預(yù)測(cè)誤差分布與光伏發(fā)電出力的條件預(yù)測(cè)誤差概率分布估計(jì)方法介紹

    Copula 函數(shù)對(duì)光伏實(shí)際出力與點(diǎn)預(yù)測(cè)的聯(lián)合概率分布進(jìn)行建模,實(shí)現(xiàn)了任意點(diǎn)預(yù)測(cè)對(duì)應(yīng)的光伏實(shí)際出力的條件概率分布的估計(jì)。針對(duì)天氣狀況,對(duì)光伏預(yù)測(cè)
    發(fā)表于 10-01 11:22 ?15次下載
    基于Copula理論的條件<b class='flag-5'>預(yù)測(cè)</b>誤差分布與光伏發(fā)電出力的條件<b class='flag-5'>預(yù)測(cè)</b>誤差<b class='flag-5'>概率</b>分布估計(jì)方法介紹

    基于概率的無監(jiān)督缺陷預(yù)測(cè)方法

    映射概率,使用概率評(píng)估類存在缺陷的可能性,然后再通過聚類和標(biāo)記來完成缺陷預(yù)測(cè),以解決現(xiàn)有無監(jiān)督方法直接根據(jù)閾值判斷時(shí)對(duì)閾值比較敏感而引起的信息丟失問題。將PCLA方法應(yīng)用在NetGe
    發(fā)表于 11-21 14:45 ?5次下載

    模式識(shí)別貝葉斯分類器概念

    貝葉斯分類器分類原理是通過某對(duì)象的先驗(yàn)概率,利用貝葉斯公式計(jì)算出其后驗(yàn)概率,即該對(duì)象屬于某一類的概率,選擇具有最大后驗(yàn)
    發(fā)表于 11-30 15:53 ?2961次閱讀
    模式識(shí)別貝葉斯<b class='flag-5'>分類器</b>概念

    貝葉斯分類器原理及應(yīng)用分析

    貝葉斯分類器分類原理是通過某對(duì)象的先驗(yàn)概率,利用貝葉斯公式計(jì)算出其后驗(yàn)概率,即該對(duì)象屬于某一類的概率,選擇具有最大后驗(yàn)
    發(fā)表于 11-30 16:12 ?1.2w次閱讀
    貝葉斯<b class='flag-5'>分類器</b>原理及應(yīng)用分析

    基于級(jí)聯(lián)式分類的網(wǎng)頁分類方法

    分類系統(tǒng)的一級(jí)分類采用在線分類方法,僅利用錨文本中網(wǎng)頁標(biāo)題包含的特征預(yù)測(cè)分類,同時(shí)計(jì)算分類結(jié)果
    發(fā)表于 12-05 08:44 ?0次下載
    基于級(jí)聯(lián)式<b class='flag-5'>分類</b><b class='flag-5'>器</b>的網(wǎng)頁<b class='flag-5'>分類</b>方法

    基于概率校準(zhǔn)的集成學(xué)習(xí)方法

    針對(duì)原有集成學(xué)習(xí)多樣性不足而導(dǎo)致的集成效果不夠顯著的問題,提出一種基于概率校準(zhǔn)的集成學(xué)習(xí)方法以及兩種降低多重共線性影響的方法。首先,通過使用不同的概率校準(zhǔn)方法對(duì)原始分類給出的
    發(fā)表于 12-22 11:02 ?0次下載
    基于<b class='flag-5'>概率</b>校準(zhǔn)的集成學(xué)習(xí)方法

    基于概率的常見的分類方法--樸素貝葉斯

    本文介紹機(jī)器學(xué)習(xí)中一種基于概率的常見的分類方法,樸素貝葉斯,之前介紹的KNN, decision tree 等方法是一種 hard decision,因?yàn)檫@些分類的輸出只有0 或者
    的頭像 發(fā)表于 02-03 14:37 ?5106次閱讀
    基于<b class='flag-5'>概率</b>的常見的<b class='flag-5'>分類</b>方法--樸素貝葉斯

    不確定區(qū)間的混合概率電力負(fù)荷預(yù)測(cè)方法

    不確定區(qū)間的混合概率電力負(fù)荷預(yù)測(cè)方法
    發(fā)表于 06-27 14:21 ?22次下載

    OpenCV中八種不同的目標(biāo)追蹤算法

    分類的任務(wù)是將圖像的矩形區(qū)域分類對(duì)象或背景分類
    的頭像 發(fā)表于 03-30 10:22 ?1194次閱讀