0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于有效樣本的類別不平衡損失

自然語(yǔ)言處理愛(ài)好者 ? 來(lái)源:AI公園 ? 作者:Sik-Ho Tsang ? 2021-08-16 11:14 ? 次閱讀

導(dǎo)讀

使用每個(gè)類的有效樣本數(shù)量來(lái)重新為每個(gè)類的Loss分配權(quán)重,效果優(yōu)于RetinaNet中的Focal Loss。

本文綜述了康奈爾大學(xué)、康奈爾科技、谷歌Brain和Alphabet公司的基于有效樣本數(shù)的類平衡損失(CB損失)。在本文中,設(shè)計(jì)了一種重新加權(quán)的方案,利用每個(gè)類的有效樣本數(shù)來(lái)重新平衡損失,稱為類別平衡損失。

1. 類別平衡問(wèn)題

假設(shè)有像上面那樣的不平衡的類。head:對(duì)于索引小的類,這些類有較多的樣本。Tail:對(duì)于大索引的類,這些類的樣本數(shù)量較少。黑色實(shí)線:直接在這些樣本上訓(xùn)練的模型偏向于優(yōu)勢(shì)類。紅色虛線:通過(guò)反向類頻率來(lái)重新加權(quán)損失可能會(huì)在具有高類不平衡的真實(shí)數(shù)據(jù)上產(chǎn)生較差的性能。藍(lán)虛線:設(shè)計(jì)了一個(gè)類平衡項(xiàng),通過(guò)反向有效樣本數(shù)來(lái)重新加權(quán)損失。

2. 有效樣本數(shù)量

2.1. 定義

6f483fc4-fd9a-11eb-9bcf-12bb97331649.png

數(shù)據(jù)間信息重疊,左:特征空間S,中:1個(gè)樣本數(shù)據(jù)的單位體積,右:數(shù)據(jù)間信息重疊

直覺(jué)上,數(shù)據(jù)越多越好。但是,由于數(shù)據(jù)之間存在信息重疊,隨著樣本數(shù)量的增加,模型從數(shù)據(jù)中提取的邊際效益會(huì)減少

左:給定一個(gè)類,將該類的特征空間中所有可能數(shù)據(jù)的集合表示為S。假設(shè)S的體積為N且N≥1。中:S子集中的每個(gè)樣本的單位體積為1,可能與其他樣本重疊。Right:從S中隨機(jī)抽取每個(gè)子集,覆蓋整個(gè)S集合。采樣的數(shù)據(jù)越多,S的覆蓋率就越好。期望的采樣數(shù)據(jù)總量隨著樣本數(shù)量的增加而增加,以N為界。

因此,將有效樣本數(shù)定義為樣本的期望體積。

這個(gè)想法是通過(guò)使用一個(gè)類的更多數(shù)據(jù)點(diǎn)來(lái)捕捉邊際效益的遞減。由于現(xiàn)實(shí)世界數(shù)據(jù)之間的內(nèi)在相似性,隨著樣本數(shù)量的增加,新添加的樣本極有可能是現(xiàn)有樣本的近重復(fù)。另外,cnn是用大量的數(shù)據(jù)增廣來(lái)訓(xùn)練的,所有的增廣實(shí)例也被認(rèn)為與原始實(shí)例相同。對(duì)于一個(gè)類,N可以看作是唯一原型的數(shù)量。

2.2. 數(shù)學(xué)公式

En表示樣本的有效數(shù)量(期望體積)。為了簡(jiǎn)化問(wèn)題,不考慮部分重疊的情況。也就是說(shuō),一個(gè)新采樣的數(shù)據(jù)點(diǎn)只能以兩種方式與之前的采樣數(shù)據(jù)交互:完全在之前的采樣數(shù)據(jù)集中,概率為p,或完全在原來(lái)的數(shù)據(jù)集之外,的概率為1- p。

有效數(shù)字:En = (1?β^n)/(1?β),其中,β = (N? 1)/N,這個(gè)命題可以用數(shù)學(xué)歸納法證明。當(dāng)E1 = 1時(shí),不存在重疊,E1 =(1?β^1)/(1?β) = 1成立。假設(shè)已經(jīng)有n?1個(gè)樣本,并且即將對(duì)第n個(gè)樣本進(jìn)行采樣,現(xiàn)在先前采樣數(shù)據(jù)的期望體積為En ?1,而新采樣的數(shù)據(jù)點(diǎn)與先前采樣點(diǎn)重疊的概率為 p = E(n?1)/N。因此,第n個(gè)實(shí)例采樣后的期望體積為:

6f8b26a4-fd9a-11eb-9bcf-12bb97331649.png

此時(shí):

我們有:

6fc6da32-fd9a-11eb-9bcf-12bb97331649.png

上述命題表明有效樣本數(shù)是n的指數(shù)函數(shù)。超參數(shù)β∈[0,1)控制En隨著n的增長(zhǎng)有多快。

3. 類別平衡 Loss (CB Loss)

類別平衡(CB)loss可以寫成:

6fe31a80-fd9a-11eb-9bcf-12bb97331649.png

其中,ny是類別y的ground-truth的數(shù)量。β = 0對(duì)應(yīng)沒(méi)有重新加權(quán), β → 1對(duì)應(yīng)于用反向頻率進(jìn)行加權(quán)。

提出的有效樣本數(shù)的新概念使我們能夠使用一個(gè)超參數(shù)β來(lái)平滑地調(diào)整無(wú)重權(quán)和反向類頻率重權(quán)之間的類平衡項(xiàng)。

所提出的類平衡項(xiàng)是模型不可知的和損失不可知的,因?yàn)樗?dú)立于損失函數(shù)L和預(yù)測(cè)類概率p的選擇。

3.1. 類別平衡的 Softmax 交叉熵?fù)p失

給定一個(gè)標(biāo)號(hào)為y的樣本,該樣本的softmax交叉熵(CE)損失記為:

6ff9c546-fd9a-11eb-9bcf-12bb97331649.png

假設(shè)類y有ny個(gè)訓(xùn)練樣本,類平衡(CB)softmax交叉熵?fù)p失為:

70271b54-fd9a-11eb-9bcf-12bb97331649.png

3.2. 類別平衡的 Sigmoid 交叉熵?fù)p失

當(dāng)對(duì)多類問(wèn)題使用sigmoid函數(shù)時(shí),網(wǎng)絡(luò)的每個(gè)輸出都執(zhí)行一個(gè)one-vs-all分類,以預(yù)測(cè)目標(biāo)類在其他類中的概率。在這種情況下,Sigmoid不假定類之間的互斥性。由于每個(gè)類都被認(rèn)為是獨(dú)立的,并且有自己的預(yù)測(cè)器,所以sigmoid將單標(biāo)簽分類和多標(biāo)簽預(yù)測(cè)統(tǒng)一起來(lái)。這是一個(gè)很好的屬性,因?yàn)楝F(xiàn)實(shí)世界的數(shù)據(jù)通常有多個(gè)語(yǔ)義標(biāo)簽。sigmoid交叉熵(CE)損失可以寫成:

7032cd82-fd9a-11eb-9bcf-12bb97331649.png

類平衡(CB) sigmoid交叉熵?fù)p失為:

709d0724-fd9a-11eb-9bcf-12bb97331649.png

3.3. 類別平衡 Focal Loss

Focal loss (FL)是在RetinaNet中提出的,可以減少分類很好的樣本的損失,聚焦于困難的樣本。

類別平衡的 (CB) Focal Loss為:

70d554f8-fd9a-11eb-9bcf-12bb97331649.png

4. 實(shí)驗(yàn)結(jié)果

4.1. 數(shù)據(jù)集

試驗(yàn)了CIFAR-10和CIFAR-100的5個(gè)不平衡系數(shù)分別為10、20、50、100和200的長(zhǎng)尾版本。iNaturalist 和ILSVRC是天然的類別不平衡數(shù)據(jù)集。

上面顯示了每個(gè)類具有不同不平衡因素的圖像數(shù)量。

4.2. CIFAR 數(shù)據(jù)集

loss類型的超參數(shù)搜索空間為{softmax, sigmoid, focal}, [focal loss]的超參數(shù)搜索空間為β∈{0.9,0.99,0.999,0.9999},γ∈{0.5,1.0,2.0}。在CIFAR-10上,最佳的β一致為0.9999。但在CIFAR-100上,不同不平衡因子的數(shù)據(jù)集往往有不同且較小的最優(yōu)β。

718c16f2-fd9a-11eb-9bcf-12bb97331649.png

有和沒(méi)有類平衡項(xiàng)時(shí)的分類錯(cuò)誤率

在CIFAR-10上,根據(jù)β = 0.9999重新加權(quán)后,有效樣本數(shù)與樣本數(shù)接近。這意味著CIFAR-10的最佳重權(quán)策略與逆類頻率重權(quán)類似。在CIFAR-100上,使用較大的β的性能較差,這表明用逆類頻率重新加權(quán)不是一個(gè)明智的選擇,需要一個(gè)更小的β,具有更平滑的跨類權(quán)重。例如,一個(gè)特定鳥(niǎo)類物種的獨(dú)特原型數(shù)量應(yīng)該小于一個(gè)一般鳥(niǎo)類類的獨(dú)特原型數(shù)量。由于CIFAR-100中的類比CIFAR-10更細(xì)粒度,因此CIFAR-100的N比CIFAR-10小。

4.3. 大規(guī)模數(shù)據(jù)集

721263ba-fd9a-11eb-9bcf-12bb97331649.png

在所有數(shù)據(jù)集驗(yàn)證集上,使用不同損失函數(shù)訓(xùn)練的大規(guī)模數(shù)據(jù)集上的Top-1和Top-5分類錯(cuò)誤率

使用了類平衡的Focal Loss,因?yàn)樗哂懈蟮撵`活性,并且發(fā)現(xiàn)β = 0.999和γ = 0.5在所有數(shù)據(jù)集上都獲得了合理的良好的性能。值得注意的是,使用了類別平衡的Focal Loss來(lái)代替Softmax交叉熵,ResNet-50能夠達(dá)到和ResNet-152相應(yīng)的性能。

以上數(shù)字顯示類平衡的Focal Loss損失經(jīng)過(guò)60個(gè)epochs的訓(xùn)練后,開(kāi)始顯示其優(yōu)勢(shì)。

英文原文:https://medium.com/nerd-for-tech/review-cb-loss-class-balanced-loss-based-on-effective-number-of-samples-image-classification-3056a1a1a001

作者:Sik-Ho Tsang

編譯:ronghuaiyang(AI公園)

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6080

    瀏覽量

    104372
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24538
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    349

    瀏覽量

    21968

原文標(biāo)題:CB Loss:基于有效樣本的類別不平衡損失

文章出處:【微信號(hào):NLP_lover,微信公眾號(hào):自然語(yǔ)言處理愛(ài)好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    電容器不平衡保護(hù)動(dòng)作原因分析

    電容器不平衡保護(hù)動(dòng)作的原因多種多樣,主要包括以下幾個(gè)方面: 1. 電容器組內(nèi)部故障 電容量不平衡 :電容器組中的電容器由于老化、損壞或制造差異,可能導(dǎo)致三相電容量不平衡。當(dāng)三相之間電容值差異較大
    的頭像 發(fā)表于 09-20 15:43 ?102次閱讀

    LCR測(cè)試儀如何測(cè)量不平衡度?

    在電路設(shè)計(jì)和維修中,了解電路元件的特性是非常重要的。LCR測(cè)試儀就是一種常用的檢測(cè)儀器,它可以測(cè)量電感(L)、電容(C)和電阻(R)的參數(shù)。其中,測(cè)量不平衡度是LCR測(cè)試儀的一項(xiàng)重要功能。那么
    的頭像 發(fā)表于 08-26 16:49 ?166次閱讀
    LCR測(cè)試儀如何測(cè)量<b class='flag-5'>不平衡</b>度?

    軟啟動(dòng)三相不平衡的解決辦法有哪些

    軟啟動(dòng)三相不平衡是指在軟啟動(dòng)過(guò)程中,三相電動(dòng)機(jī)的電流不平衡,導(dǎo)致電動(dòng)機(jī)的運(yùn)行效率降低,甚至可能引發(fā)電動(dòng)機(jī)的損壞。針對(duì)這個(gè)問(wèn)題,我們可以從多個(gè)方面進(jìn)行解決。 一、軟啟動(dòng)三相不平衡的原因分析 電源電壓
    的頭像 發(fā)表于 07-02 09:40 ?1117次閱讀

    軟啟動(dòng)報(bào)三相電流不平衡怎么處理

    軟啟動(dòng)器是一種用于電動(dòng)機(jī)啟動(dòng)的電氣設(shè)備,它可以有效地降低電動(dòng)機(jī)啟動(dòng)時(shí)的電流沖擊,減少對(duì)電網(wǎng)和電動(dòng)機(jī)的影響。然而,在實(shí)際應(yīng)用中,軟啟動(dòng)器有時(shí)會(huì)出現(xiàn)三相電流不平衡的問(wèn)題,這會(huì)對(duì)電動(dòng)機(jī)的正常運(yùn)行和軟啟動(dòng)
    的頭像 發(fā)表于 06-18 11:44 ?2459次閱讀

    三相不平衡調(diào)節(jié)裝置 三相不平衡會(huì)造成什么后果

    三相不平衡調(diào)節(jié)裝置是一種用于解決三相電力系統(tǒng)中三相電壓或電流不平衡問(wèn)題的設(shè)備。在本文中,我們將探討三相不平衡的原因、后果和解決方案,并詳細(xì)介紹三相不平衡調(diào)節(jié)裝置的工作原理和應(yīng)用。 引言
    的頭像 發(fā)表于 02-06 10:14 ?1403次閱讀

    三相不平衡最佳解決辦法 三相不平衡多少范圍內(nèi)是合理的

    三相不平衡最佳解決辦法 在電力系統(tǒng)中,三相不平衡是指三個(gè)相之間電壓或電流不相等的現(xiàn)象。當(dāng)三相不平衡的情況發(fā)生時(shí),可能會(huì)導(dǎo)致線路過(guò)載、設(shè)備壽命縮短、電能損耗增加等問(wèn)題。因此,解決三相不平衡
    的頭像 發(fā)表于 02-06 10:07 ?2012次閱讀

    三相電流不平衡是指什么?三相電流不平衡允許范圍是多少

    三相電流不平衡是指什么?三相電流不平衡允許范圍是多少? 三相電流不平衡是指三相電路中三個(gè)相位電流的大小不相等或相位角不相等的情況。在理想的三相電路中,三個(gè)相位電流應(yīng)當(dāng)相等,相位角差120度。 然而
    的頭像 發(fā)表于 02-02 17:34 ?5887次閱讀

    AD9288輸出不平衡跟Vref有關(guān)系嗎?

    最近在用AD9288作為采樣芯片,發(fā)現(xiàn)很奇怪的問(wèn)題,同樣的信號(hào)幅度輸入,兩路AD采樣數(shù)值不一樣,一路基本平衡,另一路不平衡比較嚴(yán)重,采樣值-91~+100;另一塊同樣的PCB板,兩路都不平衡,比如
    發(fā)表于 12-15 06:24

    三相電壓不平衡對(duì)電路的影響

    對(duì)電路的影響主要包括以下幾個(gè)方面: 1. 功率損失:在三相電壓不平衡的情況下,電力系統(tǒng)中的三相負(fù)載也會(huì)出現(xiàn)不平衡,導(dǎo)致三相電流不平衡不平衡
    的頭像 發(fā)表于 12-11 17:16 ?1854次閱讀

    天線與饋線匹配中的平衡不平衡以及造成的影響解析

    天線與饋線匹配中的平衡不平衡以及造成的影響解析? 天線與饋線的匹配是無(wú)線電通信中非常重要的一環(huán)。平衡不平衡是兩種不同的天線與饋線匹配方式,它們對(duì)通信系統(tǒng)的性能有著不同的影響。 所謂
    的頭像 發(fā)表于 11-28 14:28 ?1288次閱讀

    三相用電不平衡的危害?

    三相用電不平衡的危害? 三相用電不平衡是指三相電網(wǎng)中的三個(gè)相電壓或三個(gè)相電流之間存在不平衡的情況。不平衡的三相用電可能會(huì)導(dǎo)致一系列的危害,以下是詳盡、詳實(shí)、細(xì)致的關(guān)于三相用電
    的頭像 發(fā)表于 11-10 14:35 ?1654次閱讀

    I/Q不平衡的來(lái)源 IQ信道之間的不平衡會(huì)造成什么影響呢?

    I/Q不平衡的來(lái)源 IQ信道之間的不平衡會(huì)造成什么影響呢? I/Q不平衡是指在I(即“In-phase”)和Q(即“Quadrature-phase”)信道的輸出之間存在不平衡的狀態(tài)。
    的頭像 發(fā)表于 10-31 09:34 ?925次閱讀

    三相電壓不平衡是什么原因造成的?三相不平衡會(huì)跳閘嗎?

    三相電壓不平衡是什么原因造成的?三相不平衡會(huì)跳閘嗎?三相不平衡度允許范圍? 三相電壓不平衡是指三相電源電壓之間的差異,通常是由電源系統(tǒng)出現(xiàn)故障或不良設(shè)計(jì)引起的。
    的頭像 發(fā)表于 09-25 17:36 ?5903次閱讀

    三相不平衡是什么意思?三相電壓不平衡怎么處理?

    三相不平衡是什么意思?三相電壓不平衡怎么處理?? 三相不平衡是指三相電壓或電流的幅度或相位不同,這會(huì)導(dǎo)致電力系統(tǒng)的不穩(wěn)定、效率低下、設(shè)備壽命短等問(wèn)題。在三相電力系統(tǒng)中,三相電壓應(yīng)該相等且相位差為
    的頭像 發(fā)表于 09-25 17:36 ?3321次閱讀

    三相電用電不平衡會(huì)有什么影響

    某些電氣設(shè)備僅適于單相用電,如果將其接在三相供電系統(tǒng)中,一旦安排不合理,就會(huì)造成三相電流不平衡。不平衡電流在系統(tǒng)的各相中將產(chǎn)生不同的電壓降,導(dǎo)致電網(wǎng)三相電壓不平衡。而三相電壓不平衡將造
    發(fā)表于 09-25 11:06 ?2362次閱讀