0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種提高網(wǎng)絡(luò)泛化能力的概率方法

jf_pmFSk4VX ? 來(lái)源:GiantPandaCV ? 作者:Garfield ? 2022-10-25 09:40 ? 次閱讀

1. 論文信息

題目:Uncertainty Modeling for Out-of-Distribution Generalization

作者:Xiaotong Li, Yongxing Dai, Yixiao Ge, Jun Liu, Ying Shan, Ling-Yu Duan

論文鏈接:https://arxiv.org/abs/2202.03958v1

代碼鏈接:https://github.com/lixiaotong97/DSU

2. 引言

Deep neural networks 在Computer Vision領(lǐng)域取得了非常大的成功,但嚴(yán)重依賴(lài)于訓(xùn)練和測(cè)試的domain遵循 identical distribution的假設(shè)。然而,這一假設(shè)在許多實(shí)際應(yīng)用中并不成立。例如,當(dāng)將在晴天訓(xùn)練的分割模型用于雨天和霧天環(huán)境時(shí),或用在照片上訓(xùn)練的模型識(shí)別藝術(shù)繪畫(huà)時(shí),在這種非分布部署場(chǎng)景中常??梢杂^察到不可避免的性能下降。

因此,以提高網(wǎng)絡(luò)在各種不可見(jiàn)測(cè)試域上的魯棒性為目標(biāo)的領(lǐng)域泛化問(wèn)題就顯得十分重要。本文就主要聚焦,如何在分布發(fā)生偏移變化的時(shí)候,讓模型仍能比較好的work。

4932d988-5394-11ed-a3b6-dac502259ad0.png


之前的許多工作都已經(jīng)闡述了,特征數(shù)據(jù)其實(shí)算是可以比較好的建模訓(xùn)練數(shù)據(jù)中抽象出來(lái)的特征。domain的feature主要是指對(duì)單個(gè)領(lǐng)域更具體但與任務(wù)目標(biāo)相關(guān)性較小的信息,如物體識(shí)別中的照片風(fēng)格和捕獲環(huán)境信息。因此,具有不同數(shù)據(jù)分布的域通常具有不一致的特征統(tǒng)計(jì)。所以我們只需要根據(jù) Empirical Risk Minimization的原則來(lái)最小化訓(xùn)練集損失誤差就可以了。

但是其實(shí)這些之前的方法都會(huì)有一個(gè)缺陷,就是這些方法在測(cè)試階段中沒(méi)有明確考慮潛在的domain偏移引起的不確定統(tǒng)計(jì)差異。因此可能帶來(lái)模型無(wú)法處理一部分的out-of-distribution數(shù)據(jù),而在訓(xùn)練集中提供的OOD樣本數(shù)過(guò)擬合。所以,在訓(xùn)練階段引入一定的uncertain statistics對(duì)于模型泛化性能的提升是非常關(guān)鍵,且有必要的。

概括來(lái)講,本文的核心idea就是:將特征的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析計(jì)算,把它建模成一個(gè)不確定的分布,在分布中特征統(tǒng)計(jì)量的根據(jù)這種uncertain進(jìn)行不同的采樣,從而生成各種不同的風(fēng)格的圖像,來(lái)提升模型在不同目標(biāo)域的泛化性。我們提出的方法簡(jiǎn)單而有效地緩解了domain shift引起的性能下降,并且可以很容易地集成到現(xiàn)有的網(wǎng)絡(luò)中,而不帶來(lái)額外的模型參數(shù)或loss的約束。在廣泛的視覺(jué)任務(wù)上的綜合實(shí)驗(yàn)證明了該方法的優(yōu)越性,充分的實(shí)驗(yàn)表明在特征統(tǒng)計(jì)中引入uncertainty可以很好地提高模型對(duì)域偏移的泛化能力。

3. 方法

首先,是對(duì)一個(gè)mini-batch中的特征進(jìn)行建模:

49f300be-5394-11ed-a3b6-dac502259ad0.png

在非分布場(chǎng)景下,由于域特征不同,特征統(tǒng)計(jì)量往往與訓(xùn)練域不一致,不適合于非線(xiàn)性層和歸一化層等深度學(xué)習(xí)模塊,降低了模型的泛化能力。然而,大多數(shù)深度學(xué)習(xí)方法只將特征統(tǒng)計(jì)量視為從特征中測(cè)量出的確定性值,而沒(méi)有明確考慮到潛在的不確定統(tǒng)計(jì)差異。

由于模型固有的易受這種差異的影響,學(xué)習(xí)到的表示的泛化能力受到了限制。盡管之前一些利用特征統(tǒng)計(jì)來(lái)解決領(lǐng)域泛化問(wèn)題取得了成功,但它們通常采用成對(duì)樣本的線(xiàn)性操作(即交換和插值)來(lái)生成新的特征統(tǒng)計(jì)量,這限制了合成變化的多樣性。

具體而言,它們的變異方向由所選參考樣本決定,這種內(nèi)部操作限制了它們的變化強(qiáng)度。因此,這些方法在處理現(xiàn)實(shí)世界中不同的、不確定的domain shift時(shí)是效果有限的。對(duì)于具有uncertainty的特征統(tǒng)計(jì)偏移方向的任意的test domain,如何正確建模domain的shift就是解決域泛化問(wèn)題的重要任務(wù)。

4a1fc392-5394-11ed-a3b6-dac502259ad0.png

這篇文章提出的方法是在建模 Domain Shifts with Uncertainty (DSU)。通過(guò)對(duì)目標(biāo)域的不確定性進(jìn)行建模,來(lái)解決域泛化性能有限的問(wèn)題。假設(shè)特征統(tǒng)計(jì)量都服從多元高斯分布,然后計(jì)算他們的方差,把這種方差定義為不確定性:

4aeeddd0-5394-11ed-a3b6-dac502259ad0.png

我們得到了每個(gè)銅套的不確定性后,在原有的分布上加一定的高斯噪聲,利用重參數(shù)來(lái)建模統(tǒng)計(jì)量:

4b9e0b16-5394-11ed-a3b6-dac502259ad0.png

通過(guò)利用給定的高斯分布,隨機(jī)采樣可以生成不同方向和強(qiáng)度組合的新特征統(tǒng)計(jì)信息。然后就是利用經(jīng)典的

4bac889e-5394-11ed-a3b6-dac502259ad0.png

以上操作可以作為一個(gè)靈活的模塊集成在網(wǎng)絡(luò)的各個(gè)位置。注意,該模塊只在模型訓(xùn)練期間工作,可以在測(cè)試時(shí)可以不適用。為了權(quán)衡這個(gè)模塊的強(qiáng)度,論文還設(shè)置了一個(gè)超參數(shù)p,表示使用這個(gè)模塊的概率,具體的算法細(xì)節(jié)描述在附錄中可以更好地參考。利用該方法,經(jīng)過(guò)不確定特征統(tǒng)計(jì)量訓(xùn)練的模型對(duì)潛在的統(tǒng)計(jì)量偏移具有更好的魯棒性,從而獲得更好的泛化能力。

4. 實(shí)驗(yàn)

本文提出的方法其實(shí)是和內(nèi)容無(wú)關(guān)的,所以為了說(shuō)明方法的有效性和遷移性,作者在圖像分類(lèi)、語(yǔ)義分割、實(shí)例檢索和 robustness to corruptions 等任務(wù)上都做了實(shí)驗(yàn)。

首先是Multi-domain classification的PACS數(shù)據(jù)集結(jié)果,包含了畫(huà)作、卡通、照片和素描四種風(fēng)格的圖像。使用標(biāo)準(zhǔn)的leave-one-domain-out 的protocal,在三種風(fēng)格上訓(xùn)練,在剩下一種風(fēng)格上測(cè)試。

4bc3aba0-5394-11ed-a3b6-dac502259ad0.png

然后是在分割數(shù)據(jù)集上的表現(xiàn):

4c5374c4-5394-11ed-a3b6-dac502259ad0.png

可視化效果也非常不錯(cuò):

4c99c334-5394-11ed-a3b6-dac502259ad0.png

更多的消融實(shí)驗(yàn)可以參考原文。

然后作者又利用PACS數(shù)據(jù)集,把a(bǔ)rt painting作為未知目標(biāo)域,其他三種風(fēng)格作為源域。作者backbone的中間特征,測(cè)量并可視化特征統(tǒng)計(jì)量的分布??梢钥吹紻SU可以帶來(lái)更少的domain shift:

4cf0dcc8-5394-11ed-a3b6-dac502259ad0.png

5. 結(jié)論

本文提出了一種提高網(wǎng)絡(luò)泛化能力的概率方法,通過(guò)在訓(xùn)練過(guò)程中綜合特征統(tǒng)計(jì)量對(duì)領(lǐng)域偏移的不確定性進(jìn)行建模。每個(gè)特征統(tǒng)計(jì)量假設(shè)遵循一個(gè)多變量高斯分布,以建模不同的domain shift。由于生成的特征統(tǒng)計(jì)量具有不同的分布的uncertainty,該模型對(duì)不同的domain shift具有更好的魯棒性。實(shí)驗(yàn)結(jié)果證明了該方法在提高網(wǎng)絡(luò)泛化能力方面的有效性。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:ICLR 2022 基于不確定性的域外泛化

文章出處:【微信號(hào):GiantPandaCV,微信公眾號(hào):GiantPandaCV】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    一種網(wǎng)絡(luò)攻擊路徑重構(gòu)方案

    )樣,可以在攻擊結(jié)束后進(jìn)行追蹤。實(shí)驗(yàn)發(fā)現(xiàn)標(biāo)記機(jī)制不需要網(wǎng)絡(luò)路由器大的消耗。本文在文獻(xiàn)[3-5]的基礎(chǔ)上,采用代數(shù)方法,利用IP報(bào)文中的選項(xiàng)字段,以概率將流經(jīng)路由器的地址標(biāo)注報(bào)文,使得
    發(fā)表于 06-14 00:15

    一種基于區(qū)域訪(fǎng)問(wèn)概率的容遲網(wǎng)絡(luò)路由算法

    、Ad hoc網(wǎng)絡(luò)等等,具有重要的研究意義.其路由問(wèn)題極具挑戰(zhàn)性,是當(dāng)前的個(gè)研究熱點(diǎn).本文針對(duì)基于區(qū)域單元(Cell)移動(dòng)模型的延遲容忍網(wǎng)絡(luò),提出個(gè)基于區(qū)域訪(fǎng)問(wèn)
    發(fā)表于 04-24 09:26

    容差模擬電路軟故障診斷的小波與量子神經(jīng)網(wǎng)絡(luò)方法設(shè)計(jì)

    作者:李云紅0 引言自20世紀(jì)70年代以來(lái),模擬電路故障診斷領(lǐng)域已經(jīng)取得了定的研究成果,近年來(lái),基于神經(jīng)網(wǎng)絡(luò)技術(shù)的現(xiàn)代模擬電路軟故障診斷方法已成為新的研究熱點(diǎn),神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 07-05 08:06

    一種數(shù)字信道IFM接收機(jī)的高效實(shí)現(xiàn)方案

    本文提出的一種數(shù)字信道IFM接收機(jī)方案結(jié)合了數(shù)字信道接收機(jī)高效結(jié)構(gòu)和相位差分瞬時(shí)測(cè)頻方法,從而降低了系統(tǒng)復(fù)雜度,提高了實(shí)時(shí)處理
    發(fā)表于 02-23 07:05

    一種基于機(jī)器學(xué)習(xí)的建筑物分割掩模自動(dòng)正則和多邊形方法

    摘要我們提出了一種基于機(jī)器學(xué)習(xí)的建筑物分割掩模自動(dòng)正則和多邊形方法。以圖像為輸入,首先使用通用完全卷積網(wǎng)絡(luò)( FCN )預(yù)測(cè)建筑物分割圖
    發(fā)表于 09-01 07:19

    一種基于綜合幾何特征和概率神經(jīng)網(wǎng)絡(luò)的HGU軸軌識(shí)別方法

    摘要故障診斷是保證水輪發(fā)電機(jī)組安全運(yùn)行的重要環(huán)節(jié)。軸心軌跡辨識(shí)是HGU故障診斷的一種有效方法。提出了一種基于綜合幾何特征和概率神經(jīng)網(wǎng)絡(luò)(CG
    發(fā)表于 09-15 08:18

    介紹一種解決overconfidence簡(jiǎn)潔但有效的方法

    一化函數(shù),在進(jìn)行分類(lèi)的神經(jīng)網(wǎng)絡(luò)中會(huì)產(chǎn)生“過(guò)度自信的結(jié)果”。即使若測(cè)試樣本是ID數(shù)據(jù)中不存在的類(lèi)別(Out-of-Distribution),softmax 也會(huì)給這個(gè)陌生的東西計(jì)算出個(gè)概率
    發(fā)表于 08-24 15:11

    一種基于概率模型的特征補(bǔ)償算法

    本文提出了一種基于概率模型的特征補(bǔ)償算法。該方法基于語(yǔ)音和噪聲的先驗(yàn)概率密度,在倒譜域?qū)φZ(yǔ)音特征參數(shù)進(jìn)行最小均方誤差預(yù)測(cè)(MMSE),提高識(shí)
    發(fā)表于 08-24 10:16 ?6次下載

    一種服務(wù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的形式描述方法_陳鵬

    一種服務(wù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的形式描述方法_陳鵬
    發(fā)表于 03-14 17:10 ?2次下載

    一種新的自適應(yīng)提升的概率矩陣分解算法

    針對(duì)推薦系統(tǒng)中概率矩陣分解模型(PMF)能力(對(duì)新用戶(hù)和物品的推薦性能)較差、預(yù)測(cè)準(zhǔn)確性不高的問(wèn)題,提出一種新的基于自適應(yīng)提升的
    發(fā)表于 12-27 13:58 ?0次下載
    <b class='flag-5'>一種</b>新的自適應(yīng)提升的<b class='flag-5'>概率</b>矩陣分解算法

    基于粒子群優(yōu)化的條件概率神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法

    條件概率神經(jīng)網(wǎng)絡(luò)在進(jìn)行模式分類(lèi)時(shí)具有獨(dú)特的優(yōu)勢(shì),然而如何對(duì)其進(jìn)行有效的訓(xùn)練,從而找到最優(yōu)參數(shù)卻是個(gè)困難的問(wèn)題。在考慮條件概率神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
    發(fā)表于 01-08 16:35 ?0次下載

    一種提高網(wǎng)絡(luò)容量的方法

    近年來(lái),隨著網(wǎng)絡(luò)規(guī)模和網(wǎng)絡(luò)接入用戶(hù)量的爆炸性增長(zhǎng),網(wǎng)絡(luò)擁塞問(wèn)題在各種網(wǎng)絡(luò)中越來(lái)越普遍,從而導(dǎo)致網(wǎng)絡(luò)服務(wù)質(zhì)量下降。
    發(fā)表于 02-12 16:58 ?0次下載

    一種基于聯(lián)合概率矩陣分解的群推薦方法

    獨(dú)立,忽略了群內(nèi)成員間的關(guān)聯(lián)關(guān)系對(duì)群推薦結(jié)果的影響。為此,該文提岀了一種基于聯(lián)合概率矩陣分解的群推薦方法,更好地對(duì)群推薦問(wèn)題進(jìn)行建模。首先,利用用戶(hù)加人的群的信息計(jì)算用戶(hù)之間的相關(guān)性,其次,將用戶(hù)相關(guān)性矩陣
    發(fā)表于 03-31 10:17 ?6次下載
    <b class='flag-5'>一種</b>基于聯(lián)合<b class='flag-5'>概率</b>矩陣分解的群推薦<b class='flag-5'>方法</b>

    一種社交網(wǎng)絡(luò)用戶(hù)興趣點(diǎn)個(gè)性推薦方法

    在社交網(wǎng)絡(luò)環(huán)境中,傳統(tǒng)社交網(wǎng)絡(luò)用戶(hù)興趣點(diǎn)的個(gè)性推薦方法存在網(wǎng)絡(luò)用戶(hù)興趣行為的預(yù)測(cè)精準(zhǔn)性低、用戶(hù)社交數(shù)據(jù)覆蓋率低的問(wèn)題,不能充分挖掘用戶(hù)興趣
    發(fā)表于 04-23 14:03 ?8次下載
    <b class='flag-5'>一種</b>社交<b class='flag-5'>網(wǎng)絡(luò)</b>用戶(hù)興趣點(diǎn)個(gè)性<b class='flag-5'>化</b>推薦<b class='flag-5'>方法</b>

    神經(jīng)網(wǎng)絡(luò)模型剪枝后能力的驗(yàn)證方案

    針對(duì)神經(jīng)網(wǎng)絡(luò)模型在剪枝操作中υr? opout率下調(diào)造成的過(guò)擬合冋題,提岀一種剪枝模型能力的驗(yàn)證方法
    發(fā)表于 05-25 14:48 ?4次下載