0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PiCO核心點—對比學習引入PLL

深度學習自然語言處理 ? 來源:圓圓的算法筆記 ? 作者:圓圓的算法筆記 ? 2022-08-22 11:35 ? 次閱讀

今天給大家介紹ICLR 2022最佳論文PICO: CONTRASTIVE LABEL DISAMBIGUATION FOR PARTIAL LABEL LEARNING,這篇文章解決的是Partial Label Learning(PLL)問題,即訓練數(shù)據(jù)中一個圖像不是一個確定的label,而是一組可能的label集合,需要預測出每個樣本的真實label。

2e372fe2-21c8-11ed-ba43-dac502259ad0.png

下載地址:https://openreview.net/pdf?id=EhYjZy6e1gJ

1什么是Partial Label Learning(PLL)

有監(jiān)督學習是最常見的一種機器學習問題,給定一個輸入樣本,預測該樣本的label是什么。Partial Label Learning(PLL)問題也是預測一個樣本對應的label,但是和有監(jiān)督學習問題的差異是,PLL問題的訓練數(shù)據(jù)中,一個輸入樣本對應多個候選label,真正的label是候選label中的一個。

為什么會有PLL這樣的問題呢?因為在現(xiàn)實問題中,label來自于人工標注,而有的樣本人工標注比較困難,只標注一個label會造成噪聲較大的問題。例如下面的例子中,比較難區(qū)分這張狗對應的類別是哈士奇、雪橇犬還是薩摩耶,強行讓人工標注成一個確定的label容易在數(shù)據(jù)中引入噪聲。PLL放寬了這種限制,在標注的label中可以引入一些不確定性,給一個樣本賦予多個候選label,模型學習從這些label中預測ground-truth對應的那個label。

poYBAGMC-4eAYRYNAACACdSoxmk001.png

2PLL問題的難點

PLL的效果目前和有監(jiān)督學習還有一定差距。PLL問題的難點在于標簽消歧,也就是從候選label集合中預測出樣本的真實label。業(yè)內一般的解法是學習樣本高質量的表示,然后根據(jù)在特征空間中距離近的樣本更可能屬于同一類別這個假設,實現(xiàn)標簽消歧。

然而,這種方法的問題在于,當label是一個不確定的集合而不是一個確定值時,這種不確定性也會對表示學習的過程造成負面影響。表示學習效果不好,又會對標簽消歧的效果造成負面影響。

為了解決這個問題,ICLR 2022的最佳論文提出了基于對比學習的PLL問題求解方法。利用對比學習提升表示學習的效果,再利用良好的表示對label進行消歧,消歧后的label又有助于進一步生成良好的樣本表征,形成良性循環(huán),提升整體效果。

這篇文章提出的Partial label learning with COntrastive label disambiguation (PiCO) framework主要包括利用對比學習提升表示生成質量,以及基于聚類的label消歧兩個核心模塊。下面,我們走進這篇最佳論文,理解其背后的思想。

3PiCO核心點1—對比學習引入PLL

第一個核心點是為了提升PLL中的表示生成效果,作者將對比學習的方法引入到PLL問題中。對比學習在有監(jiān)督問題上已經(jīng)取得廣泛的應用,但是在PLL問題上目前還沒有相關研究。將對比學習應用到PLL的一個最主要的問題是正樣本對如何構造。在有監(jiān)督學習中,每個樣本都有其對應的確定性label,天然可以構造出正樣本。而PLL問題中,每個樣本的label是不確定的,無法直接獲取正樣本對。

為了解決上述問題,本文提出利用分類器對樣本的預測結果作為樣本真實label(也就是偽標簽persudo label),根據(jù)這個label構造正樣本對。在得到正樣本對后,利用MoCo對比學習框架進行表示學習,將樣本的兩種view分別輸入兩個參數(shù)共享的Encoder,其中key側的Encoder使用動量更新的方式減小計算開銷。對比學習loss作為一個輔助任務和主任務聯(lián)合學習。對MoCo等對比學習框架不了解的同學,可以參考我之前的文章:對比學習中的4種經(jīng)典訓練模式。利用對比學習,可以讓樣本在特征空間形成類簇,這也為后續(xù)的標簽消歧奠定了基礎。

2e652a6e-21c8-11ed-ba43-dac502259ad0.png

4PiCO核心點2—標簽消歧

本文采用了一種類似EM算法的思路實現(xiàn)標簽消歧。首先,對于每個類別維護一個embedding向量u,它可以視為類的類簇中心。對于每個樣本的label,在PLL中也用一個N維向量表示s,N代表類別數(shù)量,表示了該樣本屬于每個類別的概率。接下來為了實現(xiàn)標簽消歧,在訓練過程中不斷更新s,更新方法是看樣本表示和哪個類別向量最近,就用滑動平均的方式對s的那一維進行更新,公式可以表示為:

2e78dd8e-21c8-11ed-ba43-dac502259ad0.png

相應的,類別向量u也利用滑動平均的方式進行更新,公式如下:

2e83af52-21c8-11ed-ba43-dac502259ad0.png

通過這兩個步驟的迭代進行,逐步實驗標簽消歧。這其實和Kmean以及Kmeans++這種方法類似,本質上就是一個聚類過程。從PiCO框架整體來看,對比學習提升表示學習效果,表示質量的提升又促進了下游基于聚類的標簽消歧效果,標簽的確定性增加又進一步提升了表示生成的質量,形成了良性循環(huán)。

5實驗結果

本文進行了大量實驗從多個角度驗證了PiCO解決PLL問題的效果。在樣本表示的學習上,從下面的t-SNE向量可視化分析圖可以看出,PiCO生成不用類別的向量表示非常清晰,類內的內聚性和類間的差異性相比其他方法都是更好的。

2e92e1a2-21c8-11ed-ba43-dac502259ad0.png

下面的實驗結果對比了PiCO和和其他方法在PLL問題上的效果,可以看出PiCO要比其他方法效果有非常顯著的提升。

2ea22838-21c8-11ed-ba43-dac502259ad0.png

6總結

本文介紹了ICLR 2022的最佳論文,在Partial Label Learning問題上的解決方法。通過這篇文章,核心是理解頂會最佳論文的設計思路,本文用的求解方法比較優(yōu)雅,背后的設計思路也非常清晰,背后的思考非常值得學習。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • pll
    pll
    +關注

    關注

    6

    文章

    774

    瀏覽量

    135014
  • 機器學習
    +關注

    關注

    66

    文章

    8356

    瀏覽量

    132324

原文標題:ICLR2022最佳論文解讀:對比學習解決Partial Label Learning問題

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    用于智能顯示的TI DLP? Pico?技術

    電子發(fā)燒友網(wǎng)站提供《用于智能顯示的TI DLP? Pico?技術.pdf》資料免費下載
    發(fā)表于 08-31 10:12 ?0次下載
    用于智能顯示的TI DLP? <b class='flag-5'>Pico</b>?技術

    用于設備顯示的TI DLP? Pico?技術

    電子發(fā)燒友網(wǎng)站提供《用于設備顯示的TI DLP? Pico?技術.pdf》資料免費下載
    發(fā)表于 08-31 10:07 ?0次下載
    用于設備顯示的TI DLP? <b class='flag-5'>Pico</b>?技術

    PLL1705/PLL1706雙通道PLL多時鐘發(fā)生器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《PLL1705/PLL1706雙通道PLL多時鐘發(fā)生器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-22 11:32 ?0次下載
    <b class='flag-5'>PLL</b>1705/<b class='flag-5'>PLL</b>1706雙通道<b class='flag-5'>PLL</b>多時鐘發(fā)生器數(shù)據(jù)表

    PICO推出旗下首款MR混合現(xiàn)實一體機PICO 4 Ultra

    8月20日,PICO震撼發(fā)布其首款MR(混合現(xiàn)實)一體機——PICO 4 Ultra,標志著該公司在混合現(xiàn)實技術領域的重大飛躍,為用戶解鎖了前所未有的沉浸式與個性化體驗新境界。
    的頭像 發(fā)表于 08-21 15:45 ?872次閱讀

    PLL是什么意思

    PLL是Phase Locked Loop的縮寫,中文譯作鎖相環(huán)。它是一種用于控制頻率和相位的電路,通過檢測和跟蹤輸入信號的頻率和相位,并將其轉換為一個穩(wěn)定的輸出信號,從而實現(xiàn)頻率和相位的同步與控制。以下是對PLL的詳細解析,包括其定義、分類、工作原理、作用以及在現(xiàn)代電子
    的頭像 發(fā)表于 08-16 17:03 ?2455次閱讀

    深度學習與傳統(tǒng)機器學習對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器學習的范疇,但深度
    的頭像 發(fā)表于 07-01 11:40 ?1124次閱讀

    ESP32 Pico Kit使用5v管腳供電無法連接藍牙要怎么處理?

    我想自己做一個藍牙機械鍵盤,用ESP32做藍牙HID,在網(wǎng)上下載https://github.com/T-vK/ESP32-BLE-Keyboard,上傳到ESP32 Pico Kit上,這時候
    發(fā)表于 06-25 07:17

    使用PICO示波器配合PICO軟件的邏輯觸發(fā)功能

    介紹PICO示波器軟件提供了各種簡單和高級的觸發(fā)器,用于檢測和捕獲難以捉摸的信號。大多數(shù)類型的觸發(fā)器一次只能監(jiān)控一個信號。由于許多示波器有多個輸入(最多四個通道以及某些型號的擴展輸入和音頻輸入)因此
    的頭像 發(fā)表于 06-01 08:31 ?490次閱讀
    使用<b class='flag-5'>PICO</b>示波器配合<b class='flag-5'>PICO</b>軟件的邏輯觸發(fā)功能

    FPGA學習筆記-電源電壓

    通常FPGA中會有各種資源可以使用,而每種資源都需要有電源電壓支持。在單片機中,通常是使用同樣的電源電壓供電的,比如常見的5V、3.3V。而在FPGA中,一般需要:核心電壓、I/O口電壓、PLL電壓
    發(fā)表于 05-22 18:42

    Snap將AI和機器學習引入Snapchat

    Snap首席執(zhí)行官伊萬·斯皮格近日宣布,公司將加大投資力度,將人工智能和機器學習技術深度引入其主打社交應用Snapchat,以進一步提升用戶吸引力。斯皮格直言,公司在機器學習領域已稍顯落后,這一狀況在一定程度上影響了其業(yè)務表現(xiàn)。
    的頭像 發(fā)表于 05-21 09:31 ?469次閱讀

    鎖相環(huán)PLL學習記錄

    鎖相環(huán) (PLL) 是電子系統(tǒng)中最通用、最靈活和最有價值的電路配置之一,因此在許多應用中都有使用。它用于時鐘重定時和恢復,作為頻率合成器和可調諧振蕩器,僅舉幾個例子。
    的頭像 發(fā)表于 02-17 14:07 ?668次閱讀
    鎖相環(huán)<b class='flag-5'>PLL</b><b class='flag-5'>學習</b>記錄

    數(shù)字PLL孤立頻失鎖是什么原因?又應該怎么解決呢?

    數(shù)字PLL(相位鎖定環(huán))在應用中遇到孤立頻失鎖的情況,可能由多種因素引起。
    的頭像 發(fā)表于 01-30 14:13 ?1385次閱讀

    ESP32-PICO系列技術規(guī)格書

    ESP32-PICO 系列是基于 ESP32 芯片 的系統(tǒng)級封裝 (SiP) 產(chǎn)品。ESP32-PICO 系列產(chǎn)品包括 ESP32-PICO-D4、 ESP32-PICO-V3、ESP
    發(fā)表于 12-12 16:56 ?0次下載
    ESP32-<b class='flag-5'>PICO</b>系列技術規(guī)格書

    【LuckFox Pico Plus開發(fā)板免費試用】一根線玩轉開發(fā)板

    拉高的時間也還好。還是上圖吧。 體會 最近工作比較還沒時間玩。偶爾在學習這個SDK。 發(fā)現(xiàn)luckfox的sdk 還挺好,git 記錄了成長進程,可以供我們學習板子一點點增加功能。
    發(fā)表于 11-30 11:16

    如何在樹莓派Pico上使用紅外線接收模塊?

    在樹莓派 Pico 上使用紅外線接收模塊(HX1838 型),我們采用開源的 pico_ir 庫。
    的頭像 發(fā)表于 11-30 09:08 ?2079次閱讀
    如何在樹莓派<b class='flag-5'>Pico</b>上使用紅外線接收模塊?