0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CVPR 2023 | 清華大學(xué)提出LiVT,用視覺Transformer學(xué)習(xí)長(zhǎng)尾數(shù)據(jù)

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:未知 ? 2023-06-18 21:30 ? 次閱讀

aff2221c-0ddb-11ee-962d-dac502259ad0.png ?背景

機(jī)器學(xué)習(xí)領(lǐng)域中,學(xué)習(xí)不平衡的標(biāo)注數(shù)據(jù)一直是一個(gè)常見而具有挑戰(zhàn)性的任務(wù)。近年來,視覺 Transformer 作為一種強(qiáng)大的模型,在多個(gè)視覺任務(wù)上展現(xiàn)出令人滿意的效果。然而,視覺 Transformer 處理長(zhǎng)尾分布數(shù)據(jù)的能力和特性,還有待進(jìn)一步挖掘。

目前,已有的長(zhǎng)尾識(shí)別模型很少直接利用長(zhǎng)尾數(shù)據(jù)對(duì)視覺 Transformer(ViT)進(jìn)行訓(xùn)練。基于現(xiàn)成的預(yù)訓(xùn)練權(quán)重進(jìn)行研究可能會(huì)導(dǎo)致不公平的比較結(jié)果,因此有必要對(duì)視覺 Transformer 在長(zhǎng)尾數(shù)據(jù)下的表現(xiàn)進(jìn)行系統(tǒng)性的分析和總結(jié)。

b004ada6-0ddb-11ee-962d-dac502259ad0.png

論文鏈接:

https://arxiv.org/abs/2212.02015

代碼鏈接:

https://github.com/XuZhengzhuo/LiVT 本文旨在填補(bǔ)這一研究空白,詳細(xì)探討了視覺 Transformer 在處理長(zhǎng)尾數(shù)據(jù)時(shí)的優(yōu)勢(shì)和不足之處。本文將重點(diǎn)關(guān)注如何有效利用長(zhǎng)尾數(shù)據(jù)來提升視覺 Transformer 的性能,并探索解決數(shù)據(jù)不平衡問題的新方法。通過本文的研究和總結(jié),研究團(tuán)隊(duì)有望為進(jìn)一步改進(jìn)視覺 Transformer 模型在長(zhǎng)尾數(shù)據(jù)任務(wù)中的表現(xiàn)提供有益的指導(dǎo)和啟示。這將為解決現(xiàn)實(shí)世界中存在的數(shù)據(jù)不平衡問題提供新的思路和解決方案。 文章通過一系列實(shí)驗(yàn)發(fā)現(xiàn),在有監(jiān)督范式下,視覺 Transformer 在處理不平衡數(shù)據(jù)時(shí)會(huì)出現(xiàn)嚴(yán)重的性能衰退,而使用平衡分布的標(biāo)注數(shù)據(jù)訓(xùn)練出的視覺 Transformer 呈現(xiàn)出明顯的性能優(yōu)勢(shì)。相比于卷積網(wǎng)絡(luò),這一特點(diǎn)在視覺 Transformer 上體現(xiàn)的更為明顯。另一方面,無監(jiān)督的預(yù)訓(xùn)練方法無需標(biāo)簽分布,因此在相同的訓(xùn)練數(shù)據(jù)量下,視覺 Transformer 可以展現(xiàn)出類似的特征提取和重建能力。 基于以上觀察和發(fā)現(xiàn),研究提出了一種新的學(xué)習(xí)不平衡數(shù)據(jù)的范式,旨在讓視覺 Transformer 模型更好地適應(yīng)長(zhǎng)尾數(shù)據(jù)。通過這種范式的引入,研究團(tuán)隊(duì)希望能夠充分利用長(zhǎng)尾數(shù)據(jù)的信息,提高視覺 Transformer 模型在處理不平衡標(biāo)注數(shù)據(jù)時(shí)的性能和泛化能力。 b0232678-0ddb-11ee-962d-dac502259ad0.png ?文章貢獻(xiàn) 本文是第一個(gè)系統(tǒng)性的研究用長(zhǎng)尾數(shù)據(jù)訓(xùn)練視覺 Transformer 的工作,在此過程中,做出了以下主要貢獻(xiàn): 首先,本文深入分析了傳統(tǒng)有監(jiān)督訓(xùn)練方式對(duì)視覺 Transformer 學(xué)習(xí)不均衡數(shù)據(jù)的限制因素,并基于此提出了雙階段訓(xùn)練流程,將視覺 Transformer 模型內(nèi)在的歸納偏置和標(biāo)簽分布的統(tǒng)計(jì)偏置分階段學(xué)習(xí),以降低學(xué)習(xí)長(zhǎng)尾數(shù)據(jù)的難度。其中第一階段采用了流行的掩碼重建預(yù)訓(xùn)練,第二階段采用了平衡的損失進(jìn)行微調(diào)監(jiān)督。 b035076c-0ddb-11ee-962d-dac502259ad0.png ? ?其次,本文提出了平衡的二進(jìn)制交叉熵?fù)p失函數(shù),并給出了嚴(yán)格的理論推導(dǎo)。平衡的二進(jìn)制交叉熵?fù)p失的形式如下: b0498976-0ddb-11ee-962d-dac502259ad0.png ? ?與之前的平衡交叉熵?fù)p失相比,本文的損失函數(shù)在視覺 Transformer 模型上展現(xiàn)出更好的性能,并且具有更快的收斂速度。研究中的理論推導(dǎo)為損失函數(shù)的合理性提供了嚴(yán)密的解釋,進(jìn)一步加強(qiáng)了我們方法的可靠性和有效性。 b06900a8-0ddb-11ee-962d-dac502259ad0.png▲不同損失函數(shù)的收斂速度的比較 基于以上貢獻(xiàn),文章提出了一個(gè)全新的學(xué)習(xí)范式 LiVT,充分發(fā)揮視覺 Transformer 模型在長(zhǎng)尾數(shù)據(jù)上的學(xué)習(xí)能力,顯著提升模型在多個(gè)數(shù)據(jù)集上的性能。該方案在多個(gè)數(shù)據(jù)集上取得了遠(yuǎn)好于視覺 Transformer 基線的性能表現(xiàn)。 b0827376-0ddb-11ee-962d-dac502259ad0.png▲不同參數(shù)量下在ImageNet-LT上的準(zhǔn)確性

b09d72de-0ddb-11ee-962d-dac502259ad0.png▲在ImagNet-LT(左)和iNaturalist18(右)數(shù)據(jù)集上的性能表現(xiàn)

同時(shí),本文還驗(yàn)證了在相同的訓(xùn)練數(shù)據(jù)規(guī)模的情況下,使用ImageNet的長(zhǎng)尾分布子集(LT)和平衡分布子集(BAL)訓(xùn)練的 ViT-B 模型展現(xiàn)出相近的重建能力。如 LT-Large-1600 列所示,在 ImageNet-LT 數(shù)據(jù)集中,可以通過更大的模型和 MGP epoch 獲得更好的重建結(jié)果。 wKgZomTYg3CAQbicAARAkEpPjg4567.png ? ?b1201f86-0ddb-11ee-962d-dac502259ad0.png ?

總結(jié)

本文提供了一種新的基于視覺 Transformer 處理不平衡數(shù)據(jù)的方法 LiVT。LiVT 利用掩碼建模和平衡微調(diào)兩個(gè)階段的訓(xùn)練策略,使得視覺 Transformer 能夠更好地適應(yīng)長(zhǎng)尾數(shù)據(jù)分布并學(xué)習(xí)到更通用的特征表示。該方法不僅在實(shí)驗(yàn)中取得了顯著的性能提升,而且無需額外的數(shù)據(jù),具有實(shí)際應(yīng)用的可行性。 論文的更多細(xì)節(jié)請(qǐng)參考論文原文和補(bǔ)充材料。


原文標(biāo)題:CVPR 2023 | 清華大學(xué)提出LiVT,用視覺Transformer學(xué)習(xí)長(zhǎng)尾數(shù)據(jù)

文章出處:【微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:CVPR 2023 | 清華大學(xué)提出LiVT,用視覺Transformer學(xué)習(xí)長(zhǎng)尾數(shù)據(jù)

文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    熱烈歡迎清華大學(xué)電子工程系學(xué)子來武漢六博光電交流實(shí)踐!

    近日,武漢六博光電技術(shù)有限責(zé)任公司接到清華大學(xué)函件,正式成為清華大學(xué)電子工程系武漢實(shí)踐基地之一。2024年8月1日上午,清華大學(xué)電子工程系實(shí)踐團(tuán)隊(duì)一行共計(jì)13名學(xué)子前往武漢六博光電有限責(zé)任公司交流
    的頭像 發(fā)表于 08-02 08:37 ?369次閱讀
    熱烈歡迎<b class='flag-5'>清華大學(xué)</b>電子工程系學(xué)子來武漢六博光電交流實(shí)踐!

    易華錄無錫數(shù)據(jù)湖與清華大學(xué)蘇州汽車研究院(吳江)合作挖掘智能駕駛數(shù)據(jù)新價(jià)值

    6月15日,易華錄無錫數(shù)據(jù)湖與清華大學(xué)蘇州汽車研究院(吳江)數(shù)字工業(yè)中心就“聚焦汽車智能駕駛領(lǐng)域,共同挖掘智駕數(shù)據(jù)新價(jià)值”舉行了簽約儀式。清華大學(xué)蘇州汽車研究院顧問、數(shù)字工業(yè)中心主任王
    的頭像 發(fā)表于 06-18 15:00 ?735次閱讀

    清華大學(xué)研發(fā)新型仿生三維電子皮膚系統(tǒng)

    在科技日新月異的今天,清華大學(xué)再次引領(lǐng)了科研的潮流。6月5日,從清華大學(xué)傳來喜訊,該校航天航空學(xué)院與柔性電子技術(shù)實(shí)驗(yàn)室的張一慧教授團(tuán)隊(duì),成功研制出了一款具有仿生三維架構(gòu)的新型電子皮膚系統(tǒng)。這一突破性的科研成果不僅代表了電子皮膚領(lǐng)域的新高度,更在人機(jī)交互、物理量測(cè)量等多個(gè)領(lǐng)
    的頭像 發(fā)表于 06-06 16:37 ?301次閱讀

    世界首款!又是清華:類腦互補(bǔ)視覺芯片“天眸芯”

    近日,清華大學(xué)在類腦視覺感知芯片領(lǐng)域取得重要突破:清華大學(xué)依托精密儀器系的類腦計(jì)算研究中心施路平教授團(tuán)隊(duì),提出一種基于視覺原語的互補(bǔ)雙通路類
    的頭像 發(fā)表于 06-04 08:36 ?286次閱讀
    世界首款!又是<b class='flag-5'>清華</b>:類腦互補(bǔ)<b class='flag-5'>視覺</b>芯片“天眸芯”

    清華大學(xué)創(chuàng)新領(lǐng)軍工程博士團(tuán)訪問摩爾線程

    5月19日,“清華大學(xué)創(chuàng)新領(lǐng)軍工程博士代表團(tuán)走進(jìn)摩爾線程”活動(dòng)順利舉辦。近五十位來自集成電路、能源、航天、通信等重要領(lǐng)域的清華大學(xué)工程博士參加了本次活動(dòng)。
    的頭像 發(fā)表于 05-20 15:28 ?293次閱讀

    清華大學(xué)創(chuàng)新領(lǐng)軍工程博士代表團(tuán)到訪摩爾線程,深化產(chǎn)學(xué)合作

    5月19日,“清華大學(xué)創(chuàng)新領(lǐng)軍工程博士代表團(tuán)走進(jìn)摩爾線程”活動(dòng)成功舉行。此次活動(dòng)聚集了五十多位來自集成電路、能源、航天、通信等重要行業(yè)的清華大學(xué)創(chuàng)新領(lǐng)軍工程博士。
    的頭像 發(fā)表于 05-20 09:21 ?399次閱讀
    <b class='flag-5'>清華大學(xué)</b>創(chuàng)新領(lǐng)軍工程博士代表團(tuán)到訪摩爾線程,深化產(chǎn)學(xué)合作

    清華大學(xué)聯(lián)合中交興路發(fā)布《中國(guó)公路貨運(yùn)大數(shù)據(jù)碳排放報(bào)告》

    為踐行并推動(dòng)實(shí)現(xiàn)“雙碳”目標(biāo),清華大學(xué)聯(lián)合中交興路發(fā)布《中國(guó)公路貨運(yùn)大數(shù)據(jù)碳排放報(bào)告》(以下簡(jiǎn)稱:《報(bào)告》)。
    的頭像 發(fā)表于 05-09 14:47 ?281次閱讀
    <b class='flag-5'>清華大學(xué)</b>聯(lián)合中交興路發(fā)布《中國(guó)公路貨運(yùn)大<b class='flag-5'>數(shù)據(jù)</b>碳排放報(bào)告》

    直線電機(jī)生產(chǎn)廠家談清華大學(xué)獲芯片領(lǐng)域重要突破

    設(shè)備制造商、醫(yī)學(xué)設(shè)備制造商、科研機(jī)構(gòu)以及各大高校。 像大家熟知的清華大學(xué)、北京航空航天大學(xué)、西安交通大學(xué)、哈爾濱工業(yè)大學(xué)、浙江大學(xué)、南京
    的頭像 發(fā)表于 04-24 08:18 ?198次閱讀
    直線電機(jī)生產(chǎn)廠家談<b class='flag-5'>清華大學(xué)</b>獲芯片領(lǐng)域重要突破

    清華大學(xué)研發(fā)成功大規(guī)模干涉-衍射異構(gòu)集成芯片——太極

    4月12日公布,清華大學(xué)研發(fā)出太極芯片,實(shí)現(xiàn)了每瓦160TOPS的高性能通用智能計(jì)算,這是該校電子工程系與自動(dòng)化系共同攻克的難題。
    的頭像 發(fā)表于 04-12 15:50 ?338次閱讀

    清華大學(xué)研發(fā)光電融合芯片,算力超商用芯片三千余倍

    據(jù)清華大學(xué)官方消息,在計(jì)算能力方面,清華大學(xué)攻關(guān)團(tuán)隊(duì)創(chuàng)造性地提出的計(jì)算框架光電深度融合,從最本質(zhì)的物理原理出發(fā),電磁波傳播的空間為基礎(chǔ)的光計(jì)算和基爾霍夫定律為基礎(chǔ)的純結(jié)合了模擬電子計(jì)算?!?/div>
    的頭像 發(fā)表于 10-31 11:18 ?831次閱讀

    清華大學(xué)團(tuán)隊(duì)在超高性能計(jì)算芯片領(lǐng)域取得新突破

    清華大學(xué)團(tuán)隊(duì)在超高性能計(jì)算芯片領(lǐng)域取得新突破,相關(guān)研究發(fā)表在Nature上。
    的頭像 發(fā)表于 10-29 09:20 ?904次閱讀
    <b class='flag-5'>清華大學(xué)</b>團(tuán)隊(duì)在超高性能計(jì)算芯片領(lǐng)域取得新突破

    清華大學(xué)研發(fā)出存儲(chǔ)芯片“診療一體化”技術(shù)

    清華大學(xué)物理系教授薛平團(tuán)隊(duì)與公安部鑒定中心合作的方法開發(fā)的機(jī)器人技術(shù)融合智能機(jī)器人做手術(shù),光學(xué)影像和激光蝕消融等技術(shù)以損毀的存儲(chǔ)芯片幫助一體化“手術(shù)”一體化usb儲(chǔ)存裝置等丟了恢復(fù)數(shù)據(jù)
    的頭像 發(fā)表于 10-18 11:01 ?661次閱讀

    我國(guó)芯片突破!清華大學(xué)全球首枚!

    10月10日消息,據(jù)清華大學(xué)公眾號(hào),近日,清華大學(xué)集成電路學(xué)院教授吳華強(qiáng)、副教授高濱基于存算一體計(jì)算范式,研制出全球首顆全系統(tǒng)集成的、支持高效片上學(xué)習(xí)(機(jī)器學(xué)習(xí)能在硬件端直接完成)的憶
    的頭像 發(fā)表于 10-14 08:11 ?498次閱讀
    我國(guó)芯片突破!<b class='flag-5'>清華大學(xué)</b>全球首枚!

    存算一體芯片新突破!清華大學(xué)研制出首顆存算一體芯片

    這幾天清華大學(xué)又火出圈了。但這次并不是因?yàn)檎猩鷵屓撕惋執(zhí)?,而?b class='flag-5'>清華大學(xué)的芯片研發(fā)團(tuán)隊(duì)研制出全球首顆全系統(tǒng)集成的存算一體芯片。這是我國(guó)、乃至全世界對(duì)半導(dǎo)體行業(yè)的又一重大突破。 這個(gè)芯片由清華大學(xué)
    的頭像 發(fā)表于 10-11 14:39 ?947次閱讀

    清華大學(xué)重磅消息:全球首顆!我國(guó)芯片領(lǐng)域取得重大突破

    想象一下,一枚芯片上集成了記憶和計(jì)算的能力,在保護(hù)用戶隱私同時(shí),還具備了類似人腦的自主學(xué)習(xí),能耗僅為先進(jìn)工藝下專用集成電路系統(tǒng)的1/35,聽起來是不是很神奇? 據(jù)清華大學(xué)公眾號(hào)10月9日消息,近期
    的頭像 發(fā)表于 10-11 08:39 ?645次閱讀
    <b class='flag-5'>清華大學(xué)</b>重磅消息:全球首顆!我國(guó)芯片領(lǐng)域取得重大突破