亚洲视频狠狠爱,一级爱爱片一级毛片一毛

【導(dǎo)讀】CRATE模型完全由理論指導(dǎo)設(shè)計(jì)，僅用自監(jiān)督學(xué)習(xí)即可實(shí)現(xiàn)分割語義涌現(xiàn)。

基于Transformer的視覺基礎(chǔ)模型在各種下游任務(wù)，如分割和檢測(cè)中都展現(xiàn)出了非常強(qiáng)大的性能，并且DINO等模型經(jīng)過自監(jiān)督訓(xùn)練后已經(jīng)涌現(xiàn)出了語義的分割屬性。

不過奇怪的是，類似的涌現(xiàn)能力并沒有出現(xiàn)在有監(jiān)督分類訓(xùn)練后的視覺Transformer模型中。

最近，馬毅教授團(tuán)隊(duì)探索了基于Transformer架構(gòu)的模型中涌現(xiàn)分割能力是否僅僅是復(fù)雜的自監(jiān)督學(xué)習(xí)機(jī)制的結(jié)果，或者是否可以通過模型架構(gòu)的適當(dāng)設(shè)計(jì)在更通用的條件下實(shí)現(xiàn)相同的涌現(xiàn)。

在CVer微信公眾號(hào)后臺(tái)回復(fù)：CRATE，可以下載本論文pdf和代碼

Emergence of Segmentation with Minimalistic White-Box Transformers

代碼：https://github.com/Ma-Lab-Berkeley/CRATE

論文：https://arxiv.org/abs/2308.16271

通過大量的實(shí)驗(yàn)，研究人員證明了當(dāng)采用白盒Transformer模型CRATE時(shí)，其設(shè)計(jì)明確地模擬并追求數(shù)據(jù)分布中的低維結(jié)構(gòu)，整體和part級(jí)別的分割屬性已經(jīng)以最小化的監(jiān)督訓(xùn)練配方出現(xiàn)。

分層的細(xì)粒度分析表明，涌現(xiàn)屬性有力地證實(shí)了白盒網(wǎng)絡(luò)的設(shè)計(jì)數(shù)學(xué)功能。我們的結(jié)果提出了一條設(shè)計(jì)白盒基礎(chǔ)模型的途徑，該模型同時(shí)具有高性能和數(shù)學(xué)上完全可解釋性。

馬毅教授也表示，深度學(xué)習(xí)的研究將會(huì)逐漸從經(jīng)驗(yàn)設(shè)計(jì)轉(zhuǎn)向理論指導(dǎo)。

白盒CRATE的涌現(xiàn)屬性

DINO的分割涌現(xiàn)能力

智能系統(tǒng)中的表征學(xué)習(xí)旨在將世界的高維、多模態(tài)感官數(shù)據(jù)（圖像、語言、語音）轉(zhuǎn)換為更緊湊的形式，同時(shí)保留其基本的低維結(jié)構(gòu)，實(shí)現(xiàn)高效的識(shí)別（比如分類）、分組（比如分割）和追蹤。

深度學(xué)習(xí)模型的訓(xùn)練通常采用數(shù)據(jù)驅(qū)動(dòng)的方式，輸入大規(guī)模數(shù)據(jù)，以自監(jiān)督的方式進(jìn)行學(xué)習(xí)。

在視覺基礎(chǔ)模型中，自監(jiān)督Transformer架構(gòu)的DINO模型展現(xiàn)出了令人驚訝的涌現(xiàn)能力，即使沒有經(jīng)過有監(jiān)督分割訓(xùn)練，ViTs也能識(shí)別出顯式的語義分割信息。

后續(xù)有工作研究了如何在DINO模型中利用這種分割信息，并在下游任務(wù)中，如分割、檢測(cè)等實(shí)現(xiàn)了最先進(jìn)的性能，也有工作證明了用DINO訓(xùn)練的ViTs中的倒數(shù)第二層特征與視覺輸入中的顯著性信息強(qiáng)烈相關(guān)，如區(qū)分前景、背景和物體邊界，從而提升圖像分割和其他任務(wù)的性能。

為了讓分割屬性涌現(xiàn)，DINO需要在訓(xùn)練期間將自監(jiān)督學(xué)習(xí)、知識(shí)蒸餾和權(quán)重平均巧妙地結(jié)合起來。

目前還不清楚DINO中引入的每個(gè)組件是否對(duì)于分割遮罩的涌現(xiàn)來說必不可缺，盡管DINO也采用ViT架構(gòu)作為其主干，但在分類任務(wù)上訓(xùn)練的普通有監(jiān)督ViT模型中，并沒有觀察到分割涌現(xiàn)行為。

CRATE的涌現(xiàn)

基于DINO的成功案例，研究人員想要探究，復(fù)雜的自監(jiān)督學(xué)習(xí)pipeline對(duì)于獲得類似Transformer的視覺模型中的涌現(xiàn)屬性是否是必要的。

研究人員認(rèn)為，在Transformer模型中促進(jìn)分割屬性的一種有前途的方法是，在考慮輸入數(shù)據(jù)結(jié)構(gòu)的情況下設(shè)計(jì)Transformer模型架構(gòu)，也代表了表征學(xué)習(xí)經(jīng)典方法與現(xiàn)代數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)框架的結(jié)合。

與目前主流的Transformer模型對(duì)比，這種設(shè)計(jì)方法也可以叫做白盒Transformer模型。

基于馬毅教授組之前的工作，研究人員對(duì)白盒架構(gòu)的CRATE模型進(jìn)行了廣泛的實(shí)驗(yàn)，證明了CRATE的白盒設(shè)計(jì)是自注意力圖中分割屬性涌現(xiàn)的原因。

定性評(píng)估

研究人員采用基于[CLS] token的注意力圖方法對(duì)模型進(jìn)行解釋和可視化，結(jié)果發(fā)現(xiàn)CRATE中的query-key-value矩陣都是相同的。

可以觀察到CRATE模型的自注意力圖（self-attention map）可以對(duì)應(yīng)到輸入圖像的語義上，模型的內(nèi)部網(wǎng)絡(luò)對(duì)每個(gè)圖像都進(jìn)行了清晰的語義分割，實(shí)現(xiàn)了類似DINO模型的效果。

相比之下，在有監(jiān)督分類任務(wù)上訓(xùn)練的普通ViT卻并沒有表現(xiàn)出類似的分割屬性。

遵循之前關(guān)于可視化圖像學(xué)習(xí)的逐塊深度特征的工作，研究人員對(duì)CRATE和ViT模型的深度token表征進(jìn)行主成分分析（PCA）研究。

可以發(fā)現(xiàn)，CRATE可以在沒有分割監(jiān)督訓(xùn)練的情況下，依然可以捕捉到圖像中物體的邊界。

并且，主成分（principal compoenents）也說明了token和物體中相似部分的特征對(duì)齊，例如紅色通道對(duì)應(yīng)馬腿。

而有監(jiān)督ViT模型的PCA可視化結(jié)構(gòu)化程度相當(dāng)?shù)汀?/p>

定量評(píng)估

研究人員使用現(xiàn)有的分割和目標(biāo)檢測(cè)技術(shù)對(duì)CRATE涌現(xiàn)的分割屬性進(jìn)行評(píng)估。

從自注意力圖可以看到，CRATE用清晰的邊界顯式地捕獲了對(duì)象級(jí)的語義，為了定量測(cè)量分割的質(zhì)量，研究人員利用自注意力圖生成分割遮罩（segmentation mask），對(duì)比其與真實(shí)掩碼之間的標(biāo)準(zhǔn)mIoU（平均交并比）。

從實(shí)驗(yàn)結(jié)果中可以看到，CRATE在視覺和mIOU評(píng)分上都顯著優(yōu)于ViT，表明CRATE的內(nèi)部表征對(duì)于分割掩碼任務(wù)生成來說要更有效。

對(duì)象檢測(cè)和細(xì)粒度分割

為了進(jìn)一步驗(yàn)證和評(píng)估CRATE捕獲的豐富語義信息，研究人員采用了一種高效的目標(biāo)檢測(cè)和分割方法MaskCut，無需人工標(biāo)注即可獲得自動(dòng)化評(píng)估模型，可以基于CRATE學(xué)到的token表征從圖像中提取更細(xì)粒度的分割。

在COCO val2017上的分割結(jié)果中可以看到，有CRATE的內(nèi)部表征在檢測(cè)和分割指標(biāo)上都要好于有監(jiān)督ViT，有監(jiān)督ViT特征的MaskCut在某些情況下甚至完全不能產(chǎn)生分割掩碼。

CRATE分割能力的白盒分析

深度在CRATE中的作用

CRATE的每一層設(shè)計(jì)都遵循相同的概念目的：優(yōu)化稀疏速率降低，并將token分布轉(zhuǎn)換為緊湊和結(jié)構(gòu)化的形式。

假設(shè)CRATE中語義分割能力的涌現(xiàn)類似于「表征Z中屬于相似語義類別token的聚類」，預(yù)期CRATE的分割性能可以隨著深度的增加而提高。

為了測(cè)試這一點(diǎn)，研究人員利用MaskCut來定量評(píng)估跨不同層的內(nèi)部表征的分割性能；同時(shí)應(yīng)用PCA可視化來理解分割是如何隨深度加深而涌現(xiàn)的。

從實(shí)驗(yàn)結(jié)果中可以觀察到，當(dāng)使用來自更深層的表征時(shí)，分割分?jǐn)?shù)提高了，與CRATE的增量優(yōu)化設(shè)計(jì)非常一致。

相比之下，即使ViT-B/8的性能在后面的層中略有提高，但其分割分?jǐn)?shù)明顯低于CRATE，PCA結(jié)果顯示，從CRATE深層提取的表征會(huì)逐漸更關(guān)注前景對(duì)象，并且能夠捕捉紋理級(jí)別的細(xì)節(jié)。

CRATE的消融實(shí)驗(yàn)

CRATE中的注意力塊（MSSA）和MLP塊（ISTA）都不同于ViT中的注意力塊。

為了了解每個(gè)組件對(duì)CRATE涌現(xiàn)分割屬性的影響，研究人員選取了三個(gè)CRATE變體：CRATE, CRATE-MHSA, CRATE-MLP，分別表示ViT中的注意塊（MHSA）和MLP塊。

研究人員在ImageNet-21k數(shù)據(jù)集上應(yīng)用相同的預(yù)訓(xùn)練設(shè)置，然后應(yīng)用粗分割評(píng)估和遮罩分割評(píng)估來定量對(duì)比不同模型的性能。

實(shí)驗(yàn)結(jié)果顯示，CRATE在所有任務(wù)中都明顯優(yōu)于其他模型架構(gòu)，可以發(fā)現(xiàn)，盡管MHSA和MSSA之間的架構(gòu)差異很小，但只需要簡單地用CRATE中的MSSA替換ViT中的MHSA，可以顯著改善ViT的粗分割性能（即VOC Seg），證明了白盒設(shè)計(jì)的有效性。

識(shí)別注意頭的語義屬性

[CLS] token和圖像塊token之間的自注意力圖可以看到清晰的分段掩碼，根據(jù)直覺，每個(gè)注意力頭應(yīng)該都可以捕捉到數(shù)據(jù)的部分特征。

研究人員首先將圖像輸入到CRATE模型，然后由人來檢查、選擇四個(gè)似乎具有語義含義的注意力頭；然后在其他輸入圖像上在這些注意力頭上進(jìn)行自注意力圖可視化。

可以發(fā)現(xiàn)，每個(gè)注意力頭都捕捉到了物體的不同部分，甚至不同的語義：例如第一列中顯示的注意力頭可以捕捉到不同動(dòng)物的腿，最后一列中顯示的注意力頭捕捉的是耳朵和頭部。

自從可形變部件模型（deformable part model）和膠囊網(wǎng)絡(luò)發(fā)布以來，這種將視覺輸入解析為部分-整體層次結(jié)構(gòu)的能力一直是識(shí)別架構(gòu)的目標(biāo)，白盒設(shè)計(jì)的CRATE模型也具有這種能力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

模型

模型

+關(guān)注

關(guān)注
1

文章
3032

瀏覽量
48359
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5422

瀏覽量
120592
Transformer

Transformer

+關(guān)注

關(guān)注
0

文章
135

瀏覽量
5944

原文標(biāo)題：馬毅團(tuán)隊(duì)新作：白盒ViT成功實(shí)現(xiàn)"分割涌現(xiàn)"！具有高性能和數(shù)學(xué)可解釋的特性

文章出處：【微信號(hào)：CVer，微信公眾號(hào)：CVer】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

白盒測(cè)試教程ppt

白盒測(cè)試白盒測(cè)試概念測(cè)試覆蓋標(biāo)準(zhǔn)邏輯驅(qū)動(dòng)測(cè)試基本路徑測(cè)試白盒測(cè)試也稱結(jié)構(gòu)測(cè)試或邏輯驅(qū)動(dòng)測(cè)試，

發(fā)表于 09-19 09:39 ?0次下載

白盒測(cè)試

白盒測(cè)試的英文全稱:White-box Testing 白盒測(cè)試(White-box Testing，又稱邏

發(fā)表于 10-22 12:36 ?3576次閱讀

黑盒測(cè)試與白盒測(cè)試區(qū)別

黑盒測(cè)試與白盒測(cè)試區(qū)別黑盒測(cè)試　　黑盒測(cè)試也稱功能測(cè)試或數(shù)據(jù)驅(qū)動(dòng)測(cè)試，它是在已知產(chǎn)品所應(yīng)具有的功能，通

發(fā)表于 10-22 12:40 ?9302次閱讀

白盒密碼技術(shù)如何打造更安全的物聯(lián)網(wǎng)

白盒密碼算法是一種新的密碼算法，它與傳統(tǒng)密碼算法的不同點(diǎn)是能夠抵抗白盒攻擊環(huán)境下的攻擊。白盒密碼

發(fā)表于 11-05 09:54 ?685次閱讀

<b class='flag-5'>白</b><b class='flag-5'>盒</b>密碼技術(shù)如何打造更安全的物聯(lián)網(wǎng)

PRQA白盒測(cè)試軟件使用說明書

發(fā)表于 05-05 11:17 ?7次下載

基于白盒測(cè)試的自動(dòng)化測(cè)試平臺(tái)實(shí)現(xiàn)

主要介紹了 Parlay 應(yīng)用服務(wù)器的 API 接口，提出了一個(gè)簡單的基于白盒測(cè)試的自動(dòng)化測(cè)試平臺(tái)實(shí)現(xiàn)方案，并詳細(xì)介紹了該方案的基本設(shè)計(jì)思想、總體結(jié)構(gòu)、測(cè)試用例的實(shí)現(xiàn)方法，以及該

發(fā)表于 09-08 15:07 ?7次下載

基于<b class='flag-5'>白</b><b class='flag-5'>盒</b>測(cè)試的自動(dòng)化測(cè)試平臺(tái)<b class='flag-5'>實(shí)現(xiàn)</b>

白盒測(cè)試和黑盒測(cè)試的優(yōu)缺點(diǎn)

白盒測(cè)試和黑盒測(cè)試是軟件測(cè)試的兩種基本方法。白盒測(cè)試又稱結(jié)構(gòu)測(cè)試、透明盒測(cè)試、邏輯驅(qū)動(dòng)測(cè)試或基于代碼的測(cè)試。

發(fā)表于 11-02 11:18 ?1.9w次閱讀

<b class='flag-5'>白</b><b class='flag-5'>盒</b>測(cè)試和黑盒測(cè)試的優(yōu)缺點(diǎn)

白盒高級(jí)加密標(biāo)準(zhǔn)的任務(wù)規(guī)劃系統(tǒng)安全傳輸

針對(duì)任務(wù)規(guī)劃系統(tǒng)中的安全傳輸在白盒攻擊環(huán)境（ WABC）下通信密鑰容易被竊取的問題，提出基于修改之后的白盒高級(jí)加密標(biāo)準(zhǔn)（白

發(fā)表于 12-06 10:53 ?1次下載

<b class='flag-5'>白</b><b class='flag-5'>盒</b>高級(jí)加密標(biāo)準(zhǔn)的任務(wù)規(guī)劃系統(tǒng)安全傳輸

詳談黑盒測(cè)試與白盒測(cè)試的異同及用例

發(fā)表于 08-19 17:07 ?6479次閱讀

詳談黑盒測(cè)試與<b class='flag-5'>白</b><b class='flag-5'>盒</b>測(cè)試的異同及用例

白盒交換機(jī)展趨勢(shì)漸起，新華三坐擁四大優(yōu)勢(shì)有力支撐白盒生態(tài)

盒交換機(jī)項(xiàng)目研發(fā)的最新進(jìn)展。新華三目前已經(jīng)成立專門的白盒交換機(jī)研發(fā)團(tuán)隊(duì)，并加大了對(duì)SONiC系統(tǒng)的研究投入。面向未來，新華三將積極參與白

發(fā)表于 10-09 14:08 ?4750次閱讀

盒馬成阿里應(yīng)對(duì)美團(tuán)、京東、拼多多挑戰(zhàn)的棋子？

2015年底，在上海世紀(jì)公園旁的一家酒店，一位曾經(jīng)在阿里任職多年的人嚴(yán)肅地說：盒馬不是老菜（侯毅）的盒馬，而是逍遙子（張勇）的，這是理解

發(fā)表于 12-18 16:41 ?3478次閱讀

VectorCAST/QA如何在LiteOS-A內(nèi)核上實(shí)現(xiàn)系統(tǒng)白盒測(cè)試

本文將通過演示實(shí)例介紹VectorCAST/QA如何在LiteOS-A內(nèi)核上實(shí)現(xiàn)系統(tǒng)白盒測(cè)試，獲取被測(cè)程序的代碼覆蓋信息。具體實(shí)現(xiàn)在支持sudo超級(jí)用戶模式的Ubuntu 18.04（

發(fā)表于 06-26 16:21 ?9121次閱讀

VectorCAST/QA如何在LiteOS-A內(nèi)核上<b class='flag-5'>實(shí)現(xiàn)</b>系統(tǒng)<b class='flag-5'>白</b><b class='flag-5'>盒</b>測(cè)試

4G終端主板白盒測(cè)試報(bào)告

發(fā)表于 09-30 16:35 ?17次下載

白盒滲透測(cè)試的優(yōu)勢(shì)是什么

滲透測(cè)試是一項(xiàng)重要的進(jìn)攻性安全演習(xí)或操作。如果執(zhí)行得當(dāng)，它會(huì)極大地提高您組織的安全性。滲透測(cè)試分為三種類型，根據(jù)滲透測(cè)試人員或道德黑客可獲得的信息量分類，其中一種是白盒滲透測(cè)試。什么是白盒

發(fā)表于 09-19 10:04 ?1014次閱讀

功能測(cè)試是白盒還是黑盒測(cè)試

功能測(cè)試是軟件測(cè)試的一種方法，主要用于驗(yàn)證軟件的功能是否滿足需求規(guī)格說明書中的要求。功能測(cè)試可以采用白盒測(cè)試或黑盒測(cè)試的方法，具體取決于測(cè)試的目的和需求。本文將詳細(xì)介紹功能測(cè)試的概念、白盒

發(fā)表于 05-30 14:53 ?475次閱讀

搜索歷史

馬毅團(tuán)隊(duì)新作：白盒ViT成功實(shí)現(xiàn)

評(píng)論