0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

馬里蘭&NYU合力解剖神經(jīng)網(wǎng)絡(luò),CLIP模型神經(jīng)元形似骷髏頭

OpenCV學(xué)堂 ? 來源:新智元 ? 2023-11-23 17:29 ? 次閱讀

【導(dǎo)讀】神經(jīng)網(wǎng)絡(luò)黑盒怎么解釋?馬里蘭大學(xué)和NYU研究人員開啟了新的嘗試。

AI黑盒如何才能解? 神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練的時,會有些ReLU節(jié)點「死亡」,也就是永遠(yuǎn)輸出0,不再有用。 它們往往會被被刪除或者忽略。 恰好趕上了模糊了生與死的界限的節(jié)日——萬圣節(jié),所以這是探索那些「死節(jié)點」的好時機。

6537a780-7a4e-11ee-939d-92fbcf53809c.png

對于大多數(shù)圖像生成模型來說,會輸出正面的圖像。但是優(yōu)化算法,可以讓模型生成更多詭異、恐怖的圖像。 就拿CLIP模型來說,可以衡量一段文本和一張圖片的匹配程度。 給定一段描述怪誕場景的文本,使用優(yōu)化算法通過最小化CLIP的損失,來生成一張與這段文本匹配的、嚇人的圖片。

65614068-7a4e-11ee-939d-92fbcf53809c.png

當(dāng)你不斷探索損失函數(shù)的最深最恐怖的區(qū)域,就像進(jìn)入了一個瘋狂的狀態(tài)。 就會發(fā)現(xiàn)這些詭異圖片超乎想象。 最重要的是,它們僅僅是通過CLIP模型優(yōu)化生成,并沒有借助其他的模型。

6592e1e0-7a4e-11ee-939d-92fbcf53809c.png

優(yōu)化算法,可以讓我們對神經(jīng)網(wǎng)絡(luò)進(jìn)行「解剖」,特征可視化(feature visualization)可以找到一個最大激活單個神經(jīng)元的圖像。 吳恩達(dá)和Jeff Dean曾在2012年就ImageNet圖像分類模型上做過這樣的實驗,并發(fā)現(xiàn)了一個對黑色貓有響應(yīng)的神經(jīng)元。 對此,來自馬里蘭大學(xué)和NYU的研究人員使用「特征可視化」來剖析CLIP模型,發(fā)現(xiàn)了一個非常令人不安的神經(jīng)元: 完全是一個類似骷髏頭的圖像。

65d0b16e-7a4e-11ee-939d-92fbcf53809c.png

但它真的是「骷髏頭神經(jīng)元」嗎?顯然不是,實際上它代表的是某種更加神秘、難以解釋的模式。 究竟怎么回事?

模型反轉(zhuǎn),卷積網(wǎng)ViT不適用

想要解釋AI生成的圖像,需要用到的一種手段——模型反轉(zhuǎn)(model inversion)。

「模型反轉(zhuǎn)」是可視化和解釋神經(jīng)架構(gòu)內(nèi)部行為、理解模型學(xué)到的內(nèi)容,以及解釋模型行為的重要工具。 一般來說,「模型反轉(zhuǎn)」通常尋找可以激活網(wǎng)絡(luò)中某個特征的輸入(即特征可視化),或者產(chǎn)生某個特定類別的高輸出響應(yīng)(即類別反轉(zhuǎn))。 然鵝,神經(jīng)網(wǎng)絡(luò)架構(gòu)不斷發(fā)展,為現(xiàn)有的「模型反轉(zhuǎn)」方案帶來了重大挑戰(zhàn)。 卷積網(wǎng)長期以來,一直是CV任務(wù)的默認(rèn)方法,也是模型反轉(zhuǎn)領(lǐng)域研究的重點。 隨著Vision Transformer(ViT)、MLP-Mixer、ResMLP等其他架構(gòu)的出現(xiàn),大多數(shù)現(xiàn)有的模型反轉(zhuǎn)方法不能很好地應(yīng)用到這些新結(jié)構(gòu)上。

65ffbc2a-7a4e-11ee-939d-92fbcf53809c.png

總而言之,當(dāng)前需要研發(fā)可以應(yīng)用到新結(jié)構(gòu)上的模型反轉(zhuǎn)方法。 對此,馬里蘭和NYU研究人員將關(guān)注點放在了「類反轉(zhuǎn)」(class inversion)。 目標(biāo)是,在不知道模型訓(xùn)練數(shù)據(jù)的情況下,找到可以最大化某個類別輸出分?jǐn)?shù)的可解釋圖像。 類反轉(zhuǎn)已在模型解釋、圖像合成等任務(wù)中應(yīng)用,但是存在幾個關(guān)鍵缺陷:生成圖像質(zhì)量對正則化權(quán)重高度敏感;需要批標(biāo)準(zhǔn)化參數(shù)的方法不適用于新興架構(gòu)。 研究人員再此提出了基于數(shù)據(jù)增強的類反轉(zhuǎn)方法——Plug-In Inversion(PII)。

661eecbc-7a4e-11ee-939d-92fbcf53809c.png

論文地址:https://arxiv.org/pdf/2201.12961.pdf PII的好處在于不需要明確的正則化,因此不需要為每個模型或圖像實例調(diào)節(jié)超參數(shù)。 實驗結(jié)果證明,PII可以使用相同的架構(gòu)無關(guān)方法和超參數(shù)反轉(zhuǎn)CNN、ViT和MLP架構(gòu)。

全新類反轉(zhuǎn)——PII

此前,關(guān)于類反轉(zhuǎn)的研究,常常使用抖動之類的增強功能。 它會在水平和垂直方向上隨機移動圖像,以及水平Ips來提高反轉(zhuǎn)圖像的質(zhì)量。 在最新研究中,作者探討了有利于反轉(zhuǎn)的其他增強,然后再描述如何將它們組合起來形成PII算法。限制搜索空間作者考慮2種增強方法來提高倒置圖像的空間質(zhì)量——居中(Centering)和縮放(Zoom)。 這些方法的設(shè)計基于這樣的假設(shè):限制輸入優(yōu)化空間,可以得到更好的特征布局。 兩種方法都從小尺寸開始,逐步擴大空間,迫使放置語義內(nèi)容在中心,目的是生成更具解釋性和可識別性的反轉(zhuǎn)圖像。 圖1和圖2分別顯示了,居中和縮放過程中每個步驟測圖像狀態(tài)。

66355f2e-7a4e-11ee-939d-92fbcf53809c.png

ColorShift增強之前展示的反轉(zhuǎn)圖像,顏色看起來很不自然。 這是由于研究人員現(xiàn)在提出的一種全新增強方法——ColorShift造成的。 ColorShift是隨機擾動每個顏色通道的平均值和方差,改變圖像顏色,目的是生成更豐富多樣的反轉(zhuǎn)圖像顏色。 下圖,作者可視化了ColorShift的穩(wěn)定效果。

665d7aa4-7a4e-11ee-939d-92fbcf53809c.png

集成集成是一種成熟的工具,經(jīng)常用于從增強推理到數(shù)據(jù)集安全等應(yīng)用程序。 研究人員發(fā)現(xiàn),優(yōu)化由同一圖像的不同ColorShift組成的整體,可以同時提高反轉(zhuǎn)方法的性能。 圖4顯示了與ColorShift一起應(yīng)用集成的結(jié)果。 可以觀察,到較大的集成似乎給出了輕微的改進(jìn),但即使是大小為1或2的集成,也能產(chǎn)生令人滿意的結(jié)果。 這對于像ViT這樣的模型很重要,因為可用的GPU內(nèi)存限制了該集合的可能大小。

668d74b6-7a4e-11ee-939d-92fbcf53809c.png

到這里,你就明白什么是PII了,即結(jié)合了抖動、集成、ColorShift、居中和縮放技術(shù),并將結(jié)果命名為「插件反轉(zhuǎn)」。 它可以應(yīng)用到任何可微分模型(包括ViT和MLP),只需要一組固定超參數(shù)。

多種網(wǎng)絡(luò)架構(gòu)適用

那么,PII效果究竟如何? 實驗結(jié)果發(fā)現(xiàn),PII可以應(yīng)用于不同的模型。需要強調(diào)是的是,研究者在所有情況下都對PII參數(shù)使用相同的設(shè)置。 圖6中,描繪了通過反轉(zhuǎn)各種架構(gòu)的Volcano類生成的圖像,包括CNN、ViT和MLP的示例。

66ae15b8-7a4e-11ee-939d-92fbcf53809c.png

雖然不同神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量有所不同,但它們都包含可區(qū)分,且位置恰當(dāng)?shù)囊曈X信息。 在圖7中,研究人員還顯示了PII從幾個任意ImageNet類的每種主要架構(gòu)類型的代表生成的圖像。 可以看到,每行有獨特視覺風(fēng)格,說明模型反轉(zhuǎn)可以用來理解不同模型的學(xué)習(xí)信息。

66d80332-7a4e-11ee-939d-92fbcf53809c.png

在圖8中,作者使用PII來反轉(zhuǎn)在ImageNet上訓(xùn)練,并在CIFAR-100上進(jìn)行微調(diào)的ViT模型。

672418f8-7a4e-11ee-939d-92fbcf53809c.png

圖9顯示了在CIFAR-10上微調(diào)的模型的反轉(zhuǎn)結(jié)果。

674c0700-7a4e-11ee-939d-92fbcf53809c.png

為了定量評估全新方法,作者反轉(zhuǎn)預(yù)訓(xùn)練的ViT模型和預(yù)訓(xùn)練的ResMLP模型,使用PII為每個類生成一張圖像,并使用DeepDream執(zhí)行相同的操作。 然后使用各種預(yù)訓(xùn)練的模型對這些圖像進(jìn)行分類。 表1包含這些模型的平均top-1和top-5分類精度,以及每種方法生成的圖像的初始分?jǐn)?shù)。

677a66e0-7a4e-11ee-939d-92fbcf53809c.png

圖10顯示了PII和DeepInversion生成的一些任意類別的圖像。

678fd6c4-7a4e-11ee-939d-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100010
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266236
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3032

    瀏覽量

    48363
  • Clip
    +關(guān)注

    關(guān)注

    0

    文章

    30

    瀏覽量

    6612

原文標(biāo)題:AI生圖太詭異?馬里蘭&NYU合力解剖神經(jīng)網(wǎng)絡(luò),CLIP模型神經(jīng)元形似骷髏頭

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    神經(jīng)網(wǎng)絡(luò)教程(李亞非)

      第1章 概述  1.1 人工神經(jīng)網(wǎng)絡(luò)研究與發(fā)展  1.2 生物神經(jīng)元  1.3 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成  第2章人工神經(jīng)網(wǎng)絡(luò)基本模型  2.
    發(fā)表于 03-20 11:32

    人工神經(jīng)網(wǎng)絡(luò)算法的學(xué)習(xí)方法與應(yīng)用實例(pdf彩版)

    的基本處理單元,它是神經(jīng)網(wǎng)絡(luò)的設(shè)計基礎(chǔ)。神經(jīng)元是以生物的神經(jīng)系統(tǒng)的神經(jīng)細(xì)胞為基礎(chǔ)的生物模型。在人們對生物
    發(fā)表于 10-23 16:16

    【PYNQ-Z2試用體驗】神經(jīng)網(wǎng)絡(luò)基礎(chǔ)知識

    學(xué)習(xí)和認(rèn)知科學(xué)領(lǐng)域,是一種模仿生物神經(jīng)網(wǎng)絡(luò)(動物的中樞神經(jīng)系統(tǒng),特別是大腦)的結(jié)構(gòu)和功能的數(shù)學(xué)模型或計算模型,用于對函數(shù)進(jìn)行估計或近似。神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 03-03 22:10

    【案例分享】基于BP算法的前饋神經(jīng)網(wǎng)絡(luò)

    期望的輸出。BP神經(jīng)網(wǎng)絡(luò)算法推導(dǎo)(更新權(quán)重和偏倚):從上面推導(dǎo)可以發(fā)現(xiàn):對于任意從神經(jīng)元i(輸出神經(jīng)元/隱層神經(jīng)元)至 神經(jīng)元j(隱層
    發(fā)表于 07-21 04:00

    【案例分享】ART神經(jīng)網(wǎng)絡(luò)與SOM神經(jīng)網(wǎng)絡(luò)

    是一種常用的無監(jiān)督學(xué)習(xí)策略,在使用改策略時,網(wǎng)絡(luò)的輸出神經(jīng)元相互競爭,每一時刻只有一個競爭獲勝的神經(jīng)元激活。ART神經(jīng)網(wǎng)絡(luò)由比較層、識別層、識別閾值、重置模塊構(gòu)成。其中比較層負(fù)責(zé)接收輸
    發(fā)表于 07-21 04:30

    有關(guān)脈沖神經(jīng)網(wǎng)絡(luò)的基本知識

    譯者|VincentLee來源 |曉飛的算法工程筆記脈沖神經(jīng)網(wǎng)絡(luò)(Spiking neural network, SNN)將脈沖神經(jīng)元作為計算單...
    發(fā)表于 07-26 06:23

    基于BP神經(jīng)網(wǎng)絡(luò)的PID控制

    最近在學(xué)習(xí)電機的智能控制,上周學(xué)習(xí)了基于單神經(jīng)元的PID控制,這周研究基于BP神經(jīng)網(wǎng)絡(luò)的PID控制。神經(jīng)網(wǎng)絡(luò)具有任意非線性表達(dá)能力,可以通過對系統(tǒng)性能的學(xué)習(xí)來實現(xiàn)具有最佳組合的PID控制。利用BP
    發(fā)表于 09-07 07:43

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    。神經(jīng)網(wǎng)絡(luò)的思想起源于1943年McCulloch 和 Pitts 提出的神經(jīng)元模型[19],簡稱 MCP 神經(jīng)元模 型。它是利用計算機來模擬人的神經(jīng)元反應(yīng)的過 程,具有開創(chuàng)性意義。此
    發(fā)表于 08-02 10:39

    神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)課件免費下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)課件免費下載包括了:1生物神經(jīng)元模型,2人工神經(jīng)元模型,3人工神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 01-20 11:20 ?7次下載
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>與<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>控制的學(xué)習(xí)課件免費下載

    構(gòu)建神經(jīng)網(wǎng)絡(luò)模型的常用方法 神經(jīng)網(wǎng)絡(luò)模型的常用算法介紹

    神經(jīng)網(wǎng)絡(luò)模型是一種通過模擬生物神經(jīng)元間相互作用的方式實現(xiàn)信息處理和學(xué)習(xí)的計算機模型。它能夠?qū)斎霐?shù)據(jù)進(jìn)行分類、回歸、預(yù)測和聚類等任務(wù),已經(jīng)廣泛應(yīng)用于計算機視覺、自然語言處理、語音處理等
    發(fā)表于 08-28 18:25 ?944次閱讀

    神經(jīng)元神經(jīng)網(wǎng)絡(luò)的區(qū)別與聯(lián)系

    在人工智能和機器學(xué)習(xí)的領(lǐng)域中,神經(jīng)元神經(jīng)網(wǎng)絡(luò)是兩個至關(guān)重要的概念。雖然它們都與人腦中的神經(jīng)系統(tǒng)有著密切的聯(lián)系,但在實際應(yīng)用和理論研究中,它們各自扮演著不同的角色。本文旨在深入探討神經(jīng)元
    的頭像 發(fā)表于 07-01 11:50 ?500次閱讀

    神經(jīng)網(wǎng)絡(luò)模型的原理、類型、應(yīng)用場景及優(yōu)缺點

    神經(jīng)網(wǎng)絡(luò)模型是一種基于人工神經(jīng)元的數(shù)學(xué)模型,用于模擬人腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能。神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-02 09:56 ?560次閱讀

    神經(jīng)網(wǎng)絡(luò)模型的原理、類型及應(yīng)用領(lǐng)域

    數(shù)學(xué)建模神經(jīng)網(wǎng)絡(luò)模型是一種基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)建模方法,它通過模擬人腦神經(jīng)元的工作機制,實現(xiàn)對復(fù)雜問題的建模和求解。神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-02 11:31 ?647次閱讀

    人工神經(jīng)網(wǎng)絡(luò)模型是一種什么模型

    人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡稱ANNs)是一種受生物神經(jīng)網(wǎng)絡(luò)啟發(fā)而產(chǎn)生的數(shù)學(xué)模型,用于模擬人腦處理信息的方式。它由大量的節(jié)點(或稱為神經(jīng)元)相
    的頭像 發(fā)表于 07-04 16:57 ?441次閱讀

    rnn是什么神經(jīng)網(wǎng)絡(luò)模型

    領(lǐng)域有著廣泛的應(yīng)用。 RNN的基本概念 1.1 神經(jīng)網(wǎng)絡(luò)的基本概念 神經(jīng)網(wǎng)絡(luò)是一種受生物神經(jīng)網(wǎng)絡(luò)啟發(fā)的數(shù)學(xué)模型,它由多個神經(jīng)元(或稱為節(jié)點)
    的頭像 發(fā)表于 07-05 09:50 ?392次閱讀