0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大腦視覺(jué)信號(hào)被Stable Diffusion復(fù)現(xiàn)圖像!

新機(jī)器視覺(jué) ? 來(lái)源:量子位 ? 2023-03-16 10:26 ? 次閱讀

導(dǎo)讀

“現(xiàn)在Stable Diffusion已經(jīng)能重建大腦視覺(jué)信號(hào)了!”

一個(gè)聽(tīng)起來(lái)細(xì)思極恐的“AI讀腦術(shù)”研究,在網(wǎng)上掀起軒然大波:

32fc8f98-c378-11ed-bfe3-dac502259ad0.jpg

這項(xiàng)研究聲稱(chēng),只需用fMRI(功能磁共振成像技術(shù),相比sMRI更關(guān)注功能性信息,如腦皮層激活情況等)掃描大腦特定部位獲取信號(hào),AI就能重建出我們看到的圖像!

330a216c-c378-11ed-bfe3-dac502259ad0.jpg

例如這是一系列人眼看到的圖像,包括戴著蝴蝶結(jié)的小熊、飛機(jī)和白色鐘樓:

3312c6fa-c378-11ed-bfe3-dac502259ad0.jpg

AI看了眼人腦信號(hào)后,立馬就給出這樣的結(jié)果,屬實(shí)把該抓的重點(diǎn)全都抓住了:

331d6f4c-c378-11ed-bfe3-dac502259ad0.gif

再發(fā)展一步,這不就約等于哈利波特里的讀心術(shù)了嗎??

34ee7e06-c378-11ed-bfe3-dac502259ad0.png

更有網(wǎng)友感到驚嘆:如果說(shuō)ChatGPT開(kāi)放API是件大事,那這簡(jiǎn)直稱(chēng)得上瘋狂。

3512a524-c378-11ed-bfe3-dac502259ad0.png

所以,這究竟是怎么一回事?

用Stable Diffusion可視化人腦信號(hào)

這項(xiàng)研究來(lái)自日本大阪大學(xué),目前已經(jīng)被CVPR 2023收錄:

35262d6a-c378-11ed-bfe3-dac502259ad0.png

研究希望能從人類(lèi)大腦活動(dòng)中,重建高保真的真實(shí)感圖像,來(lái)理解大腦、并解讀計(jì)算機(jī)視覺(jué)模型和人類(lèi)視覺(jué)系統(tǒng)之間的聯(lián)系。

要知道,此前雖然有不少腦機(jī)接口研究,致力于從人類(lèi)大腦活動(dòng)中讀取并重建信號(hào),如意念打字等。

然而,從人類(lèi)大腦活動(dòng)中重建視覺(jué)信號(hào)——具有真實(shí)感的圖像,仍然挑戰(zhàn)極大。

例如這是此前UC伯克利做過(guò)的一項(xiàng)類(lèi)似研究,復(fù)現(xiàn)一張人眼看到的飛機(jī)片段,但計(jì)算機(jī)重建出來(lái)的圖像卻幾乎看不出飛機(jī)的特征:

35309a34-c378-11ed-bfe3-dac502259ad0.jpg

△圖源UC伯克利研究Reconstructing Visual Experiences from Brain Activity Evoked by Natural Movies

這次,研究人員重建信號(hào)選用的AI模型,是這一年多在圖像生成領(lǐng)域地位飛升的擴(kuò)散模型。

當(dāng)然,更準(zhǔn)確地說(shuō)是基于潛在擴(kuò)散模型(LDM)——Stable Diffusion。

整體研究的思路,則是基于Stable Diffusion,打造一種以人腦活動(dòng)信號(hào)為條件的去噪過(guò)程的可視化技術(shù)。

它不需要在復(fù)雜的深度學(xué)習(xí)模型上進(jìn)行訓(xùn)練或做精細(xì)的微調(diào),只需要做好fMRI(功能磁共振成像技術(shù))成像到Stable Diffusion中潛在表征的簡(jiǎn)單線性映射關(guān)系就行。

它的概覽框架是這樣的,看起來(lái)也非常簡(jiǎn)單:

僅由1個(gè)圖像編碼器、1個(gè)圖像解碼器,外加1個(gè)語(yǔ)義解碼器組成。

353da54e-c378-11ed-bfe3-dac502259ad0.jpg

具體怎么work?

如下圖所示,第一部分為本研究用到的LDM示意圖。

其中ε代表圖像編碼器,D代表圖像解碼器,而τ是一個(gè)文本編碼器(CLIP)。

3550921c-c378-11ed-bfe3-dac502259ad0.jpg

重點(diǎn)是解碼分析,如下圖所示,模型依次從大腦早期(藍(lán)色)和較高(黃色)視覺(jué)皮層內(nèi)的fMRI信號(hào)中,解碼出重建圖像(z)和相關(guān)文本c的潛在表征。

然后將這些潛在表征當(dāng)作輸入,就可以得到模型最終復(fù)現(xiàn)出來(lái)的圖像Xzc。

3564b850-c378-11ed-bfe3-dac502259ad0.jpg

最后還沒(méi)有完,如編碼分析示意圖,作者還構(gòu)建了一個(gè)編碼模型,用來(lái)預(yù)測(cè)LDM不同組件(包括圖像z、文本c和zc)所對(duì)應(yīng)的fMRI信號(hào),它可以用來(lái)理解Stable Diffusion的內(nèi)部過(guò)程。

357a3540-c378-11ed-bfe3-dac502259ad0.jpg

可以看到,采用了zc的編碼模型在大腦后部視覺(jué)皮層產(chǎn)生的預(yù)測(cè)精確度是最高的。(zc是與c進(jìn)行交叉注意的反向擴(kuò)散后,z再添加噪聲的潛在表征)

3584d482-c378-11ed-bfe3-dac502259ad0.jpg

相比其它兩者,它生成的圖像既具有高語(yǔ)義保真度,分辨率也很高。

359d6326-c378-11ed-bfe3-dac502259ad0.jpg

還有用GAN重建人臉圖像的

看完這項(xiàng)研究,已經(jīng)有網(wǎng)友想到了細(xì)思極恐的東西:

這個(gè)AI雖然只是復(fù)制了“眼睛”所看到的東西。
但是否會(huì)有一天,AI能直接從人腦的思維、甚至是記憶中重建出圖像或文字?

35dddfdc-c378-11ed-bfe3-dac502259ad0.jpg

“語(yǔ)言的用處不再存在了”

35f8543e-c378-11ed-bfe3-dac502259ad0.png

于是有網(wǎng)友進(jìn)一步想到,如果能讀取記憶的話,那么目擊證人的證詞似乎也會(huì)變得更可靠了:

360e982a-c378-11ed-bfe3-dac502259ad0.png

還別說(shuō),就在去年真有一項(xiàng)研究基于GAN,通過(guò)fMRI收集到的大腦信號(hào)重建看到的人臉圖像:

3614f224-c378-11ed-bfe3-dac502259ad0.jpg

不過(guò),重建出來(lái)的效果似乎不怎么樣……

36291312-c378-11ed-bfe3-dac502259ad0.jpg

顯然,在人臉這種比較精細(xì)的圖像生成上,AI“讀腦術(shù)”還有很長(zhǎng)一段路要走。

對(duì)于這種大腦信號(hào)重建的研究,也有網(wǎng)友提出了質(zhì)疑。

例如,是否只是AI從訓(xùn)練數(shù)據(jù)集中提取出了相似的數(shù)據(jù)?

3639f768-c378-11ed-bfe3-dac502259ad0.jpg

對(duì)此有網(wǎng)友回復(fù)表示,論文中的訓(xùn)練數(shù)據(jù)集和測(cè)試集是分開(kāi)的:

365692c4-c378-11ed-bfe3-dac502259ad0.jpg

作者們也在項(xiàng)目主頁(yè)中表示,代碼很快會(huì)開(kāi)源??梢韵绕诖幌聗

366d19e0-c378-11ed-bfe3-dac502259ad0.png

作者介紹

本研究?jī)H兩位作者。

一位是2021年才剛剛成為大阪大學(xué)助理教授的Yu Takagi,他主要從事計(jì)算神經(jīng)科學(xué)和人工智能的交叉研究。

最近,他同時(shí)在牛津大學(xué)人腦活動(dòng)中心和東京大學(xué)心理學(xué)系利用機(jī)器學(xué)習(xí)技術(shù),來(lái)研究復(fù)雜決策任務(wù)中的動(dòng)態(tài)計(jì)算。

另一位是大阪大學(xué)教授Shinji Nishimoto,他也是日本腦信息通信融合研究中心的首席研究員。

研究方向?yàn)槎坷斫獯竽X中的視覺(jué)和認(rèn)知處理,谷歌學(xué)術(shù)引用3000+次。

那么,你覺(jué)得這波AI重建圖像的效果如何?

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1075

    瀏覽量

    40274
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266239
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120593

原文標(biāo)題:CVPR 2023|大腦視覺(jué)信號(hào)被Stable Diffusion復(fù)現(xiàn)圖像!“人類(lèi)的謀略和謊言不存在了”

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Stable Diffusion的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

    的,其目的是消除對(duì)訓(xùn)練圖像的連續(xù)應(yīng)用高斯噪聲,可以將其視為一系列去噪自編碼器。Stable Diffusion由3個(gè)部分組成:變分自編碼器(VAE)、U-Net和一個(gè)文本編碼器。添加和去除高斯噪聲的過(guò)程
    的頭像 發(fā)表于 09-18 10:06 ?2027次閱讀
    <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

    Stability AI開(kāi)源圖像生成模型Stable Diffusion

    Stable Diffusion 的很多用戶已經(jīng)公開(kāi)發(fā)布了生成圖像的樣例,Stability AI 的首席開(kāi)發(fā)者 Katherine Crowson 在推特上分享了許多圖像?;?AI
    的頭像 發(fā)表于 09-21 15:37 ?2819次閱讀

    大腦視覺(jué)信號(hào)Stable Diffusion復(fù)現(xiàn)圖像!

    這項(xiàng)研究聲稱(chēng),只需用fMRI(功能磁共振成像技術(shù),相比sMRI更關(guān)注功能性信息,如腦皮層激活情況等)掃描大腦特定部位獲取信號(hào),AI就能重建出我們看到的圖像!
    的頭像 發(fā)表于 03-06 10:56 ?1617次閱讀

    大腦視覺(jué)信號(hào)Stable Diffusion復(fù)現(xiàn)圖像!“人類(lèi)的謀略和謊言不存在了”

    它不需要在復(fù)雜的深度學(xué)習(xí)模型上進(jìn)行訓(xùn)練或做精細(xì)的微調(diào),只需要做好fMRI(功能磁共振成像技術(shù))成像到Stable Diffusion中潛在表征的簡(jiǎn)單線性映射關(guān)系就行。
    的頭像 發(fā)表于 03-08 10:21 ?701次閱讀

    高性能計(jì)算HPC照亮AIGC未來(lái):PC集群+Stable Diffusion 打造極致游戲體驗(yàn)

    隨著計(jì)算能力和技術(shù)水平的不斷提高,PC集群和Stable Diffusion集成在游戲行業(yè)中的應(yīng)用將會(huì)更加廣泛,可以為游戲開(kāi)發(fā)者和分析師提供更多一流的工具和技術(shù)支持,從而推動(dòng)整個(gè)游戲產(chǎn)業(yè)迎來(lái)新的發(fā)展機(jī)遇。
    的頭像 發(fā)表于 04-20 11:46 ?747次閱讀
    高性能計(jì)算HPC照亮AIGC未來(lái):PC集群+<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 打造極致游戲體驗(yàn)

    一文讀懂Stable Diffusion教程,搭載高性能PC集群,實(shí)現(xiàn)生成式AI應(yīng)用

    PC Farm、生成式AI和Stable Diffusion模型都是非常有用的工具和技術(shù),可以幫助用戶快速構(gòu)建和管理計(jì)算機(jī)集群,生成高質(zhì)量的數(shù)據(jù)和圖像,提高模型的泛化能力和魯棒性。
    的頭像 發(fā)表于 05-01 07:47 ?2142次閱讀
    一文讀懂<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>教程,搭載高性能PC集群,實(shí)現(xiàn)生成式AI應(yīng)用

    使用OpenVINO?在算力魔方上加速stable diffusion模型

    Stable Diffusion 是 stability.ai 開(kāi)源的 AI 圖像生成模型,實(shí)現(xiàn)輸入文字,生成圖像的功能。Stable
    的頭像 發(fā)表于 05-12 09:10 ?1286次閱讀
    使用OpenVINO?在算力魔方上加速<b class='flag-5'>stable</b> <b class='flag-5'>diffusion</b>模型

    驚!大腦視覺(jué)信號(hào)Stable Diffusion復(fù)現(xiàn)成視頻!

    大腦活動(dòng)中重建人類(lèi)視覺(jué)任務(wù),尤其是功能磁共振成像技術(shù)(fMRI)這種非侵入式方法,一直是受到學(xué)界較多的關(guān)注。因?yàn)轭?lèi)似這樣的研究,有利于理解我們的認(rèn)知過(guò)程。
    的頭像 發(fā)表于 06-02 16:51 ?880次閱讀
    驚!<b class='flag-5'>大腦</b><b class='flag-5'>視覺(jué)</b><b class='flag-5'>信號(hào)</b><b class='flag-5'>被</b><b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b><b class='flag-5'>復(fù)現(xiàn)</b>成視頻!

    優(yōu)化 Stable Diffusion 在 GKE 上的啟動(dòng)體驗(yàn)

    Diffusion 等應(yīng)運(yùn)而生。Stable Diffusion 是一個(gè)文字生成圖像Diffusion 模型,它能夠根據(jù)給定任何文本輸
    的頭像 發(fā)表于 06-03 08:35 ?752次閱讀

    基于一種移動(dòng)端高性能 Stable Diffusion 模型

    ? Stable Diffusion (SD)是當(dāng)前最熱門(mén)的文本到圖像(text to image)生成擴(kuò)散模型。盡管其強(qiáng)大的圖像生成能力令人震撼,一個(gè)明顯的不足是需要的計(jì)算資源巨大,
    的頭像 發(fā)表于 06-12 10:14 ?685次閱讀
    基于一種移動(dòng)端高性能 <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 模型

    iPhone兩秒出圖,目前已知的最快移動(dòng)端Stable Diffusion模型來(lái)了

    近日,Snap 研究院推出最新高性能 Stable Diffusion 模型,通過(guò)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練流程、損失函數(shù)全方位進(jìn)行優(yōu)化,在 iPhone 14 Pro 上實(shí)現(xiàn) 2 秒出圖(512x512
    的頭像 發(fā)表于 06-12 15:25 ?675次閱讀
    iPhone兩秒出圖,目前已知的最快移動(dòng)端<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>模型來(lái)了

    樹(shù)莓派能跑Stable Diffusion了?

    Stable Diffusion是一種文本到圖像生成的大型深度學(xué)習(xí)模型,它可以根據(jù)文本的描述生成詳細(xì)的圖像,也可以用于其他任務(wù),如圖像修復(fù)、
    的頭像 發(fā)表于 07-26 11:46 ?1381次閱讀

    Stable Diffusion的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

    13400;i3 12100;i7 12700 ;i9 12900? 在當(dāng)今的數(shù)字時(shí)代,人工智能正在逐步改變?nèi)藗兊纳詈凸ぷ鞣绞?。其?Stable Diffusion作為一種深度學(xué)習(xí)技術(shù),受到廣泛關(guān)注。它能夠通過(guò)對(duì)圖像或視頻
    的頭像 發(fā)表于 09-07 14:12 ?1978次閱讀
    <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

    Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大,而Stab
    的頭像 發(fā)表于 02-19 16:03 ?781次閱讀
    Stability AI試圖通過(guò)新的<b class='flag-5'>圖像</b>生成人工智能模型保持領(lǐng)先地位

    UL Procyon AI 發(fā)布圖像生成基準(zhǔn)測(cè)試,基于Stable Diffusion

    UL去年發(fā)布的首個(gè)Windows版Procyon AI推理基準(zhǔn)測(cè)試,以計(jì)算機(jī)視覺(jué)工作負(fù)載評(píng)估AI推理性能。新推出的圖像生成測(cè)試將提供統(tǒng)一、精確且易于理解的工作負(fù)載,用以保證各支持硬件間公平、可比的性能表現(xiàn)。
    的頭像 發(fā)表于 03-25 16:16 ?710次閱讀