乱人伦中文视频在线无码,2022最新国产福利在线,国产91无码一本在线无码

“現(xiàn)在Stable Diffusion已經(jīng)能重建大腦視覺信號了！”

就在昨晚，一個聽起來細(xì)思極恐的“AI讀腦術(shù)”研究，在網(wǎng)上掀起軒然大波：

這項(xiàng)研究聲稱，只需用fMRI（功能磁共振成像技術(shù)，相比sMRI更關(guān)注功能性信息，如腦皮層激活情況等）掃描大腦特定部位獲取信號，AI就能重建出我們看到的圖像！

例如這是一系列人眼看到的圖像，包括戴著蝴蝶結(jié)的小熊、飛機(jī)和白色鐘樓：

AI看了眼人腦信號后，立馬就給出這樣的結(jié)果，屬實(shí)把該抓的重點(diǎn)全都抓住了：

再發(fā)展一步，這不就約等于哈利波特里的讀心術(shù)了嗎？？

更有網(wǎng)友感到驚嘆：如果說ChatGPT開放API是件大事，那這簡直稱得上瘋狂。

所以，這究竟是怎么一回事？

用Stable Diffusion可視化人腦信號

這項(xiàng)研究來自日本大阪大學(xué)，目前已經(jīng)被CVPR 2023收錄：

High-resolution image reconstruction with latent diffusion models from human brain activity

研究希望能從人類大腦活動中，重建高保真的真實(shí)感圖像，來理解大腦、并解讀計(jì)算機(jī)視覺模型和人類視覺系統(tǒng)之間的聯(lián)系。

要知道，此前雖然有不少腦機(jī)接口研究，致力于從人類大腦活動中讀取并重建信號，如意念打字等。

然而，從人類大腦活動中重建視覺信號——具有真實(shí)感的圖像，仍然挑戰(zhàn)極大。

例如這是此前UC伯克利做過的一項(xiàng)類似研究，復(fù)現(xiàn)一張人眼看到的飛機(jī)片段，但計(jì)算機(jī)重建出來的圖像卻幾乎看不出飛機(jī)的特征：

△圖源UC伯克利研究Reconstructing Visual Experiences from Brain Activity Evoked by Natural Movies

這次，研究人員重建信號選用的AI模型，是這一年多在圖像生成領(lǐng)域地位飛升的擴(kuò)散模型。

當(dāng)然，更準(zhǔn)確地說是基于潛在擴(kuò)散模型（LDM）——Stable Diffusion。

整體研究的思路，則是基于Stable Diffusion，打造一種以人腦活動信號為條件的去噪過程的可視化技術(shù)。

它不需要在復(fù)雜的深度學(xué)習(xí)模型上進(jìn)行訓(xùn)練或做精細(xì)的微調(diào)，只需要做好fMRI（功能磁共振成像技術(shù)）成像到Stable Diffusion中潛在表征的簡單線性映射關(guān)系就行。

它的概覽框架是這樣的，看起來也非常簡單：

僅由1個圖像編碼器、1個圖像解碼器，外加1個語義解碼器組成。

具體怎么work？

如下圖所示，第一部分為本研究用到的LDM示意圖。

其中ε代表圖像編碼器，D代表圖像解碼器，而τ是一個文本編碼器（CLIP）。

重點(diǎn)是解碼分析，如下圖所示，模型依次從大腦早期（藍(lán)色）和較高（黃色）視覺皮層內(nèi)的fMRI信號中，解碼出重建圖像（z）和相關(guān)文本c的潛在表征。

然后將這些潛在表征當(dāng)作輸入，就可以得到模型最終復(fù)現(xiàn)出來的圖像Xzc。

最后還沒有完，如編碼分析示意圖，作者還構(gòu)建了一個編碼模型，用來預(yù)測LDM不同組件（包括圖像z、文本c和zc）所對應(yīng)的fMRI信號，它可以用來理解Stable Diffusion的內(nèi)部過程。

可以看到，采用了zc的編碼模型在大腦后部視覺皮層產(chǎn)生的預(yù)測精確度是最高的。（zc是與c進(jìn)行交叉注意的反向擴(kuò)散后，z再添加噪聲的潛在表征）

相比其它兩者，它生成的圖像既具有高語義保真度，分辨率也很高。

還有用GAN重建人臉圖像的

看完這項(xiàng)研究，已經(jīng)有網(wǎng)友想到了細(xì)思極恐的東西：

這個AI雖然只是復(fù)制了“眼睛”所看到的東西。

但是否會有一天，AI能直接從人腦的思維、甚至是記憶中重建出圖像或文字？

“語言的用處不再存在了”

于是有網(wǎng)友進(jìn)一步想到，如果能讀取記憶的話，那么目擊證人的證詞似乎也會變得更可靠了：

還別說，就在去年真有一項(xiàng)研究基于GAN，通過fMRI收集到的大腦信號重建看到的人臉圖像：

不過，重建出來的效果似乎不怎么樣……

顯然，在人臉這種比較精細(xì)的圖像生成上，AI“讀腦術(shù)”還有很長一段路要走。

對于這種大腦信號重建的研究，也有網(wǎng)友提出了質(zhì)疑。

例如，是否只是AI從訓(xùn)練數(shù)據(jù)集中提取出了相似的數(shù)據(jù)？

對此有網(wǎng)友回復(fù)表示，論文中的訓(xùn)練數(shù)據(jù)集和測試集是分開的：

作者們也在項(xiàng)目主頁中表示，代碼很快會開源?？梢韵绕诖幌聗

作者介紹

本研究僅兩位作者。

一位是2021年才剛剛成為大阪大學(xué)助理教授的Yu Takagi，他主要從事計(jì)算神經(jīng)科學(xué)和人工智能的交叉研究。

最近，他同時(shí)在牛津大學(xué)人腦活動中心和東京大學(xué)心理學(xué)系利用機(jī)器學(xué)習(xí)技術(shù)，來研究復(fù)雜決策任務(wù)中的動態(tài)計(jì)算。

另一位是大阪大學(xué)教授Shinji Nishimoto，他也是日本腦信息通信融合研究中心的首席研究員。

研究方向?yàn)槎坷斫獯竽X中的視覺和認(rèn)知處理，谷歌學(xué)術(shù)引用3000+次。

那么，你覺得這波AI重建圖像的效果如何？

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

成像技術(shù)

成像技術(shù)

+關(guān)注

關(guān)注
4

文章
279

瀏覽量
31397
人工智能

人工智能

+關(guān)注

關(guān)注
1787

文章
46061

瀏覽量
235033

原文標(biāo)題：CVPR 2023 | 大腦視覺信號被Stable Diffusion復(fù)現(xiàn)成圖像！"AI讀腦術(shù)"來了！

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

示波器的波形存儲與復(fù)現(xiàn)，再也不怕瞬時(shí)信號抓不住了

示波器和虛擬USB示波器來進(jìn)行。Chrent臺式示波器的波形存儲與復(fù)現(xiàn)使用信號源模擬一個被測信號。通過BNC線將這個信號連接到示波器上。在示

發(fā)表于 09-05 08:06 ?1458次閱讀

示波器的波形存儲與<b class='flag-5'>復(fù)現(xiàn)</b>，再也不怕瞬時(shí)<b class='flag-5'>信號</b>抓不住了

實(shí)操: 如何在AirBox上跑Stable Diffusion 3

StableDiffusion3Medium是一種多模態(tài)擴(kuò)散變換器(MMDiT)文本到圖像模型，在圖像質(zhì)量、排版、復(fù)雜提示理解和資源效率方面具有顯著提升的性能。目前瑞莎團(tuán)隊(duì)

發(fā)表于 07-23 08:34 ?167次閱讀

實(shí)操: 如何在AirBox上跑<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 3

UL Procyon AI 發(fā)布圖像生成基準(zhǔn)測試，基于Stable Diffusion

UL去年發(fā)布的首個Windows版Procyon AI推理基準(zhǔn)測試，以計(jì)算機(jī)視覺工作負(fù)載評估AI推理性能。新推出的圖像生成測試將提供統(tǒng)一、精確且易于理解的工作負(fù)載，用以保證各支持硬件間公平、可比的性能表現(xiàn)。

發(fā)表于 03-25 16:16 ?710次閱讀

韓國科研團(tuán)隊(duì)發(fā)布新型AI圖像生成模型KOALA，大幅優(yōu)化硬件需求

由此模型的核心在于其運(yùn)用了“知識蒸餾”（knowledge distillation）技術(shù)，這使得開源圖像生成工具Stable Diffusion XL可大幅縮小其規(guī)模。原Stable

發(fā)表于 03-01 14:10 ?475次閱讀

機(jī)器視覺圖像采集卡：關(guān)鍵的圖像處理設(shè)備

機(jī)器視覺圖像采集卡的工作原理。機(jī)器視覺圖像采集卡通常由模擬-數(shù)字轉(zhuǎn)換器（ADC）、數(shù)字信號處理器（DSP）和接口電路等組成。當(dāng)光線照射到傳感

發(fā)表于 02-22 16:23 ?350次閱讀

機(jī)器<b class='flag-5'>視覺</b><b class='flag-5'>圖像</b>采集卡：關(guān)鍵的<b class='flag-5'>圖像</b>處理設(shè)備

Stability AI試圖通過新的圖像生成人工智能模型保持領(lǐng)先地位

Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大，而Stab

發(fā)表于 02-19 16:03 ?781次閱讀

人工視覺仍然需要圖像采集卡

機(jī)器視覺系統(tǒng)中的三項(xiàng)重要任務(wù)。首先是圖像重建，利用原有的模擬視頻技術(shù)，將攝像機(jī)的模擬信號數(shù)字化。圖像采集卡執(zhí)行的第二個功能是存儲圖像，直到主

發(fā)表于 01-30 14:42 ?263次閱讀

圖像采集卡的工作原理及其與圖像處理軟件的區(qū)別介紹

圖像采集卡是一種用于將模擬圖像信號轉(zhuǎn)換號的設(shè)備。它在計(jì)算機(jī)視覺和圖像處理領(lǐng)域中起著關(guān)鍵作用，被廣

發(fā)表于 01-10 16:35 ?773次閱讀

NeurIPS23｜視覺「讀腦術(shù)」：從大腦活動中重建你眼中的世界

在這篇 NeurIPS23 論文中，來自魯汶大學(xué)、新加坡國立大學(xué)和中科院自動化所的研究者提出了一種視覺「讀腦術(shù)」，能夠從人類的大腦活動中以高分辨率出解析出人眼觀看到的圖像。人類的感知不僅由客觀

發(fā)表于 12-24 21:35 ?390次閱讀

免費(fèi)開源圖像修復(fù)工具lama-cleaner介紹

Lama Cleaner 是由 SOTA AI 模型提供支持的免費(fèi)開源圖像修復(fù)工具?？梢詮膱D片中移除任何不需要的物體、缺陷和人，或者擦除并替換（powered by stable diffusion）圖片上的任何東西。

發(fā)表于 12-04 10:23 ?2053次閱讀

上線一周就2.1k star！單張圖像直接轉(zhuǎn)為3D模型！

最大的好處就是可以直接利用Stable Diffusion這種經(jīng)過數(shù)十億張圖像訓(xùn)練過的2D擴(kuò)散模型，實(shí)際上相當(dāng)于引入了非常強(qiáng)的先驗(yàn)信息。而且法線圖可以表征物體的起伏和表面幾何信息，進(jìn)而計(jì)算3D模型的高保真幾何元素。

發(fā)表于 11-06 16:13 ?920次閱讀

機(jī)器視覺之圖像增強(qiáng)和圖像處理

一、圖像處理技術(shù)概述1.定義對原始獲取圖像進(jìn)行一系列的運(yùn)算處理，稱為圖像處理。圖像處理是機(jī)器視覺技術(shù)的方法基礎(chǔ)，包括

發(fā)表于 10-26 08:07 ?806次閱讀

機(jī)器視覺之圖像增強(qiáng)和圖像處理

對原始獲取圖像進(jìn)行一系列的運(yùn)算處理，稱為圖像處理。圖像處理是機(jī)器視覺技術(shù)的方法基礎(chǔ)，包括圖像增強(qiáng)、邊緣提取、

發(fā)表于 10-23 10:43 ?433次閱讀

智能制造設(shè)備如何擁有最強(qiáng)大腦？機(jī)器視覺+AI

智能制造產(chǎn)線設(shè)備的發(fā)展正日益推動著工業(yè)領(lǐng)域的進(jìn)步和創(chuàng)新。隨著技術(shù)的不斷演進(jìn)，機(jī)器視覺和人工智能（AI）兩個關(guān)鍵領(lǐng)域的結(jié)合，為智能制造設(shè)備構(gòu)建了最強(qiáng)大腦。

發(fā)表于 10-21 14:47 ?1074次閱讀

基于機(jī)器視覺的產(chǎn)品檢測技術(shù)研究

機(jī)器視覺被定義為用計(jì)算機(jī)來模擬人的視覺功能，從客觀事物的圖像中提取信息，進(jìn)行處理并加以理解，最終用于實(shí)際檢測、測量和控制。一個典型的工業(yè)機(jī)器

發(fā)表于 09-25 07:12