99亚洲精品卡2卡三卡4卡2卡,91蜜桃精品国产91久久蜜臀,aaa无码国产精品视频

現(xiàn)在，AI可以把人類腦中的信息，用高清視頻展示出來了！

例如你坐在副駕所欣賞到的沿途美景信息，AI分分鐘給重建了出來：

看到過的水中的魚兒、草原上的馬兒，也不在話下：

這就是由新加坡國立大學和香港中文大學共同完成的最新研究，團隊將項目取名為MinD-Video。

Cinematic Mindscapes: High-quality Video Reconstruction from Brain Activity 主頁：https://mind-video.com/ 論文：https://arxiv.org/abs/2305.11675 代碼：https://github.com/jqin4749/MindVideo

這波操作，宛如科幻電影《超體》中Lucy讀取反派大佬記憶一般：

引得網(wǎng)友直呼：

推動人工智能和神經(jīng)科學的前沿。

值得一提的是，大火的Stable Diffusion也在這次研究中立了不小的功勞。

怎么做到的？

從大腦活動中重建人類視覺任務，尤其是功能磁共振成像技術(shù)（fMRI）這種非侵入式方法，一直是受到學界較多的關(guān)注。

因為類似這樣的研究，有利于理解我們的認知過程。

但以往的研究都主要聚焦在重建靜態(tài)圖像，而以高清視頻形式來展現(xiàn)的工作還是較為有限。

之所以會如此，是因為與重建一張靜態(tài)圖片不同，我們視覺所看到的場景、動作和物體的變化是連續(xù)、多樣化的。

而fMRI這項技術(shù)的本質(zhì)是測量血氧水平依賴（BOLD）信號，并且在每隔幾秒鐘的時間里捕捉大腦活動的快照。

相比之下，一個典型的視頻每秒大約包含30幀畫面，如果要用fMRI去重建一個2秒的視頻，就需要呈現(xiàn)起碼60幀。

因此，這項任務的難點就在于解碼fMRI并以遠高于fMRI時間分辨率的FPS恢復視頻。

為了彌合圖像和視頻大腦解碼之間差距，研究團隊便提出了MinD-Video的方法。

整體來看，這個方法主要包含兩大模塊，它們分別做訓練，然后再在一起做微調(diào)。

這個模型從大腦信號中逐步學習，在第一個模塊多個階段的過程，可以獲得對語義空間的更深入理解。

具體而言，便是先利用大規(guī)模無監(jiān)督學習與mask brain modeling（MBM）來學習一般的視覺fMRI特征。

然后，團隊使用標注數(shù)據(jù)集的多模態(tài)提取語義相關(guān)特征，在對比語言-圖像預訓練（CLIP）空間中使用對比學習訓練fMRI編碼器。

在第二個模塊中，團隊通過與增強版Stable Diffusion模型的共同訓練來微調(diào)學習到的特征，這個模型是專門為fMRI技術(shù)下的視頻生成量身定制的。

如此方法之下，團隊也與此前的諸多研究做了對比，可以明顯地看到MinD-Video方法所生成的圖片、視頻質(zhì)量要遠優(yōu)于其它方法。

而且在場景連續(xù)變化的過程中，也能夠呈現(xiàn)高清、有意義的連續(xù)幀。

研究團隊

這項研究的共同一作，其中一位是來自新加坡國立大學的博士生Zijiao Chen，目前在該校的神經(jīng)精神疾病多模式神經(jīng)成像實驗室（MNNDL_Lab）。

另一位一作則是來自香港中文大學的Jiaxin Qing，就讀專業(yè)是信息工程系。

除此之外，通訊作者是新加坡國立大學副教授Juan Helen ZHOU。

據(jù)了解，這次的新研究是他們團隊在此前一項名為MinD-Vis的功能磁共振成像圖像重建工作的延伸。

MinD-Vis已經(jīng)被CVPR 2023所接收。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
28877

瀏覽量
266239
人工智能

人工智能

+關(guān)注

關(guān)注
1787

文章
46061

瀏覽量
235033
視覺

視覺

+關(guān)注

關(guān)注
1

文章
144

瀏覽量
23774

原文標題：驚！大腦視覺信號被Stable Diffusion復現(xiàn)成視頻！"AI讀腦術(shù)"又來了！

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

PCB視頻板 —— 開啟視覺盛宴的關(guān)鍵之匙

PCB 視頻板是一種專門用于處理視頻信號的印制電路板。它作為電子元器件的支撐體和電氣連接的載體，主要功能是承載與視頻處理相關(guān)的電子元件，如視頻信號處理器、解碼器、編碼器等。通過其上面

發(fā)表于 09-06 14:18 ?60次閱讀

示波器的波形存儲與復現(xiàn)，再也不怕瞬時信號抓不住了

示波器和虛擬USB示波器來進行。Chrent臺式示波器的波形存儲與復現(xiàn)使用信號源模擬一個被測信號。通過BNC線將這個信號連接到示波器上。在示

發(fā)表于 09-05 08:06 ?1458次閱讀

示波器的波形存儲與<b class='flag-5'>復現(xiàn)</b>，再也不怕瞬時<b class='flag-5'>信號</b>抓不住了

實操: 如何在AirBox上跑Stable Diffusion 3

StableDiffusion3Medium是一種多模態(tài)擴散變換器(MMDiT)文本到圖像模型，在圖像質(zhì)量、排版、復雜提示理解和資源效率方面具有顯著提升的性能。目前瑞莎團隊使用StableDiffusion3Medium開源模型，通過SOPHONSDK移植到SG2300X處理器系列產(chǎn)品上進行本地TPU硬件加速推理，實現(xiàn)在radxaAirbox上離線快速生成特

發(fā)表于 07-23 08:34 ?167次閱讀

實操: 如何在AirBox上跑<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 3

STM32F4在APP運行時導致IAP程序被修改怎么解決？

IAP程序被修改無法運行，導致過程IAP卡死。已驗證該錯誤發(fā)生在APP程序（地址0x08020000）中，僅IAP程序的首地址0x08000000和0x08000004兩個數(shù)據(jù)被改寫，且每次復現(xiàn)

發(fā)表于 05-17 09:32

UL Procyon AI 發(fā)布圖像生成基準測試，基于Stable Diffusion

UL去年發(fā)布的首個Windows版Procyon AI推理基準測試，以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統(tǒng)一、精確且易于理解的工作負載，用以保證各支持硬件間公平、可比的性能表現(xiàn)。

發(fā)表于 03-25 16:16 ?710次閱讀

Stability AI推出全新Stable Video 3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，該模型以其獨特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成多視圖3D視頻的能力，為視頻制作領(lǐng)域帶來了革命性的突破。

發(fā)表于 03-22 10:30 ?651次閱讀

Stability AI推出Stable Video 3D模型，可制作多視角3D視頻

SV3D_u是Stable Video 3D的一個版本，僅需單幅圖片即可生成運動軌跡視頻，無須進行相機調(diào)整。擴充版本的SV3D_p加入了軌道視圖的特性，使其可以根據(jù)預設(shè)的相機路徑創(chuàng)建3D視頻。

發(fā)表于 03-21 14:57 ?808次閱讀

韓國科研團隊發(fā)布新型AI圖像生成模型KOALA，大幅優(yōu)化硬件需求

由此模型的核心在于其運用了“知識蒸餾”（knowledge distillation）技術(shù)，這使得開源圖像生成工具Stable Diffusion XL可大幅縮小其規(guī)模。原Stable Dif

發(fā)表于 03-01 14:10 ?475次閱讀

OpenAI視頻模型Sora的架構(gòu)及應用場景

LDM 就是 Stable Diffusion 使用的模型架構(gòu)。擴散模型的一大問題是計算需求大，難以擬合高分辨率圖像。為了解決這一問題，實現(xiàn) LDM時，會先訓練一個幾乎能無損壓縮圖像的自編碼器，能把 512x512 的真實圖像壓縮成 64x64 的壓縮圖像并還原。

發(fā)表于 02-20 15:13 ?530次閱讀

Stability AI試圖通過新的圖像生成人工智能模型保持領(lǐng)先地位

Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強大，而Stable

發(fā)表于 02-19 16:03 ?781次閱讀

一種新的分割模型Stable-SAM

SAM、HQ-SAM、Stable-SAM在提供次優(yōu)提示時的性能比較，Stable-SAM明顯優(yōu)于其他算法。這里也推薦工坊推出的新課程《如何將深度學習模型部署到實際工程中？

發(fā)表于 12-29 14:35 ?509次閱讀

NeurIPS23｜視覺「讀腦術(shù)」：從大腦活動中重建你眼中的世界

在這篇 NeurIPS23 論文中，來自魯汶大學、新加坡國立大學和中科院自動化所的研究者提出了一種視覺「讀腦術(shù)」，能夠從人類的大腦活動中以高分辨率出解析出人眼觀看到的圖像。人類的感知不僅由客觀

發(fā)表于 12-24 21:35 ?390次閱讀

免費開源圖像修復工具lama-cleaner介紹

Lama Cleaner 是由 SOTA AI 模型提供支持的免費開源圖像修復工具。可以從圖片中移除任何不需要的物體、缺陷和人，或者擦除并替換（powered by stable diffusion）圖片上的任何東西。

發(fā)表于 12-04 10:23 ?2053次閱讀

AMD發(fā)布23.11.1版顯卡驅(qū)動：AI性能飛躍

ai系列的情況是，改進和優(yōu)化了RX 600M、RX 700M、RX 6000、RX 7000系列對DirectML的支持，Stable Diffusion、Adobe Lightroom、Davinci Resolve、Procyon AI性能有了很大的提高，但沒有公布具

發(fā)表于 11-13 10:04 ?1799次閱讀

智能制造設(shè)備如何擁有最強大腦？機器視覺+AI

智能制造產(chǎn)線設(shè)備的發(fā)展正日益推動著工業(yè)領(lǐng)域的進步和創(chuàng)新。隨著技術(shù)的不斷演進，機器視覺和人工智能（AI）兩個關(guān)鍵領(lǐng)域的結(jié)合，為智能制造設(shè)備構(gòu)建了最強大腦。

發(fā)表于 10-21 14:47 ?1074次閱讀