0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

單像素成像圖像智能處理算法和應(yīng)用場景

新機器視覺 ? 來源:愛光學(xué) ? 作者:焦述銘 ? 2022-10-26 15:57 ? 次閱讀

圖像傳感器是把攝像頭接收到的光信號轉(zhuǎn)化成電子信號的感光元件,可以記錄光場強度的分布,對于拍照設(shè)備來說,它就如同人眼的視網(wǎng)膜。手機或者相機的傳感器一般是一個包含了很多個小單元的陣列,每個小單元對應(yīng)著照片中的一個像素。我們平時說的,相機2000萬像素就是指圖像傳感器上有2000萬個小單元(感光點)。

628a2c48-5447-11ed-a3b6-dac502259ad0.png

圖像傳感器單像素成像原理然而,近十多年來,科學(xué)家們卻在探索一種新型的“單像素相機”[2],即圖像傳感器只包含一個像素,這種另類的光學(xué)成像方式就是“單像素成像”[1]。 那么單像素相機又是怎么工作的呢?單像素成像中,通過一個投影器件不斷向目標(biāo)物體照射不同的結(jié)構(gòu)光圖案,單像素探測器依次記錄下每次照射時物體場景總體光強度,最后計算重建出具有空間分辨率的物體圖像。數(shù)學(xué)上來說,單像素探測器記錄的光強度是投影圖案和物體圖像之間的內(nèi)積。單像素成像與以往常常提到的鬼成像和關(guān)聯(lián)成像的概念比較接近。

62a60d00-5447-11ed-a3b6-dac502259ad0.png

典型的單像素成像系統(tǒng)單像素成像智能處理算法由于單像素相機與普通相機有著不同的成像機制和框架,在最近的研究中,筆者設(shè)計了四種為其“量身打造”的圖像智能處理算法。 (1)運動物體單像素成像中模糊去除和質(zhì)量提升 單像素成像中需要依次投影大量不同圖案,記錄下很長一串單像素值序列,才能重建出一張物體圖像,這顯然需要一定的成像時間。所以,拍攝快速運動的物體時,幀率往往比較低,記錄前幾個單像素值時還“朝發(fā)白帝”,記錄后幾個單像素值時就已經(jīng)“暮到江陵”了。這導(dǎo)致最后記錄下的單像素值數(shù)據(jù)里包含了不同位置物體的混合信息,重建的圖像會包含比較多模糊和噪聲,類似于普通相機拍攝一輛飛馳而過的汽車得到的“拖尾”照片一樣。 為解決這一問題,可以考慮一個基本的物理定律——運動的相對性,物體在運動,投影圖案是靜止的,等效于物體是靜止的,而投影圖案在反方向運動。物體從左到右運動,相當(dāng)于投影圖案從右到左運動;物體順時針轉(zhuǎn)動,相當(dāng)于投影圖案逆時針轉(zhuǎn)動。通過搜索估算物體的平移或者轉(zhuǎn)動速度,對投影圖案做相應(yīng)的反向變換,然后計算時使用變換后的投影圖案替代原本的投影圖案,重建出的物體圖像就會清晰很多,質(zhì)量得到明顯提升[3]。

62c1c7d4-5447-11ed-a3b6-dac502259ad0.png

實驗中,拍攝一個快速轉(zhuǎn)動圓盤上的數(shù)字,我們設(shè)計的算法可以去除重建圖像中的模糊和噪聲 [3]。 (2)基于單像素成像的全光學(xué)物體快速分類 圖像常常需要進(jìn)行自動分類識別,比如照片里的是一只貓,還是一只狗?一般無論普通相機還是單像素相機,都要先拍攝到物體(比如數(shù)字或交通標(biāo)志)清晰的圖片,才能使用機器學(xué)習(xí)方法進(jìn)行圖像分類任務(wù)。 不過,筆者提出的基于單像素成像的全光學(xué)物體快速分類方案中[4],不需要重建物體圖像,物體只被很少數(shù)量的投影圖案所照射,探測器只記錄下“寥寥無幾”的單像素值,該算法直接基于這些單像素值,在“不知道物體到底長得什么樣”情況下,能夠進(jìn)行快速物體分類。比如我們要把物體分為10類,只需要從大量訓(xùn)練圖片中優(yōu)化設(shè)計出10個投影圖案,一共投影10次,而進(jìn)行完整的圖像重建可能需要投影幾百幾千次。

62eee458-5447-11ed-a3b6-dac502259ad0.png

從10個類別的數(shù)字圖像和交通標(biāo)志圖像中分別優(yōu)化設(shè)計出的10個用于快速物體分類的投影圖案(第四行)。 分類結(jié)果可以通過單像素值序列中最大光強度值直接顯示出來,無需后續(xù)的數(shù)字處理,整個系統(tǒng)相當(dāng)于一個可以進(jìn)行線性分類任務(wù)的“光學(xué)計算機”。相比于2018年Science論文中多層級聯(lián)相位板結(jié)構(gòu)的全光學(xué)衍射神經(jīng)網(wǎng)絡(luò)(DNN)系統(tǒng)[5],我們的系統(tǒng)可以完成類似的全光學(xué)物體分類任務(wù),同時具有非相干光照射下工作,低實驗復(fù)雜性,高可編程性等優(yōu)點,更容易實現(xiàn)。 (3)單像素成像中圖像盲重建 單像素成像中一般既需要已知所有投影圖案,又需要已知所有單像素值,才能進(jìn)行物體圖像的重建。這樣看起來二者缺一就無法重建圖像,其實未必。

63148ffa-5447-11ed-a3b6-dac502259ad0.png

假設(shè)投影圖案雖然是未知的,但它們保持固定不變。如果已知一定數(shù)量不同的物體圖像和它們對應(yīng)單像素值序列作為訓(xùn)練樣本,可以通過機器學(xué)習(xí)方式實現(xiàn)盲重建。筆者在研究[6]中并沒有使用“時尚潮流之選”的深度學(xué)習(xí)方法,而使用了更簡單的基于線性回歸模型的方式恢復(fù)未知的投影圖案,但獲得的結(jié)果在一定條件下優(yōu)于深度學(xué)習(xí)的結(jié)果。 事實上,很多相干和非相干的光學(xué)成像系統(tǒng)都是線性的,一些傳統(tǒng)方法也可能對系統(tǒng)進(jìn)行精確模擬,那么近年在各領(lǐng)域都普遍使用的深度學(xué)習(xí)方法是否一定優(yōu)于傳統(tǒng)方法?一些仿真和實驗結(jié)果顯示,對于單像素成像系統(tǒng)和其他一些線性光學(xué)系統(tǒng),深度學(xué)習(xí)其實未必總能表現(xiàn)出優(yōu)勢,尤其在需要大量訓(xùn)練樣本和泛化性這兩個方面表現(xiàn)出一定不足[6]。 (4)單像素成像中的可視加密 作為90后經(jīng)典童年回憶的《冒險小虎隊》中,通過解密卡才能看到雜亂無章的條紋中隱藏的信息,這其實很類似于一種“可視加密”技術(shù)。

632ae052-5447-11ed-a3b6-dac502259ad0.png

可視加密(Visual Cryptography)把要隱藏的圖像分解成幾個隨機圖案,把它們打印在透明膠片上,每個圖案稱為一個可視密鑰(Visual Key),無法從中看到隱藏的圖像??墒钱?dāng)可視密鑰重疊在一起時,隱藏圖像就可以在視覺上顯現(xiàn)出來。單像素成像中的探測器收集物體圖像總體光強度的方式,相當(dāng)于進(jìn)行了像素值的虛擬疊加操作,與可視加密一定程度上“異曲同工”。 筆者提出通過物體圖像和通過投影圖案兩種方式將可視加密在單像素成像中實現(xiàn)[7]。單像素的可視加密可以適用于打印在不透明介質(zhì)上的可視密鑰圖案,并且容易在肉眼觀察不到的非可見光波段以及視平線之外隱藏角落實現(xiàn)可視加密,物理層面上提升可視加密的安全性。 例如,(a)和(b)兩個二維碼可以作為一組可視密鑰,用手機掃它們,可以讀出同樣的信息,不過讀出的并不是要隱藏的信息,而是做偽裝的“幌子”。通過單像素可視加密系統(tǒng)虛擬疊加到一起之后,依舊是一個可以用手機掃的二維碼(c),不過真正隱藏的信息”O(jiān)K”浮現(xiàn)了出來。

633f2d1e-5447-11ed-a3b6-dac502259ad0.png

此外單像素成像中,只對一組投影圖案的隨機置換也能實現(xiàn)圖像加密[8]。單像素成像的應(yīng)用單像素成像可以把傳感器從一個單元陣列簡化為單個像素,與此同時,則需要額外的投影器件,比如,數(shù)字微鏡陣列DMD,并且要投影照射和記錄很多次,而不是一次性成像。 然而,這不妨礙在很多情況下,單像素相機仍然比普通相機更具有優(yōu)勢,比如在可見光以外的一些波段,單元陣列傳感器難以制造,或者成本非常高,而只包含一個像素的簡單傳感器就容易實現(xiàn)得多,單像素成像為這些波段的低成本相機提供了一個好的選擇。 再比如普通相機拍攝照片時,物體需要放到鏡頭或者傳感器的視平線范圍內(nèi),而單像素探測器可以拍攝隱藏在拐角處的物體。當(dāng)同時對多個光譜和多個偏振態(tài)的光場進(jìn)行記錄時,難以在同一個單元陣列傳感器上對這么多的“頻道”同時進(jìn)行復(fù)用,單像素探測器則比較容易在“頻道”間靈活來回切換。 目前,該技術(shù)已被研究者嘗試應(yīng)用于多個領(lǐng)域,如遙感成像、顯微鏡、光譜儀、無人駕駛激光雷達(dá)、加油站氣體泄露監(jiān)測、便攜式掃描儀等,單像素成像的潛在應(yīng)用場景一直在不斷被發(fā)掘和擴展。

作者簡介

焦述銘,深圳大學(xué)納米光子學(xué)研究中心副研究員,香港城市大學(xué)博士畢業(yè)。主要從事單像素成像,全息成像及顯示,圖像處理等方面研究。以第一作者發(fā)表期刊論文20余篇,曾入選Hong Kong PhD Fellowship Scheme和廣東省“珠江人才計劃”博士后資助項目。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2546

    文章

    50498

    瀏覽量

    751211
  • 攝像頭
    +關(guān)注

    關(guān)注

    59

    文章

    4793

    瀏覽量

    95302

原文標(biāo)題:單像素成像圖像智能處理算法

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    實時示波器的技術(shù)原理和應(yīng)用場景

    波形圖像。在信號處理方面,示波器首先將接收到的被測信號進(jìn)行放大和濾波等處理,以確保信號的準(zhǔn)確性和穩(wěn)定性。然后,通過A/D轉(zhuǎn)換技術(shù),將模擬信號轉(zhuǎn)換為數(shù)字信號,以便進(jìn)行后續(xù)的數(shù)字處理和顯示
    發(fā)表于 10-23 14:22

    FPGA在圖像處理領(lǐng)域的優(yōu)勢有哪些?

    。這種并行處理能力使得FPGA在處理大規(guī)模圖像數(shù)據(jù)時表現(xiàn)出色,能夠?qū)崟r完成復(fù)雜的圖像處理算法。 二、高靈活性 FPGA具有很高的靈活性,可以
    發(fā)表于 10-09 14:36

    智能IC卡測試設(shè)備的技術(shù)原理和應(yīng)用場景

    智能IC卡測試設(shè)備的技術(shù)原理和應(yīng)用場景,可以從以下幾個方面進(jìn)行闡述:技術(shù)原理智能IC卡測試設(shè)備的技術(shù)原理主要圍繞IC卡的通信和數(shù)據(jù)處理機制展開。IC卡(包括
    發(fā)表于 09-26 14:27

    淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應(yīng)用場景

    技術(shù)手段提高系統(tǒng)的安全性和可靠性,適用于對安全要求較高的應(yīng)用場景。 應(yīng)用場景 邊緣計算 : 在物聯(lián)網(wǎng)、智能城市等邊緣計算場景中,異構(gòu)雙核RISC-V+FPGA
    發(fā)表于 08-31 08:32

    LED像素間距的定義和應(yīng)用場景

    LED像素間距,也被稱為點間距,是LED顯示屏上一個關(guān)鍵的技術(shù)參數(shù),它直接關(guān)聯(lián)到顯示屏的分辨率、清晰度以及觀看體驗。以下是對LED像素間距的詳細(xì)解析,包括其定義、重要性、影響因素、應(yīng)用場景以及選擇原則等方面。
    的頭像 發(fā)表于 08-10 09:59 ?1405次閱讀

    RISC-V適合什么樣的應(yīng)用場景

    解決方案,適用于邊緣計算、智能攝像頭、智能音箱等場景。 靈活性:RISC-V的開放性使得其能夠更容易地與各種AI框架和算法集成,滿足不同的AI應(yīng)用需求。 4. 自動駕駛和汽車電子 定制
    發(fā)表于 07-29 17:16

    FPGA在人工智能中的應(yīng)用有哪些?

    和安全的云計算和網(wǎng)絡(luò)服務(wù)。 三、具體應(yīng)用場景 圖像分類:在圖像分類任務(wù)中,F(xiàn)PGA可以承擔(dān)前置處理、圖像卷積、全連接等任務(wù)。通過FPGA的并
    發(fā)表于 07-29 17:05

    FPGA與MCU的應(yīng)用場景

    大量計算任務(wù),這在實時處理等應(yīng)用中尤為重要。 高性能計算 FPGA在處理復(fù)雜算法和大規(guī)模數(shù)據(jù)時表現(xiàn)出色,特別是在人工智能(AI)和機器學(xué)習(xí)(ML)領(lǐng)域。它們可以加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理
    發(fā)表于 07-29 15:45

    FPGA設(shè)計經(jīng)驗之圖像處理

    NxN的算子中的N不能特別大。當(dāng)然FPGA也可以接DDR把圖像緩存到其中再讀出來進(jìn)行處理,但這種處理模式就和CPU差不多了,達(dá)不到最高的實時性。其實有些我們認(rèn)為需要隨機讀取數(shù)據(jù)的圖像
    發(fā)表于 06-12 16:26

    基于FPGA的實時邊緣檢測系統(tǒng)設(shè)計,Sobel圖像邊緣檢測,F(xiàn)PGA圖像處理

    搭建圖像處理硬件平臺成為圖像處理的發(fā)展趨勢。FPGA在運算性能方面的具有較大優(yōu)勢,使用FPGA并行加速圖像
    發(fā)表于 05-24 07:45

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳輸延遲、降低
    發(fā)表于 03-12 08:09

    一種基于擴散模型的傅里葉像素成像高分辨率迭代重建方法

    傅里葉像素成像(FSPI)是一種基于傅里葉分析理論的計算光學(xué)成像技術(shù)。
    的頭像 發(fā)表于 01-24 09:43 ?933次閱讀
    一種基于擴散模型的傅里葉<b class='flag-5'>單</b><b class='flag-5'>像素</b><b class='flag-5'>成像</b>高分辨率迭代重建方法

    AG32VF-MIPI應(yīng)用場景

    MIPI接口技術(shù)在圖像和視頻傳輸中的應(yīng)用越來越廣泛,應(yīng)用場景也在不斷拓展,而不僅限于移動設(shè)備。MIPI接口在物聯(lián)網(wǎng)、智能家居、智能監(jiān)控、智能
    發(fā)表于 01-22 08:56

    FPGA圖像處理之CLAHE算法

    在FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強。
    的頭像 發(fā)表于 01-04 12:23 ?2348次閱讀
    FPGA<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>之CLAHE<b class='flag-5'>算法</b>

    圖像處理算法——邊緣檢測

    基于邊緣檢測的分析不易受整體光照強度變化的影響,同時利用邊緣信息容易凸顯目標(biāo)信息和達(dá)到簡化處理的目的,因此很多圖像理解方法都以邊緣為基礎(chǔ)。邊緣檢測強調(diào)的是圖像對比度。
    的頭像 發(fā)表于 11-30 16:56 ?977次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>處理算法</b>——邊緣檢測