0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

機器視覺新突破,神經(jīng)網(wǎng)絡讓圖像處理速度大幅提升

獨愛72H ? 來源:智東西 ? 作者:智東西 ? 2020-03-06 15:58 ? 次閱讀

(文章來源:智東西)

據(jù)外媒報道,維也納大學的研究人員研發(fā)了一種兼顧神經(jīng)網(wǎng)絡功能的圖像傳感器,該傳感器可以使圖像分析速度相較傳統(tǒng)方式提升近2萬倍。研究人員用每個像素代表一個神經(jīng)元,用每個子像素代表一個突觸,從而構(gòu)成神經(jīng)網(wǎng)絡。目前這項技術主要應用于特定的科學應用程序中,對于像自動駕駛中的機器視覺這樣的更復雜的任務,還需要做進一步研究。

機器視覺技術通常使用人工神經(jīng)網(wǎng)絡來分析圖像。在人工神經(jīng)網(wǎng)絡中,被稱為“神經(jīng)元”的組件會接收數(shù)據(jù)并進行協(xié)作,以解決諸如識別圖像之類的問題。神經(jīng)網(wǎng)絡會反復調(diào)整其神經(jīng)元之間的連接點或突觸的強度,并查看所得的行為模式是否能更好地解決問題。經(jīng)過一段時間調(diào)整,神經(jīng)網(wǎng)絡會找到最適合的模式和解決方案。然后,它會將找到的最佳方案設置為默認值,從而模仿人腦學習的過程。

機器視覺技術經(jīng)常會遇到延遲問題,因為相機必須逐行掃描像素,然后將視頻幀轉(zhuǎn)換為數(shù)字信號,并將其傳輸?shù)接嬎銠C中進行分析。當下隨著成像速率和像素數(shù)量的增長,帶寬限制使得傳感器難以將所有信息快速傳輸?shù)接嬎銠C中,這對于無人駕駛、機器人工業(yè)制造等延遲敏感型應用影響十分明顯。

維也納大學的電氣工程師Lukas Mennel和他的同事們試圖通過減少中間步驟來加快機器視覺,他們創(chuàng)建了一個圖像傳感器,該圖像傳感器本身就構(gòu)成了可以同時獲取和分析圖像的人工神經(jīng)網(wǎng)絡。該傳感器由一個像素陣列組成,每個像素代表一個神經(jīng)元。每個像素又由多個子像素組成,每個子像素代表一個突觸。每個光電二極管都建立在二硒化鎢層上,二硒化鎢是一種對光具有可調(diào)節(jié)響應能力的二維半導體

這種可調(diào)節(jié)的光響應能力讓每個光電二極管以可編程的方式對光進行記憶和響應,從而可以分別調(diào)整每個二極管的靈敏度,改變光電二極管的光響應性會改變網(wǎng)絡中的連接強度(突觸重量)。然后,科學家們基于這些光電二極管之間的鏈接創(chuàng)建了一個神經(jīng)網(wǎng)絡,通過對該網(wǎng)絡進行訓練,使其能夠執(zhí)行簡單的計算任務。

研究人員將光電二極管排列成九個像素的正方形陣列,每個像素三個二極管。當圖像投影到芯片上時,芯片會生成、讀取各種二極管產(chǎn)生的電流。每個光電二極管都會產(chǎn)生與入射光強度成比例的輸出電流,并且可以根據(jù)電流的基本規(guī)則進行計算。

使用神經(jīng)網(wǎng)絡的不同算法,該團隊演示了兩種神經(jīng)形態(tài)功能。第一種是分類:它們的3×3像素陣列可以將圖像分類為與三個簡化字母相對應的三個類別之一,從而以納秒為單位識別該字母。如果按比例增加陣列的大小,該神經(jīng)網(wǎng)絡還可以識別更復雜的圖像。

Mennel說:“我們的圖像傳感器在工作時不會消耗任何電能,被檢測的光子本身就可以作為電流供能。”他著重提到,“傳統(tǒng)的機器視覺技術通常能夠每秒處理100幀圖像,而一些更快的系統(tǒng)則可以每秒處理1000幀圖像,但我們的系統(tǒng)每秒可以處理2000萬幀圖像?!盡ennel指出,系統(tǒng)運行的速度僅受電路中電子移動速度的限制。從原則上講,這種策略的工作速度可以達到皮秒級,即數(shù)萬億分之一秒,或者比目前演示的速度快三到四個數(shù)量級。

此外,科學家們指出,原則上他們可以使用計算機模擬來訓練神經(jīng)網(wǎng)絡,并借此將該神經(jīng)網(wǎng)絡傳輸?shù)接嬎銠C設備上。這樣的傳感器可以用來做什么?Mennel說:“目前,這項技術主要應用于特定的科學應用程序中。對于像自動駕駛中的機器視覺這樣的更復雜的任務,還需要做進一步研究。”

用于自動駕駛車輛和機器人技術的神經(jīng)網(wǎng)絡需要能夠捕獲具有廣闊視野的三維動態(tài)圖像和視頻。當前使用的圖像捕獲技術通常將3D現(xiàn)實世界轉(zhuǎn)換為2D信息,從而丟失運動信息和深度。Mennel團隊的研究結(jié)果不僅可以用于視覺系統(tǒng),它還可以擴展到聽覺、觸覺、熱感或嗅覺等其他物理輸入系統(tǒng)。此類智能系統(tǒng)的開發(fā)以及5G高速無線網(wǎng)絡的到來,會讓實時(低延遲)邊緣計算成為可能。
(責任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    殘差網(wǎng)絡是深度神經(jīng)網(wǎng)絡

    殘差網(wǎng)絡(Residual Network,通常簡稱為ResNet) 是深度神經(jīng)網(wǎng)絡的一種 ,其獨特的結(jié)構(gòu)設計在解決深層網(wǎng)絡訓練中的梯度消失和梯度爆炸問題上取得了顯著的突破,并因此成為
    的頭像 發(fā)表于 07-11 18:13 ?729次閱讀

    全卷積神經(jīng)網(wǎng)絡的工作原理和應用

    全卷積神經(jīng)網(wǎng)絡(FCN)是深度學習領域中的一種特殊類型的神經(jīng)網(wǎng)絡結(jié)構(gòu),尤其在計算機視覺領域表現(xiàn)出色。它通過全局平均池化或轉(zhuǎn)置卷積處理任意尺寸的輸入,特別適用于像素級別的任務,如
    的頭像 發(fā)表于 07-11 11:50 ?470次閱讀

    怎么對神經(jīng)網(wǎng)絡重新訓練

    重新訓練神經(jīng)網(wǎng)絡是一個復雜的過程,涉及到多個步驟和考慮因素。 引言 神經(jīng)網(wǎng)絡是一種強大的機器學習模型,廣泛應用于圖像識別、自然語言處理、語音
    的頭像 發(fā)表于 07-11 10:25 ?309次閱讀

    rnn是遞歸神經(jīng)網(wǎng)絡還是循環(huán)神經(jīng)網(wǎng)絡

    RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡,而非遞歸神經(jīng)網(wǎng)絡。循環(huán)神經(jīng)網(wǎng)絡是一種具有時間序列特性的神經(jīng)網(wǎng)絡,能夠處理
    的頭像 發(fā)表于 07-05 09:52 ?385次閱讀

    遞歸神經(jīng)網(wǎng)絡是循環(huán)神經(jīng)網(wǎng)絡

    。 遞歸神經(jīng)網(wǎng)絡的概念 遞歸神經(jīng)網(wǎng)絡是一種具有短期記憶功能的神經(jīng)網(wǎng)絡,它能夠處理序列數(shù)據(jù),如時間序列、文本、語音等。與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡不同
    的頭像 發(fā)表于 07-04 14:54 ?449次閱讀

    反向傳播神經(jīng)網(wǎng)絡和bp神經(jīng)網(wǎng)絡的區(qū)別

    神經(jīng)網(wǎng)絡在許多領域都有廣泛的應用,如語音識別、圖像識別、自然語言處理等。然而,BP神經(jīng)網(wǎng)絡也存在一些問題,如容易陷入局部最優(yōu)解、訓練時間長、對初始權重敏感等。為了解決這些問題,研究者們
    的頭像 發(fā)表于 07-03 11:00 ?367次閱讀

    卷積神經(jīng)網(wǎng)絡的基本結(jié)構(gòu)和工作原理

    和工作原理。 1. 引言 在深度學習領域,卷積神經(jīng)網(wǎng)絡是一種非常重要的模型。它通過模擬人類視覺系統(tǒng),能夠自動學習圖像中的特征,從而實現(xiàn)對圖像的識別和分類。與傳統(tǒng)的
    的頭像 發(fā)表于 07-03 09:38 ?247次閱讀

    卷積神經(jīng)網(wǎng)絡的原理與實現(xiàn)

    1.卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。 卷積神經(jīng)網(wǎng)絡是一種前饋
    的頭像 發(fā)表于 07-02 16:47 ?325次閱讀

    卷積神經(jīng)網(wǎng)絡的基本結(jié)構(gòu)及其功能

    卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經(jīng)網(wǎng)絡的基
    的頭像 發(fā)表于 07-02 14:45 ?540次閱讀

    卷積神經(jīng)網(wǎng)絡的原理是什么

    卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、語音識別、自然語言處理等領域。本文將詳細介紹卷積神經(jīng)網(wǎng)絡的原
    的頭像 發(fā)表于 07-02 14:44 ?354次閱讀

    神經(jīng)網(wǎng)絡圖像識別中的應用

    隨著人工智能技術的飛速發(fā)展,神經(jīng)網(wǎng)絡圖像識別領域的應用日益廣泛。神經(jīng)網(wǎng)絡以其強大的特征提取和分類能力,為圖像識別帶來了革命性的進步。本文將詳細介紹
    的頭像 發(fā)表于 07-01 14:19 ?412次閱讀

    神經(jīng)網(wǎng)絡架構(gòu)有哪些

    神經(jīng)網(wǎng)絡架構(gòu)是機器學習領域中的核心組成部分,它們模仿了生物神經(jīng)網(wǎng)絡的運作方式,通過復雜的網(wǎng)絡結(jié)構(gòu)實現(xiàn)信息的處理、存儲和傳遞。隨著深度學習技術
    的頭像 發(fā)表于 07-01 14:16 ?345次閱讀

    GRU是什么?GRU模型如何你的神經(jīng)網(wǎng)絡更聰明 掌握時間 掌握未來

    適用于處理圖像識別和計算機視覺任務。今天要給大家介紹一位新朋友,名為GRU。 Gated RecurrentUnit(GRU)是一種用于處理序列數(shù)據(jù)的循環(huán)
    發(fā)表于 06-13 11:42 ?721次閱讀
    GRU是什么?GRU模型如何<b class='flag-5'>讓</b>你的<b class='flag-5'>神經(jīng)網(wǎng)絡</b>更聰明 掌握時間 掌握未來

    詳解深度學習、神經(jīng)網(wǎng)絡與卷積神經(jīng)網(wǎng)絡的應用

    在如今的網(wǎng)絡時代,錯綜復雜的大數(shù)據(jù)和網(wǎng)絡環(huán)境,傳統(tǒng)信息處理理論、人工智能與人工神經(jīng)網(wǎng)絡都面臨巨大的挑戰(zhàn)。近些年,深度學習逐漸走進人們的視線
    的頭像 發(fā)表于 01-11 10:51 ?1607次閱讀
    詳解深度學習、<b class='flag-5'>神經(jīng)網(wǎng)絡</b>與卷積<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的應用

    卷積神經(jīng)網(wǎng)絡的優(yōu)點

    卷積神經(jīng)網(wǎng)絡的優(yōu)點? 卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)是一種基于深度學習的神經(jīng)網(wǎng)絡模型,在圖像識別、語音識別、自然語言
    的頭像 發(fā)表于 12-07 15:37 ?3754次閱讀