人類和 DNN 的目標(biāo)識別穩(wěn)健性比較 - 全文

深度神經(jīng)網(wǎng)絡(luò)在很多任務(wù)上都已取得了媲美乃至超越人類的表現(xiàn)，但其泛化能力仍遠(yuǎn)不及人類。德國蒂賓根大學(xué)等多所機(jī)構(gòu)近期的一篇論文對人類和 DNN 的目標(biāo)識別穩(wěn)健性進(jìn)行了行為比較，并得到了一些有趣的見解。機(jī)器之心對該論文進(jìn)行了編譯介紹。

摘要

我們通過 12 種不同類型的圖像劣化（image degradation）方法，比較了人類與當(dāng)前的卷積式深度神經(jīng)網(wǎng)絡(luò)（DNN）在目標(biāo)識別上的穩(wěn)健性。首先，對比三種著名的 DNN（ResNet-152、VGG-19、GoogLeNet），我們發(fā)現(xiàn)不管對圖像進(jìn)行怎樣的操作，幾乎所有情況下人類視覺系統(tǒng)都更為穩(wěn)健。我們還觀察到，當(dāng)信號越來越弱時(shí)，人類和 DNN 之間的分類誤差模式之間的差異會逐漸增大。其次，我們的研究表明直接在畸變圖像上訓(xùn)練的 DNN 在其所訓(xùn)練的同種畸變類型上的表現(xiàn)總是優(yōu)于人類，但在其它畸變類型上測試時(shí)，DNN 卻表現(xiàn)出了非常差的泛化能力。比如，在椒鹽噪聲上訓(xùn)練的模型并不能穩(wěn)健地應(yīng)對均勻白噪聲，反之亦然。因此，訓(xùn)練和測試之間噪聲分布的變化是深度學(xué)習(xí)視覺系統(tǒng)所面臨的一大關(guān)鍵難題，這一難題可通過終身機(jī)器學(xué)習(xí)方法而系統(tǒng)地解決。我們的新數(shù)據(jù)集包含 8.3 萬個精心度量的人類心理物理學(xué)試驗(yàn)，能根據(jù)人類視覺系統(tǒng)設(shè)置的圖像劣化提供對終身穩(wěn)健性的有用參考。

圖 1：在（有可能畸變的）ImageNet 圖像上從頭開始訓(xùn)練的 ResNet-50 的分類表現(xiàn)。（a）在標(biāo)準(zhǔn)的彩色圖像上訓(xùn)練后的模型在彩色圖像上的測試表現(xiàn)接近完美（優(yōu)于人類觀察者）。（b）類似地，在添加了均勻噪聲的圖像上訓(xùn)練和測試的模型也優(yōu)于人類。（c）顯著的泛化問題：在添加了椒鹽噪聲的圖像上訓(xùn)練的模型在具有均勻噪聲的圖像上進(jìn)行測試時(shí)，表現(xiàn)時(shí)好時(shí)壞——即使這兩種噪聲類型在人眼看來并沒有太大的區(qū)別。

1 引言

1.1 作為人類目標(biāo)識別模型的深度神經(jīng)網(wǎng)絡(luò)

人類在日常生活中進(jìn)行的視覺識別速度很快，似乎也毫不費(fèi)力，而且很大程度無關(guān)視角和物體的方向 [Biederman (1987)]。在單次注視過程中完成的主要由中心凹進(jìn)行的快速識別被稱為“核心目標(biāo)識別（core object recognition）”[DiCarlo et al. (2012)]。比如，在查看“標(biāo)準(zhǔn)的”圖像時(shí)，我們能夠在不到 200 毫秒的單次注視內(nèi)可靠地辨別出視野中心的目標(biāo)。[DiCarlo et al. (2012); Potter (1976); Thorpe et al. (1996)]。由于目標(biāo)識別速度很快，所以研究者常認(rèn)為核心目標(biāo)識別主要是通過前饋處理實(shí)現(xiàn)的，盡管反饋連接在靈長類大腦中無處不在。靈長類大腦中的目標(biāo)識別據(jù)信是通過腹側(cè)視覺通路實(shí)現(xiàn)的，這是一個由區(qū)域 V1-V2-V4-IT 組成的分層結(jié)構(gòu)，來自視網(wǎng)膜的信息會首先傳遞至 V1 的皮層 [Goodale and Milner (1992)]。

就在幾年前，動物視覺系統(tǒng)還是已知的唯一能夠進(jìn)行種類廣泛的視覺目標(biāo)識別的視覺系統(tǒng)。但這種情況已然改變，在數(shù)百萬張有標(biāo)注圖像上訓(xùn)練之后的腦啟發(fā)式深度神經(jīng)網(wǎng)絡(luò)已經(jīng)在自然場景圖像中的物體分類上達(dá)到了人類水平 [Krizhevsky et al. (2012)]。DNN 現(xiàn)在可用于各種類型的任務(wù)，并且創(chuàng)造了新的當(dāng)前最佳，甚至在一些幾年前還被認(rèn)為需要數(shù)十年時(shí)間才能通過算法解決的任務(wù)上取得了超越人類的表現(xiàn) [He et al. (2015); Silver et al. (2016)]。因?yàn)?DNN 和人類能達(dá)到相近的準(zhǔn)確度，所以已有一些工作開始研究 DNN 和人類視覺的相似和不同之處。一方面，由于大腦本身的復(fù)雜性和神經(jīng)元的多樣性，所以 DNN 的網(wǎng)絡(luò)單元得到了很大的簡化 [Douglas and Martin (1991)]。另一方面，一個模型的能力往往并不取決于對原有系統(tǒng)的復(fù)現(xiàn)，而在于模型取得原系統(tǒng)的重要方面并將其從實(shí)現(xiàn)的細(xì)節(jié)中抽象出來的能力 [如 Box (1976); Kriegeskorte (2015)]。

人類視覺系統(tǒng)最顯著的性質(zhì)之一是穩(wěn)健的泛化能力。即使輸入分布發(fā)生很大的變化（比如不同的光照條件和天氣類型），人類視覺系統(tǒng)也能輕松應(yīng)對。比如，即使在一個物體前面有雨滴或雪花，人類對物體的識別也基本不會出錯。盡管人類在一生中肯定會遇到很多這樣的變化情況（對于 DNN，即是我們所說的“訓(xùn)練時(shí)間”），但似乎人類的泛化方式非常普適，并不局限于之前看過的同種分布。否則我們將無法理解存在某些全新之處的場景，之前未見過的噪聲也會讓我們束手無策。即使一個人的頭上還從未被撒過彩片碎紙，但他仍然可以毫無壓力地辨認(rèn)出花車巡游中的目標(biāo)。很自然，這樣通用穩(wěn)健的機(jī)制并不只是動物視覺系統(tǒng)所需的，要讓人工視覺系統(tǒng)具備超出其訓(xùn)練時(shí)間所用分布的“眼界”，從而處理各種各樣的視覺任務(wù)，也將需要類似的機(jī)制。用于自動駕駛的深度學(xué)習(xí)可能就是其中一個突出案例：即使系統(tǒng)在訓(xùn)練時(shí)間從沒見過彩片碎紙雨，在花車巡游時(shí)也需要有穩(wěn)健的分類表現(xiàn)。因此，從機(jī)器學(xué)習(xí)角度看，因?yàn)榻K身機(jī)器學(xué)習(xí)所需的泛化能力并不依賴于在測試時(shí)間使用獨(dú)立同分布（i.i.d.）樣本的標(biāo)準(zhǔn)假設(shè)，所以對一般噪聲的穩(wěn)健性可用作終身機(jī)器學(xué)習(xí)的高度相關(guān)的案例 [Chen and Liu (2016)]。

1.2 泛化能力比較

DNN 的泛化效果一般很好：首先，DNN 能夠在訓(xùn)練分布上學(xué)習(xí)到足夠一般的特征，能在獨(dú)立同分布的測試分布上得到很高的準(zhǔn)確度；盡管 DNN 也有足夠的能力完全記憶訓(xùn)練數(shù)據(jù) [Zhang et al. (2016)]，。有很多研究致力于理解這一現(xiàn)象 [如 Kawaguchi et al. (2017); Neyshabur et al. (2017); Shwartz-Ziv and Tishby (2017)]。其次，在一個任務(wù)上學(xué)習(xí)到特征往往只會遷移到有所相關(guān)的任務(wù)上，比如從分類任務(wù)遷移到顯著性預(yù)測任務(wù) [Kümmerer et al. (2016)]、情緒識別任務(wù) [Ng et al. (2015)]、醫(yī)學(xué)成像任務(wù) [Greenspan et al. (2016)] 以及其它很多遷移學(xué)習(xí)任務(wù) [Donahue et al. (2014)]。但是，在用于新任務(wù)之前，遷移學(xué)習(xí)仍然需要大量訓(xùn)練。這里，我們采用第三種設(shè)定：終身機(jī)器學(xué)習(xí)角度的泛化 [Thrun (1996)]。即當(dāng)一個視覺學(xué)習(xí)系統(tǒng)在學(xué)習(xí)過處理一種特定類型的圖像劣化后，在處理新類型的圖像劣化時(shí)效果如何？作為一種目標(biāo)識別穩(wěn)健性的度量方法，我們可以測試分類器或視覺系統(tǒng)能夠忍受輸入分布的變化達(dá)到一定程度的能力，即在一定程度上不同于訓(xùn)練分布的測試分布上評估時(shí)的識別表現(xiàn)是否夠好（即在接近真實(shí)的情況下測試，而非在獨(dú)立同分布上測試）。使用這種方法，我們可以衡量 DNN 和人類觀察者應(yīng)對由參數(shù)化圖像處理所造成的原始圖像逐漸畸變的能力。

首先，我們將評估在 ImageNet 上訓(xùn)練的表現(xiàn)最好的 DNN，即 GoogLeNet [Szegedy et al. (2015)]、 VGG-19 [Simonyan and Zisserman (2015)] 和 ResNet-152 [He et al. (2016)]，并會在 12 種不同的圖像畸變上比較這些 DNN 與人類的表現(xiàn)，看各自在之前未見過的畸變上的泛化能力如何。圖 2 展示了這些畸變類型，包含加性噪聲或相位噪聲等。

在第二組實(shí)驗(yàn)中，我們會直接在畸變圖像上訓(xùn)練網(wǎng)絡(luò)，看它們在一般意義上處理有噪聲輸入的效果究竟如何，以及在畸變圖像上進(jìn)行多少訓(xùn)練就能以數(shù)據(jù)增強(qiáng)的形式助力對其它畸變形式的處理。研究者已對人類在目標(biāo)識別任務(wù)上的行為進(jìn)行了很多心理物理學(xué)研究，這些任務(wù)包括在不同顏色（灰度和彩色）或?qū)Ρ榷纫约疤砑恿瞬煌康目梢娫肼暤膱D像上測量準(zhǔn)確度。研究表明，這種方法確實(shí)有助于對人類視覺系統(tǒng)的探索，能揭示出有關(guān)其中內(nèi)部計(jì)算和機(jī)制的信息 [Nachmias and Sansbury (1974); Pelli and Farell (1999); Wichmann (1999); Henning et al. (2002); Carandini and Heeger (2012); Carandini et al. (1997); Delorme et al. (2000)]。因此，類似的實(shí)驗(yàn)也許同樣能讓我們了解 DNN 的工作方式，尤其是還能通過與人類行為的高質(zhì)量測量結(jié)果來進(jìn)行比較。

特別需要指出，我們實(shí)驗(yàn)中的人類數(shù)據(jù)是從受控的實(shí)驗(yàn)環(huán)境中獲得的（而沒有使用 Amazon Mechanical Turk 等服務(wù)，因?yàn)檫@些服務(wù)無法讓我們充分地控制展示時(shí)間、顯示器校準(zhǔn)、視角和參與者在實(shí)驗(yàn)中的注意力）。我們精心測量得到的行為數(shù)據(jù)集共包含 12 個實(shí)驗(yàn)的 82880 次心理物理學(xué)試驗(yàn)，這些數(shù)據(jù)以及相關(guān)材料和代碼都已公開：https://github.com/rgeirhos/generalisation-humans-DNNs

2 方法

這一節(jié)將報(bào)告所用的范式、流程、圖像處理方法、觀察者和 DNN 的核心元素；這里的信息足以讓讀者了解相關(guān)實(shí)驗(yàn)和結(jié)果。更深入的解讀請參閱補(bǔ)充材料，其中有更詳細(xì)的細(xì)節(jié)，可幫助研究者重現(xiàn)我們的實(shí)驗(yàn)。

2.1 范式、流程和 16-class-ImageNet

為了本研究，我們開發(fā)了一種實(shí)驗(yàn)范式，旨在使用一種強(qiáng)制選擇的圖像分類任務(wù)來盡可能公平地比較人類觀察者和 DNN。實(shí)現(xiàn)公平的心理物理學(xué)比較面臨著一些難題：首先，很多表現(xiàn)優(yōu)良的 DNN 是在 ILSRVR 2012 數(shù)據(jù)庫 [Russakovsky et al. (2015)] 上訓(xùn)練的，這個數(shù)據(jù)庫有 1000 種細(xì)粒度的類別（比如，超過 100 種狗）。如果讓人類說出這些目標(biāo)的名稱，他們基本上很自然地會使用大類的名稱（比如會說這是“狗”，而不是說是“德國牧羊犬”）。因此，我們使用 WordNet 的層次結(jié)構(gòu) [Miller (1995)] 開發(fā)了一種映射方法，將 16 種大類類別（比如狗、車或椅子）映射到了它們對應(yīng)的 ImageNet 類別。我們將這個數(shù)據(jù)集稱為 16-class-ImageNet，因?yàn)樗鼘?ImageNet 的一個子集分組成了 16 個大類，即：飛機(jī)、兩輪車、船舶、小車、椅子、狗、鍵盤、烤箱、熊、鳥、瓶子、貓、鐘表、象、刀具、卡車）。然后，在每次試驗(yàn)中都會有一張圖像顯示在計(jì)算機(jī)屏幕上，觀察者必須通過點(diǎn)擊這 16 個類別中的 1 個來選出正確的類別。對于預(yù)訓(xùn)練的 DNN，則是計(jì)算映射到特定大類的所有 softmax 值的總和。然后，具有最高總和的大類被用作該網(wǎng)絡(luò)的最終決定。

另一個難題是實(shí)際上標(biāo)準(zhǔn)的 DNN 在推理時(shí)間僅會使用前饋式計(jì)算，而循環(huán)連接在人腦中無處不在 [Lamme et al. (1998); Sporns and Zwi (2004)]。為了防止這種差異在我們的實(shí)驗(yàn)比較中成為混淆結(jié)果的主要原因，給人類觀察者的呈現(xiàn)時(shí)間被限制在了 200ms。在展示完一張圖像之后，還會呈現(xiàn) 200ms 的 1/f 噪聲掩模——在心理物理學(xué)上，已知這種方法能夠盡可能地最小化大腦中的反饋影響。

2.2 觀察者和預(yù)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)

來自人類觀察者的數(shù)據(jù)與三個預(yù)訓(xùn)練的 DNN 的分類表現(xiàn)進(jìn)行了比較，即 GoogLeNet、 VGG-19 和 ResNet-152。對于我們進(jìn)行的 12 個實(shí)驗(yàn)中的每一個，都有 5 或 6 個觀察者參與（只有彩色圖像的實(shí)驗(yàn)除外，該實(shí)驗(yàn)僅有三位觀察者參與，因?yàn)橐延泻芏嘌芯繄?zhí)行過類似的實(shí)驗(yàn) [Delorme et al. (2000); Kubilius et al. (2016); Wichmann et al. (2006)]。觀察者的視力或矯正后視力處于正常水平。

2.3 圖像處理方法

我們在一個控制良好的心理物理學(xué)實(shí)驗(yàn)室環(huán)境中進(jìn)行了總共 12 個實(shí)驗(yàn)。在每個實(shí)驗(yàn)中，都會在大量圖像上施加（可能是參數(shù)化的）圖像畸變，這樣信號強(qiáng)度的范圍就從“沒有畸變/全信號”到“有畸變/（更）弱信號”不等。然后我們測量了分類準(zhǔn)確度隨信號強(qiáng)度的變化情況。我們使用的圖像處理方法中有三種是二分式的（彩色與灰度、真色與反色、原始與均衡化的功率譜）；一種處理方式有 4 個不同層級（旋轉(zhuǎn) 0、90、180、270 度）；還有一種方式有 7 個層級（0、30……180 度的相位噪聲）；其它畸變方法則各有 8 個不同層級。這些方法為：均勻噪聲（受表示像素層面加性均勻噪聲的邊界的“width”參數(shù)控制）、對比度下降（對比度從 100% 到 1% 不等）以及三種來自 Eidolon 工具箱的三種不同的處理方法 [Koenderink et al. (2017)]。這三個 Eidolon 實(shí)驗(yàn)都對應(yīng)于一種參數(shù)化圖像處理的不同版本，“reach”參數(shù)控制了畸變的強(qiáng)度。此外，對于在畸變上訓(xùn)練的實(shí)驗(yàn)，我們也評估了在具有椒鹽噪聲的刺激上的表現(xiàn)（受參數(shù) p 控制，該參數(shù)表示將一個像素設(shè)置成黑或白色的概率；p∈[0,10,20,35,50,65,80,95]%）。

更多有關(guān)不同圖像處理方法的信息請參閱補(bǔ)充材料，其中也包含各種不同處理方法和畸變等級的圖例。圖 2 則展示了每種畸變的一個圖例。整體而言，我們選擇使用的圖像處理方法能夠代表很多不同類型的可能畸變。

圖 2：一張鳥圖像在經(jīng)過所有類型的畸變處理后的結(jié)果。從左至右的圖像處理方法依次為：（上面一行）：彩色原圖（未畸變）、灰度、低對比度、高通、低通（模糊）、相位噪聲、功率均衡；（下面一行）：反色、旋轉(zhuǎn)、Eidolon I、Eidolon II、Eidolon III、加性均勻噪聲、椒鹽噪聲。補(bǔ)充材料中提供了所用到的所有畸變等級。

2.4 在畸變圖像上訓(xùn)練

除了在畸變圖像上評估標(biāo)準(zhǔn)的預(yù)訓(xùn)練的 DNN（結(jié)果見圖 3），我們還直接在畸變圖像上訓(xùn)練了神經(jīng)網(wǎng)絡(luò)（圖 4）。這些網(wǎng)絡(luò)是在 16-class-ImageNet 上訓(xùn)練的，這是標(biāo)準(zhǔn) ImageNet 數(shù)據(jù)集的一個子集，詳見 2.1 節(jié)。這將未受擾動的訓(xùn)練集規(guī)模減小到了大約原來的五分之一。為了校正每個類別的高度不平衡的樣本數(shù)量，我們使用了一個與對應(yīng)類別的樣本數(shù)量成正比的權(quán)重給損失函數(shù)中的每個樣本加權(quán)。這些實(shí)驗(yàn)中訓(xùn)練的所有網(wǎng)絡(luò)都使用了類似 ResNet 的架構(gòu)，與標(biāo)準(zhǔn) ResNet-50 的不同之處僅有輸出神經(jīng)元的數(shù)量——從 1000 降至了 16，以對應(yīng)數(shù)據(jù)集的 16 個大類。權(quán)重使用了一個截?cái)嗟恼龖B(tài)分布進(jìn)行初始化，均值為零，標(biāo)準(zhǔn)差為，其中 n 是一層中輸出神經(jīng)元的數(shù)量。

在從頭開始訓(xùn)練時(shí)，我們使用圖像處理方法的不同組合在訓(xùn)練過程中執(zhí)行了數(shù)據(jù)增強(qiáng)。當(dāng)在多種類型的圖像處理上訓(xùn)練網(wǎng)絡(luò)時(shí)（圖 4 中的 B1-B9 和 C1-C2 模型），圖像處理的類型（包括未畸變圖像，即標(biāo)準(zhǔn)的彩色圖像）是均勻選取的，而且我們每次僅應(yīng)用一種處理（即網(wǎng)絡(luò)永遠(yuǎn)不會看到同時(shí)應(yīng)用了多種圖像處理方法的單張圖像，但注意某些圖像處理方法本質(zhì)上已經(jīng)包含了其它處理方法：比如均勻噪聲，總是在進(jìn)行灰度轉(zhuǎn)換并將對比度降至 30% 后添加的）。對于一個給定的圖像處理方法，擾動量是根據(jù)測試時(shí)間所用的等級均勻選取的（參見圖 3）。

訓(xùn)練過程的其它方面都遵循在 ImageNet 上訓(xùn)練 ResNet 的標(biāo)準(zhǔn)訓(xùn)練流程：我們使用了動量為 0.997 的 SGD，批大小為 64，初始學(xué)習(xí)率為 0.025。在 30、60、80 和 90 epoch 后（當(dāng)訓(xùn)練 100 epoch 時(shí)）或 60、120、160、180 epoch 后（當(dāng)訓(xùn)練 200 epoch 時(shí)），學(xué)習(xí)率乘以 0.1。我們使用了 TensorFlow 1.6.0 [Abadi et al. (2016)] 進(jìn)行訓(xùn)練。在訓(xùn)練實(shí)驗(yàn)中，除了 Eidolon 刺激（因?yàn)檫@些刺激的生成對 ImageNet 訓(xùn)練而言的計(jì)算速度實(shí)在太慢）之外，所有的圖像處理方法都有超過兩個層級。為了進(jìn)行比較，我們額外添加了彩色與灰度和椒鹽噪聲的對比（因?yàn)榻符}噪聲方面沒有人類的數(shù)據(jù)，但均勻噪聲和椒鹽噪聲之間不正式的比較說明人類的表現(xiàn)是相近的，參見圖 1(c)）。

3 人類和預(yù)訓(xùn)練后的 DNN 對圖像畸變的泛化能力

為了評估信號更弱時(shí)的泛化能力，我們測試了 12 種不同的圖像劣化方法。然后將這些不同信號強(qiáng)度的圖像呈現(xiàn)給實(shí)驗(yàn)室環(huán)境中的人類觀察者以及預(yù)訓(xùn)練的 DNN（ResNet-152、GoogLeNet 和 VGG-19）進(jìn)行分類。圖 3 給出了可視化的結(jié)果比較。

圖 3：GoogLeNet、VGG-19 和 ResNet-152 以及人類觀察者的分類準(zhǔn)確度和響應(yīng)分布熵。“熵”是指響應(yīng)/決定分布（16 類）的香農(nóng)熵。這里衡量了與特定類別的偏差：使用一個在每個類別的圖像數(shù)量方面平衡的測試數(shù)據(jù)集，對所有 16 個類別進(jìn)行同等頻率的響應(yīng)能得到 4 bit 的最大可能熵。如果網(wǎng)絡(luò)或觀察者更偏愛響應(yīng)其中某些類別，則熵會降低（如果是一直響應(yīng)單個類別的極端情況，則會降至 0 bit，不管基本真值的類別如何）。人類表現(xiàn)的“誤差線”表示了所有參與者的結(jié)果的整個區(qū)間。2.3 節(jié)將解釋圖像處理方法，可視化結(jié)果請參閱補(bǔ)充材料。

雖然在僅有相對較小的與顏色相關(guān)的畸變時(shí)（比如灰度轉(zhuǎn)換或反色）人類和 DNN 的性能接近，但我們發(fā)現(xiàn)人類觀察者對其它所有畸變都更穩(wěn)健：在低對比度、功率均衡和相位噪聲圖像上有少許優(yōu)勢，在均勻噪聲、低通、高通、旋轉(zhuǎn)和三種 Eidolon 實(shí)驗(yàn)上優(yōu)勢更大。此外，由響應(yīng)分布熵衡量的誤差模式存在很大的差異（這表明存在對特定類別的偏差）。當(dāng)信號越來越弱時(shí)，人類參與者的響應(yīng)在 16 個類別上或多或少是均等分布的，而三個 DNN 都表現(xiàn)出了對特定類別的偏差。這些偏差并不能完全通過先驗(yàn)類別概率解釋，而且因具體畸變而各不相同。比如，對于有很強(qiáng)均勻噪聲的圖像，ResNet-152 幾乎只能預(yù)測瓶子類別（與基本真值類別無關(guān)），而對于有嚴(yán)重相位噪聲的圖像則只能預(yù)測狗或鳥類別。人們可能會想到一些降低 DNN 和人類的響應(yīng)分布熵之間的差異的簡單技巧。一種可能的方法是增大 softmax 溫度參數(shù)并假設(shè)模型的決定是從這個 softmax 分布采樣的，而不是取自 argmax。但是，以這種方式增大響應(yīng) DNN 分布熵會極大降低分類準(zhǔn)確度，因此需要一定的權(quán)衡（參見補(bǔ)充材料圖 8）。

這些結(jié)果與之前報(bào)告的 DNN 中對顏色信息的處理與人類類似的發(fā)現(xiàn)一致 [Flachot and Gegenfurtner (2018)]，但 DNN 識別的準(zhǔn)確度會因噪聲和模糊等圖像劣化而顯著下降 [Vasiljevic et al. (2016); Dodge and Karam (2016, 2017a, 2017b); Zhou et al. (2017)]。整體而言，在各種圖像畸變情況下，DNN 在泛化到更弱信號上的表現(xiàn)比人類更差。盡管人類的視覺系統(tǒng)隨進(jìn)化過程和生命周期已經(jīng)遇到了大量畸變，但我們顯然沒遇到過我們的測試中很多確切的圖像處理方式。因此，我們的人類數(shù)據(jù)表明原則上高水平的泛化能力是可能的。我們發(fā)現(xiàn)，人類與 DNN 的泛化能力差異的可能原因有很多：在當(dāng)前所使用的網(wǎng)絡(luò)架構(gòu)方面是否存在局限性（正如 Dodge and Karam (2016) 假設(shè)的那樣），使得 DNN 無法匹敵人腦中錯綜復(fù)雜的計(jì)算？訓(xùn)練數(shù)據(jù)是否存在問題（Zhou et al. (2017) 就這樣認(rèn)為）？還是說當(dāng)今的訓(xùn)練方法/優(yōu)化方法不足以實(shí)現(xiàn)穩(wěn)健和通用的目標(biāo)識別？為了理解我們發(fā)現(xiàn)的差異之處，我們進(jìn)行了另一批實(shí)驗(yàn)——直接在畸變圖像上訓(xùn)練網(wǎng)絡(luò)。

4 直接在畸變圖像上訓(xùn)練 DNN

圖 4：使用可能畸變的數(shù)據(jù)訓(xùn)練的網(wǎng)絡(luò)的分類準(zhǔn)確度（百分?jǐn)?shù)）。行表示中等難度的不同測試條件（括號中給出了具體條件，單位同圖 3）。列對應(yīng)按不同方式訓(xùn)練的網(wǎng)絡(luò)（最左列：用于比較的人類觀察者；沒有人類在椒鹽噪聲方面的數(shù)據(jù)）。所有的網(wǎng)絡(luò)都是在（可能處理過的）16-class-ImageNet 上從頭開始訓(xùn)練得到的。紅框標(biāo)記了對應(yīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)中使用的處理方法；此外，加上了下劃線的結(jié)果表示“灰度”是訓(xùn)練數(shù)據(jù)的一部分，因?yàn)槟承┗兎椒ò送耆珜Ρ榷鹊幕叶葓D像。模型 A1-A9：在單一畸變上訓(xùn)練的 ResNet-50（100 epoch）。模型 B1-B9：在均勻噪聲和另一種畸變上訓(xùn)練的 ResNet-50（200 epoch）。模型 C1 和 C2：在除一種畸變外的所有畸變上訓(xùn)練的 ResNet-50（200 epoch）。隨機(jī)選中的幾率是十六分之一，即 6.25%。

我們?yōu)槊糠N畸變直接在 16-class-ImageNet 圖像（有可能進(jìn)行了圖像處理）上從頭開始訓(xùn)練一個網(wǎng)絡(luò)。圖 4（A1-A9）展示了訓(xùn)練的結(jié)果。我們發(fā)現(xiàn)，這些特定的網(wǎng)絡(luò)在其所訓(xùn)練的圖像處理類型上總是優(yōu)于人類觀察者的表現(xiàn)（即圖中對角線上的優(yōu)良結(jié)果）。這表明，當(dāng)前所用的架構(gòu)（比如 ResNet-50）和訓(xùn)練方法（標(biāo)準(zhǔn)的優(yōu)化器和訓(xùn)練過程）足以“解決”獨(dú)立同分布的訓(xùn)練/測試條件下的畸變。我們不僅能解決 Dodge and Karam (2017a) 觀察到的人類與 DNN 表現(xiàn)的差異問題（他們在畸變上對網(wǎng)絡(luò)進(jìn)行了精細(xì)調(diào)節(jié)，但得到的 DNN 未達(dá)到人類水平），而且能在這方面超越人類的水平。盡管人類視覺系統(tǒng)的結(jié)構(gòu)肯定更為復(fù)雜 [Kietzmann et al. (2017)]，但看起來對處理這類圖像處理問題來說似乎并不是必需的。

但是，正如之前指出的那樣，穩(wěn)健的泛化能力的關(guān)鍵不是解決事先已知的特定問題。因此，我們測試了在特定畸變類型上訓(xùn)練的網(wǎng)絡(luò)在另一些畸變上的表現(xiàn)。圖 4 A1-A9 中非對角線上的數(shù)據(jù)即為實(shí)驗(yàn)結(jié)果。整體而言，我們發(fā)現(xiàn)，在一些案例中，在特定畸變上訓(xùn)練能稍微提升在其它畸變上的表現(xiàn)，但也有一些案例給出了相反的結(jié)果（比較對象是在彩色圖像上訓(xùn)練的純 ResNet-50，即圖中的 A1）。所有網(wǎng)絡(luò)在椒鹽噪聲以及均勻噪聲上的表現(xiàn)都接近隨機(jī)亂選，即使是在各自相應(yīng)的其它噪聲模型上直接訓(xùn)練的網(wǎng)絡(luò)也是如此。因?yàn)檫@兩種類型的噪聲在人眼看來其實(shí)差別并不大（如圖 1(c) 所示），所以這一結(jié)果可能還是頗讓人驚訝。因此，在一種畸變類型上訓(xùn)練的網(wǎng)絡(luò)并不總是能實(shí)現(xiàn)在其它畸變上的表現(xiàn)提升。

因?yàn)橹辉趩我灰环N畸變上訓(xùn)練似乎不足以為 DNN 帶來強(qiáng)大的泛化能力，所以我們還在另外兩種設(shè)置上訓(xùn)練了同樣的架構(gòu)（ResNet-50）。圖 4 中 B1-B9 模型展示了在一種特定的畸變與均勻噪聲的組合上訓(xùn)練后的結(jié)果（來自每種圖像處理方法的訓(xùn)練數(shù)據(jù)各 50%）。選擇均勻噪聲的原因是這似乎是對所有網(wǎng)絡(luò)而言最困難的畸變，因此將這種特定畸變納入訓(xùn)練數(shù)據(jù)可能是有益的。此外，我們還在除去了一種畸變（除去了均勻噪聲或椒鹽噪聲）之外的所有畸變上訓(xùn)練了模型 C1 和 C2。

我們發(fā)現(xiàn)，相比于模型 A1-A9，模型 B1-B9 的目標(biāo)識別表現(xiàn)有所提升——不管是它們實(shí)際訓(xùn)練的畸變上（圖 4 中的對角線上的紅框），還是在其它未在訓(xùn)練數(shù)據(jù)中出現(xiàn)的畸變上。但是，這一提升的原因很大程度上可能是模型 B1-B9 訓(xùn)練了 200 epoch，而不是像 A1-A9 那樣訓(xùn)練了 100 epoch，因?yàn)槟Ｐ?B9（在均勻噪聲上訓(xùn)練和測試，200 epoch）的表現(xiàn)也由于模型 A9（在均勻噪聲上訓(xùn)練和測試，100 epoch）。因此，當(dāng)存在嚴(yán)重畸變時(shí)，訓(xùn)練更長時(shí)間可能更有用，但將其它畸變集成到訓(xùn)練過程中卻似乎并不具有普適的益處。此外，我們還發(fā)現(xiàn)，即使對于單個模型來說，在其所訓(xùn)練的所有 8 種畸變上都達(dá)到較高的準(zhǔn)確度也是可能（模型 C1 和 C2），但是對于剩下的兩種畸變（均勻噪聲或椒鹽噪聲），目標(biāo)識別準(zhǔn)確度卻僅有 11%-14%；比起在同一畸變上訓(xùn)練得到的專用網(wǎng)絡(luò)（準(zhǔn)確度超過 70%），這一準(zhǔn)確度離隨機(jī)亂選要近得多。

總的來說，這些發(fā)現(xiàn)表明僅使用畸變來進(jìn)行數(shù)據(jù)增強(qiáng)可能不足以克服我們發(fā)現(xiàn)的泛化問題。問題也許應(yīng)該變一變了——不再是“為什么 DNN 的泛化能力這么好（在獨(dú)立同分布條件下）？”[Zhang et al. (2016)]，而變成“為什么 DNN 的泛化能力這么糟（在非獨(dú)立同分布條件下）？”目前被視為人類目標(biāo)識別的計(jì)算模型的 DNN 將如何解決這一難題？還有待未來研究。這個激動人心的領(lǐng)域處于認(rèn)知科學(xué)/視覺感知和深度學(xué)習(xí)領(lǐng)域的交叉點(diǎn)，會從這兩個領(lǐng)域同時(shí)汲取靈感和新思想：計(jì)算機(jī)視覺的域適應(yīng)子領(lǐng)域（參閱 Patel et al. (2015) 的綜述）正在研究不受輸入分布變化所影響的穩(wěn)健型機(jī)器推理方法，同時(shí)人類視覺研究領(lǐng)域也正在積累證據(jù)證明局部增益控制機(jī)制的優(yōu)勢。這些標(biāo)準(zhǔn)化過程似乎對動物和人類的穩(wěn)健視覺的很多方面而言都至關(guān)重要 [Carandini and Heeger (2012)]，也能預(yù)測人類視覺數(shù)據(jù) [Berardino et al. (2017); Schütt and Wichmann (2017)]，并以證明可用于計(jì)算機(jī)視覺 [Jarrett et al. (2009); Ren et al. (2016)]。神經(jīng)標(biāo)準(zhǔn)化過程與 DNN 的泛化能力之間是否存在關(guān)聯(lián)？這將是值得未來研究一個有趣方向。

5 總結(jié)

我們基于 12 種不同的圖像畸變，對人類和 DNN 的目標(biāo)識別穩(wěn)健性進(jìn)行了行為比較。我們發(fā)現(xiàn)，與人類觀察者相比，在 ImageNet 上訓(xùn)練的三種知名 DNN（ResNet-152、GoogLeNet 和 VGG-19）的表現(xiàn)會隨著圖像畸變所造成的信噪比的減小而迅速降低。此外，我們還發(fā)現(xiàn)當(dāng)信號越來越弱時(shí)，人類與 DNN 的分類誤差模式的差別會逐漸增大。我們在良好控制的實(shí)驗(yàn)室條件下進(jìn)行了 82880 次心理物理學(xué)試驗(yàn)，結(jié)果表明人類與當(dāng)前 DNN 處理目標(biāo)信息的方式仍存在顯著區(qū)別。在我們的設(shè)置中，這些區(qū)別無法通過在畸變圖像上進(jìn)行訓(xùn)練（即數(shù)據(jù)增強(qiáng)）而克服：盡管 DNN 能完美應(yīng)對其所訓(xùn)練過的特定畸變，但對于它們之前未曾見過的畸變類型，它們?nèi)匀皇譄o策。因?yàn)闈撛诨兊念愋突旧鲜菬o窮無盡的（不管是理論上還是實(shí)際應(yīng)用中都是如此），所以不可能在所有畸變上都訓(xùn)練一遍。當(dāng)超出常規(guī)的獨(dú)立同分布假設(shè)時(shí)（通常是不現(xiàn)實(shí)的），DNN 就會遇到泛化問題。我們相信，不管是為了創(chuàng)造穩(wěn)健的機(jī)器推理，還是為了更好地理解人類目標(biāo)識別，解決這一泛化問題都至關(guān)重要。我們希望我們的發(fā)現(xiàn)以及我們精心測量并免費(fèi)公開的行為數(shù)據(jù)能為 DNN 穩(wěn)健性的提升提供一個有用的新基準(zhǔn)，并能激勵神經(jīng)科學(xué)家找到大腦中負(fù)責(zé)這一出色的穩(wěn)健性機(jī)制。

閱讀全文

上一頁 1 2 3 4 5 6全文

嵌入式系統(tǒng)中的目標(biāo)識別技術(shù)

目標(biāo)檢測和識別是計(jì)算機(jī)視覺系統(tǒng)的一個必不可少的組成部分。在計(jì)算機(jī)視覺中，首先是將場景分解成計(jì)算機(jī)可以看到和分析的組件。

2015-10-28 10:12:32

725

目標(biāo)識別之YOLO學(xué)習(xí)筆記

目標(biāo)識別 YOLO 學(xué)習(xí)筆記（一）

2020-05-12 15:05:34

RCS目標(biāo)識別

各位好！我是一名學(xué)生，先階段在準(zhǔn)備競賽，需要RCS目標(biāo)識別技術(shù)，實(shí)現(xiàn)海上油污檢測。請問有沒有地方采購現(xiàn)成產(chǎn)品，或是自己制作是如何制作，謝謝！或是有其他什么方法可以實(shí)現(xiàn)海上油污檢測?

2015-01-27 15:50:02

RFID射頻識別技術(shù)頻率的選擇

應(yīng)答器 / 標(biāo)簽(Transponder/Tag)和詢問器 /讀寫器(Interrogator/Reader)之間雙向通信，從而達(dá)到識別目的并交換數(shù)據(jù)的新興技術(shù)該技術(shù)能實(shí)現(xiàn)多目標(biāo)識別和運(yùn)動目標(biāo)識別;具有抗

2019-07-26 07:33:13

【HarmonyOS HiSpark AI Camera】智能目標(biāo)識別

項(xiàng)目名稱：智能目標(biāo)識別試用計(jì)劃：通過攝像頭采集視頻，利用海思芯片進(jìn)行處理和目標(biāo)識別。計(jì)劃年內(nèi)完成。

2020-11-19 20:46:19

【OK210申請】基于樹莓派與FPGA的運(yùn)動目標(biāo)識別

圖像采集，F(xiàn)PGA做圖像處理，主要采取opencv對圖像進(jìn)行處理，ok210可做平時(shí)擴(kuò)展項(xiàng)目，例如植入APP中，如果cortex-A8足夠強(qiáng)大可考慮換下樹莓派原理：運(yùn)動目標(biāo)識別；背景減除

2015-08-10 14:13:25

【PYNQ-Z2申請】圖像目標(biāo)識別FPGA硬件加速

項(xiàng)目名稱：圖像目標(biāo)識別FPGA硬件加速試用計(jì)劃：申請理由本人供職于一家AI公司，現(xiàn)在在使用FPGA硬件加速相關(guān)目標(biāo)檢測算法的端側(cè)實(shí)現(xiàn)（鑒黃/司機(jī)行為識別），公司已經(jīng)有非常成熟的軟件算法以及GPU

2019-01-09 14:51:09

【平頭哥CB6121 BLE及BLE Mesh評估板試用連載】目標(biāo)識別和語音識別一體化的家居機(jī)器人

本帖最后由 jf_11671167 于 2021-10-12 10:04 編輯項(xiàng)目名稱：目標(biāo)識別和語音識別一體化的家居機(jī)器人試用計(jì)劃：使用貴開發(fā)板用做傳輸工具，將數(shù)據(jù)傳輸?shù)缴衔粰C(jī)處理

2020-07-31 10:49:41

【我是電子發(fā)燒友】如何加速DNN運(yùn)算？

深度神經(jīng)網(wǎng)絡(luò)（DNN）目前是許多現(xiàn)代AI應(yīng)用的基礎(chǔ)。自從DNN在語音識別和圖像識別任務(wù)中展現(xiàn)出突破性的成果，使用DNN的應(yīng)用數(shù)量呈爆炸式增加。這些DNN方法被大量應(yīng)用在無人駕駛汽車，癌癥檢測，游戲

2017-06-14 21:01:14

【飛凌嵌入式OKMX8MP-C 開發(fā)板試用體驗(yàn)】OpenCV-DNN移植&使用體驗(yàn)(基于YOLOV3模型識別物體)

的OpenCV-DNN攝像頭圖像實(shí)時(shí)識別物品的Demo，從網(wǎng)上下載coco.names（物品類名稱文件）,yolov3.cfg（YOLOV3配置文件），yolov3.weights（YOLOV3模型

2022-02-21 00:22:42

一種適用于空間觀測任務(wù)的實(shí)時(shí)多目標(biāo)識別算法分享

基于嵌入式圖像處理平臺的實(shí)時(shí)多目標(biāo)識別算法人工智能技術(shù)與咨詢昨天本文來自《科學(xué)技術(shù)與工程》，作者王旭輝等摘要提出了一種適用于空間觀測任務(wù)的實(shí)時(shí)多目標(biāo)識別算法，它基于DSP和FPGA組合的圖像處理

2021-12-21 07:02:06

東芝新一代圖像識別人工智能處理器ViscontiTM5的DNN硬件IP

東芝成功研發(fā)出面向汽車駕駛員輔助系統(tǒng)的圖像識別人工智能處理器ViscontiTM5的DNN硬件IP

2019-07-25 07:45:24

關(guān)于MATLAB建立圖像處理和目標(biāo)識別系統(tǒng)流程的求助

本人新手，之前從未接觸過圖像處理，現(xiàn)在因?yàn)轫?xiàng)目需要搭建一個關(guān)于圖像處理和目標(biāo)識別的MATLAB系統(tǒng)，系統(tǒng)介紹如下：想要從圖片中將目標(biāo)提取出來并與模板庫進(jìn)行匹配對比，以確定是否為我感興趣的目標(biāo)

2016-07-10 15:05:58

基于DSP的毫米波主被動復(fù)合探測器目標(biāo)識別系統(tǒng)設(shè)計(jì)【回映分享】

被動回波的特性，設(shè)計(jì)了毫米波主動測距算法、毫米波輻射計(jì)目標(biāo)識別算法，在DSP芯片上完成了全部系統(tǒng)的軟件開發(fā)，包括主動測距、目標(biāo)識別模塊。給出了程序開發(fā)中的部分代碼，比較細(xì)致的介紹了實(shí)現(xiàn)系統(tǒng)自舉加載的發(fā)

2021-12-30 10:36:54

基于RT-Thread和N32G457的嵌入式目標(biāo)識別系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)

1、基于RT-Thread和N32G457的嵌入式目標(biāo)識別系統(tǒng)設(shè)計(jì)　　本演示示例移植蘇州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院王宜懷教授團(tuán)隊(duì)的金葫蘆嵌入式人工智能：物體認(rèn)知系統(tǒng)中的代碼在N32G457上實(shí)現(xiàn)?？梢?b class="flag-6" style="color: red">識別單獨(dú)的英文字母A B C D原作者：tai-he

2022-11-30 11:36:05

嵌入式系統(tǒng)中的目標(biāo)識別技術(shù)有哪些？

嵌入式系統(tǒng)中的目標(biāo)識別技術(shù)

2021-03-09 08:33:26

嵌入式系統(tǒng)中的目標(biāo)識別技術(shù)，不看肯定后悔

本文將回顧一系列的特征檢測算法，在這個過程中，看看一般目標(biāo)識別和具體特征識別在這些年經(jīng)歷了怎樣的發(fā)展。

2021-06-02 06:24:59

怎么實(shí)現(xiàn)基于Z85C30的動目標(biāo)識別系統(tǒng)的串行通信設(shè)計(jì)？

怎么實(shí)現(xiàn)基于Z85C30的動目標(biāo)識別系統(tǒng)的串行通信設(shè)計(jì)？

2021-05-31 06:32:52

怎樣通過遠(yuǎn)程桌面去查看ROS小車的目標(biāo)識別情況呢

怎樣通過windows自帶的遠(yuǎn)程桌面訪問RK3566呢？怎樣通過遠(yuǎn)程桌面去查看ROS小車的目標(biāo)識別情況呢？

2022-03-02 08:50:23

智能車目標(biāo)識別系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)資料推薦

1、智能車目標(biāo)識別系統(tǒng)的實(shí)現(xiàn)　　首先，簡單介紹一下上面提到的各個話題的范圍（Domain），人工智能（Artifitial Intelligence）是最大的話題，如果用一張圖來說明的話

2022-09-06 14:54:26

求一種可以應(yīng)用于軍事偵察的紅外動目標(biāo)識別跟蹤系統(tǒng)的設(shè)計(jì)

本文介紹的就是一種可以應(yīng)用于軍事偵察的紅外動目標(biāo)識別跟蹤系統(tǒng)的設(shè)計(jì)。

2021-04-29 06:27:10

神經(jīng)網(wǎng)絡(luò)DNN知識點(diǎn)總結(jié)

DNN：關(guān)于神經(jīng)網(wǎng)絡(luò)DNN的知識點(diǎn)總結(jié)(持續(xù)更新)

2018-12-26 10:41:47

改進(jìn)最優(yōu)聚類中心雷達(dá)目標(biāo)識別法

最優(yōu)聚類中心法是一種有效的雷達(dá)目標(biāo)一維距離像識別方法，但當(dāng)訓(xùn)練數(shù)據(jù)較少時(shí)，該方法的識別性能急劇下降。其原因是該算法在利用少量數(shù)據(jù)進(jìn)行訓(xùn)練時(shí)易產(chǎn)生“病態(tài)”矩陣，

2009-05-20 20:06:47

基于多傳感器模糊神經(jīng)網(wǎng)絡(luò)的水下目標(biāo)識別Underwater

首先將模糊神經(jīng)網(wǎng)絡(luò)應(yīng)用于單傳感器潛艇目標(biāo)識別，在此基礎(chǔ)上將多傳感器數(shù)據(jù)融合技術(shù)應(yīng)用于目標(biāo)識別。仿真結(jié)果證明：這種方法是可行的、高效的。關(guān)鍵詞:模糊神經(jīng)網(wǎng)絡(luò),

2009-05-26 10:57:18

基于模糊識別的汽車目標(biāo)識別研究與實(shí)現(xiàn)

本文結(jié)合實(shí)際路面狀況，將模糊模式識別技術(shù)應(yīng)用到汽車識別中，對汽車特征進(jìn)行分析，設(shè)計(jì)了適用于高速公路汽車防撞系統(tǒng)的汽車目標(biāo)模糊識別算法，并完成相關(guān)的系統(tǒng)軟硬件

2009-06-24 09:48:51

D2S證據(jù)理論在多傳感器目標(biāo)識別中的應(yīng)用

針對多傳感器目標(biāo)信號的特點(diǎn),運(yùn)用小波變換和FOBW編碼對信號進(jìn)行特征提取。在此基礎(chǔ)上,運(yùn)用D2S 證據(jù)理論對目標(biāo)進(jìn)行融合識別。與單一傳感器的識別結(jié)果相比較,上述方法能明顯提高

2009-06-27 08:36:53

基于異類傳感器的戰(zhàn)場運(yùn)動目標(biāo)識別算法

利用異類傳感器的互補(bǔ)特性, 提出了一種新的運(yùn)動目標(biāo)識別算法: 選取目標(biāo)速度、第1 主頻、第2 主頻作為識別的有效特征; 運(yùn)用模糊推理得到目標(biāo)分類信息的基本概率分配函數(shù); 把D2S

2009-07-09 13:40:33

基于NMI特征的目標(biāo)識別與跟蹤

本文提出一種全新的圖像分割方法——連通線多級切割方法，并在此基礎(chǔ)上建立圖像NMI特征的目標(biāo)識別與跟蹤算法。文章給出了運(yùn)用連通線多級切割方法實(shí)現(xiàn)閾值求取、圖像分割、

2009-07-15 10:36:04

基于USB和目標(biāo)識別的圖像采集系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)

介紹了一種有目標(biāo)識別功能的圖像采集系統(tǒng)，用USB 接口芯片實(shí)現(xiàn)了數(shù)據(jù)的傳輸。闡述了系統(tǒng)的硬件、固件、設(shè)備驅(qū)動程序和應(yīng)用軟件的設(shè)計(jì)與實(shí)現(xiàn)方法。詳細(xì)介紹了目標(biāo)識別算法

2009-08-13 08:42:45

星空運(yùn)動背景中目標(biāo)識別算法研究

針對微型航天探測器在星空運(yùn)動背景下對目標(biāo)識別的要求，提出一種基于圖像配準(zhǔn)與邊緣提取的差分算法。該算法將采集的連續(xù)兩幀圖像配準(zhǔn)后差分，將差分圖像二值

2009-08-15 15:10:21

基于熵權(quán)優(yōu)屬度的模糊傳感器目標(biāo)識別方法

針對具有多個特征指標(biāo)的模糊多傳感器目標(biāo)識別問題，提出一種新的模糊多傳感器數(shù)據(jù)融合方法。該方法根據(jù)信息熵理論，引入不均衡度定義熵權(quán)矢量，通過求解數(shù)學(xué)規(guī)劃問題，

2009-10-04 14:12:09

基于內(nèi)港區(qū)域的港口目標(biāo)識別

遙感圖像中不同港口的內(nèi)港區(qū)域呈現(xiàn)出不同的形狀，該文提出一種基于內(nèi)港區(qū)域的港口目標(biāo)識別方法。首先利用直方圖和形態(tài)學(xué)算子分割海域；再利用多邊形近似法提取海岸線上的

2009-11-17 15:22:31

基于GSVD的核不相關(guān)辨別子空間與雷達(dá)目標(biāo)識別

該文提出了一種基于廣義奇異值分解的核不相關(guān)辨別子空間算法，并將其用于高分辨距離像雷達(dá)目標(biāo)識別。新算法結(jié)合廣義奇異值分解與核方法的優(yōu)點(diǎn)，有效地解決了傳統(tǒng)方法面臨

2009-11-18 14:54:32

目標(biāo)識別中SVM線性可分性研究

該文主要研究了目標(biāo)識別中SVM 線性可分的充要條件以及線性不可分時(shí)軟間隔分類的內(nèi)涵。首先給出了SVM 特征空間線性可分充要條件的簡潔清晰、物理意義更明確的證明過程，然后證

2009-11-21 11:49:03

基于小波域NMF特征提取的SAR圖像目標(biāo)識別方法

該文提出了一種基于小波域非負(fù)矩陣分解特征提取的合成孔徑雷達(dá)圖像目標(biāo)識別方法。該方法對圖像二維離散小波分解后提取低頻子帶圖像，用非負(fù)矩陣分解對低頻子帶圖像提取特

2009-11-21 11:58:48

光通信目標(biāo)識別系統(tǒng)半物理仿真方案

針對光通信目標(biāo)識別子系統(tǒng)提出了一種半物理仿真方案。該方案使用軟件模擬器模擬數(shù)字照相機(jī)和上位機(jī)的功能，與目標(biāo)識別子系統(tǒng)進(jìn)行命令和數(shù)據(jù)交互。與傳統(tǒng)方案相比，該方

2009-12-22 17:09:30

基于GNN-DS信息融合的目標(biāo)識別方法

針對當(dāng)前目標(biāo)識別系統(tǒng)中常用的信息融合方法識別率較低、運(yùn)行速度慢、抗噪性差等問題，提出一種基于神經(jīng)網(wǎng)絡(luò)組和 DS 證據(jù)理論的信息融合方法。該方法兼顧神經(jīng)網(wǎng)絡(luò)和DS 推理

2010-01-18 12:22:52

基于TDRNN的大氣層外彈道式空間紅外目標(biāo)識別

該文提出一種基于時(shí)延回歸神經(jīng)網(wǎng)絡(luò)(TDRNN)的大氣層外彈道式空間紅外目標(biāo)識別方法。該網(wǎng)絡(luò)采用自適應(yīng)時(shí)間延遲器和輸出層回歸結(jié)構(gòu)，可以針對輸入時(shí)間序列信號的局部時(shí)變信息自

2010-02-09 14:17:31

基于樣本正交子空間的SAR目標(biāo)識別方法

利用合成孔徑雷達(dá)(Synthetic Aperture Radar, SAR)獲取的目標(biāo)像進(jìn)行識別時(shí)，基于子空間的自動目標(biāo)識別(Automatic Target Recognition, ATR)方法通常是對樣本數(shù)據(jù)的值空間進(jìn)行操作。當(dāng)識別相似目

2010-02-10 14:00:47

針對目標(biāo)識別的波形優(yōu)化設(shè)計(jì)方法

針對寬帶雷達(dá)多類目標(biāo)識別波形優(yōu)化中的方位敏感性、距離敏感性和初相不確定性問題，該文在高斯色噪聲背景下提出一種基于遺傳算法和最大滑動相關(guān)分類器的波形優(yōu)化方法，簡

2010-02-10 14:03:32

運(yùn)動目標(biāo)識別與跟蹤系統(tǒng)的研究

提出了一種運(yùn)動目標(biāo)識別與跟蹤系統(tǒng)的方案，給出了系統(tǒng)的原理圖和結(jié)構(gòu)框圖。重點(diǎn)論述了圖像處理的過程和算法，包括顏色模型的選擇，圖像的預(yù)處理，圖像分割，目標(biāo)的識別及

2010-07-20 16:14:33

硬盤標(biāo)識識別方法

硬盤標(biāo)識識別方法 Seagate硬盤的編號比較簡單，其識別方法為："ST+硬盤尺寸+容量+主標(biāo)識+副標(biāo)識+接口類型"。為了另大家容易理解，簡單的

2008-09-04 12:56:41

6181

基于顏色和區(qū)域的運(yùn)動目標(biāo)識別

針對全自主足球機(jī)器人目標(biāo)識別受光強(qiáng)變化的影響, 實(shí)時(shí)性、準(zhǔn)確性和魯棒性存在的不足, 提出了一種基于動態(tài)窗口HSI 色彩空間模型的閾值向量位與及區(qū)域合并算法, 并通過動態(tài)窗口減小

2011-06-28 15:36:06

基于ARM9與移動目標(biāo)識別算法的安防監(jiān)控系統(tǒng)設(shè)計(jì)

介紹了一種基于$3C2440硬件平臺和移動目標(biāo)識別技術(shù)的安防監(jiān)控系統(tǒng)的總體設(shè)計(jì)方案，在嵌入式Linux平臺下實(shí)現(xiàn)視頻數(shù)據(jù)的采集、編碼與傳輸l選擇時(shí)間差分圖像檢測移動目標(biāo)算法，實(shí)現(xiàn)視

2011-08-25 15:35:33

軍事假目標(biāo)識別的新方法

通常的偵察手段對于軍事假目標(biāo)的識別能力有限，文中提出了一種新的軍事假目標(biāo)識別方法。在介紹偏振成像機(jī)理的基礎(chǔ)上，分析了偏振信息檢測和強(qiáng)度信息檢測在物理含義中的區(qū)別。

2011-08-29 15:11:01

紅外目標(biāo)識別跟蹤系統(tǒng)的DSP+FPGA實(shí)現(xiàn)

現(xiàn)場可編程門陣列(FPGA)是在專用ASIC的基礎(chǔ)上發(fā)展出來的，它克服了專用ASIC不夠靈活的缺點(diǎn).本文介紹的就是一種可以應(yīng)用于軍事偵察的紅外動目標(biāo)識別跟蹤系統(tǒng)的設(shè)計(jì)。

2011-09-16 11:00:16

1215

DSP在自動目標(biāo)識別中的應(yīng)用

自動目標(biāo)識別(ATR)算法通常包括自動地對目標(biāo)進(jìn)行檢測、跟蹤、識別和選擇攻擊點(diǎn)等算法。戰(zhàn)場環(huán)境的復(fù)雜性和目標(biāo)類型的不斷增長使ATR算法的運(yùn)算量越來越大，因此ATR算法對微處理器的

2012-01-17 14:53:55

1781

基于相關(guān)分析的飛機(jī)目標(biāo)識別方法

提出了一種基于相關(guān)分析的飛機(jī)目標(biāo)識別方法。該方法利用飛機(jī)圖像低頻和高頻部分合成濾波器模板，能達(dá)到很高識別率與很低的等錯率。該研究旨在提高飛機(jī)識別的準(zhǔn)確率和降低出錯

2013-09-02 14:54:55

基于協(xié)同神經(jīng)網(wǎng)絡(luò)的導(dǎo)彈攻擊目標(biāo)識別方法研究

針對目標(biāo)識別問題，采取了基于協(xié)同學(xué)的模式識別理論，引入了協(xié)同神經(jīng)網(wǎng)絡(luò)并對其穩(wěn)定性進(jìn)行了分析，提出了基于協(xié)同神經(jīng)網(wǎng)絡(luò)對軍事目標(biāo)進(jìn)行識別的方法，并通過仿真驗(yàn)證了該方法

2013-09-18 10:29:59

[14.3.1]--學(xué)習(xí)視頻：輻射源個體目標(biāo)識別_clip001

目標(biāo)檢測

jf_75936199發(fā)布于 2023-03-09 10:57:04

[14.3.1]--學(xué)習(xí)視頻：輻射源個體目標(biāo)識別_clip002

目標(biāo)檢測

jf_75936199發(fā)布于 2023-03-09 10:57:46

全自主移動足球機(jī)器人目標(biāo)識別

電子開發(fā)機(jī)器人相關(guān)教程資料——全自主移動足球機(jī)器人目標(biāo)識別

2016-09-06 16:42:43

基于MVDR參數(shù)譜在艦船目標(biāo)識別中的應(yīng)用

基于MVDR參數(shù)譜在艦船目標(biāo)識別中的應(yīng)用_魏鑫

2017-01-07 21:28:58

融合壓縮感知和SVM的SAR變形目標(biāo)識別算法_谷雨

融合壓縮感知和SVM的SAR變形目標(biāo)識別算法_谷雨

2017-01-08 11:07:01

紅外動目標(biāo)識別跟蹤系統(tǒng)的實(shí)現(xiàn)方案

紅外動目標(biāo)識別跟蹤系統(tǒng)的實(shí)現(xiàn)方案

2017-01-12 22:13:34

多尺度Retinex算法在自動目標(biāo)識別中的應(yīng)用_周澤華

多尺度Retinex算法在自動目標(biāo)識別中的應(yīng)用_周澤華

2017-03-19 11:29:00

基于OpenCv運(yùn)動目標(biāo)識別技術(shù)的研究孟介成

基于OpenCv運(yùn)動目標(biāo)識別技術(shù)的研究_孟介成

2017-03-17 08:00:00

基于RHT的局部有遮擋圓形目標(biāo)識別方法顧肇瑞

基于RHT的局部有遮擋圓形目標(biāo)識別方法_顧肇瑞

2017-03-17 08:00:00

基于大視場星敏感器的目標(biāo)識別技術(shù)_丁國鵬

基于大視場星敏感器的目標(biāo)識別技術(shù)_丁國鵬

2017-03-19 19:19:35

什么是DNN_如何使用硬件加速DNN運(yùn)算

2018-07-08 06:45:00

21270

基于信息熵理論的模糊傳感器目標(biāo)識別研究

針對具有多個特征指標(biāo)的模糊多傳感器目標(biāo)識別問題，提出一種新的模糊多傳感器數(shù)據(jù)融合方法。該方法根據(jù)信息熵理論，引入不均衡度定義熵權(quán)矢量，通過求解數(shù)學(xué)規(guī)劃問題，得到各目標(biāo)類別的優(yōu)屬度，并給出目標(biāo)識別規(guī)則。實(shí)驗(yàn)結(jié)果表明，該方法能提高目標(biāo)識別結(jié)果的客觀性和可信度，具有可操作性。

2017-09-08 15:25:55

電磁場在目標(biāo)識別中的應(yīng)用

電磁場在目標(biāo)識別中的應(yīng)用

2017-09-15 10:01:54

基于證據(jù)相似性度量的目標(biāo)識別融合改進(jìn)算法

的目標(biāo)識別融合改進(jìn)算法，利用證據(jù)相似性度量對證據(jù)源進(jìn)行修正，通過對水下不同背景噪聲數(shù)據(jù)進(jìn)行融合試驗(yàn)表明，經(jīng)數(shù)據(jù)融合后，目標(biāo)識別率可由原來的80%提高到99%，從而證明本文所提出的融合算法可以有效提高目標(biāo)識別準(zhǔn)確率。

2017-11-14 10:36:48

基于SIFT視覺詞匯的目標(biāo)識別算法

算法的目標(biāo)識別算法。結(jié)合在無遮擋與被局部遮擋的交通工具全方位姿態(tài)模型庫上進(jìn)行的目標(biāo)識別試驗(yàn)，得出結(jié)果：算法對無遮擋目標(biāo)的平均識別率能到達(dá)83%以上，具有良好的識別性能：對被局部遮擋目標(biāo)的平均識別率也能保持在80%左右，只有很小的降低。實(shí)驗(yàn)結(jié)果顯示算法具有優(yōu)良的識別被局

2017-11-14 11:04:14

基于改進(jìn)KD樹與RANSC算法的目標(biāo)識別算法

為了能夠更好地滿足日益擴(kuò)大的目標(biāo)識別需求，提出了一種基于改進(jìn)KD樹與RANSC算法的目標(biāo)識別算法。通過對比改進(jìn)前后KD樹匹配算法匹配SIFT特征點(diǎn)的執(zhí)行效果，很明顯的看出改進(jìn)KD樹算法的匹配效果更佳

2017-11-16 17:45:02

結(jié)合顯著性檢測與詞袋模型的目標(biāo)識別方法

針對詞袋模型易受到無關(guān)的背景視覺噪音干擾的問題，提出了一種結(jié)合顯著性檢測與詞袋模型的目標(biāo)識別方法。首先，聯(lián)合基于圖論的視覺顯著性算法與一種全分辨率視覺顯著性算法，自適應(yīng)地從原始圖像中獲取感興趣區(qū)域

2017-11-17 15:24:14

基于擴(kuò)展字典稀疏表示分類的遙感目標(biāo)識別

針對遙感圖像視覺對比度差、分辨率低及目標(biāo)含有不同角度旋轉(zhuǎn)的情況，在稀疏表示分類識別的基礎(chǔ)上，提出一種基于擴(kuò)展字典稀疏表示的遙感目標(biāo)識別方法。首先將訓(xùn)練樣本和待測樣本進(jìn)行二進(jìn)小波變換增強(qiáng)，提取增強(qiáng)圖像

2017-11-17 17:18:38

復(fù)雜電磁環(huán)境中雷達(dá)目標(biāo)識別

綜上所述，復(fù)雜電磁環(huán)境對雷達(dá)目標(biāo)識別影響非常大。在復(fù)雜電磁環(huán)境方面的研究我國與發(fā)達(dá)國家的差距還很大。發(fā)達(dá)國家對復(fù)雜電磁環(huán)境下的作戰(zhàn)、訓(xùn)練、裝備、技術(shù)、人才的研究起步較早，現(xiàn)在已經(jīng)取得了一大批

2017-12-11 11:54:14

1549

基于貝葉斯網(wǎng)絡(luò)的目標(biāo)識別方法

在現(xiàn)代防空作戰(zhàn)中，為獲得最佳作戰(zhàn)效果，必須實(shí)時(shí)獲取戰(zhàn)場態(tài)勢估計(jì)，目標(biāo)識別是戰(zhàn)場態(tài)勢估計(jì)的重要組成部分。目標(biāo)識別技術(shù)利用多傳感器資源，通過對各個傳感器及其觀測信息的合理支配與使用，將各傳感器

2017-12-14 16:34:16

基于卷積神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)識別算法

針對圖像在平移、旋轉(zhuǎn)或局部形變等復(fù)雜情況下的識別問題，提出一種基于非監(jiān)督預(yù)訓(xùn)練和多尺度分塊的卷積神經(jīng)網(wǎng)絡(luò)（CNN）目標(biāo)識別算法。算法首先利用不合標(biāo)簽的圖像訓(xùn)練一個稀疏自動編碼器，得到符合數(shù)據(jù)集特性

2017-12-20 15:37:25

嵌入式系統(tǒng)中的目標(biāo)識別技術(shù)

，也希望有朝一日由機(jī)器人來代替人的雙眼做許多人類做不到的事情。下面就有尚觀教育培訓(xùn)講師給大家講解一下嵌入式系統(tǒng)中的目標(biāo)識別技術(shù)?！　∮?jì)算機(jī)視覺的第一步是特征提取，即檢測圖像中的關(guān)鍵點(diǎn)并獲取有關(guān)這些關(guān)鍵

2018-07-12 14:55:54

426

嵌入式系統(tǒng)中的目標(biāo)識別技術(shù)

有朝一日由機(jī)器人來代替人的雙眼做許多人類做不到的事情。下面就由尚觀教育的嵌入式培訓(xùn)講師給大家講解一下嵌入式系統(tǒng)中的目標(biāo)識別技術(shù)?！　∮?jì)算機(jī)視覺的第一步是特征提取，即檢測圖像中的關(guān)鍵點(diǎn)并獲取有關(guān)這些關(guān)鍵

2018-07-12 16:38:45

153

新的DNN目標(biāo)識別模型: 同時(shí)關(guān)注“像什么”和“是什么”

他們解釋說：“這個模型以及其他類似模型可以非常精確地識別圖像中的對象，但模型中不包含任何關(guān)于對象語義屬性的明確知識。例如，香蕉和獼猴桃的外觀（不同的顏色，形狀，質(zhì)地等）有很大不同，但是，我們能夠

2018-07-31 09:49:01

2085

基于Xilinx開發(fā)平臺和FPGA器件實(shí)現(xiàn)一維成像雷達(dá)目標(biāo)識別

目標(biāo)識別作為現(xiàn)代雷達(dá)的重要發(fā)展方向之一，成為未來武器系統(tǒng)中的一個重要組成部分和當(dāng)前國內(nèi)外關(guān)注的熱點(diǎn)，具有廣泛的民用和軍事應(yīng)用價(jià)值。根據(jù)雷達(dá)的探測手段及應(yīng)用背景的不同，出現(xiàn)了多種識別方法，其中雷達(dá)

2020-07-20 08:18:00

2304

如何使用機(jī)器視覺和機(jī)器學(xué)習(xí)應(yīng)用程序執(zhí)行多目標(biāo)識別

觀看iVeia的首席技術(shù)官M(fèi)ichael Fawcett，演示了采用Zynq Ultrascale + MPSoC的模塊上的Atlas 2Z8系統(tǒng)如何使用機(jī)器視覺和機(jī)器學(xué)習(xí)應(yīng)用程序執(zhí)行多目標(biāo)識別。

2018-11-26 06:22:00

2748

Pembroke公司推出用于目標(biāo)識別的光電短波紅外傳感器

位于美國舊金山市的Pembroke儀器公司推出具有千兆比特以太網(wǎng)成像性能的短波紅外相機(jī)SenS II，用于遙感、監(jiān)視、目標(biāo)識別以及激光跟蹤。

2019-04-19 16:42:01

3059

交通標(biāo)識識別流程解析

交通標(biāo)識識別算法一方面采用了基于卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和識別方法，極大地提高了交通標(biāo)識識別的準(zhǔn)確率；另一方面通過快速的交通標(biāo)識檢測算法定位交通標(biāo)識的候選區(qū)域，極大地減少了識別所需要的時(shí)間。圖4給出了3幅交通標(biāo)識識別的識別結(jié)果圖像。

2019-08-08 10:04:03

6232

基于HOG+SVM的目標(biāo)檢測與識別的方案設(shè)計(jì)和分析

目標(biāo)識別部分是在快速檢測的結(jié)果上進(jìn)行，快速檢測部分提供了目標(biāo)的疑似區(qū)域，在疑似區(qū)域?qū)?yīng)的原始圖像上，形成目標(biāo)切片、提取特征、分類器判定，形成目標(biāo)候選區(qū)域。目標(biāo)識別部分的主要工作體現(xiàn)在分類器的訓(xùn)練，因?yàn)?b class="flag-6" style="color: red">識別部分只是使用與訓(xùn)練部分相同的特征提取方式，以及分類模型的導(dǎo)入等。

2019-08-26 09:48:03

8100

基于聚類分析的復(fù)雜環(huán)境中人臉目標(biāo)識別技術(shù)

在現(xiàn)代社會，人臉目標(biāo)識別技術(shù)在各大領(lǐng)域應(yīng)用得越來越廣泛;同時(shí)，社會治安環(huán)境和國際安全問題也愈發(fā)嚴(yán)峻，人臉目標(biāo)識別面臨著越來越嚴(yán)峻的挑戰(zhàn)。在復(fù)雜環(huán)境下，檢測目標(biāo)和背景場景都是復(fù)雜且動態(tài)變化的，傳統(tǒng)的人

2021-05-18 14:48:46

無人機(jī)在線目標(biāo)識別和定位技術(shù)研究綜述

無人機(jī)在線目標(biāo)識別和定位技術(shù)研究綜述

2021-06-19 14:59:00

《光學(xué)精密工程》—采用優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的紅外目標(biāo)識別系統(tǒng)

采用優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的紅外目標(biāo)識別系統(tǒng) 人工智能技術(shù)與咨詢前天本文來自《光學(xué)精密工程》，作者劉可佳等關(guān)注微信公眾號：人工智能技術(shù)與咨詢。了解更多咨詢！摘要針對視頻數(shù)據(jù)利用低效和光測設(shè)備目標(biāo)識別

2021-11-16 14:33:21

878

《圖學(xué)學(xué)報(bào)》—深度殘差網(wǎng)絡(luò)的無人機(jī)多目標(biāo)識別

深度殘差網(wǎng)絡(luò)的無人機(jī)多目標(biāo)識別 人工智能技術(shù)與咨詢來源：《圖學(xué)學(xué)報(bào)》。作者翟進(jìn)有等摘要：傳統(tǒng)目標(biāo)識別算法中，經(jīng)典的區(qū)域建議網(wǎng)絡(luò)(RPN)在提取目標(biāo)候選區(qū)域時(shí)計(jì)算量大，時(shí)間復(fù)雜度較高，因此提出一種

2021-12-02 17:14:14

936

《圖學(xué)學(xué)報(bào)》—深度殘差網(wǎng)絡(luò)的無人機(jī)多目標(biāo)識別

深度殘差網(wǎng)絡(luò)的無人機(jī)多目標(biāo)識別 人工智能技術(shù)與咨詢? 來源：《圖學(xué)學(xué)報(bào)》。作者翟進(jìn)有等摘要：傳統(tǒng)目標(biāo)識別算法中，經(jīng)典的區(qū)域建議網(wǎng)絡(luò)(RPN)在提取目標(biāo)候選區(qū)域時(shí)計(jì)算量大，時(shí)間復(fù)雜度較高，因此提出

2021-12-06 17:02:02

445

基于三維激光點(diǎn)云的目標(biāo)識別與跟蹤研究

基于三維激光點(diǎn)云的目標(biāo)識別與跟蹤研究來源：《汽車工程》，作者徐國艷等［摘要］針對無人車環(huán)境感知中的障礙物檢測問題，設(shè)計(jì)了一套基于車載激光雷達(dá)的目標(biāo)識別與跟蹤方法。為降低計(jì)算量，提高處理速度

2022-01-17 11:22:44

639

基于三維激光點(diǎn)云的目標(biāo)識別與跟蹤研究

基于三維激光點(diǎn)云的目標(biāo)識別與跟蹤研究來源：《汽車工程》?，作者徐國艷等［摘要］?針對無人車環(huán)境感知中的障礙物檢測問題，設(shè)計(jì)了一套基于車載激光雷達(dá)的目標(biāo)識別與跟蹤方法。為降低計(jì)算量，提高處理速度

2022-02-15 13:36:38

2593

機(jī)器視覺常用的3種目標(biāo)識別方法

隨著機(jī)器視覺技術(shù)的快速發(fā)展，傳統(tǒng)很多需要人工來手動操作的工作，漸漸地被機(jī)器所替代。傳統(tǒng)方法做目標(biāo)識別大多都是靠人工實(shí)現(xiàn)，從形狀、顏色、長度、寬度、長寬比來確定被識別的目標(biāo)是否符合標(biāo)準(zhǔn)，最終

2023-02-07 12:00:07

700

手把手教你使用LabVIEW OpenCV DNN實(shí)現(xiàn)手寫數(shù)字識別（含源碼）

在LabVIEW中如何使用OpenCV DNN模塊實(shí)現(xiàn)手寫數(shù)字識別

2023-03-08 16:10:48

946

XenP影系列毫米波傳感器優(yōu)化人體測距定位和多目標(biāo)識別功能

近日，矽典微發(fā)布了兩款XenP系列毫米波傳感器。該系列命名為“影”旨在幫助客戶優(yōu)化智能設(shè)備對人體測距定位和多目標(biāo)識別的需求。

2023-04-15 09:34:35

1267

超詳細(xì)！一文講透機(jī)器視覺常用的 3 種“目標(biāo)識別”方法

來源：機(jī)器視覺沙龍隨著機(jī)器視覺技術(shù)的快速發(fā)展，傳統(tǒng)很多需要人工來手動操作的工作，漸漸地被機(jī)器所替代。傳統(tǒng)方法做目標(biāo)識別大多都是靠人工實(shí)現(xiàn)，從形狀、顏色、長度、寬度、長寬比來確定被識別的目標(biāo)是否符合

2022-12-15 10:44:10

619

機(jī)器視覺的圖像目標(biāo)識別方法操作要點(diǎn)

通過加強(qiáng)圖像分割，能夠提高機(jī)器視覺的圖像目標(biāo)識別的自動化水平，使得圖像目標(biāo)識別效果更加顯著。圖像分割的方法有很多種，不同方法分別適用于不同領(lǐng)域，這里重點(diǎn)介紹以下3種分割方法。

2024-01-15 12:17:54

122

機(jī)器視覺的圖像目標(biāo)識別方法綜述

文章來源：MEMS引言從20世紀(jì)80年代開始，機(jī)器視覺技術(shù)的發(fā)展速度不斷加快，已經(jīng)走進(jìn)了人們的日常生活與工作之中。機(jī)器視覺的圖像目標(biāo)識別系統(tǒng)的自動化程度較高，應(yīng)用范圍廣，尤其在危險(xiǎn)場所的運(yùn)用，采用

2024-02-23 08:26:49

280

機(jī)器視覺常用的三種目標(biāo)識別方法解析

2024-03-14 08:26:20

223

已全部加載完成

搜索歷史

人類和 DNN 的目標(biāo)識別穩(wěn)健性比較 - 全文

評論