无人区码卡二卡乱码字幕,一本大道久久东京热无码,男人的天堂免费A级毛片无码

什么是數(shù)據(jù)增強(qiáng)

數(shù)據(jù)增強(qiáng)（Data Augmentation）是一種通過讓有限的數(shù)據(jù)產(chǎn)生更多的等價(jià)數(shù)據(jù)來人工擴(kuò)展訓(xùn)練數(shù)據(jù)集的技術(shù)。它是克服訓(xùn)練數(shù)據(jù)不足的有效手段，目前在深度學(xué)習(xí)的各個(gè)領(lǐng)域中應(yīng)用廣泛。但是由于生成的數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的差異，也不可避免地帶來了噪聲問題。

為什么需要數(shù)據(jù)增強(qiáng)

深度神經(jīng)網(wǎng)絡(luò)在許多任務(wù)中表現(xiàn)良好，但這些網(wǎng)絡(luò)通常需要大量數(shù)據(jù)才能避免過度擬合。遺憾的是，許多場景無法獲得大量數(shù)據(jù)，例如醫(yī)學(xué)圖像分析。數(shù)據(jù)增強(qiáng)技術(shù)的存在是為了解決這個(gè)問題，這是針對有限數(shù)據(jù)問題的解決方案。數(shù)據(jù)增強(qiáng)一套技術(shù)，可提高訓(xùn)練數(shù)據(jù)集的大小和質(zhì)量，以便您可以使用它們來構(gòu)建更好的深度學(xué)習(xí)模型。在計(jì)算視覺領(lǐng)域，生成增強(qiáng)圖像相對容易。即使引入噪聲或裁剪圖像的一部分，模型仍可以對圖像進(jìn)行分類，數(shù)據(jù)增強(qiáng)有一系列簡單有效的方法可供選擇，有一些機(jī)器學(xué)習(xí)庫來進(jìn)行計(jì)算視覺領(lǐng)域的數(shù)據(jù)增強(qiáng)，比如：imgaug(https://github.com/aleju/imgaug)它封裝了很多數(shù)據(jù)增強(qiáng)算法，給開發(fā)者提供了方便。但是在自然語言處理領(lǐng)域中，由于自然語言本身是離散的抽象符號，微小的變化就可能會導(dǎo)致含義的巨大偏差，所以數(shù)據(jù)增強(qiáng)算法并不常用。很多自然語言處理任務(wù)在真正落地的時(shí)候，往往會遇到數(shù)據(jù)量不足的問題，自然語言的數(shù)據(jù)增強(qiáng)算法值得我們深入研究。接下來我們先介紹計(jì)算視覺領(lǐng)域的數(shù)據(jù)增強(qiáng)方法，再介紹自然語言處理領(lǐng)域的數(shù)據(jù)增強(qiáng)算法，希望能對大家有所啟發(fā)。

計(jì)算視覺數(shù)據(jù)增強(qiáng)

計(jì)算視覺領(lǐng)域的數(shù)據(jù)增強(qiáng)算法大致可以分為兩類：第一類是基于基本圖像處理技術(shù)的數(shù)據(jù)增強(qiáng)，第二個(gè)類別是基于深度學(xué)習(xí)的數(shù)據(jù)增強(qiáng)算法。

下面先介紹基于基本圖像處理技術(shù)的數(shù)據(jù)增強(qiáng)方法：

幾何變換（Geometric Transformations）：由于訓(xùn)練集與測試集合中可能存在潛在的位置偏差，使得模型在測試集中很難達(dá)到訓(xùn)練集中的效果，幾何變換可以有效地克服訓(xùn)練數(shù)據(jù)中存在的位置偏差，而且易于實(shí)現(xiàn)，許多圖像處理庫都包含這個(gè)功能。

顏色變換（Color Space）：圖片在輸入計(jì)算機(jī)之前，通常會被編碼為張量（高度×寬度×顏色通道），所以可以在色彩通道空間進(jìn)行數(shù)據(jù)增強(qiáng)，比如將某種顏色通道關(guān)閉，或者改變亮度值。

旋轉(zhuǎn) | 反射變換（Rotation/Reflection）：選擇一個(gè)角度，左右旋轉(zhuǎn)圖像，可以改變圖像內(nèi)容朝向。關(guān)于旋轉(zhuǎn)角度需要慎重考慮，角度太大或者太小都不合適，適宜的角度是1度到 20度。

噪聲注入（Noise Injection）：從高斯分布中采樣出的隨機(jī)值矩陣加入到圖像的RGB像素中，通過向圖像添加噪點(diǎn)可以幫助CNN學(xué)習(xí)更強(qiáng)大的功能。

內(nèi)核過濾器（Kernel Filte rs）：內(nèi)核濾鏡是在圖像處理中一種非常流行的技術(shù)，比如銳化和模糊。將特定功能的內(nèi)核濾鏡與圖像進(jìn)行卷積操作，就可以得到增強(qiáng)后的數(shù)據(jù)。直觀上，數(shù)據(jù)增強(qiáng)生成的圖像可能會使得模型面對這種類型的圖像具有更高的魯棒性。

混合圖像（Mix）：通過平均圖像像素值將圖像混合在一起是一種非常違反直覺的數(shù)據(jù)增強(qiáng)方法。對于人來說，混合圖像生成的數(shù)據(jù)似乎沒有意義。雖然這種方法缺乏可解釋性，但是作為一種簡單有效的數(shù)據(jù)增強(qiáng)算法，有一系列的工作進(jìn)行相關(guān)的研究。Inoue在圖像每個(gè)像素點(diǎn)混合像素值來混合圖像，Summers和Dinneen又嘗試以非線性的方法來混合圖像，Takahashi和Matsubara通過隨機(jī)圖像裁剪和拼接來混合圖像，以及后來的mixup方法均取得了不錯(cuò)的成果。

隨機(jī)擦除（Random Erasing）：隨機(jī)擦除是Zhong等人開發(fā)的數(shù)據(jù)增強(qiáng)技術(shù)。他們受到Dropout機(jī)制的啟發(fā)，隨機(jī)選取圖片中的一部分，將這部分圖片刪除，這項(xiàng)技術(shù)可以提高模型在圖片被部分遮擋的情況下性能，除此之外還可以確保網(wǎng)絡(luò)關(guān)注整個(gè)圖像，而不只是其中的一部分。

縮放變換（Zoom）：圖像按照一定的比例進(jìn)行放大和縮小并不改變圖像中的內(nèi)容，可以增加模型的泛化性能。

移動（Translation）：向左，向右，向上或向下移動圖像可以避免數(shù)據(jù)中的位置偏差，比如在人臉識別數(shù)據(jù)集合中，如果所有圖像都居中，使用這種數(shù)據(jù)增強(qiáng)方法可以避免可能出現(xiàn)的位置偏差導(dǎo)致的錯(cuò)誤。

翻轉(zhuǎn)變換（Flipping）：通常是關(guān)于水平或者豎直的軸進(jìn)行圖像翻轉(zhuǎn)操作，這種擴(kuò)充是最容易實(shí)現(xiàn)的擴(kuò)充，并且已經(jīng)證明對ImageNet數(shù)據(jù)集有效。

裁剪（Cropping）：如果輸入數(shù)據(jù)集合的大小是變化的，裁剪可以作為數(shù)據(jù)預(yù)處理的一個(gè)手段，通過裁剪圖像的中央色塊，可以得到新的數(shù)據(jù)。在實(shí)際使用過程之中，這些數(shù)據(jù)增強(qiáng)算法不是只使用一種，而是使用一套數(shù)據(jù)增強(qiáng)策略，在AutoAugment這篇文章中，作者嘗試讓模型自動選擇數(shù)據(jù)增強(qiáng)策略。

第二個(gè)類別是基于深度學(xué)習(xí)的數(shù)據(jù)增強(qiáng)算法：

特征空間增強(qiáng)（Feature Space Augmentation）：神經(jīng)網(wǎng)絡(luò)可以將圖像這種高維向量映射為低維向量，之前討論的所有圖像數(shù)據(jù)增強(qiáng)方法都應(yīng)用于輸入空間中的圖像?，F(xiàn)在可以在特征空間進(jìn)行數(shù)據(jù)增強(qiáng)操作，例如：SMOTE算法，它是一種流行的增強(qiáng)方法，通過將k個(gè)最近的鄰居合并以形成新實(shí)例來緩解類不平衡問題。

對抗生成（Adversarial Training）：對抗攻擊表明，圖像表示的健壯性遠(yuǎn)不及預(yù)期的健壯性，Moosavi-Dezfooli等人充分證明了這一點(diǎn)。對抗生成可以改善學(xué)習(xí)的決策邊界中的薄弱環(huán)節(jié)，提高模型的魯棒性。

基于GAN的數(shù)據(jù)增強(qiáng)（GAN-based Data Augmentation）：使用 GAN 生成模型來生成更多的數(shù)據(jù)，可用作解決類別不平衡問題的過采樣技術(shù)。

神經(jīng)風(fēng)格轉(zhuǎn)換（Neural Style Transfer）：通過神經(jīng)網(wǎng)絡(luò)風(fēng)格遷移來生成不同風(fēng)格的數(shù)據(jù)，防止模型過擬合。

如果想要閱讀更多的細(xì)節(jié)，請參考這篇文章：

https://link.springer.com/article/10.1186/s40537-019-0197-0

自然語言處理數(shù)據(jù)增強(qiáng)

在自然語言處理領(lǐng)域，被驗(yàn)證為有效的數(shù)據(jù)增強(qiáng)算法相對要少很多，下面我們介紹幾種常見方法。

同義詞詞典（Thesaurus）：Zhang Xiang等人提出了Character-level Convolutional Networks for Text Classification，通過實(shí)驗(yàn)，他們發(fā)現(xiàn)可以將單詞替換為它的同義詞進(jìn)行數(shù)據(jù)增強(qiáng)，這種同義詞替換的方法可以在很短的時(shí)間內(nèi)生成大量的數(shù)據(jù)。

隨機(jī)插入（Randomly Insert）：隨機(jī)選擇一個(gè)單詞，選擇它的一個(gè)同義詞，插入原句子中的隨機(jī)位置，舉一個(gè)例子：“我愛中國” —> “喜歡我愛中國”。

隨機(jī)交換（Randomly Swap）：隨機(jī)選擇一對單詞，交換位置。

隨機(jī)刪除（Randomly Delete）：隨機(jī)刪除句子中的單詞。

語法樹結(jié)構(gòu)替換：通過語法樹結(jié)構(gòu)，精準(zhǔn)地替換單詞。

加噪（NoiseMix） (https://github.com/noisemix/noisemix)：類似于圖像領(lǐng)域的加噪，NoiseMix提供9種單詞級別和2種句子級別的擾動來生成更多的句子，例如：這是一本很棒的書，但是他們的運(yùn)送太慢了。->這是本很棒的書，但是運(yùn)送太慢了。

情境增強(qiáng)（Contextual Augmentation）：這種數(shù)據(jù)增強(qiáng)算法是用于文本分類任務(wù)的獨(dú)立領(lǐng)域的數(shù)據(jù)擴(kuò)充。通過用標(biāo)簽條件的雙向語言模型預(yù)測的其他單詞替換單詞，可以增強(qiáng)監(jiān)督數(shù)據(jù)集中的文本。

生成對抗網(wǎng)絡(luò)：利用生成對抗網(wǎng)絡(luò)的方法來生成和原數(shù)據(jù)同分布的數(shù)據(jù)，來制造更多的數(shù)據(jù)。在自然語言處理領(lǐng)域，有很多關(guān)于生成對抗網(wǎng)絡(luò)的工作：

Generating Text via Adversarial Training

GANS for Sequences of Discrete Elements with the Gumbel-softmax Distribution

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

回譯技術(shù)（Back Translation）：回譯技術(shù)是NLP在機(jī)器翻譯中經(jīng)常使用的一個(gè)數(shù)據(jù)增強(qiáng)的方法。其本質(zhì)就是快速產(chǎn)生一些翻譯結(jié)果達(dá)到增加數(shù)據(jù)的目的?；刈g的方法可以增加文本數(shù)據(jù)的多樣性，相比替換詞來說，有時(shí)可以改變句法結(jié)構(gòu)等，并保留語義信息。但是，回譯的方法產(chǎn)生的數(shù)據(jù)嚴(yán)重依賴于翻譯的質(zhì)量。

擴(kuò)句-縮句-句法：先將句子壓縮，得到句子的縮寫，然后再擴(kuò)寫，通過這種方法生成的句子和原句子具有相似的結(jié)構(gòu)，但是可能會帶來語義信息的損失。

無監(jiān)督數(shù)據(jù)擴(kuò)增（Unsupervised Data Augmentation）：通常的數(shù)據(jù)增強(qiáng)算法都是為有監(jiān)督任務(wù)服務(wù)，這個(gè)方法是針對無監(jiān)督學(xué)習(xí)任務(wù)進(jìn)行數(shù)據(jù)增強(qiáng)的算法，UDA方法生成無監(jiān)督數(shù)據(jù)與原始無監(jiān)督數(shù)據(jù)具備分布的一致性，而以前的方法通常只是應(yīng)用高斯噪聲和Dropout噪聲（無法保證一致性）。(https://arxiv.org/abs/1904.12848)

此外，這個(gè)倉庫(https://github.com/quincyliang/nlp-data-augmentation)中介紹了一些自然語言處理中的數(shù)據(jù)增強(qiáng)技術(shù)。

總結(jié)

數(shù)據(jù)增強(qiáng)是增大數(shù)據(jù)規(guī)模，減輕模型過擬合的有效方法，但是，數(shù)據(jù)增強(qiáng)不能保證總是有利的。在數(shù)據(jù)非常有限的域中，這可能導(dǎo)致進(jìn)一步過度擬合。因此，重要的是要考慮搜索算法來推導(dǎo)增強(qiáng)數(shù)據(jù)的最佳子集，以便訓(xùn)練深度學(xué)習(xí)模型。

雖然相比于計(jì)算視覺，自然語言處理領(lǐng)域中的數(shù)據(jù)增強(qiáng)應(yīng)用更少，難度也要更大，但是同時(shí)也意味著更大的機(jī)遇。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4717

瀏覽量
100007
nlp

nlp

+關(guān)注

關(guān)注
1

文章
481

瀏覽量
21932
計(jì)算視覺

計(jì)算視覺

+關(guān)注

關(guān)注
0

文章
5

瀏覽量
1511

原文標(biāo)題：一文了解NLP和CV領(lǐng)域的數(shù)據(jù)增強(qiáng)

文章出處：【微信號：zenRRan，微信公眾號：深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

圖像識別算法的提升有哪些

方法。 數(shù)據(jù)增強(qiáng) 數(shù)據(jù)增強(qiáng)是提高圖像識別算法性能的一種有效方

發(fā)表于 07-16 11:12 ?406次閱讀

圖像識別技術(shù)包括自然語言處理嗎

圖像識別技術(shù)與自然語言處理是人工智能領(lǐng)域的兩個(gè)重要分支，它們在很多方面有著密切的聯(lián)系，但也存在一些區(qū)別。一、圖像識別技術(shù)與自然語言

發(fā)表于 07-16 10:54 ?394次閱讀

機(jī)器人視覺技術(shù)中圖像分割方法有哪些

機(jī)器人視覺技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支，它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個(gè)學(xué)科。圖像分割是機(jī)器人視覺技術(shù)中的一個(gè)重要環(huán)節(jié)，它的目

發(fā)表于 07-04 11:34 ?387次閱讀

FPGA設(shè)計(jì)經(jīng)驗(yàn)之圖像處理

設(shè)計(jì)基本方法： 1.陣列結(jié)構(gòu)結(jié)合流水線處理設(shè)計(jì) 例如RGB圖像，包括三組數(shù)據(jù)，處理時(shí)需要并行三通道后，每個(gè)通道進(jìn)行分別的串行流水

發(fā)表于 06-12 16:26

基于TOF深度相機(jī)的圖像處理專利獲授權(quán)

該專利主要涉及圖像處理技術(shù)領(lǐng)域，特別是針對基于TOF深度相機(jī)的圖像處理方法和存儲媒介進(jìn)行了深入研

發(fā)表于 04-15 10:04 ?297次閱讀

FPGA圖像處理之CLAHE算法

在FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強(qiáng)。

發(fā)表于 01-04 12:23 ?2103次閱讀

如何解決極端環(huán)境視頻圖像處理的畫質(zhì)大幅下降問題？

除了視頻圖像處理技術(shù)外，圖像增強(qiáng)技術(shù)可針對給定圖像的

發(fā)表于 12-11 11:11 ?453次閱讀

FPGA圖像處理方法

圖像細(xì)節(jié)。 FPGA 圖像處理方法 1、圖像增強(qiáng) 兩大方法

發(fā)表于 12-02 13:15 ?911次閱讀

圖像增強(qiáng)三大類別介紹

圖像增強(qiáng)是圖像模式識別中非常重要的圖像預(yù)處理過程。圖像增強(qiáng)

發(fā)表于 11-14 14:34 ?1255次閱讀

醫(yī)療圖像處理的關(guān)鍵領(lǐng)域及技術(shù)挑戰(zhàn)

醫(yī)療圖像處理的最后一部分涉及對所獲取信息的管理，包括用于圖像數(shù)據(jù)存儲、檢索和傳輸?shù)母鞣N技術(shù)。制定了若干標(biāo)準(zhǔn)和

發(fā)表于 10-31 11:43 ?595次閱讀

機(jī)器視覺之圖像增強(qiáng)和圖像處理

一、圖像處理技術(shù)概述1.定義對原始獲取圖像進(jìn)行一系列的運(yùn)算處理，稱為圖像

發(fā)表于 10-26 08:07 ?806次閱讀

機(jī)器視覺之圖像增強(qiáng)和圖像處理

對原始獲取圖像進(jìn)行一系列的運(yùn)算處理，稱為圖像處理。圖像處理是機(jī)器視覺

發(fā)表于 10-23 10:43 ?432次閱讀

機(jī)器視覺：圖像處理技術(shù)、圖像增強(qiáng)技術(shù)

對原始獲取圖像進(jìn)行一系列的運(yùn)算處理，稱為圖像處理。圖像處理是機(jī)器視覺

發(fā)表于 10-20 10:17 ?948次閱讀

機(jī)器視覺（五）：頻域圖像增強(qiáng)處理

頻域法是在圖像的頻率變化域中對圖像的變換值進(jìn)行某種運(yùn)算處理，然后再變回空間域中。

發(fā)表于 10-19 14:24 ?1257次閱讀

機(jī)器視覺技術(shù)之空域圖像增強(qiáng)技術(shù)解析

用這種方式倒轉(zhuǎn)圖像的強(qiáng)度產(chǎn)生圖像反轉(zhuǎn)的對等圖像。該方式適用于增強(qiáng)嵌入于圖像暗色區(qū)域的白色或灰色細(xì)節(jié)，特別是當(dāng)黑色面積占主導(dǎo)地位時(shí)。

發(fā)表于 10-08 11:10 ?795次閱讀