我和闺蜜在公交被高潮在线看,99久女女精品视频在线观看,永久免费不卡一区二区

數(shù)據(jù)對于深度學(xué)習(xí)來說至關(guān)重要，而數(shù)據(jù)增強策略對于提升訓(xùn)練樣本數(shù)據(jù)量、改善模型穩(wěn)定性和魯棒性，提高對于真實世界的適應(yīng)性和泛化性具有重要的作用。

雖然在圖像分類中數(shù)據(jù)增強有著廣泛的使用，但將數(shù)據(jù)增強用于目標(biāo)檢測的系統(tǒng)性研究還較少。此外由于目標(biāo)檢測數(shù)據(jù)的標(biāo)記成本比圖像分類更高，數(shù)據(jù)增強策略在有限數(shù)據(jù)的情況下除了能提高模型表現(xiàn)同時還能節(jié)省數(shù)據(jù)成本。

來自谷歌的研究人員針對目標(biāo)檢測任務(wù)提出了一種基于學(xué)習(xí)的數(shù)據(jù)增強策略，通過在訓(xùn)練數(shù)據(jù)上進行增強策略搜索和驗證集的性能測試來尋找最優(yōu)的數(shù)據(jù)增強方法，有效地提升了模型的表現(xiàn)，同時學(xué)習(xí)到的數(shù)據(jù)增強策略對于不同數(shù)據(jù)、基礎(chǔ)網(wǎng)絡(luò)和模型架構(gòu)都具有效的泛化性和適應(yīng)性。值得一提的是，文章的作者來自提出著名的神經(jīng)架構(gòu)搜索及其相關(guān)方法的研究團隊。

通用高效的目標(biāo)檢測數(shù)據(jù)增強策略

數(shù)據(jù)增強廣泛是機器學(xué)習(xí)中常用的數(shù)據(jù)處理手段，不同的數(shù)據(jù)集通常會利用針對性的數(shù)據(jù)處理手段來處理。例如MNIST大多使用尺度、旋轉(zhuǎn)和平移的操作，也有加入顏色、噪聲等變換，而針對自然圖像，更多采用進行和隨機裁剪的方法來進行。還包括以對象為中心的裁剪、針對圖像片的增減和變換等，但這些方法大都針對特定的數(shù)據(jù)來處理并集中于圖像分類問題。

但由于數(shù)據(jù)標(biāo)記的成本很高，數(shù)據(jù)增強對于目標(biāo)檢測有著更為重要的實際意義。由于目標(biāo)檢測的復(fù)雜性使得有效的數(shù)據(jù)增強策略難以獲取。為了得到有效的數(shù)據(jù)增強策略并應(yīng)用于目標(biāo)檢測任務(wù)中，研究人員希望利用算法搜索到一套新穎的檢測數(shù)據(jù)增強策略，并能夠有效地應(yīng)用于不同的數(shù)據(jù)集、數(shù)據(jù)尺寸、基礎(chǔ)網(wǎng)絡(luò)和檢測架構(gòu)上，有效提升算法的性能。

基于離散優(yōu)化增強策略搜索

對于目標(biāo)檢測來說通常需要考慮目標(biāo)框(bounding box, bbox)與變換后圖像連續(xù)性，研究人員針對bbox內(nèi)部的圖像提出了一系列變換，同時探索了圖像整體變化時如何調(diào)整bbox的策略。通過定義一系列子策略集和多個圖像操作變換，最終將這一問題歸結(jié)為離散空間中的優(yōu)化問題來進行求解。首先研究人員將圖像增強策略定義為K個子策略的無序集合，在訓(xùn)練時從中隨機選取策略對圖像進行數(shù)據(jù)增強。而其中每一個策略則包含了N個圖先變換，這些圖像變換將依次作用于被增強的數(shù)據(jù)，研究的目的在于從中搜索出最有效的策略。這些變量共同定義了一個離散優(yōu)化問題的搜索空間，針對目標(biāo)檢測任務(wù)的數(shù)據(jù)增強，研究人員將設(shè)置K=5，N=2。其中搜索空間總共包含了五個子策略，每個子策略包含了2種圖像操作，而每個操作同時包含了這個操作對應(yīng)的概率p和操作的具體數(shù)值m兩個參數(shù)。這里的概率定義的增強策略在數(shù)據(jù)樣本上進行的隨機性，而m則定義了增強的幅度。

具體來說，研究人員從實驗中總結(jié)了22中有利于檢測的數(shù)據(jù)增強算法，分別是顏色操作、幾何變換和bbox操作。

顏色操作：針對圖像的顏色通道進行操作，包括直方圖均衡、對比圖調(diào)整和亮度調(diào)整等；

幾何操作：對于圖像進行幾何變換，包括位置變換，bbox的大小和位置、旋轉(zhuǎn)、剪切變換等，需要指出的是在進行幾何變換時需要對bbox進行調(diào)整；

bbox操作：僅針對bbox內(nèi)部的內(nèi)容進行操作，而不改變外部的背景，可以綜合使用前面的顏色和幾何變換。

在使用過程中，研究人員將每種操作的幅度都?xì)w一化到[0,10]，對應(yīng)L=6等間距的空間，對應(yīng)概率也是一個M=6的等間距空間，這一取值平衡了強化學(xué)習(xí)算法計算的可追溯性和學(xué)習(xí)能力。

針對這樣的數(shù)值定義可以計算出每個策略需要搜索的空間包含(22LM)^2，而五個策略對應(yīng)的空間為(22*6*6)^10~9.6*10^18如此大的搜索空間一定需要高效的方法才能進行有效的處理。在這篇文章中研究人員采用了基于RNN輸出空間表示離散值，同時利用RL算法來更新模型權(quán)重。其中PPO(proximal policy optimization)被用于搜索策略。RNN每次需要進行30步來預(yù)測輸出，這來自于5個子策略，每個子策略兩個操作，每個操作包含概率、幅度和操作本身三個參數(shù)，其乘積即為30。在訓(xùn)練過程中，研究人員為了減小整體計算量從COCO數(shù)據(jù)集中選取了5K圖像來訓(xùn)練增強算法。算法利用了ResNet-50作為主干網(wǎng)絡(luò)、RetinaNet檢測器來從零開始構(gòu)建目標(biāo)檢測器，并利用在7392張COCO子驗證集上的mAP作為獎勵信號來更新控制器迭代搜索空間參數(shù)。

這一算法需要消耗巨大的算力，在400個TPUs上訓(xùn)練了48個小時完成了20K增強策略的訓(xùn)練，最終得到的數(shù)據(jù)增強策略使得目標(biāo)檢測得到了較大的提升，其中最好的幾個策略能夠廣泛應(yīng)用到不同的數(shù)據(jù)集、大小和架構(gòu)上去。

結(jié)果

訓(xùn)練后的結(jié)果顯示，算法通過驗證集的測試得到最多的圖像增強操作是旋轉(zhuǎn)操作，同時圖像均衡和bbox在Y方向上的平移操作也是排名較為靠前的操作。研究人員首先將學(xué)習(xí)到的策略進行了整體評測，在Res-Net和RetinaNet檢測器上都實現(xiàn)了較大幅度的提升：

為了探索哪些操作對于目標(biāo)檢測算法帶來的優(yōu)勢較大，研究人員將增強操作拆解成了顏色、幾何與bbox相關(guān)操作，并分別測試了對于基準(zhǔn)網(wǎng)絡(luò)的提升，下表顯示了不同操作疊加下對于目標(biāo)檢測性能的影響。

此外研究人員還探索了不同模型下數(shù)據(jù)增強策略的有效性，并通過增加圖像分辨率和錨的數(shù)量實現(xiàn)了50.7mAP！

同時也在不同的數(shù)據(jù)上驗證了這一算法的有效性。研究人員還探索了用于訓(xùn)練數(shù)據(jù)增強策略數(shù)據(jù)集的大小對于目標(biāo)檢測算法提升的效果，雖然隨著訓(xùn)練數(shù)據(jù)的增加，數(shù)據(jù)增強的效果逐漸減弱。

但這種方法針對小數(shù)據(jù)集和小物體的檢測卻具有明顯的效果。同時對于較為困難的AP75任務(wù)也有較好的表現(xiàn)，這意味著數(shù)據(jù)增強策略幫助算法學(xué)習(xí)到了bbox位置出更細(xì)粒度的空間細(xì)節(jié)特征，這也同時改善了小物體的檢測性能。下表中mAPs顯示了小物體檢測提升的情況。

在改進模型正則化方面，研究人員發(fā)現(xiàn)了訓(xùn)練數(shù)據(jù)大的情況下?lián)p失會提升，同時隨著數(shù)據(jù)量的增加L2會變小，數(shù)據(jù)增強策略進一步減少了權(quán)重的衰減。研究人員發(fā)現(xiàn)在使用有效數(shù)據(jù)增強策略的同時，就不需要正則化技術(shù)來幫助網(wǎng)絡(luò)更好的訓(xùn)練了。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4552

瀏覽量
92020
機器學(xué)習(xí)

機器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8306

瀏覽量
131841
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1197

瀏覽量
24537

原文標(biāo)題：目標(biāo)檢測數(shù)據(jù)不夠用？快來試試數(shù)據(jù)增強新方法！

文章出處：【微信號：thejiangmen，微信公眾號：將門創(chuàng)投】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

#硬聲創(chuàng)作季 #深度學(xué)習(xí) 深度學(xué)習(xí)基礎(chǔ)-1.2.1 數(shù)據(jù)集及其拆分

數(shù)據(jù)集深度學(xué)習(xí)

水管工

發(fā)布于 :2022年10月27日 17:48:02

計算機視覺/深度學(xué)習(xí)領(lǐng)域常用數(shù)據(jù)集匯總

經(jīng)歷總結(jié)的目前深度學(xué)習(xí)視覺領(lǐng)域研究人員常用數(shù)據(jù)集。由于個人學(xué)識有限，難免有疏漏和不當(dāng)?shù)牡胤剑x者朋友們不吝賜教。如果以上數(shù)據(jù)集還不能滿足

發(fā)表于 08-29 10:36

深度學(xué)習(xí)中開發(fā)集和測試集的定義

算法性能。換而言之，開發(fā)集和測試集的使命就是引導(dǎo)你的團隊對機器學(xué)習(xí)系統(tǒng)做出最重要的改變?。所以你應(yīng)當(dāng)這樣處理：合理地選擇開發(fā)

發(fā)表于 11-30 16:58

開發(fā)集和測試集應(yīng)該有多大？

的開發(fā)集將無法檢測出這 0.1% 的差異。與我所遇到的機器學(xué)習(xí)問題相比，一個樣本容量僅為 100 的開發(fā)集，規(guī)模太小了。通常來說，開發(fā)集的規(guī)模應(yīng)該在 1,000 到 10,000 個樣

發(fā)表于 12-10 10:23

詳解各種圖像數(shù)據(jù)增強技術(shù)

機器學(xué)習(xí)或深度學(xué)習(xí)模型的訓(xùn)練的目標(biāo)是成為“通用”模型。這就需要模型沒有過度擬合訓(xùn)練數(shù)據(jù)集，或者換句話說，我們的模型對看不見的數(shù)據(jù)有很好的了解

發(fā)表于 10-26 16:29

AI技術(shù)的數(shù)據(jù)科學(xué)將面臨哪些挑戰(zhàn)

“思考特性而不是算法”，這是在機器學(xué)習(xí)背景下評估數(shù)據(jù)的另一個有用方法。友情提示：數(shù)據(jù)擴充可能改善你的現(xiàn)有模型，在某些情況下，甚至有助于緩解冷

發(fā)表于 10-18 13:35 ?1480次閱讀

Python在音頻（Audio）領(lǐng)域中，如何進行數(shù)據(jù)擴充呢？

經(jīng)典的深度學(xué)習(xí)網(wǎng)絡(luò)AlexNet使用數(shù)據(jù)擴充（Data Augmentation）的方式擴大數(shù)據(jù)集，取得較好的分類效果。在深度

發(fā)表于 04-15 10:35 ?1w次閱讀

八大機器學(xué)習(xí)數(shù)據(jù)集

網(wǎng)頁中也有一個搜索框來幫助用戶尋找想要的數(shù)據(jù)集，還有所有數(shù)據(jù)集的描述和使用示例，這些數(shù)據(jù)集信息豐

發(fā)表于 01-18 09:52 ?7894次閱讀

八大機器<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>

機器學(xué)習(xí)應(yīng)用及數(shù)據(jù)集

本文介紹了包括圖像分類、交易預(yù)測、情感分類、推薦系統(tǒng)、股票預(yù)測等在內(nèi)的若干個機器學(xué)習(xí)應(yīng)用及數(shù)據(jù)集。

發(fā)表于 04-21 11:01 ?3961次閱讀

研究人員們提出了PBA的方法來獲取更為有效的數(shù)據(jù)增強策略

數(shù)據(jù)增強策略通常包括剪切、填充、翻轉(zhuǎn)和旋轉(zhuǎn)等，但這些基本策略對于深度網(wǎng)絡(luò)的訓(xùn)練還是太簡單，在對于數(shù)據(jù)增強

發(fā)表于 08-02 15:56 ?5446次閱讀

區(qū)塊鏈數(shù)據(jù)集有怎樣的機器學(xué)習(xí)方法

區(qū)塊鏈數(shù)據(jù)集提供了一個與加密貨幣資產(chǎn)行為相關(guān)的獨特的數(shù)據(jù)宇宙，因此，為機器學(xué)習(xí)方法的應(yīng)用提供了獨特的機會。

發(fā)表于 11-26 09:49 ?854次閱讀

如何使用機器學(xué)習(xí)來分析區(qū)塊鏈數(shù)據(jù)集

區(qū)塊鏈數(shù)據(jù)集提供了一個與加密貨幣資產(chǎn)行為相關(guān)的獨特的數(shù)據(jù)宇宙，因此，為機器學(xué)習(xí)方法的應(yīng)用提供了獨特的機會。然而，區(qū)塊鏈數(shù)據(jù)

發(fā)表于 11-26 11:38 ?1764次閱讀

基于圖像的數(shù)據(jù)增強方法發(fā)展現(xiàn)狀綜述

基于圖像的數(shù)據(jù)增強能夠增加訓(xùn)練樣本的多樣性，如通過翻轉(zhuǎn)、添加噪聲等基礎(chǔ)圖像處理操作或根據(jù)現(xiàn)有數(shù)據(jù)生成新的樣本進行數(shù)據(jù)集

發(fā)表于 03-23 17:17 ?1648次閱讀

NLP數(shù)據(jù)增強的最新綜述

作為一種有效的策略，數(shù)據(jù)增強 (data augmentation, DA) 緩解了深度學(xué)習(xí)技術(shù)可能失敗的數(shù)據(jù)稀缺情況。

發(fā)表于 03-16 09:13 ?678次閱讀

PyTorch如何訓(xùn)練自己的數(shù)據(jù)集

PyTorch是一個廣泛使用的深度學(xué)習(xí)框架，它以其靈活性、易用性和強大的動態(tài)圖特性而聞名。在訓(xùn)練深度學(xué)習(xí)模型時，數(shù)據(jù)集是不可或缺的組成部分。然而，很多時候，我們可能需要使用自己的

發(fā)表于 07-02 14:09 ?527次閱讀

搜索歷史

基于學(xué)習(xí)的數(shù)據(jù)增強策略擴充你的數(shù)據(jù)集！

評論

#硬聲創(chuàng)作季 #深度學(xué)習(xí) 深度學(xué)習(xí)基礎(chǔ)-1.2.1 數(shù)據(jù)集及其拆分

計算機視覺/深度學(xué)習(xí)領(lǐng)域常用數(shù)據(jù)集匯總

深度學(xué)習(xí)中開發(fā)集和測試集的定義

開發(fā)集和測試集應(yīng)該有多大？

詳解各種圖像數(shù)據(jù)增強技術(shù)

AI技術(shù)的數(shù)據(jù)科學(xué)將面臨哪些挑戰(zhàn)

Python在音頻（Audio）領(lǐng)域中，如何進行數(shù)據(jù)擴充呢？

八大機器學(xué)習(xí)數(shù)據(jù)集

機器學(xué)習(xí)應(yīng)用及數(shù)據(jù)集

研究人員們提出了PBA的方法來獲取更為有效的數(shù)據(jù)增強策略

區(qū)塊鏈數(shù)據(jù)集有怎樣的機器學(xué)習(xí)方法

如何使用機器學(xué)習(xí)來分析區(qū)塊鏈數(shù)據(jù)集

基于圖像的數(shù)據(jù)增強方法發(fā)展現(xiàn)狀綜述

NLP數(shù)據(jù)增強的最新綜述

PyTorch如何訓(xùn)練自己的數(shù)據(jù)集

搜索歷史

基于學(xué)習(xí)的數(shù)據(jù)增強策略擴充你的數(shù)據(jù)集！

評論

基于學(xué)習(xí)的數(shù)據(jù)增強策略擴充你的數(shù)據(jù)集！