0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么需要分割?U-Net能提供什么?U-Net和自編碼器的區(qū)別

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 2023-11-25 11:38 ? 次閱讀

U-Net是一種卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法,由Olaf Ronneberger、Phillip Fischer和Thomas Brox于2015年首次提出,它可以更好的分割生物醫(yī)學(xué)圖像。

一、為什么需要分割?U-Net 能提供什么?

大體說來,分割就是將一幅圖像分割為若干個(gè)部分的過程,這可以讓我們把圖像中的目標(biāo)或紋理分割出來。因此分割常常被用于遙感影像或者腫瘤檢測等應(yīng)用中。

傳統(tǒng)上有很多方法可以實(shí)現(xiàn)這一過程,例如點(diǎn)、線和邊緣檢測方法,閾值分割法,基于區(qū)域的聚類,基于像素的聚類,形態(tài)學(xué)的方法等等。目前也出現(xiàn)很多利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分割的方法,對(duì)于那些需要進(jìn)行圖像分割處理的更高級(jí)的任務(wù),這種方法是不可或缺的。在本篇文章中,我們將仔細(xì)研究這樣一個(gè)架構(gòu):U-Net。

我們知道,深度學(xué)習(xí)需要大量數(shù)據(jù)集來訓(xùn)練模型。但這有一定的難度,對(duì)于像目標(biāo)分類這樣問題我們常常不能提供足夠的數(shù)據(jù)量。這里的“不能”,往往意味著時(shí)間、金錢以及硬件設(shè)備。

例如,我們不可能去用手機(jī)攝像頭來收集生物醫(yī)學(xué)圖像,而是需要復(fù)雜系統(tǒng)的方法來收集;此外在數(shù)據(jù)標(biāo)記過程中,僅僅依靠開發(fā)人員/工程師是不夠的 , 更需要大量具備專業(yè)知識(shí)和經(jīng)驗(yàn)的人員對(duì)相關(guān)圖像進(jìn)行分類,對(duì)于醫(yī)療診斷等高度專業(yè)化的領(lǐng)域尤其如此。

相比于傳統(tǒng)模型,U-Net在架構(gòu)和基于像素的圖像分割方面更成功;特別地,它在有限數(shù)據(jù)集圖像上更加有效。下面,我們通過對(duì)生物醫(yī)學(xué)圖像分析來實(shí)現(xiàn)該體系結(jié)構(gòu)。

二、U-Net 的獨(dú)特之處

我們知道,在模型中會(huì)使用池化層來對(duì)高和寬進(jìn)行降維處理,簡單來說池化就是用一個(gè)像素來代表一組元素,從而實(shí)現(xiàn)圖像降維。

3c784274-8ace-11ee-939d-92fbcf53809c.jpg

最大和平均池。注意:池化可以有不同的方法,包括Max、Avg Pooling等。

3c8a68e6-8ace-11ee-939d-92fbcf53809c.jpg ?

U-Net模型結(jié)構(gòu) U-Net,如上圖所示,它的命名源自它的結(jié)構(gòu)——網(wǎng)絡(luò)結(jié)構(gòu)可視化的結(jié)果正如一個(gè)字母“U”。U-Net 由收縮路徑(左側(cè))和擴(kuò)展路徑(右側(cè))兩部分組成!它的特殊之處在于結(jié)構(gòu)后半部分的擴(kuò)展路徑。

此外,該網(wǎng)絡(luò)沒有使用全連接層,只采用了卷積層,每個(gè)標(biāo)準(zhǔn)的卷積層后面都緊跟著一個(gè)Relu激活函數(shù)層。

下面是conv 3×3+ReLU的具體過程:

3ca4d00a-8ace-11ee-939d-92fbcf53809c.jpg

下面是up-conv 2×2的具體過程:

3cb94cd8-8ace-11ee-939d-92fbcf53809c.jpg

需要注意,這里要在圖像四周的邊界區(qū)域中對(duì)稱地添加像素,以便可以實(shí)現(xiàn)連續(xù)分割圖像;使用這種策略,可以將圖像完全分割。此外,填充(添加像素)方法對(duì)于將U-Net模型應(yīng)用于大圖像上也具有重要意義;如果不這樣,GPU內(nèi)存容量將限制分辨率。下圖顯示了我提到的鏡像填充和分割的結(jié)果:

3cc9b4ec-8ace-11ee-939d-92fbcf53809c.jpg

三、U-Net 和自編碼器的區(qū)別

為了理解UNet獨(dú)特的結(jié)構(gòu),我們將傳統(tǒng)的分割方法“自編碼器”(autoencoder)架構(gòu)與Unet進(jìn)行簡單地比較。 在傳統(tǒng)的自動(dòng)編碼器結(jié)構(gòu)中,輸入信息的大小逐層遞減。

3cdd5fa6-8ace-11ee-939d-92fbcf53809c.jpg

自編碼器的模型 在這個(gè)結(jié)構(gòu)中,編碼器部分完成之后,解碼器部分開始。線性特征表示也是在解碼器部分學(xué)習(xí)的,特征的大小將逐漸增大,到了解碼器的末尾,輸出圖像大小等于輸入圖像相等。

這種體系結(jié)構(gòu)在保持輸出大小方面是理想的,但有一個(gè)問題是,它對(duì)輸入進(jìn)行線性壓縮,從而導(dǎo)致所有特性都無法傳輸?shù)钠款i。

這就是U-Net的不同之處。U-Net在解碼器部分(網(wǎng)絡(luò)的后半部分)采用反卷積,這種結(jié)構(gòu)可以克服自編碼器在特征傳遞過程中產(chǎn)生的特征丟失問題。

四、繼續(xù)學(xué)習(xí) U-Net

我們回到生物醫(yī)學(xué)圖像分割的案例。 生物醫(yī)學(xué)圖像中組織影像最常見的變化是變形(deformation)。我們可以模擬實(shí)際中的變形,通過彈性變形方法可以幫助我們擴(kuò)充數(shù)據(jù)集,從而提高學(xué)習(xí)效果。

3cee86c8-8ace-11ee-939d-92fbcf53809c.jpg

彈性變形的可視化表示 此外,當(dāng)同一類別的某些部分相互接觸時(shí),往往很難確定邊界。因此,推薦使用 loss 函數(shù)中具有較大權(quán)重的值,同時(shí)也先從背景中分離要分割的信息。 由DIC(Differential Interference Contrast,差分干涉對(duì)比度)顯微鏡記錄的HeLa細(xì)胞。a) 原始圖像;b) 標(biāo)記的分割結(jié)果,用不同的顏色標(biāo)識(shí) HeLa 細(xì)胞的不同個(gè)體;c) 創(chuàng)建的分割蒙版(黑白);d) 以像素為單位的權(quán)重?fù)p失圖,以便于網(wǎng)絡(luò)學(xué)習(xí)邊緣像素。

五、Loss函數(shù)

Loss可以通過標(biāo)準(zhǔn)二值交叉熵(binary cross-entropy)和 Dice 損失計(jì)算,這是評(píng)估生物醫(yī)學(xué)圖像分割成功與否的常用性能標(biāo)準(zhǔn)。

3d0e6e20-8ace-11ee-939d-92fbcf53809c.png

3d2647d4-8ace-11ee-939d-92fbcf53809c.png

二值交叉熵和 Dice 損失 交并比(IoU) 是基于像素的評(píng)價(jià)標(biāo)準(zhǔn),通常用于評(píng)估分割性能。這里考慮了目標(biāo)矩陣與結(jié)果矩陣之間的不同像素比。這個(gè)度量與Dice計(jì)算也有關(guān)。

3d3a59fe-8ace-11ee-939d-92fbcf53809c.png

下面是IOU的可視化:

3d4975c4-8ace-11ee-939d-92fbcf53809c.jpg?

下面是輸入的圖像和標(biāo)簽

3d5cbad0-8ace-11ee-939d-92fbcf53809c.jpg

我們來看看與其他方法相比,U-Net在EM圖像分割方面的表現(xiàn):

3d7da100-8ace-11ee-939d-92fbcf53809c.png

下面這是U-Net在PhC-U373 (a-b)和DIC-HeLa (c-d) 數(shù)據(jù)集上的分割,看起來還是比較成功的:

3d9ceaa6-8ace-11ee-939d-92fbcf53809c.jpg

在這兩個(gè)數(shù)據(jù)集的結(jié)果以及與先前研究的比較如下:

3dc5c570-8ace-11ee-939d-92fbcf53809c.png

當(dāng)然,分割不僅僅用于醫(yī)學(xué)圖像。地球科學(xué)或衛(wèi)星圖像的遙感系統(tǒng)也使用分割,無人駕駛系統(tǒng)也是如此。畢竟,到處都有“模式”。

六、其他應(yīng)用

1、TGS鹽鑒定挑戰(zhàn)

在地球各地區(qū),地表下有大量的油氣和鹽層。不幸的是,很難知道大型鹽礦藏在哪里。

專業(yè)的地震成像圖需要專家來判斷是否有鹽體存在。這往往存在極大的主觀性,不同專家往往會(huì)給出不同的結(jié)果。

TGS(地質(zhì)學(xué)數(shù)據(jù)公司)有精確的地震圖像和三維成像圖,他們希望Kaggle的機(jī)器學(xué)習(xí)社區(qū)能夠創(chuàng)建一種算法來自動(dòng)地、準(zhǔn)確地確定地下目標(biāo)是否是鹽,因此他們舉辦了一個(gè)TGS Salt Identification Challenge。

下面這就是U-Net在這個(gè)挑戰(zhàn)賽中成功應(yīng)用的案例:

3ddc8846-8ace-11ee-939d-92fbcf53809c.jpg

2、地圖挑戰(zhàn)-利用分割構(gòu)建缺失地圖

利用衛(wèi)星影像確定地圖區(qū)域是U-Net另一個(gè)應(yīng)用領(lǐng)域。事實(shí)上,可以說,隨著這一領(lǐng)域的發(fā)展而出現(xiàn)的應(yīng)用將極大地促進(jìn)測繪和環(huán)境工程師的工作。 這種方法不僅適用于國防工業(yè),也適用于城市區(qū)域規(guī)劃。例如,在建筑物檢測競賽中,U-Net取得平均精度0.943,平均靈敏度0.954的結(jié)果。

3df9cb7c-8ace-11ee-939d-92fbcf53809c.jpg3e13d364-8ace-11ee-939d-92fbcf53809c.jpg

地圖挑戰(zhàn)賽中Neptune.ML的結(jié)果

3、U-Net對(duì)其他深度學(xué)習(xí)方法的啟示

U-Net對(duì)不同體系結(jié)構(gòu)以及其他計(jì)算機(jī)視覺深度學(xué)習(xí)模型也具有極大的啟發(fā)意義。 例如,ResNet的ResNet(RoR)概念就是一個(gè)例子。該結(jié)構(gòu)可定義為U-Net體系結(jié)構(gòu)的后半部分,適用于經(jīng)典殘差網(wǎng)絡(luò)中的跳躍連接(skip connections)。

3e34b2b4-8ace-11ee-939d-92fbcf53809c.png

原始ResNet(左)-RoR方法(右) 從經(jīng)典的ResNet模型架構(gòu)可以看出,每個(gè)藍(lán)色塊都有一個(gè)跳過連接。在RoR 方法中,通過前面的連接將新的連接從輸入添加到輸出。在ResNet中有不同版本的RoR。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:圖像分割中的深度學(xué)習(xí):U-Net 體系結(jié)構(gòu)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    van-自然和醫(yī)學(xué)圖像的深度語義分割:網(wǎng)絡(luò)結(jié)構(gòu)

    :醫(yī)學(xué)影像是具有多種模態(tài)的;可解釋性:醫(yī)生需要進(jìn)一步指導(dǎo)病灶在哪一層,哪一層的哪個(gè)位置,分割結(jié)果求體積么?而且U-Net在自然圖像分割也取
    發(fā)表于 12-28 11:03

    van-自然和醫(yī)學(xué)圖像的深度語義分割:網(wǎng)絡(luò)結(jié)構(gòu)

    :醫(yī)學(xué)影像是具有多種模態(tài)的;可解釋性:醫(yī)生需要進(jìn)一步指導(dǎo)病灶在哪一層,哪一層的哪個(gè)位置,分割結(jié)果求體積么?而且U-Net在自然圖像分割也取
    發(fā)表于 12-28 11:06

    一種基于Deep U-Net的多任務(wù)學(xué)習(xí)框架

    提出了一種基于Deep U-Net的多任務(wù)學(xué)習(xí)框架,用于GE-MRI左心房分割,該框架同時(shí)執(zhí)行心房分割和消融前后分類。雖然論文已經(jīng)很老了,但是改論文提出的多任務(wù)和后處理方法到現(xiàn)在還是可以
    發(fā)表于 11-10 15:35

    主要語義分割網(wǎng)絡(luò):FCN,SegNet,U-Net以及一些半監(jiān)督方法

    我們將當(dāng)前分類網(wǎng)絡(luò)(AlexNet, VGG net 和 GoogLeNet)修改為全卷積網(wǎng)絡(luò),通過對(duì)分割任務(wù)進(jìn)行微調(diào),將它們學(xué)習(xí)的表征轉(zhuǎn)移到網(wǎng)絡(luò)中。然后,我們定義了一種新架構(gòu),它將深的、粗糙的網(wǎng)絡(luò)層語義信息和淺的、精細(xì)的網(wǎng)絡(luò)層的表層信息結(jié)合起來,來生成精確的
    的頭像 發(fā)表于 06-03 09:53 ?10.5w次閱讀

    一種基于對(duì)抗訓(xùn)練的圖像翻譯技術(shù),為裸女們自動(dòng)“穿”上比基尼

    。此外,我們還采用了 U-Net 256 結(jié)構(gòu)的生成器。U-Net 由一個(gè)帶殘余連接的自動(dòng)編碼器構(gòu)成,它能夠在相同的空間維度上進(jìn)行殘余操作。同樣地,我們也采用 IN 正則化,并對(duì)編碼器
    的頭像 發(fā)表于 07-23 09:11 ?3561次閱讀

    圖像分割的背景知識(shí)

    U-Net是一種卷積神經(jīng)網(wǎng)絡(luò),最初是為分割生物醫(yī)學(xué)圖像而開發(fā)的。當(dāng)它被可視化的時(shí)候,它的架構(gòu)看起來像字母U,因此被命名為U-Net。其體系結(jié)構(gòu)由兩部分組成,左側(cè)為收縮路徑,右側(cè)為擴(kuò)展路
    的頭像 發(fā)表于 12-28 14:22 ?2401次閱讀

    基于改進(jìn)U-Net網(wǎng)絡(luò)建立HU-ResNet模型

    針對(duì)混凝土結(jié)構(gòu)表觀裂縫檢測準(zhǔn)確率低、細(xì)節(jié)信息丟失及精度不髙等問題,提出一種利用HU-RεsNet卷積神經(jīng)網(wǎng)絡(luò)的混凝土表觀裂縫檢測方法?;诟倪M(jìn)U-Net網(wǎng)絡(luò)建立HU- Resnet模型,采用經(jīng)
    發(fā)表于 03-17 10:12 ?12次下載
    基于改進(jìn)<b class='flag-5'>U-Net</b>網(wǎng)絡(luò)建立HU-ResNet模型

    基于U-Net的多尺度循環(huán)卷積神經(jīng)網(wǎng)絡(luò)

    喉白斑屬于癌前組織病變,準(zhǔn)確檢測該病灶對(duì)癌變預(yù)防和病變治療至關(guān)重要,但喉鏡圖像中病灶邊界模糊且表面反光導(dǎo)致其不易分割。為此,提出一種基于U-Net的多尺度循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(MRU-Net)進(jìn)行喉
    發(fā)表于 03-24 11:14 ?5次下載
    基于<b class='flag-5'>U-Net</b>的多尺度循環(huán)卷積神經(jīng)網(wǎng)絡(luò)

    利用變分推斷進(jìn)行分割置信度的預(yù)測

    在目前的文獻(xiàn)中主要利用兩種技術(shù)成功地解決了醫(yī)學(xué)圖像的分割問題,一種是利用全卷積網(wǎng)絡(luò)(FCN),另一種是基于U-Net的技術(shù)。FCN體系結(jié)構(gòu)的主要特點(diǎn)是在最后沒有使用已成功用于圖像分類問題的全連接層。另一方面,U-Net使用一種
    的頭像 發(fā)表于 03-29 13:46 ?1842次閱讀
    利用變分推斷進(jìn)行<b class='flag-5'>分割</b>置信度的預(yù)測

    利用可分離殘差卷積和語義補(bǔ)償?shù)?b class='flag-5'>U-Net裂縫分割

    壩面缺陷檢測是水利樞紐安全巡檢的關(guān)鍵環(huán)節(jié),但復(fù)雜環(huán)境下壩面圖像存在干擾噪聲大和像素不均衡等冋題造成壩面裂縫難以精細(xì)分割。提出一種利用可分離殘差卷積和語義補(bǔ)償?shù)?b class='flag-5'>U-Net裂縫分割方法。在U-Ne
    發(fā)表于 05-24 16:40 ?8次下載

    基于U-net分割的遙感圖像配準(zhǔn)方法

    在利用航拍遙感圖像進(jìn)行土地測量與變化檢測時(shí),需要對(duì)圖像進(jìn)行配準(zhǔn)處理。為實(shí)現(xiàn)目標(biāo)區(qū)域的高精度匹配,提出一種遙感圖像配準(zhǔn)方法。對(duì)圖像進(jìn)行U-net分割,以適用于小樣本數(shù)據(jù)集的處理,針對(duì)不同區(qū)域特征的誤差
    發(fā)表于 05-28 14:41 ?2次下載

    基于 U-Net 的醫(yī)學(xué)影像分割算法

    分割,可以為疾病的精準(zhǔn)識(shí)別、詳細(xì)分析、合理診斷、預(yù)測與預(yù)防等方面提供非常重要的意義和價(jià)值。 在醫(yī)學(xué)影像分割任務(wù)中,目前主要存在以下幾個(gè)難點(diǎn): 標(biāo)注數(shù)據(jù)少。造成該問題的一個(gè)重要的原因是收集標(biāo)注困難,手工標(biāo)注醫(yī)學(xué)影像是一個(gè)
    的頭像 發(fā)表于 08-25 17:36 ?4563次閱讀

    當(dāng)UNet與HRNet碰撞會(huì)產(chǎn)生怎樣的火花?U-HRNet不做選擇

    U-Net在一定程度上緩解了上述兩個(gè)問題。然而,在U-Net中,每個(gè)階段只保留一個(gè)分辨率,不同尺度之間沒有融合,只有與殘差分支合并。作者認(rèn)為,HRNet的最大優(yōu)勢是能夠并行維護(hù)多尺度并始終執(zhí)行多尺度融合。
    的頭像 發(fā)表于 11-07 14:27 ?1199次閱讀

    UNet++與Ronneberger的U-Net進(jìn)行比較

    ? ? ? 導(dǎo)讀 ? 使用一系列的網(wǎng)格狀的密集跳躍路徑來提升分割的準(zhǔn)確性。 ? 在這篇文章中,我們將探索UNet++: A Nested U-Net Architecture for Medical
    的頭像 發(fā)表于 05-31 11:36 ?1608次閱讀
    UNet++與Ronneberger的<b class='flag-5'>U-Net</b>進(jìn)行比較

    UNet模型屬于哪種神經(jīng)網(wǎng)絡(luò)

    分割任務(wù)而設(shè)計(jì)。U-Net模型以其獨(dú)特的U形網(wǎng)絡(luò)結(jié)構(gòu)而得名,這一結(jié)構(gòu)結(jié)合了編碼器和解碼的對(duì)稱設(shè)計(jì),以實(shí)現(xiàn)對(duì)圖像的高效
    的頭像 發(fā)表于 07-24 10:59 ?939次閱讀