0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用自適應(yīng)條形采樣和雙分支Transformer的DA-Net

jf_pmFSk4VX ? 來(lái)源:GiantPandaCV ? 作者:GiantPandaCV ? 2022-10-31 14:41 ? 次閱讀

文章目錄

前言

概述

網(wǎng)絡(luò)簡(jiǎn)介

DBTM:Local Patches Meet Global Context

ASUB block

實(shí)驗(yàn)

討論

前言

這是 MICCAI 2022 上的第三篇閱讀筆記了,之前兩篇也都可以在 GiantPandaCV 公眾號(hào)搜索到。如下圖所示,目前的視網(wǎng)膜血管分割方法按照輸入數(shù)據(jù)劃分有兩類(lèi):image-level 和 patches-level,每一種方法都有自己的優(yōu)勢(shì),如何將兩者結(jié)合起來(lái)是一個(gè)需要去解決的問(wèn)題,這也是 DA-Net 這篇文章的貢獻(xiàn)之一。此外,這篇文章還提出了一個(gè)自適應(yīng)的條狀 Upsampling Block,我們會(huì)在后面展開(kāi)介紹。

概述

目前的視網(wǎng)膜血管分割方法根據(jù)輸入類(lèi)型大致分為 image-level 和 patches-level 方法,為了從這兩種輸入形式中受益,這篇文章引入了一個(gè)雙分支 Transformer 模塊,被叫做 DBTM,它可以同時(shí)利用 patches-level 的本地信息和 image-level 的全局上下文信息。視網(wǎng)膜血管跨度長(zhǎng)、細(xì)且呈條狀分布,傳統(tǒng)的方形卷積核表現(xiàn)不佳,也是為了更好地捕獲這部分的上下文信息,進(jìn)一步設(shè)計(jì)了一個(gè)自適應(yīng)條狀 Upsampling Block,被叫做 ASUB,以適應(yīng)視網(wǎng)膜血管的條狀分布。

網(wǎng)絡(luò)簡(jiǎn)介

下圖是 DA-Net 的整體結(jié)構(gòu)。共享 encoder 包含五個(gè)卷積塊,DBTM 在 encoder 之后,最后是帶 ASUB 的 decoder。首先,原眼底圖像很常規(guī)的被分成 N^2 個(gè) patches,N 為 patch 的大小,除此之外,將原眼底圖像也下采樣 N 倍,但是不做裁剪。將它們一起送入共享 encoder,分別得到相應(yīng)的特征圖 F(i) 和 F′,這里的共享指的是兩個(gè) encoder 分支的權(quán)重共享(那么你可以把它簡(jiǎn)單理解為用同一個(gè)卷積核掃描 N^1+1 個(gè) patches,只不過(guò)其中 1 這個(gè) patch 是完整的圖像),兩個(gè)分支可以通過(guò)合并批次并行操作,這意味著輸入圖像的編碼可以在一次推理中完成,無(wú)需增加額外的參數(shù)和時(shí)間消耗。隨后,這兩個(gè)分支的輸出通過(guò) DBTM 進(jìn)行通信,DBTM 可以向每個(gè)補(bǔ)丁廣播長(zhǎng)距離的全局信息。U 型網(wǎng)絡(luò)中間還有普通的跨層連接,最后,再通過(guò) ASUB 的 decoder后,得到預(yù)測(cè)的分割結(jié)果。

5219b27e-58d5-11ed-a3b6-dac502259ad0.png請(qǐng)?zhí)砑訄D片描述

DBTM:Local Patches Meet Global Context

下面兩部分,我們分別對(duì) DBTM 和 AUSB block 展開(kāi)介紹。

首先,將經(jīng)過(guò) flatten 和投影的特征圖 F(i) 和 F′ 作為輸入 tokens ,其中加入訓(xùn)練過(guò)的 position embeddings 以保留位置信息。然后,如下圖所示,輸入 tokens 被送入 Transformer Layer。不同的是,設(shè)計(jì)了一個(gè)特殊的 self-then-cross 的 pipeline,將兩個(gè)分支的輸入混合起來(lái),稱(chēng)為雙分支 Transformer 模塊(看網(wǎng)絡(luò)簡(jiǎn)介中的圖)。第一個(gè) Transformer Layer 作為 Q,第二個(gè) Transformer Layer 作為 K 和 V。具體來(lái)說(shuō),首先,這兩個(gè)分支的輸入標(biāo)記分別用自注意機(jī)制模擬 image-level 和 patches-level 的長(zhǎng)距離依賴(lài)。然后,交叉注意機(jī)制被用于兩個(gè)分支的 tokens 之間的通信。在交叉注意機(jī)制中,將 patches-level 的標(biāo)記表示為查詢 Q, image-level 分支的標(biāo)記表示為下圖中多頭自我注意(MSA)層的鍵 Q 值 V。整體設(shè)計(jì)是很簡(jiǎn)單的,實(shí)現(xiàn)了”Local Patches Meet Global Context“。52423302-58d5-11ed-a3b6-dac502259ad0.png

ASUB block

視網(wǎng)膜血管的一些固有特征導(dǎo)致了其分割困難,比如視網(wǎng)膜血管的分支很細(xì),邊界很難區(qū)分,而且視網(wǎng)膜血管之間的關(guān)系很復(fù)雜。在這些情況下,視網(wǎng)膜血管周?chē)谋尘靶畔?duì)視網(wǎng)膜血管的分割至關(guān)重要。如下圖所示,傳統(tǒng)的方形卷積核在正常的上采樣塊中不能很好地捕捉線性特征,并且不可避免地引入了來(lái)自鄰近的不相關(guān)信息。為了更好地收集視網(wǎng)膜血管周?chē)谋尘靶畔ⅲ岢隽?Adaptive Strip Upsampling Block(ASUB),它適合于長(zhǎng)而細(xì)的視網(wǎng)膜血管分布。

525a3628-58d5-11ed-a3b6-dac502259ad0.png請(qǐng)?zhí)砑訄D片描述

粗略看一下,在 (c) 中,一共有四種類(lèi)型的條狀卷積核,捕捉水平(S1)、垂直(S2)、左對(duì)角線(S3)和右對(duì)角線(S4)方向上的信息。接下來(lái),我們仔細(xì)分析下 ASUB 的思路,首先,使用一個(gè) 1×1 的 Conv 來(lái)將特征圖的維度減半,以減少計(jì)算成本。然后,利用四個(gè)帶狀卷積來(lái)捕捉來(lái)自不同方向的上下文信息。此外,做全局平均池化(GAP)來(lái)獲得通道維度的特征圖。在特征圖的通道維度上獲得特征向量,并使用全連接層來(lái)學(xué)習(xí)每個(gè)帶狀卷積的通道方向的注意立向量。之后,應(yīng)用萬(wàn)能的 softmax 來(lái)產(chǎn)生通道融合權(quán)重Wi , i∈{1, 2, 3, 4}。最后,我們用學(xué)到的自適應(yīng)權(quán)重對(duì)每個(gè)帶狀卷積 Fi 的輸出進(jìn)行加權(quán),得到特征圖,特征圖是 4 個(gè) Fi*Wi 求和。最后用 1×1 的 Conv 恢復(fù)維度,得到最終輸出 Foutput。同時(shí),這部分是會(huì)增加網(wǎng)絡(luò)學(xué)習(xí)負(fù)擔(dān)的。

5324e116-58d5-11ed-a3b6-dac502259ad0.png請(qǐng)?zhí)砑訄D片描述

實(shí)驗(yàn)

首先是和其他 SOTA 方法的比較,包括 image-level 和 patches-level 兩種,如下表。53560160-58d5-11ed-a3b6-dac502259ad0.png

接下來(lái)是消融實(shí)驗(yàn)的部分,其中的 Baseline 指 U-Net。注意到,F(xiàn)LOPs 和 參數(shù)量的增加是可以接受的。5378661a-58d5-11ed-a3b6-dac502259ad0.png

討論

其實(shí) ASUB 設(shè)置的條形采樣方向也不一定與一些小血管的方向完全一致,這是可以進(jìn)一步改進(jìn)的地方。比如說(shuō)嘗試可變形卷積(Deformable ConvNetsV2)的方式。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6715

    瀏覽量

    88311
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    915

    瀏覽量

    54651
  • 卷積
    +關(guān)注

    關(guān)注

    0

    文章

    94

    瀏覽量

    18466
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    135

    瀏覽量

    5944

原文標(biāo)題:MICCAI 2022:使用自適應(yīng)條形采樣和雙分支 Transformer 的 DA-Net

文章出處:【微信號(hào):GiantPandaCV,微信公眾號(hào):GiantPandaCV】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    自適應(yīng)天線原理_石鎮(zhèn)

        自適應(yīng)天線原理_石鎮(zhèn)第一章傳統(tǒng)天線第二章預(yù)備知識(shí)第三章主波束自適應(yīng)控制  &
    發(fā)表于 06-16 17:25

    自適應(yīng)數(shù)字傳感器設(shè)計(jì)

    信號(hào),這樣會(huì)使測(cè)試結(jié)果的分析造成偏差。自適應(yīng)數(shù)字傳感器在選擇高量程加速度傳感器的條件下,能夠根據(jù)加速度信號(hào)的幅值自動(dòng)調(diào)整測(cè)試增益,保持加速度信號(hào)的完整輸出,拓寬了動(dòng)態(tài)測(cè)試范圍,實(shí)現(xiàn)了加速度傳感器測(cè)量
    發(fā)表于 11-08 16:23

    如何實(shí)現(xiàn)自適應(yīng)測(cè)頻?

    如何實(shí)現(xiàn)自適應(yīng)測(cè)頻?
    發(fā)表于 11-29 07:42

    自適應(yīng)濾波器的相關(guān)資料推薦

    本題擬采用實(shí)時(shí)采樣的方式來(lái)進(jìn)行自適應(yīng)濾波。學(xué)過(guò)數(shù)字信號(hào)處理都知道,頻率分辨率是采樣率除以采樣點(diǎn)數(shù),而這道題提高部分要求10Hz的分辨率,經(jīng)過(guò)前期的分析,我們采用
    發(fā)表于 02-09 07:29

    自適應(yīng)控制試題

    自適應(yīng)控制理論試題
    發(fā)表于 08-21 12:41

    自適應(yīng)饋風(fēng)力發(fā)電機(jī)低電壓穿越

    電子資料論文:自適應(yīng)饋風(fēng)力發(fā)電機(jī)低電壓穿越
    發(fā)表于 07-06 15:14 ?15次下載

    寬動(dòng)態(tài)范圍自適應(yīng)采樣率數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)

    寬動(dòng)態(tài)范圍自適應(yīng)采樣率數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)
    發(fā)表于 01-07 21:24 ?30次下載

    基于自適應(yīng)GPC的舵和水艙聯(lián)合減搖系統(tǒng)研究_官英

    基于自適應(yīng)GPC的舵和水艙聯(lián)合減搖系統(tǒng)研究_官英
    發(fā)表于 03-15 17:32 ?0次下載

    自適應(yīng)的弱選擇壓縮采樣匹配追蹤算法

    針對(duì)實(shí)際中未知稀疏度信號(hào)的重建問(wèn)題,提出了一種自適應(yīng)的弱選擇壓縮采樣匹配追蹤算法.該算法將自適應(yīng)思想、弱選擇思想與CoSaMP算法相結(jié)合,在預(yù)選階段后利用限制性弱選擇策略對(duì)候選集進(jìn)行二次篩選,通過(guò)
    發(fā)表于 11-10 09:55 ?3次下載

    基于評(píng)判準(zhǔn)則自適應(yīng)融合的跟蹤算法

    針對(duì)單一評(píng)判準(zhǔn)則較難適應(yīng)復(fù)雜環(huán)境下的目標(biāo)跟蹤問(wèn)題,提出了一種基于評(píng)判準(zhǔn)則自適應(yīng)融合的跟蹤算法。在該算法中,空間直方圖被用作目標(biāo)表示模型,候選目標(biāo)與目標(biāo)模板之間的相似度、以及候選目標(biāo)與其鄰近背景
    發(fā)表于 01-08 10:39 ?0次下載

    視頻壓縮感知自適應(yīng)改進(jìn)

    線性動(dòng)態(tài)系統(tǒng)的視頻壓縮感知( CS-LDS)是指從隨機(jī)采樣數(shù)據(jù)中直接估計(jì)出模型參數(shù),然而對(duì)所有視頻幀采取同樣的采樣方式,使得采樣數(shù)據(jù)存在一定的時(shí)間冗余。針對(duì)這一問(wèn)題,結(jié)合自適應(yīng)壓縮
    發(fā)表于 01-22 15:56 ?1次下載
    視頻壓縮感知<b class='flag-5'>自適應(yīng)</b>改進(jìn)

    什么是自適應(yīng)控制_自適應(yīng)控制基本原理

    自適應(yīng)控制包括模型參考自適應(yīng)控制和自校正控制兩個(gè)分支。前者是20世紀(jì)50年代建立起來(lái)的,它是通過(guò)自適應(yīng)機(jī)構(gòu)來(lái)克服系統(tǒng)模型參數(shù)的不確定性;后者是瑞典學(xué)者Astrom1973年提出的,它是
    發(fā)表于 03-27 09:35 ?5.6w次閱讀

    自適應(yīng)控制的優(yōu)缺點(diǎn)_自適應(yīng)控制存在的問(wèn)題及發(fā)展

    近年來(lái),自校正控制技術(shù)如雨后春筍般地迅速發(fā)展。關(guān)于離散時(shí)間隨機(jī)自適應(yīng)控制的穩(wěn)定性和收斂性,澳大刊亞紐卡斯?fàn)柎髮W(xué)的Goodwin作出了有益的貢獻(xiàn)。自尋優(yōu)自適應(yīng)控制系統(tǒng)、變結(jié)構(gòu)白適應(yīng)控制系統(tǒng)也得到了相應(yīng)
    的頭像 發(fā)表于 03-27 10:26 ?4.9w次閱讀

    AD9557:路輸入多服務(wù)線路卡自適應(yīng)時(shí)鐘轉(zhuǎn)換器

    AD9557:路輸入多服務(wù)線路卡自適應(yīng)時(shí)鐘轉(zhuǎn)換器
    發(fā)表于 03-21 14:48 ?6次下載
    AD9557:<b class='flag-5'>雙</b>路輸入多服務(wù)線路卡<b class='flag-5'>自適應(yīng)</b>時(shí)鐘轉(zhuǎn)換器

    基于孿生網(wǎng)絡(luò)的自適應(yīng)選擇跟蹤系統(tǒng)ASTS

    分支獨(dú)立訓(xùn)練,導(dǎo)致系統(tǒng)速度較低。為此,在孿生網(wǎng)絡(luò)的基礎(chǔ)上提出一種自適應(yīng)選擇跟蹤系統(tǒng)ASTS。在測(cè)試過(guò)程中,簡(jiǎn)單幀時(shí)自動(dòng)停止網(wǎng)絡(luò)向前傳播,快速判斷目標(biāo)所在位置,從而提高系統(tǒng)的跟蹤速度。復(fù)雜幀時(shí)2個(gè)
    發(fā)表于 04-01 15:14 ?14次下載
    基于<b class='flag-5'>雙</b>孿生網(wǎng)絡(luò)的<b class='flag-5'>自適應(yīng)</b>選擇跟蹤系統(tǒng)ASTS