雙向特征融合的數(shù)據(jù)自適應(yīng)SAR圖像艦船目標(biāo)檢測(cè)模型
人工智能技術(shù)與咨詢 昨天
本文來(lái)自《中國(guó)圖象圖形學(xué)報(bào)》,作者張?bào)汴系?/p>
關(guān)注微信公眾號(hào):人工智能技術(shù)與咨詢。了解更多咨詢!
?
摘要:?利用合成孔徑雷達(dá)(synthetic aperture radar,SAR)圖像進(jìn)行艦船目標(biāo)檢測(cè)是實(shí)施海洋監(jiān)視的重要手段?;?a target="_blank">深度學(xué)習(xí)的目標(biāo)檢測(cè)模型在自然圖像目標(biāo)檢測(cè)任務(wù)中取得了巨大成功,但由于自然圖像與SAR圖像的差異,不能將其直接遷移到SAR圖像目標(biāo)檢測(cè)中。針對(duì)SAR圖像目標(biāo)檢測(cè)實(shí)際應(yīng)用中對(duì)速度和精度的需求,借鑒經(jīng)典的單階段目標(biāo)檢測(cè)模型(single shot detector,SSD)框架,提出一種基于特征優(yōu)化的輕量化SAR圖像艦船目標(biāo)檢測(cè)網(wǎng)絡(luò)。方法?改進(jìn)模型并精簡(jiǎn)網(wǎng)絡(luò)結(jié)構(gòu),提出一種數(shù)據(jù)驅(qū)動(dòng)的目標(biāo)分布聚類算法,學(xué)習(xí)SAR數(shù)據(jù)集的目標(biāo)尺度、長(zhǎng)寬比分布特性,用于網(wǎng)絡(luò)參數(shù)設(shè)定;對(duì)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)提取的特征進(jìn)行優(yōu)化,提出一種雙向高低層特征融合機(jī)制,將高層特征的語(yǔ)義信息通過(guò)語(yǔ)義聚合模塊加成到低層特征中,在低層特征中提取特征平均圖,處理后作為高層特征的注意力權(quán)重圖對(duì)高層特征進(jìn)行逐像素加權(quán),將低層特征豐富的空間信息融入到高層特征中。結(jié)果?利用公開(kāi)的SAR艦船目標(biāo)檢測(cè)數(shù)據(jù)集(SAR ship detection dataset,SSDD)進(jìn)行實(shí)驗(yàn),與原始的SSD模型相比,輕量化結(jié)構(gòu)設(shè)計(jì)在不損失檢測(cè)精度的前提下,樣本測(cè)試時(shí)間僅為SSD的65%;雙向特征融合機(jī)制將平均精確度(average precision,AP)值由77.93%提升至80.13%,訓(xùn)練和測(cè)試時(shí)間分別為SSD的64.1%和72.6%;與公開(kāi)的基于深度學(xué)習(xí)的SAR艦船目標(biāo)檢測(cè)方法相比,本文方法在速度和精度上都取得了最佳性能,AP值較精度次優(yōu)模型提升了1.23%,訓(xùn)練和測(cè)試時(shí)間較精度次優(yōu)模型分別提升了559.34 ms和175.35 ms。結(jié)論?實(shí)驗(yàn)充分驗(yàn)證了本文所提模型的有效性,本文模型兼具檢測(cè)速度與精度優(yōu)勢(shì),具有很強(qiáng)的實(shí)用性。
? ? ? 艦船目標(biāo)檢測(cè)是實(shí)施海洋監(jiān)視的重要環(huán)節(jié),在軍事偵察、海洋運(yùn)輸管理、海上犯罪打擊等領(lǐng)域都有著重要應(yīng)用(Allard等,2008)。得益于全天時(shí)、全天候的優(yōu)勢(shì),合成孔徑雷達(dá)(synthetic aperture radar,SAR)圖像成為一種有效的艦船目標(biāo)遙感數(shù)據(jù)源,SAR艦船目標(biāo)檢測(cè)得到了廣泛研究。傳統(tǒng)的基于海雜波建模思想的SAR艦船檢測(cè)方法通常針對(duì)某一場(chǎng)景進(jìn)行建模(Dalal和Triggs,2005;Agrawal等,2015;Pappas等,2018),無(wú)法同時(shí)兼顧多類應(yīng)用場(chǎng)景。而基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)目標(biāo)檢測(cè)方法則不受場(chǎng)景影響,只要提供充足多樣的數(shù)據(jù),即可訓(xùn)練深度網(wǎng)絡(luò)自動(dòng)提取圖像特征,實(shí)現(xiàn)目標(biāo)檢測(cè)。
得益于計(jì)算機(jī)技術(shù)與人工智能技術(shù)的發(fā)展,在計(jì)算機(jī)視覺(jué)領(lǐng)域,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法取得了很多檢測(cè)任務(wù)的最佳性能。經(jīng)典的目標(biāo)檢測(cè)模型,包括以Faster RCNN(region convolutional neural network)(Ren等,2017)為代表的雙階段檢測(cè)模型、以YOLO(you only look once)(Redmon等,2015)和SSD(single shot multi-box detector)(Liu等,2016)為代表的單階段檢測(cè)模型都被引入到SAR艦船檢測(cè)中。與傳統(tǒng)方法相比,這些模型多是端到端的,并且在精度和泛化能力上有了很大提升。但是,將這些模型從自然圖像目標(biāo)檢測(cè)遷移到SAR艦船目標(biāo)檢測(cè)時(shí)仍面臨著一些問(wèn)題:1)這些模型參數(shù),如網(wǎng)絡(luò)層數(shù)和錨框設(shè)置多是針對(duì)Pascal VOC(visual object classes)(Everingham等,2015)和MS COCO(Lin等,2014)等自然圖像數(shù)據(jù)集設(shè)定的,而這些設(shè)置未必適合SAR艦船數(shù)據(jù); 2)數(shù)據(jù)量相對(duì)較小的檢測(cè)數(shù)據(jù)集往往不足以從頭訓(xùn)練規(guī)模較大的檢測(cè)模型,通常做法是在檢測(cè)模型初始化時(shí),將特征提取部分直接載入大型自然圖像分類數(shù)據(jù)集(如ImageNet等)預(yù)訓(xùn)練好的模型參數(shù),然后使用檢測(cè)數(shù)據(jù)集進(jìn)行微調(diào); 3)分類任務(wù)與檢測(cè)任務(wù)、自然分類數(shù)據(jù)集與SAR目標(biāo)檢測(cè)數(shù)據(jù)集存在偏差; 4)SAR圖像自身的一些特點(diǎn)給檢測(cè)增加了難度,如受空間分辨率與成像機(jī)理影響,圖像中艦船目標(biāo)細(xì)節(jié)信息少,各類艦船尺度不一、分布各異等。在設(shè)計(jì)SAR艦船目標(biāo)檢測(cè)模型時(shí), 要考慮這些問(wèn)題。Kang等人(2017)和Yang等人(2018)根據(jù)使用的遙感艦船數(shù)據(jù)重新設(shè)置了檢測(cè)模型參數(shù)。Deng等人(2019)利用密集連接網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),并采用了特征重用等策略,可以從頭訓(xùn)練。為了提升SAR艦船目標(biāo)檢測(cè)的精度,學(xué)者利用多種方式對(duì)網(wǎng)絡(luò)提取的特征進(jìn)行優(yōu)化,其中,特征融合是一項(xiàng)常用策略(Jiao等,2018;Zhang等,2019)。自從Lin等人(2017)提出特征金字塔網(wǎng)絡(luò)(feature pyramid network,F(xiàn)PN),其高低特征層融合的思想大量用于多種模型。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)在提取特征過(guò)程中,隨著網(wǎng)絡(luò)層數(shù)的加深與池化層的應(yīng)用,深特征層有著更大的感受野,能夠提取出更多抽象的全局語(yǔ)義特征,而淺層特征空間信息更加豐富。為彌補(bǔ)淺層特征語(yǔ)義信息的不足,將高層特征處理后加入到淺層特征。Wang等人(2018)將FPN中的語(yǔ)義聚合策略應(yīng)用在SAR艦船檢測(cè)中,與原始的SSD模型相比,顯著提升了艦船檢測(cè)精度。Kang等人(2017)將淺層特征、中層特征與高層特征都融合起來(lái),輸入到Faster RCNN模型。特征融合的策略能夠提升模型性能,但也增加了運(yùn)算量,此外,大部分融合模型的融合通道是由上至下的,沒(méi)有考慮高層信息中空間信息的不足。
針對(duì)上述問(wèn)題,本文對(duì)SAR圖像艦船目標(biāo)檢測(cè)進(jìn)行研究,針對(duì)SAR圖像的特點(diǎn)改進(jìn)了經(jīng)典檢測(cè)模型SSD,同時(shí)提升了目標(biāo)檢測(cè)的速度和精度。本文工作包括兩部分:1)根據(jù)SAR數(shù)據(jù)的特點(diǎn),精簡(jiǎn)了SSD模型結(jié)構(gòu),提出了一種數(shù)據(jù)集目標(biāo)特性聚類算法,用于指導(dǎo)網(wǎng)絡(luò)參數(shù)的設(shè)置;2)借鑒特征融合思想,提出一種雙向特征融合機(jī)制,除了利用語(yǔ)義聚合增強(qiáng)淺層特征的語(yǔ)義信息,同時(shí)設(shè)計(jì)了一種新的基于注意力機(jī)制的融合方法,將淺層特征豐富的空間信息加成到高層特征。前者主要改進(jìn)模型適應(yīng)SAR艦船檢測(cè)任務(wù),后者進(jìn)一步優(yōu)化模型,提升檢測(cè)精度。在公開(kāi)SAR艦船目標(biāo)檢測(cè)數(shù)據(jù)集SSDD(SAR ship detection dataset)(Li等,2017)上的實(shí)驗(yàn)充分驗(yàn)證了本文方法的有效性。
1 LSSD檢測(cè)模型
1.1 模型結(jié)構(gòu)
本文模型是在經(jīng)典的SSD模型基礎(chǔ)上改進(jìn)的,并以VGG-16(visual geometry group 16)作為特征提取網(wǎng)絡(luò)。標(biāo)準(zhǔn)的SSD-300模型(輸入圖像大小為300 × 300 × 3)保留了VGG-16的前5個(gè)卷積單元,去掉全連接層,并繼續(xù)在后面連接了6個(gè)卷積單元,最終卷積單元輸出的特征圖空間維變成1×1。但是,對(duì)SAR圖像來(lái)說(shuō),某種極化模式下獲取的圖像是單通道的。在使用通用檢測(cè)模型時(shí),通常做法是將單通道SAR圖像擴(kuò)展為3通道作為輸入,這種做法增加了網(wǎng)絡(luò)的冗余信息。此外,SAR遙感圖像中的艦船目標(biāo)尺度變化很大,所占像素從幾個(gè)到幾百不等,但受空間分辨率影響,單個(gè)艦船目標(biāo)通常不會(huì)占滿圖像(300 × 300像素標(biāo)準(zhǔn)輸入大小)。因此,對(duì)模型進(jìn)行更改,直接以單通道圖像作為輸入,去掉SSD模型的后3個(gè)卷積模塊,并將全部卷積層的通道維減半。這樣,與SSD相比,網(wǎng)絡(luò)需要訓(xùn)練的參數(shù)量少于原來(lái)的1/4,模型顯著變輕量化,將其命名為L(zhǎng)SSD(lightweight SSD)。經(jīng)驗(yàn)證,即使是較小的檢測(cè)數(shù)據(jù)集如SSDD也可以從頭訓(xùn)練LSSD,使其不必依賴于分類任務(wù)預(yù)訓(xùn)練模型。借鑒SSD模型的設(shè)置,同時(shí)考慮SAR圖像中的小艦船目標(biāo),選取conv3_3、conv4_3、conv7、conv8輸出的特征圖輸入到檢測(cè)器中進(jìn)行后續(xù)檢測(cè)。
本文模型整體框架如圖 1所示,圖中右側(cè)為L(zhǎng)SSD網(wǎng)絡(luò)的具體設(shè)置,圖中S代表語(yǔ)義聚合,A代表注意力引導(dǎo)的融合。
圖 1?本文模型框架圖
Fig. 1?Framework of proposed model
1.2 基于聚類算法的數(shù)據(jù)集目標(biāo)特性統(tǒng)計(jì)
與Faster RCNN和SSD模型相同,LSSD也是基于錨框(anchor)實(shí)施檢測(cè)。錨框的設(shè)置包括尺度和比例,能夠反映數(shù)據(jù)集中目標(biāo)的尺度和比例分布特性,對(duì)網(wǎng)絡(luò)檢測(cè)性能具有重要影響。受YOLOv2(Redmon和Farhadi,2017)中的維度聚類算法啟發(fā),本文設(shè)計(jì)了一種基于聚類的目標(biāo)特性分布自動(dòng)學(xué)習(xí)算法,具體內(nèi)容以SSDD數(shù)據(jù)集為例進(jìn)行說(shuō)明。
假設(shè)圖像大小為M×NM×N,艦船目標(biāo)檢測(cè)框大小為w×hw×h。目標(biāo)尺度ss和長(zhǎng)寬比rr的定義為
?
s=w×hM×Ns=w×hM×N |
(1) |
?
?
r=whr=wh |
(2) |
?
1) 學(xué)習(xí)數(shù)據(jù)集中艦船目標(biāo)的尺度分布。假設(shè)數(shù)據(jù)集中所有艦船目標(biāo)的尺度集合為S:{s1,s2,…,sk}S:{s1,s2,…,sk},設(shè)定kk個(gè)尺度聚類中心U:{μ1,μ2,???,μk}U:{μ1,μ2,···,μk},其中μiμi初值為[0,1][0,1]區(qū)間的隨機(jī)值,μ1μ1到μkμk從小到大排列。通過(guò)最小化目標(biāo)各尺度與聚類中心歐氏距離之和dsds,以更新UU的參數(shù),即
?
minds=∑i=1n∥si?μj∥2minds=∑i=1n‖si?μj‖2 |
(3) |
?
式中,j∈{1,2,???,k}j∈{1,2,···,k},μjμj為最接近sisi的聚類中心。每次迭代中,μjμj更新為以其為聚類中心的所有目標(biāo)尺度的均值,不斷迭代直到dsds小于設(shè)定閾值。迭代完成后,將學(xué)習(xí)到的尺度聚類中心UU分配到合適的特征層中,較小的尺度分配給低的特征層,大的錨框尺度則分配給高特征層。
2) 學(xué)習(xí)數(shù)據(jù)集中艦船目標(biāo)的長(zhǎng)寬比分布特性。設(shè)定特征層lxlx的長(zhǎng)寬比聚類中心個(gè)數(shù)為gg,尺度接近該層各尺度聚類中心的艦船目標(biāo)長(zhǎng)寬比構(gòu)成集合Rx:{rx1,rx2,…}Rx:{rx1,rx2,…},gg個(gè)長(zhǎng)寬比聚類中心構(gòu)成集合Vx:{τ1,τ2,…,τg}Vx:{τ1,τ2,…,τg},τiτi初值設(shè)為隨機(jī)正數(shù),通過(guò)最小化目標(biāo)長(zhǎng)寬比到各自聚類中心歐氏距離之和drsdrs進(jìn)行優(yōu)化,即
?
mindrs=∑xi=1nx∥rxi?τj∥2mindrs=∑xi=1nx‖rxi?τj‖2 |
(4) |
?
式中,j∈{1,2,…,g}j∈{1,2,…,g},τjτj為最接近rxirxi的長(zhǎng)寬比聚類中心。每次迭代中,τjτj更新為聚類中心目標(biāo)長(zhǎng)寬比的均值。不斷進(jìn)行迭代,直到drsdrs小于設(shè)定閾值。最后根據(jù)長(zhǎng)寬比聚類中心的值設(shè)置該層錨框的長(zhǎng)寬比參數(shù)。
2 基于雙向融合的特征優(yōu)化
2.1 原理分析
卷積神經(jīng)網(wǎng)絡(luò)提取的分層特征有著不同的特點(diǎn)。與SSD一樣,為檢測(cè)多尺度目標(biāo),LSSD也使用了多層特征。其中淺層特征通常包含更多目標(biāo)細(xì)節(jié)信息,缺乏高級(jí)語(yǔ)義信息; 深層特征信息更加抽象,但缺乏空間位置信息。以FPN網(wǎng)絡(luò)為代表的從上到下的語(yǔ)義聚合的特征融合方式已經(jīng)得到了廣泛應(yīng)用,針對(duì)如何將淺層豐富的空間信息傳遞到深特征層,本文提出了基于注意力機(jī)制的融合方式。
為直觀理解CNN提取的特征,本文將訓(xùn)練好的LSSD模型中不同層的特征進(jìn)行可視化。圖 2是訓(xùn)練好的LSSD模型提取的兩幅SAR圖像conv3_3、conv4_3、conv7、conv8的第1通道和第64通道的特征圖及各通道平均熱力圖。可以看出,針對(duì)輸入的特定圖像,不同卷積層在不同通道提取了不同特征,但很難解釋特定通道特征的含義。為展示每個(gè)卷積層提取的整體特征,在特征層通道維進(jìn)行全局平均池化,得到特征的空間維平均圖,并以熱圖的形式展示。從平均圖可以看出,隨著特征層的增深,平均特征中關(guān)于目標(biāo)的表征越來(lái)越抽象。其中,在conv4_3的特征平均圖中,無(wú)論背景是較為簡(jiǎn)單的水面,還是更復(fù)雜的陸地,艦船目標(biāo)與背景分離最明顯。受計(jì)算機(jī)視覺(jué)中注意力機(jī)制(Woo等,2018)啟發(fā),將conv4_3特征平均圖視為空間注意力顯著圖,指導(dǎo)網(wǎng)絡(luò)更關(guān)注的位置??梢灾苯永胏onv4_3特征平均圖作為權(quán)重圖,去對(duì)其余更深的特征層進(jìn)行加權(quán),以這種方式將低特征層的目標(biāo)位置信息傳遞到更深的特征層中,實(shí)現(xiàn)特征自下而上的融合。
圖 2?訓(xùn)練好的LSSD模型從SAR圖像提取的特征圖
Fig. 2?Feature maps extracted by our trained model from SAR image
((a) original images; (b) conv3_3; (c) conv4_3; (d) conv7; (e) conv8)
2.2 特征雙向融合實(shí)施流程
采用的雙向特征融合操作流程如圖 3所示。首先進(jìn)行自上而下的語(yǔ)義聚合,然后實(shí)施注意力機(jī)制引導(dǎo)下的自下而上的特征融合。語(yǔ)義聚合模型(圖 3(a))主要包括深層特征上采樣、特征圖通道維串聯(lián)以及1×1卷積修正通道數(shù)等過(guò)程,最終融合特征與淺層特征在空間維和通道維的尺寸相同?;谧⒁饬σ龑?dǎo)的特征融合模塊如圖 3(b)所示,來(lái)自conv4_3的特征圖在通道維進(jìn)行平均池化,得到大小為pp的平均特征圖FF,作為融合中的注意力圖。FF通過(guò)sigmoid函數(shù)進(jìn)行歸一化,得到注意力權(quán)重圖,具體計(jì)算為
?
F(x)=11+e?xF(x)=11+e?x |
(5) |
?
圖 3?特征融合算法流程圖
Fig. 3?Framework of our feature fusion module
((a) semantic aggregation block; (b) attention guided fusion block)
式中,xx代表FF中各像素值,F(xiàn)(x)∈(0,1)F(x)∈(0,1)。該權(quán)重圖被用來(lái)對(duì)其余特征層進(jìn)行加權(quán)。融合前,需要通過(guò)下采樣等方式將權(quán)重圖的大小改為高層特征圖的空間大小,然后對(duì)高層特征的每個(gè)通道的特征圖進(jìn)行逐元素相乘的操作,得到融合特征圖。注意該操作只自下而上進(jìn)行,conv4_3特征圖得到的注意力權(quán)重圖不再影響conv3_3。
3 實(shí)驗(yàn)與結(jié)果分析
對(duì)本文方法利用公開(kāi)的SSDD數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),首先利用基于聚類的數(shù)據(jù)集目標(biāo)特性統(tǒng)計(jì)方法指導(dǎo)的網(wǎng)絡(luò)參數(shù)設(shè)置與原SSD網(wǎng)絡(luò)參數(shù)設(shè)置進(jìn)行對(duì)比,然后逐步對(duì)比本文方法每一模塊的效果,最后將本文方法與其他SAR艦船目標(biāo)檢測(cè)的方法進(jìn)行對(duì)比。
3.1 數(shù)據(jù)集說(shuō)明與實(shí)驗(yàn)設(shè)置
SSDD數(shù)據(jù)集是國(guó)內(nèi)第1個(gè)公開(kāi)的SAR艦船目標(biāo)檢測(cè)數(shù)據(jù)集,包含1 160幅圖像與2 456個(gè)艦船實(shí)例。實(shí)驗(yàn)平臺(tái)操作系統(tǒng)為64位單GTX 1080Ti GPU計(jì)算機(jī),操作系統(tǒng)為Ubuntu 16.06,編程語(yǔ)言為Python,使用的深度學(xué)習(xí)框架為TensorFlow,并使用CUDA9.0與cuDNN7.0加速。訓(xùn)練次數(shù)設(shè)為12萬(wàn)次,前2萬(wàn)次初始學(xué)習(xí)率為0.000 1,接下來(lái)6萬(wàn)次學(xué)習(xí)率設(shè)為0.000 01,最后4萬(wàn)次學(xué)習(xí)率設(shè)為0.000 001。訓(xùn)練中,批次容量設(shè)為24,使用momentum訓(xùn)練優(yōu)化器。
為評(píng)價(jià)測(cè)試結(jié)果,采用精確率(precision)、召回率(recall)以及平均精確率(average precision,AP)作為客觀評(píng)價(jià)指標(biāo),指標(biāo)的具體定義與Kang等人(2017)采用的定義相同。精確率和召回率是在交并比(intersection-over-union,IoU)閾值設(shè)為0.5、分類得分閾值設(shè)為0.2的情況下計(jì)算的。這些指標(biāo)值越高,說(shuō)明算法檢測(cè)性能越好。此外,利用單幅圖像的平均訓(xùn)練與測(cè)試時(shí)間衡量算法的運(yùn)行速度。
3.2 實(shí)驗(yàn)結(jié)果
3.2.1 網(wǎng)絡(luò)參數(shù)設(shè)置對(duì)檢測(cè)結(jié)果的影響
實(shí)驗(yàn)采用兩組參數(shù)設(shè)置在SSD模型上進(jìn)行。一組為SSD原始參數(shù),錨框采用SSD模型中的6層特征,如表 1所示;另一組為使用本文提出的基于聚類的數(shù)據(jù)集目標(biāo)特性學(xué)習(xí)方法為指導(dǎo)的網(wǎng)絡(luò)參數(shù),錨框采用LSSD模型中的4層特征,如表 2所示。
表 1?采用SSD模型中6層特征的錨框參數(shù)
Table 1?Anchor settings of SSD in the 6 feature layers
卷積層 | 尺度 | 長(zhǎng)寬比 | 額外尺度 |
---|---|---|---|
conv4_3 | 0.1 | 1 :1, 1 :2, 2 :1 | 0.141 4 |
conv7 | 0.2 | 1 :1, 1 :2, 2 :1, 1 :3, 3 :1 | 0.273 9 |
conv8_2 | 0.375 | 1 :1, 1 :2, 2 :1, 1 :3, 3 :1 | 0.454 1 |
conv9 | 0.55 | 1 :1, 1 :2, 2 :1, 1 :3, 3 :1 | 0.631 5 |
conv10 | 0.725 | 1 :1, 1 :2, 2 :1 | 0.807 8 |
conv11 | 0.9 | 1 :1, 1 :2, 2 :1 | 0.983 6 |
表 2?采用LSSD模型中4層特征的錨框參數(shù)
Table 2?Anchor settings of LSSD in the 4 feature layers
卷積層 | 尺度 | 長(zhǎng)寬比 | 額外尺度 |
---|---|---|---|
conv3_3 | 0.005 | 1 :1, 1 :2, 2 :1 | 0.01 |
conv4_3 | 0.020 | 1 :1, 4 :7, 20 :11 | 0.04 |
conv7 | 0.060 | 1 :1, 4 :7, 3 :1, 1 :4, 20 :11 | 0.12 |
conv8_2 | 0.250 | 1 :1, 4 :7, 3 :1, 1 :4, 20 :11 | 0.40 |
兩組實(shí)驗(yàn)除錨框設(shè)置不同外,其余實(shí)驗(yàn)條件均相同,實(shí)驗(yàn)結(jié)果如表 3所示??梢钥闯?,錨框的參數(shù)設(shè)置對(duì)檢測(cè)結(jié)果有很大影響。在其他條件不變的前提下,適合檢測(cè)數(shù)據(jù)集的網(wǎng)絡(luò)參數(shù)設(shè)置對(duì)挖掘模型的性能潛力非常重要。本文方法不受人為經(jīng)驗(yàn)影響,完全基于數(shù)據(jù)集特性優(yōu)化網(wǎng)絡(luò)參數(shù)設(shè)置。
表 3?SSD模型采用不同錨框參數(shù)的檢測(cè)結(jié)果
Table 3?Detection results of SSD with different anchors parameters?
/% | |||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
參數(shù) | 平均精確率 | 精確率 | 召回率 | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? |
SSD中6層特征的錨框參數(shù) | 76.95 | 86.35 | 87.00 | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? |
LSSD中4層特征的錨框參數(shù) |
78.03 |
89.15 |
88.80 |
? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? |
注:加粗字體為每列最優(yōu)結(jié)果。 | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? |
3.2.2 模型簡(jiǎn)化實(shí)驗(yàn)
通過(guò)模型簡(jiǎn)化實(shí)驗(yàn)的方法驗(yàn)證所提輕量化設(shè)置、雙向特征融合模塊對(duì)檢測(cè)結(jié)果的影響。將采用LSSD模型中4層特征的錨框參數(shù)設(shè)置的SSD模型作為比較的基準(zhǔn)模型,與LSSD模型、結(jié)合了語(yǔ)義聚合的LSSD模型、結(jié)合了注意力引導(dǎo)融合的LSSD模型以及結(jié)合了雙向特征融合方法的LSSD模型分別進(jìn)行性能指標(biāo)與速度指標(biāo)的對(duì)比,結(jié)果如表 4所示。可以看出,與SSD模型相比,本文提出的LSSD模型在速度方面具有顯著優(yōu)勢(shì),測(cè)試時(shí)間僅為SSD模型的65%,而檢測(cè)精度與SSD模型基本一致。語(yǔ)義聚合和注意力引導(dǎo)特征融合都可以提高檢測(cè)的精度,而在訓(xùn)練和測(cè)試中,只增加了很少的時(shí)間。兩個(gè)模塊的組合在精度方面實(shí)現(xiàn)了最佳性能,平均精確率與SSD相比提高了2.1%。
表 4?模型簡(jiǎn)化實(shí)驗(yàn)結(jié)果
Table 4?The testing results in ablation study
模型 | 語(yǔ)義聚合 | 注意力引導(dǎo)融合 | 平均精確率/% | 精確率/% | 召回率/% | 訓(xùn)練時(shí)間/ms | 測(cè)試時(shí)間/ms |
---|---|---|---|---|---|---|---|
SSD | - | - | 78.03 | 89.15 | 88.80 | 20.79 | 14.02 |
LSSD | - | - | 77.93 | 89.54 | 88.60 |
12.74 |
9.17 |
LSSD +語(yǔ)義聚合 | √ | - | 78.68 | 94.55 | 88.00 | 13.01 | 9.72 |
LSSD +注意力引導(dǎo)融合 | - | √ | 72.20 | 95.26 | 89.20 | 12.97 | 9.57 |
LSSD +雙向特征融合 | √ | √ |
80.13 |
96.68 |
89.60 |
13.33 | 10.18 |
注:加粗字體為每列最優(yōu)結(jié)果。“-”表示沒(méi)有采用對(duì)應(yīng)方法,“√”表示采用了該方法。 |
為進(jìn)一步展示這些模型的檢測(cè)結(jié)果,圖 4給出了部分典型檢測(cè)結(jié)果樣例。可以看出,結(jié)合了雙向特征融合模塊的模型在提升召回率、減少虛警率等方面表現(xiàn)最佳,說(shuō)明本文的融合方法是一種有效的特征優(yōu)化方法。
圖 4?不同方法部分檢測(cè)結(jié)果樣例圖
Fig. 4?Some samples of detecting results using different methods((a) ground truths; (b) SSD; (c) LSSD; (d) LSSD with semantic aggregation module; (e) LSSD with attention fusion module; (f) LSSD with bi-directional fusion module)
3.2.3 與其他方法對(duì)比
為進(jìn)一步驗(yàn)證本文方法的有效性與實(shí)用性,與Faster RCNN(Ren等,2017)、基于卷積神經(jīng)網(wǎng)絡(luò)的檢測(cè)模型(CNN-based model)(李健偉等,2018)、基于生成對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)和線上難例挖掘(online hard example mining,OHEM)的檢測(cè)模型(李健偉等,2019)以及密集連接的端到端檢測(cè)網(wǎng)絡(luò)(densely connected end-to-end neural network)(Jiao等,2018)等模型進(jìn)行對(duì)比實(shí)驗(yàn),以上對(duì)比模型依次稱為模型1、模型2、模型3、模型4,結(jié)果如表 5所示。
表 5?本文方法與其他艦船檢測(cè)方法對(duì)比結(jié)果
Table 5?Detection results of different models for comparison
模型 | 平均精確率/% | 精確率/% | 召回率/% | 訓(xùn)練時(shí)間/ms | 測(cè)試時(shí)間/ms |
---|---|---|---|---|---|
模型1 | 73.24 | 92.31 | 88.80 | 540.42 | 159.11 |
模型2 | 78.90 | 93.10 | 86.40 | 572.67 | 185.53 |
模型3 | 70.24 | 82.01 | 78.40 | 2 152.09 | 330.78 |
模型4 | 77.84 | 95.21 | 83.60 | 561.82 | 180.95 |
本文 |
80.13 |
96.68 |
89.60 |
13.33 |
10.18 |
注:加粗字體為每列最優(yōu)結(jié)果。 |
模型2和模型4都是基于Faster RCNN模型提出的,與Faster RCNN模型相比,它們提高了檢測(cè)精度,同時(shí)也增加了平均訓(xùn)練和測(cè)試的時(shí)間。但是,與本文的單階段檢測(cè)方法相比,F(xiàn)aster RCNN在訓(xùn)練精度上并沒(méi)有表現(xiàn)出太大優(yōu)勢(shì),原因可能由于Faster RCNN系列結(jié)構(gòu)更復(fù)雜,像SSDD這樣的小型檢測(cè)數(shù)據(jù)集無(wú)法很好地對(duì)其進(jìn)行訓(xùn)練。模型3利用生成對(duì)抗網(wǎng)絡(luò)和在線難例挖掘技術(shù)來(lái)擴(kuò)大訓(xùn)練中的數(shù)據(jù),并基于RCNN方法進(jìn)行檢測(cè),不僅速度慢,而且精度也是幾種方法中最低的。而本文方法在召回率和檢測(cè)精度等方面都實(shí)現(xiàn)了最佳性能,并且在速度方面具有明顯優(yōu)勢(shì),反映出本文方法的有效性與實(shí)用性。
4 結(jié)論
本文主要研究SAR圖像艦船目標(biāo)檢測(cè),著重解決了檢測(cè)中速度與精度的平衡問(wèn)題。為了提高算法的處理速度,設(shè)計(jì)了輕量化的LSSD模型,與SSD模型相比,需訓(xùn)練的參數(shù)大幅減少,模型可從頭開(kāi)始訓(xùn)練而不必依賴預(yù)訓(xùn)練模型。為了提高模型檢測(cè)的精度,提出了一種用于參數(shù)設(shè)置的基于聚類的目標(biāo)分布特性學(xué)習(xí)算法,并采用語(yǔ)義聚合塊和新的注意力引導(dǎo)融合塊的雙向特征融合模塊來(lái)優(yōu)化檢測(cè)特征,改進(jìn)了傳統(tǒng)方法中單向特征融合不能優(yōu)化高層特征的不足。利用公開(kāi)的SSDD數(shù)據(jù)集驗(yàn)證了所提各模塊的效果,結(jié)果表明,所提模型在速度和精度方面均表現(xiàn)出良好性能,與基準(zhǔn)模型以及其他經(jīng)典檢測(cè)算法相比,訓(xùn)練和測(cè)試速度均有明顯提升,檢測(cè)精度也高于其他檢測(cè)算法,從檢測(cè)結(jié)果圖中也可以看出,所提模型有效降低了目標(biāo)漏檢情況。
然而,盡管本文模型較其他檢測(cè)模型表現(xiàn)出更好的速度和精度性能,但測(cè)試中仍存在一些失敗案例,如無(wú)法較好地檢測(cè)密集排列的艦船目標(biāo),這也是實(shí)驗(yàn)中各檢測(cè)模型存在的普遍問(wèn)題。其原因主要在于包括本文模型在內(nèi)的這些模型都采用了垂直矩形邊框作為目標(biāo)邊界框?qū)嵤z測(cè),而相鄰的密集排列艦船目標(biāo)的檢測(cè)框存在大量重疊區(qū)域,容易被模型自動(dòng)合并、刪減,造成檢測(cè)框位置不準(zhǔn)確甚至漏檢。而采用目標(biāo)最小外接傾斜矩形框作為目標(biāo)邊界檢測(cè)框可以有效避免這類問(wèn)題。因此,在今后工作中,將繼續(xù)研究基于目標(biāo)傾斜邊界框的檢測(cè)算法,提高檢測(cè)效果。此外,本文模型沒(méi)有利用SAR圖像的極化信息。如何利用SAR圖像的極化信息提升檢測(cè)性能也是接下來(lái)一個(gè)有意義的研究重點(diǎn)。
?【轉(zhuǎn)載聲明】轉(zhuǎn)載目的在于傳遞更多信息。如涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本號(hào)聯(lián)系,我們將在第一時(shí)間刪除!
關(guān)注微信公眾號(hào):人工智能技術(shù)與咨詢。了解更多咨詢!
編輯:fqj
評(píng)論
查看更多