大豆食心蟲(chóng)成蟲(chóng)的蟲(chóng)卵會(huì)附著于大豆表面,孵化的幼蟲(chóng)會(huì)啃食大豆,對(duì)大豆產(chǎn)量和品質(zhì)造成嚴(yán)重影響。這種現(xiàn)象在我國(guó)各大豆產(chǎn)區(qū)普遍發(fā)生,如發(fā)現(xiàn)和預(yù)防得不及時(shí)會(huì)使得大豆產(chǎn)量嚴(yán)重下降。在大豆病害的檢測(cè)上,人工可視化調(diào)查作為實(shí)踐中最基本的直接方法,至今仍在使用。然而,這種方法需要相關(guān)植物表型和植物病理學(xué)的專(zhuān)業(yè)知識(shí);另一種常見(jiàn)的植物病害檢測(cè)技術(shù)可以稱(chēng)為生物分子法,但生物分子技術(shù)需要詳細(xì)的取樣和復(fù)雜的處理方法,與人工調(diào)查方法相比,這些方法更具專(zhuān)業(yè)性和周期性。這兩種技術(shù)具有基本性、有效性,但總是需要手動(dòng)去檢測(cè),導(dǎo)致復(fù)雜的工作和較大的勞動(dòng)量。
近年來(lái),深度學(xué)習(xí)技術(shù)在植物病害分類(lèi)中的成功應(yīng)用,為大豆病害的研究提供了新思路,該技術(shù)通過(guò)將卷積網(wǎng)絡(luò)與高光譜結(jié)合,能夠?qū)δ繕?biāo)進(jìn)行有效分類(lèi)。高光譜技術(shù)可視為光譜學(xué)的一部分,它可以從多個(gè)光譜帶中獲取光譜信息,一些有效波段對(duì)病害引起的大豆細(xì)微變化具有很高的敏感性,從而可以區(qū)分不同的病害類(lèi)型。卷積網(wǎng)絡(luò)是一種特殊的深度學(xué)習(xí)技術(shù),在圖像處理和提取特征方面具有突出的能力。
1實(shí)驗(yàn)部分
1.1樣本制備
測(cè)試集中所需要食心蟲(chóng)大豆樣本由專(zhuān)業(yè)農(nóng)業(yè)機(jī)構(gòu)提供,將只成蟲(chóng)放入大豆中使其于大豆上產(chǎn)卵,5d后采集附著蟲(chóng)卵的大豆,10d后采集附著食心蟲(chóng)幼蟲(chóng)的大豆,30d后采集被啃食的大豆。分別對(duì)正常的大豆以及上述三種大豆拍攝高光譜圖像,每類(lèi)樣本數(shù)量為20。
1.2高光譜成像系統(tǒng)
由軟件進(jìn)行圖像采集,高光譜成像系統(tǒng)的組成部分有電控平移臺(tái),4盞功率為150w的鹵素?zé)?,CCD相機(jī),一臺(tái)計(jì)算機(jī)五個(gè)部分,采集的圖像包含256個(gè)光譜波段。它們的光譜范圍為383.70~1032.70nm,整個(gè)采集過(guò)程在暗箱中完成,避免了環(huán)境光的影響,如圖1所示。
圖1系統(tǒng)結(jié)構(gòu)圖
1.3高光譜圖像采集
采集圖像時(shí),曝光時(shí)間為18ms,平臺(tái)的移動(dòng)速度設(shè)置為1.50cm.s-1,鹵素?zé)襞c平臺(tái)之間的夾角設(shè)置為50°。先采集白板圖像W和暗背景圖像B,然后對(duì)大豆樣本進(jìn)行圖像采集,得到256個(gè)波段的高光譜圖像。采集到的大豆樣本合成的RGB圖如圖2所示
圖2大豆樣本高光譜圖像
1.4數(shù)據(jù)預(yù)處理
采集圖像過(guò)程中為了緩解可能出現(xiàn)的漫反射,樣本不均勻,基線(xiàn)漂移等問(wèn)題,對(duì)采集圖像進(jìn)行了Savitzky-Golay濾波處理,針對(duì)光照不均勻的問(wèn)題,使用了黑白校正的預(yù)處理方法。高光譜圖像的波段數(shù)量太多,許多波段的數(shù)據(jù)是冗余的;為了避免這些冗余數(shù)據(jù)造成的影響,使用了主成分分析法進(jìn)行降維處理,選取前30個(gè)高光譜波段作為特征波段。以樣本為中心截取了50*50像素的正方形區(qū)域,使得單個(gè)高光譜樣本數(shù)據(jù)的大小為50*50*30。
1.5圖像檢索模型原理
3D-R-D模型的內(nèi)容主要包括一個(gè)用于提取特征的3D卷積網(wǎng)絡(luò),一個(gè)用于幫助網(wǎng)絡(luò)產(chǎn)生有效特征的DCH損失函數(shù)。其中網(wǎng)絡(luò)模型為3D-Resnet18,該預(yù)訓(xùn)練模型的原始數(shù)據(jù)集包括Kinetics-700(K)和MomentsinTime(M)兩個(gè)數(shù)據(jù)集,前者一共700個(gè)類(lèi),每個(gè)類(lèi)包括超過(guò)600個(gè)來(lái)自You-Tube的人類(lèi)動(dòng)作視頻,后者是包括100萬(wàn)個(gè)視頻的數(shù)據(jù)集,使用這樣的預(yù)訓(xùn)練模型,可以得到較好的初始化參數(shù)。預(yù)訓(xùn)練模型并不能直接使用,在網(wǎng)絡(luò)結(jié)構(gòu)的改變上,本工作僅僅去除最后的分類(lèi)層,并添加一個(gè)從高維映射到低維的hash層,這樣不僅使用了模型中的初始化參數(shù),還能利用網(wǎng)絡(luò)訓(xùn)練來(lái)進(jìn)行降維。在損失函數(shù)的設(shè)計(jì)上,為得到效果優(yōu)良的相似度特征,文獻(xiàn)中經(jīng)常使用成對(duì)損失函數(shù)來(lái)更新這些特征提取算法的可學(xué)習(xí)參數(shù)。專(zhuān)家學(xué)者通過(guò)設(shè)計(jì)合理的損失函數(shù),使得每一對(duì)輸入樣本如果相似就讓它們的特征相互靠近,不相似的樣本對(duì)特征距離相互遠(yuǎn)離,充分利用了樣本標(biāo)簽之間的相似性;部分學(xué)者對(duì)輸入圖像的監(jiān)督信息進(jìn)行編碼,對(duì)輸出特征進(jìn)行正則化,以逼近所需的離散值,該方法設(shè)計(jì)了一個(gè)閾值m,當(dāng)不相似對(duì)的特征距離大于m時(shí)不提供損失貢獻(xiàn)。部分學(xué)者設(shè)計(jì)了一個(gè)基于柯西分布的成對(duì)損失,它對(duì)漢明距離大于給定漢明半徑閾值的相似圖像對(duì)造成了顯著的懲罰,也充分利用了標(biāo)簽信息。將中的損失函數(shù)與交叉熵函數(shù)進(jìn)行結(jié)合,使得最后的特征信息包含分類(lèi)損失和標(biāo)簽之間的相似度信息。通過(guò)引入一個(gè)哈達(dá)碼矩陣,改進(jìn)交叉熵?fù)p失,通過(guò)添加分類(lèi)中心,增強(qiáng)了分類(lèi)損失的特征信息。在特征距離的計(jì)算上,由于最后的特征都是低維的二進(jìn)制碼,所以使用漢明距離進(jìn)行衡量,并且由于維度較低,不同樣本之間特征距離的計(jì)算速度極快。
2結(jié)果與討論
2.1模型使用與分析
如上所述。本工作使用預(yù)訓(xùn)練模型,并將分類(lèi)層改為hash層,損失函數(shù)使用的是DCH,訓(xùn)練集為CAVE,iCVL和NUS,測(cè)試集為采集的大豆樣本,訓(xùn)練時(shí)用于微調(diào)以適應(yīng)應(yīng)用場(chǎng)景的訓(xùn)練集則和文獻(xiàn)中描述的一樣,就是使用光譜數(shù)據(jù)集CAVE,iCVL和NUS作為數(shù)據(jù)集。CAVE是一個(gè)包含32個(gè)場(chǎng)景的數(shù)據(jù)集,iCVL高光譜數(shù)據(jù)集由計(jì)算機(jī)視覺(jué)會(huì)議收集,包含農(nóng)村,城市,植物,公園,室內(nèi)這些場(chǎng)景,NUS數(shù)據(jù)集則包含了一些普通場(chǎng)景和水果,而上述的四種類(lèi)別的大豆數(shù)據(jù)則作為分類(lèi)實(shí)驗(yàn)中的測(cè)試集和檢索集。利用圖像檢索進(jìn)行分類(lèi)的步驟如下所示:
(1)利用訓(xùn)練集訓(xùn)練得到一個(gè)網(wǎng)絡(luò)模型,這個(gè)模型能夠?qū)斎氲耐活?lèi)高光譜樣本輸出相似的二進(jìn)制特征。
(2)從大豆樣本的每一類(lèi)中隨機(jī)取出10個(gè)樣本組成檢索集,對(duì)檢索集提取特征并儲(chǔ)存到文件A中,剩下的大豆樣本作為測(cè)試集。
(3)模擬新采集樣本的分類(lèi):將測(cè)試集中每一個(gè)樣本依次提取特征,并用漢明距離與文件A中的數(shù)據(jù)進(jìn)行相似度匹配排序,從檢索集取出的排名前5個(gè)樣本中相同標(biāo)簽最多的即為這個(gè)測(cè)試樣本的類(lèi)別。
(4)實(shí)驗(yàn)得到的準(zhǔn)確率即為正確的測(cè)試個(gè)數(shù)占總測(cè)試樣本數(shù)量的比重,重復(fù)上述步驟,反復(fù)實(shí)驗(yàn)取平均值。在最近的大豆食心蟲(chóng)分類(lèi)研究中,文獻(xiàn)使用了小樣本分類(lèi),采用了MN,MAML,3D-RN的方法,也解決了高光譜圖像數(shù)據(jù)樣本不足的問(wèn)題,它的實(shí)驗(yàn)結(jié)果如表1所示。
表1不同分類(lèi)模型在4-way5-shot情況下的檢測(cè)結(jié)果
由此發(fā)現(xiàn),使用Resnet18的網(wǎng)絡(luò)結(jié)構(gòu),具有良好的效果,為了研究圖像檢索進(jìn)行分類(lèi)的有效性,也為了能和文獻(xiàn)進(jìn)行對(duì)比,通過(guò)使用不同的預(yù)模型,結(jié)合不同損失函數(shù),設(shè)計(jì)了如表2實(shí)驗(yàn)。
表2不同損失函數(shù)下的檢索性能
在表2中,Resnet18-K表示使用了Kinetics-700(K)為數(shù)據(jù)集的預(yù)訓(xùn)練模型,Resnet18-KM,表示該預(yù)訓(xùn)練模型還使用了MomentsinTime(M)數(shù)據(jù)集,從實(shí)驗(yàn)結(jié)果中發(fā)現(xiàn),盡管使用了更多的數(shù)據(jù),本實(shí)驗(yàn)在性能上,有所提升但是比較細(xì)微;和原來(lái)的交叉熵?fù)p失函數(shù)相比,DH使用成對(duì)損失提高了5%的分類(lèi)準(zhǔn)確率,在使用M閾值之后,DSH又有所提高,DSHSD盡管結(jié)合分類(lèi)損失和成對(duì)損失,但是性能和DSH幾乎沒(méi)有區(qū)別,由此可見(jiàn),單純的分類(lèi)損失并不適用于本次實(shí)驗(yàn),CSQ引入了中心損失,在改善交叉熵后,確實(shí)提高了5%左右的準(zhǔn)確率,和DSH差不多,而DCH在使用柯西分布后,達(dá)到了86%的準(zhǔn)確率,相比于之前效果最好的3D-RN實(shí)驗(yàn),提高的準(zhǔn)確率。
3結(jié)論
近年來(lái),使用高光譜成像對(duì)農(nóng)業(yè)病蟲(chóng)害檢測(cè)已經(jīng)應(yīng)用地十分廣泛,但是樣本數(shù)量少的問(wèn)題仍然需要解決,本文通過(guò)采集不同時(shí)期的樣本,利用樣本之間的相似度信息,構(gòu)建了一種基于圖像檢索的分類(lèi)方法,在模型上,從視頻檢索中得到啟發(fā),利用大量數(shù)據(jù)訓(xùn)練的3D預(yù)訓(xùn)練網(wǎng)絡(luò),獲得了較好的初始化參數(shù),利用3DCNN,使得不同波段間數(shù)據(jù)的相似性能夠被利用起來(lái),通過(guò)對(duì)不同損失函數(shù)的比較,DCH利用柯西分布,能較好地提取到樣本之間地相似信息,它的準(zhǔn)確率達(dá)到了86.0±1.00,從而解決了實(shí)際問(wèn)題,這是一種新穎的高光譜檢測(cè)方法,為高光譜檢測(cè)的相關(guān)研究提供了一種新的思路。
審核編輯 黃昊宇
-
光譜檢測(cè)
+關(guān)注
關(guān)注
0文章
10瀏覽量
6631 -
高光譜
+關(guān)注
關(guān)注
0文章
328瀏覽量
9908
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論