為了改善空氣質(zhì)量、防風(fēng)固沙、減少水土流失等環(huán)境問(wèn)題,中國(guó)政府進(jìn)行了大規(guī)模的植樹(shù)造林活動(dòng)。臭椿、云南松和欒樹(shù)作為中國(guó)常見(jiàn)的綠化樹(shù)種,自然而然地成為植樹(shù)造林的首選。由于我國(guó)綠化造林面積巨大,林業(yè)病蟲(chóng)害幾乎是不可避免的問(wèn)題,而解決這一問(wèn)題要花費(fèi)巨大的人力物力。高光譜激光雷達(dá)探測(cè)系統(tǒng)可以快速同步獲得地物目標(biāo)的測(cè)距信息和光譜信息,可應(yīng)用于目標(biāo)的探測(cè)與識(shí)別等。這為研究一種精準(zhǔn)高效的林業(yè)病蟲(chóng)害監(jiān)測(cè)方法提供了保障,因此開(kāi)展基于高光譜激光雷達(dá)的林業(yè)病蟲(chóng)害監(jiān)測(cè)方法的研究具有重要的意義。
1實(shí)驗(yàn)系統(tǒng)與分類(lèi)方法
1.1新型可調(diào)諧高光譜激光雷達(dá)系統(tǒng)
新型可調(diào)諧高光譜激光雷達(dá)系統(tǒng)主要由發(fā)射系統(tǒng)、接收探測(cè)系統(tǒng)、掃描控制系統(tǒng)三個(gè)主要部分組成。發(fā)射系統(tǒng)主要由激光器和聲光可調(diào)諧濾波器(AOTF)組成;接收探測(cè)系統(tǒng)主要包括接收光學(xué)系統(tǒng)、光電探測(cè)器和數(shù)據(jù)采集系統(tǒng);掃描控制系統(tǒng)負(fù)責(zé)對(duì)發(fā)射光束進(jìn)行空間位置和激光出射方向的控制,實(shí)現(xiàn)預(yù)定的空間掃描。圖1為高光譜激光雷達(dá)原理,表1為高光譜激光雷達(dá)系統(tǒng)的主要參數(shù)。
圖1高光譜激光雷達(dá)原理示意圖
表1高光譜激光雷達(dá)的主要參數(shù)
高光譜激光雷達(dá)系統(tǒng)首先將超連續(xù)激光光束注入AOTF中,經(jīng)AOTF調(diào)諧濾波后按照設(shè)置要求在不同時(shí)刻發(fā)射不同波長(zhǎng)的單色光,激光經(jīng)準(zhǔn)直擴(kuò)散鏡和反射鏡出射,出射光束有小部分投射到光束采樣鏡后進(jìn)入主波探測(cè)器中并傳遞到數(shù)據(jù)采集系統(tǒng),大部分光束通過(guò)掃描轉(zhuǎn)鏡后投射到目標(biāo)上,目標(biāo)的回波信號(hào)由光學(xué)接收系統(tǒng)接收,再經(jīng)光電探測(cè)器轉(zhuǎn)化為電信號(hào),由數(shù)據(jù)采集系統(tǒng)保存至上位機(jī)。對(duì)于采集到的數(shù)據(jù)首先進(jìn)行預(yù)處理,即將采集到的樣本回波強(qiáng)度信息轉(zhuǎn)化為樣本光譜反射率信息。為了減少外部環(huán)境因素的影響,保證同一次實(shí)驗(yàn)的數(shù)據(jù)之間可以橫向比較,使用回波反射率對(duì)每個(gè)測(cè)量目標(biāo)進(jìn)行歸一化。回波反射率由同一光譜通道的目標(biāo)回波強(qiáng)度與參考板回波強(qiáng)度的歸一化處理得到。待測(cè)目標(biāo)的反射率可表示為
式中:Itarget和Ireference分別為待測(cè)目標(biāo)和參考靶標(biāo)的激光回波強(qiáng)度;Rreference為參考靶標(biāo)的反射率,參考靶標(biāo)的反射率可通過(guò)地物光譜儀測(cè)量得到。起始波長(zhǎng)為650m,終止波長(zhǎng)為1100nm,波長(zhǎng)間隔為5nm,共91個(gè)光譜通道,參考靶標(biāo)可以選用不同反射率的白色參考板。
1.2分類(lèi)方法
支持向量機(jī)是一種二類(lèi)分類(lèi)模型,其基本模型是定義在特征空間上間隔最大化的線性分類(lèi)器,在分類(lèi)問(wèn)題中給定輸入數(shù)據(jù)和學(xué)習(xí)目標(biāo)x={x1,x2,x3,…,xn}和y={y1,y2,y3,…,yn},其中輸入數(shù)據(jù)的每個(gè)樣本都包含多個(gè)特征并由此構(gòu)成特征空間,而學(xué)習(xí)目標(biāo)為二元變量并分別表示負(fù)類(lèi)和正類(lèi)。若輸入數(shù)據(jù)所在的特征空間存在作為決策邊界的超平面,則將學(xué)習(xí)目標(biāo)按正類(lèi)和負(fù)類(lèi)分開(kāi),并使任意樣本的點(diǎn)X到平面距離不小于最小距離,則稱(chēng)該分類(lèi)問(wèn)題具有線性可分性,超平面的法向量ω和截距b可表示為
但是支持向量機(jī)還是局限于線性可分的數(shù)據(jù),當(dāng)引入核函數(shù)之后,則使其成為實(shí)質(zhì)上的非線性分類(lèi)器。最早Cortes等提出了線性支持向量機(jī),之后Stephan通過(guò)引入核技巧提出了非線性支持向量機(jī)。支持向量機(jī)是一種常用的數(shù)據(jù)分類(lèi)和回歸的機(jī)器學(xué)習(xí)方法,該方法已成功地應(yīng)用于遙感監(jiān)測(cè)領(lǐng)域。支持向量機(jī)的優(yōu)點(diǎn)是魯棒性強(qiáng),對(duì)維數(shù)不敏感,對(duì)訓(xùn)練樣本數(shù)量要求較低,而且支持向量機(jī)具有良好的泛化性能,具有較強(qiáng)的統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)。
2分類(lèi)實(shí)驗(yàn)與數(shù)據(jù)分析
2.1實(shí)驗(yàn)樣本與樣本光譜反射率
本實(shí)驗(yàn)采用的樣本包括標(biāo)準(zhǔn)反射率白板、健康的臭椿樣本、感染溝眶象的臭椿樣本、健康的云南松樣本、感染云南松切梢小蠹的云南松樣本、健康的欒樹(shù)樣本、感染潔長(zhǎng)棒長(zhǎng)蠹的欒樹(shù)樣本等。植被、土壤和水體等物質(zhì)是地球表面的主要組成部分,具有顯著不同的光譜特征。色素吸收決定著可見(jiàn)光波段的光譜反射率,細(xì)胞結(jié)構(gòu)決定近紅外波段的光譜反射率。一般情況下,植被在350~2500nm波長(zhǎng)范圍內(nèi)具有典型的反射光譜特征,而且植被分析常使用紅邊區(qū)域和近紅外區(qū)域的工作波段。因此,本實(shí)驗(yàn)的工作波長(zhǎng)選定為650~1100nm,光譜通道數(shù)量為91個(gè),光譜分辨率為5nm,在吸收率100%的黑色參考板背景下對(duì)上述目標(biāo)在固定距離處分別采集回波強(qiáng)度信號(hào)。實(shí)驗(yàn)采集的部分樣本如圖2所示。
圖2高光譜激光雷達(dá)數(shù)據(jù)采集的樣本實(shí)例
由于林木樣本的生長(zhǎng)環(huán)境和保存狀況一直處于變化之中,而且木質(zhì)樣本易受大氣介質(zhì)等因素的影響,所以林木樣本表面的成分隨著時(shí)間推移而不斷變化,因此激光回波強(qiáng)度受林木樣本表面特性的影響很大。首先對(duì)健康林木樣本表面與感染林木樣本表面的光譜反射率差異進(jìn)行初步分析。圖3為健康樣本表面與染病樣本表面的反射率趨勢(shì)。從圖3可以看到,除了健康臭椿與感染溝眶象臭椿的反射率在部分波長(zhǎng)范圍內(nèi)反射率差異較大,其他幾種林木樣本健康與染病的反射率都十分接近。
圖3健康樣本表面與染病樣本表面的反射率。(a)臭椿;(b)云南松;(c)欒樹(shù)
2.2支持向量機(jī)分類(lèi)器模型的構(gòu)建及參數(shù)選擇
由于林木樣本的波長(zhǎng)與反射率是非線性的,為此本文采用了非線性支持向量機(jī)分類(lèi)器。支持向量機(jī)可以配置不同的核函數(shù)來(lái)處理各種非線性決策邊界,目前常用的核函數(shù)有多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)、線性核函數(shù)。因?yàn)楦咚箯较蚧撕瘮?shù)具有平滑、穩(wěn)定、同步的特性,所以本研究采用的是高斯徑向基核函數(shù),即
式中:x和z為空間內(nèi)不同的樣本點(diǎn);σ為核半徑。關(guān)于實(shí)驗(yàn)數(shù)據(jù)處理,本文使用軟件對(duì)回波信號(hào)進(jìn)行處理、劃分樣本集、建模以及評(píng)價(jià)。通過(guò)數(shù)據(jù)預(yù)處理得到了樣本的光譜信息,之后將健康的臭椿樣本與感染溝眶象的臭椿樣本、健康的云南松樣本與感染云南松切梢小蠹的云南松樣本、健康的欒樹(shù)樣本與感染潔長(zhǎng)棒長(zhǎng)蠹的欒樹(shù)樣本的表面反射率數(shù)據(jù)一分為二,一半作為支持向量機(jī)的訓(xùn)練集并用于構(gòu)建支持向量機(jī)模型,另一半作為測(cè)試集并用來(lái)驗(yàn)證支持向量機(jī)分類(lèi)器模型的分類(lèi)效果。得到三組不同的支持向量機(jī)模型之后,調(diào)節(jié)模型參數(shù)使模型性能更加優(yōu)越。使用基于高斯徑向基核函數(shù)的SVM模型有兩個(gè)非常重要的參數(shù)C與γ。
C為懲罰系數(shù),即對(duì)誤差的寬容度,若C值越大,則說(shuō)明越不能容忍出現(xiàn)誤差,容易過(guò)擬合;若C值越小,則容易欠擬合,綜上C值過(guò)大或過(guò)小,都會(huì)影響模型的泛化能力。γ是選擇高斯徑向基函數(shù)作為核函數(shù)后,該函數(shù)自帶的一個(gè)參數(shù),其隱含地決定了數(shù)據(jù)映射到新的特征空間后的分布,γ值越大,則支持向量越少,這會(huì)造成SVM只作用于支持向量樣本附近,則訓(xùn)練集上的準(zhǔn)確率很高,而測(cè)試集上的準(zhǔn)確率較低,存在過(guò)擬合的風(fēng)險(xiǎn);γ值越小,則支持向量越多,則會(huì)造成平滑效應(yīng)太大,無(wú)法在訓(xùn)練集上得到特別高的準(zhǔn)確率,也會(huì)影響測(cè)試集的準(zhǔn)確率。此外高斯徑向基核函數(shù)公式里面的σ和γ的關(guān)系,可以通過(guò)改變?chǔ)抑祦?lái)影響γ,先根據(jù)經(jīng)驗(yàn)對(duì)其懲罰因子C和核函數(shù)的固有參數(shù)進(jìn)行初始化賦值,然后通過(guò)實(shí)驗(yàn)測(cè)試,再根據(jù)測(cè)試數(shù)據(jù)反復(fù)調(diào)整參數(shù)值,直到得到滿意的結(jié)果為止。因?yàn)閷?shí)驗(yàn)選用正類(lèi)與負(fù)類(lèi)的數(shù)據(jù)數(shù)量一樣多,所以對(duì)懲罰系數(shù)在0~64之間進(jìn)行選擇。根據(jù)臺(tái)灣大學(xué)林智仁教授的研究表明σ值通??梢栽冢?5~25之間,所以對(duì)σ在2-5~25之間進(jìn)行選擇。圖4為不同σ值條件下健康林木樣本與染病林木樣本的分類(lèi)精度趨勢(shì),圖5為不同C值條件下健康林木樣本與染病林木樣本的分類(lèi)精度趨勢(shì)。
圖4不同σ值條件下健康林木樣本與染病林木樣本的分類(lèi)精度趨勢(shì)。(a)臭椿;(b)云南松;(c)欒樹(shù)
σ的取值集中在0~1之間,γ的取值較大、支持向量減少,則展現(xiàn)出較高的分類(lèi)精度;當(dāng)σ增大時(shí),γ值減小、支持向量增多,則樣本的分類(lèi)精度呈現(xiàn)出明顯的下降趨勢(shì)。從圖4(a)可以看到,健康臭椿與感染溝眶象臭椿在σ=2-2.7附近的分類(lèi)精度可達(dá)0.9890。從圖4(b)可以看到,健康云南松和感染切梢小蠹云南松在σ=2-2.1附近的分類(lèi)精度可達(dá)0.9286。從圖4(c)可以看到,健康欒樹(shù)與感染潔長(zhǎng)棒長(zhǎng)蠹欒樹(shù)在σ=2-2.5附近的分類(lèi)精度可達(dá)0.6703。對(duì)于懲罰系數(shù)C來(lái)說(shuō),隨著C值的增加,分類(lèi)精度迅速增加,當(dāng)前取值超過(guò)一定范圍之后分類(lèi)器模型的性能將不會(huì)有較大提升。通過(guò)分析發(fā)現(xiàn),剛開(kāi)始C值增加,模型的復(fù)雜度增加,支持向量減少;而當(dāng)C值足夠大之后,模型中邊界支持向量的數(shù)量為0,C的變化就不會(huì)對(duì)模型的性能產(chǎn)生較大的影響。從圖5(a)可以看到,健康臭椿與感染溝眶象臭椿在參數(shù)C=47附近的分類(lèi)精度可達(dá)0.9945。從圖5(b)可以看到,健康云南松和感染切梢小蠹云南松在C=18附近的分類(lèi)精度可達(dá)0.9286。從圖5(c)可以看到健康欒樹(shù)與感染潔長(zhǎng)棒長(zhǎng)蠹欒樹(shù)在C=48附近的分類(lèi)精度可達(dá)0.6593。
圖5不同C值條件下健康林木樣本與染病林木樣本的分類(lèi)精度趨勢(shì)。(a)臭椿;(b)云南松;(c)欒樹(shù)
2.2測(cè)試集數(shù)據(jù)實(shí)驗(yàn)結(jié)果驗(yàn)證
完成支持向量機(jī)模型優(yōu)化之后,就得到了適合識(shí)別不同種類(lèi)林木樣本健康或者染病的支持向量機(jī)模型。將測(cè)試集數(shù)據(jù)輸入支持向量機(jī)分類(lèi)器模型中,用來(lái)驗(yàn)證其分類(lèi)效果。表2為樣本測(cè)試數(shù)據(jù)的分類(lèi)精度。
表2測(cè)試集樣本數(shù)據(jù)的分類(lèi)精度
通過(guò)測(cè)試集數(shù)據(jù)的驗(yàn)證,經(jīng)過(guò)參數(shù)優(yōu)化之后的支持向量機(jī)模型可以很好地分類(lèi)識(shí)別各種林木樣本目標(biāo),而且都達(dá)到了預(yù)期效果,并未出現(xiàn)過(guò)擬合的現(xiàn)象。從表2可以看到,臭椿和云南松的分類(lèi)精度較高,可以達(dá)到90%以上;欒樹(shù)的分類(lèi)精度也接近70%。分類(lèi)精度較高主要是因?yàn)槠湓?50~1100nm整個(gè)波長(zhǎng)范圍內(nèi)的反射率差異顯著,除了部分波段有混疊現(xiàn)象外,其他部分差異十分明顯。而欒樹(shù)在650~1100nm整個(gè)波長(zhǎng)范圍內(nèi)的反射率非常接近,這也是其分類(lèi)精度較低的主要原因。綜合來(lái)看支持向量機(jī)對(duì)于健康與染病的多種林木樣本,分類(lèi)效果明顯,原因在于新型可調(diào)諧的高光譜激光雷達(dá)的91通道光譜信息為分類(lèi)提供了豐富的光譜信息,而且具有主動(dòng)測(cè)量、占地面積小、抗干擾能力強(qiáng)等優(yōu)點(diǎn),這就使測(cè)量精度得到保證。
2結(jié)論
本研究利用自研的新型可調(diào)諧高光譜激光雷達(dá)系統(tǒng),對(duì)固定距離下不同種類(lèi)的健康林木樣本和染病林木樣本進(jìn)行了分類(lèi)研究,通過(guò)分析健康林木樣本表面光譜與橫截面光譜的關(guān)系證實(shí)表面光譜用于分類(lèi)的可行性;運(yùn)用支持向量機(jī)對(duì)健康和染病的林木樣本的表面光譜反射率展開(kāi)了關(guān)于核函數(shù)選取、模型參數(shù)選擇、分類(lèi)精度的相關(guān)研究;將實(shí)驗(yàn)獲得的數(shù)據(jù)輸入到優(yōu)化之后的支持向量機(jī)模型中并進(jìn)行驗(yàn)證,發(fā)現(xiàn)其對(duì)實(shí)驗(yàn)樣本有良好的分類(lèi)效果。其中健康臭椿和感染溝眶象臭椿在參數(shù)σ=2-2.7、C=47附近的分類(lèi)精度可達(dá)96.98%;健康云南松和感染切梢小蠹云南松在參數(shù)σ=2-2.1、C=18附近的分類(lèi)精度可達(dá)91.21%;健康欒樹(shù)與感染潔長(zhǎng)棒長(zhǎng)蠹欒樹(shù)在參數(shù)σ=2-2.5、C=48附近的分類(lèi)精度66.21%。
雖然欒樹(shù)的分類(lèi)精度沒(méi)有臭椿和云南松高,但在日后的研究中可以通過(guò)對(duì)模型的調(diào)整優(yōu)化來(lái)進(jìn)一步提升分類(lèi)精度。本文在有限的光譜通道條件下對(duì)健康和染病的林木樣本表面光譜反射率進(jìn)行分類(lèi)識(shí)別,探索了一種適用于基于可調(diào)諧高光譜激光雷達(dá)光譜的病蟲(chóng)害林木樣本分類(lèi)方法,目前只獲得了初步結(jié)果,但具有一定的參考價(jià)值。本文的研究并未關(guān)注林木樣本的染病程度,只是定性地分析了林木樣本的健康染病與否,日后可以展開(kāi)林木樣本染病程度的相關(guān)研究,實(shí)現(xiàn)更加精確的監(jiān)測(cè)。
萊森光學(xué)(深圳)有限公司是一家提供光機(jī)電一體化集成解決方案的高科技公司,我們專(zhuān)注于光譜傳感和光電應(yīng)用系統(tǒng)的研發(fā)、生產(chǎn)和銷(xiāo)售。
審核編輯 黃昊宇
-
激光雷達(dá)
+關(guān)注
關(guān)注
967文章
3863瀏覽量
188746 -
高光譜
+關(guān)注
關(guān)注
0文章
317瀏覽量
9857
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論