碳酸鹽巖是指碳酸鹽礦物含量大于 50%的巖石類,代表性的碳酸鹽巖主要有石灰?guī)r、白云巖等,其中石灰?guī)r的白云石含量位于 0~50%之間,白云巖的白云石含量高于 50%。目前,世界上眾多重要產(chǎn)油氣區(qū)的儲集層都是以碳酸鹽巖為主,因而其在世界油氣探測中起著重要作用。
至今,碳酸鹽巖巖性識別方法主要分為兩類;其一是經(jīng)驗判讀法,主要是具有豐富經(jīng)驗的地質(zhì)學(xué)家在室內(nèi)觀察樣品或者去野外通過觀察巖石的顏色、紋理與結(jié)構(gòu)等特征來對灰?guī)r和白云巖進(jìn)行區(qū)分??傮w而言,經(jīng)驗判讀法具有效率低、受判讀者主觀影響大等不足,因而即使對于經(jīng)驗豐富的地質(zhì)學(xué)家,在野外有時也難以區(qū)分碳酸鹽巖中的石灰?guī)r與白云巖;其二是光譜識別法。由于物質(zhì)在電磁波的照射下,其會引起巖石內(nèi)部分子進(jìn)行一定的運動,在吸收、散射或者轉(zhuǎn)動某種波長的光后,得到信號強度與光波長或頻率的關(guān)系圖,并能夠用于物質(zhì)結(jié)構(gòu)、組成及化學(xué)變化的分析,具體如圖1所示。
圖1信號強度與光的波長或頻率的關(guān)系圖
基于此原理,巖性光譜識別則是利用巖石或礦物對特定波長范圍內(nèi)的電磁波所表現(xiàn)出的反射、吸收和輻射等方面的差異性,從而對巖性進(jìn)行識別。相比經(jīng)驗判斷法,光譜識別法具有效率高、省時省力且精度較高等優(yōu)點,因而得到了廣泛的應(yīng)用。專家學(xué)者研究表明在可見光-近紅外光譜區(qū)(0.4~1.3μm),巖石吸收光譜主要由于巖石內(nèi)部金屬陽離子發(fā)生電子躍遷或振動過程;發(fā)現(xiàn)在短波紅外光譜區(qū)(1.3~2.5μm),巖石吸收光譜則主要由于羥基、水分子和碳酸根等基團分子發(fā)生振動;他們展開了通過多類型光譜特征對礦物信息進(jìn)行遙感識別、以北方山山口地區(qū)為研究區(qū),對典型蝕變巖礦的光譜特征進(jìn)行分析、結(jié)合遙感技術(shù),對地質(zhì)巖石進(jìn)行勘查與分析等多項研究分析活動;此外,他們還有利用多光譜遙感影像對尾亞雜巖體的巖性進(jìn)行識別。通過對已有研究文獻(xiàn)進(jìn)行歸納,總結(jié)得到不同光譜波段可識別的礦物,具體如表1所示。
表1不同礦物波段識別范圍
根據(jù)表1可以得到,不同的礦物識別波段差異較大,其中部分礦物識別波段相對較窄,比如方解石等,其波段識別范圍為2.26~2.30μm。因此,傳統(tǒng)的多光譜遙感因其波段范圍較大,光譜分辨率低等原因難以高精度地識別礦物;相比之下,高光譜因具有光譜分辨率高等優(yōu)勢,甚至達(dá)到2個納米波段,因而與多光譜相比,識別精度更高。當(dāng)然,高光譜數(shù)據(jù)在運用時也需要一定的預(yù)處理方法。目前,常用的預(yù)處理方法包括光譜反射率微分、連續(xù)統(tǒng)去除和其他數(shù)學(xué)變換方法。專家學(xué)者研究表明不同光譜變換方式的建模精度和預(yù)測精度具有以下關(guān)系:光譜對數(shù)微分>光譜一階微分>光譜倒數(shù)微分>光譜連續(xù)統(tǒng)去除>光譜倒數(shù)對數(shù)>原始光譜;然而該預(yù)測精度的排序并非全然一致的,仍需要通過具體的建模精度進(jìn)行綜合判斷,如某專家在研究可見光-近紅外光譜的成分預(yù)測時,盡管對光譜進(jìn)行導(dǎo)數(shù)運算能夠消除光譜中基線的平移和漂移,能夠減輕粒徑干擾,然而在實際運用時,若樣本前處理效果得當(dāng),使用原始吸光度光譜的預(yù)測精度更好。另外,除對高光譜數(shù)據(jù)進(jìn)行預(yù)處理外,光譜變量挑選和模型方法的選取也是重要環(huán)節(jié)。其中,光譜變量挑選涉及到從幾百甚至幾千個光譜波段變量中挑選出敏感波段,因為大多數(shù)變量與所研究的巖性種類無關(guān)。事實上,光譜變量篩選主要包括三個目的:剔除無效信息變量;濾除冗余信息變量;消除共線性信息變量。目前,常用的光譜變量篩選方法包括遺傳算法、非信息變量消除法、連續(xù)投影算法、競爭自適應(yīng)重加權(quán)采樣算法(CARS)、迭代變量子集優(yōu)化算法(IVSO)、蒙特卡洛無信息變量消除集成算法(EMCUVE)等。在模型選取方面,主要包括主成分回歸法(PCR)、偏最小二乘回歸法(PLSR)和連續(xù)小波變換(CWT)等。然而,每種方法都存在各自的優(yōu)缺點。比如有些專家學(xué)者研究表明偏最小二乘回歸法可以提供多對多變量的線性回歸建模,能夠很好地解決多重共線性問題;有些研究表明運用多特征波段構(gòu)建的逐步模型精度較高??傮w而言,已有高光譜建模研究中,并未有相對統(tǒng)一的光譜預(yù)處理方法、敏感波段挑選方法以及建模方法。由于不同的方法擁有各自的優(yōu)缺點,因而在實際應(yīng)用中,仍然采用盡可能全面的處理方法,從而對比分析不同方法建模的精度。因此,本文從巖性識別的角度出發(fā),以不同類型碳酸鹽巖的高光譜曲線為基礎(chǔ)數(shù)據(jù),通過對高光譜數(shù)據(jù)進(jìn)行預(yù)處理等操作,從而建立有效的巖性識別模型,為區(qū)域地質(zhì)勘探和油氣勘探及開發(fā)提供快速準(zhǔn)確的分類方法。
1數(shù)據(jù)獲取、預(yù)處理及模型確定
1.1碳酸鹽巖高光譜數(shù)據(jù)采集本研究去野外總共采集340塊碳酸鹽巖樣本,并在實驗室內(nèi)采用非成像光譜儀測量巖樣光譜。在具體實驗室測量時,為確保高光譜數(shù)據(jù)的準(zhǔn)確性,在測量前對其進(jìn)行白板定標(biāo),并對每一個碳酸鹽巖樣品新鮮表面測量多次,最終取其算術(shù)平均值作為該樣品的反射光譜數(shù)據(jù)。
1.2光譜數(shù)據(jù)預(yù)處理碳酸鹽巖樣本在野外采集后,由于巖石樣本受其化學(xué)成分、外部環(huán)境、表面特征和照射條件等因素影響,因此為排除外部因素影響,需要對其光譜數(shù)據(jù)進(jìn)行預(yù)處理操作,從而去除噪聲和不平滑的光譜曲線波段,從而采用更加適合分析的光譜曲線。本文通過對已有研究進(jìn)行整理,所采用的光譜預(yù)處理方法包括Savitzky-Golay卷積平滑濾波、趨勢線(DT)和連續(xù)統(tǒng)去除(CR)等。其中Savitzky-Golay卷積平滑濾波法是采用一個多項式來計算波長t處經(jīng)過平滑處理后的均值,其計算公式如式(1)所示。
式中,hi是Savitzky-Golay平滑系數(shù),H被稱為歸一化因子。平滑系數(shù)可以通過多項式擬合計算。Savitzky-Golay平滑方法強化了中心波長點的作用,其能夠降低噪聲,提高光譜信噪比。此外,本文在進(jìn)行預(yù)處理后,為研究不同光譜采樣間隔對模型精度的影響,分別將光譜重采樣間隔為0nm、2nm、4nm、6nm、8nm和10nm,其中0nm即是原始光譜,從而最終得到6份不同采樣間隔的高光譜數(shù)據(jù)。
1.3模型的確定與精度評價根據(jù)對現(xiàn)有相關(guān)研究模型進(jìn)行整理與對比分析,本文最終選擇以下四種建模方法,分別為多元線性回歸模型(MLR)、主成分回歸模型(PCA)、偏最小二乘回歸模型(PLSR)和逐步回歸模型(SR)。具體而言,多元線性回歸模型是將Y的總體條件期望表示為多個解釋變量的函數(shù);主成分回歸模型是通過提取彼此之間正交的主成分分量,并同時建立線性回歸預(yù)測模型,本研究中所使用的主成分分量數(shù)為5;偏最小二乘回歸模型是考慮與因變量相關(guān)性情況下的最小二乘算法,是通過投影分別將預(yù)測變量和觀測變量投影到一個新的空間,并建立新的線性回歸模型的過程;逐步回歸模型是指用被解釋變量對每一個待研究的解釋變量做簡單回歸分析,使用貢獻(xiàn)最大的解釋變量對應(yīng)的回歸方程為基礎(chǔ),并按照貢獻(xiàn)大小的順序逐個引入剩余的解釋變量。模型確定后,需要對模型的精度進(jìn)行檢驗。本文利用決定系數(shù)(R2)對模型的穩(wěn)定性進(jìn)行評價,R2取值范圍為0~1,其值越大,表明模型穩(wěn)定性越強,模型擬合程度越高;利用均方根誤差(RootMeanSquareError,RMSE)對模型的預(yù)測能力進(jìn)行評價,RMSE越小,表明預(yù)測值和真實測量值之間的偏差越小,模型的預(yù)測能力越強,其計算公式如式(2)所示。
式中,N為樣本集包含樣本的總數(shù)目,y(i)realy和y(i)predicty分別表示第i個樣本的真實值和利用模型建立的預(yù)測值。經(jīng)過對光譜數(shù)據(jù)進(jìn)行處理、模型確定與精度評價等步驟,最終可得到本文的技術(shù)路線圖如圖3所示。
圖3研究技術(shù)路線圖
2結(jié)果與分析
2.1光譜預(yù)處理結(jié)果對比經(jīng)過預(yù)處理后,選擇單個樣品將其結(jié)果進(jìn)行對比顯示,具體如圖4所示。
(a)預(yù)處理前 (b)預(yù)處理后
圖4碳酸鹽巖樣品高光譜曲線預(yù)處理前后對比
根據(jù)圖4可以發(fā)現(xiàn),經(jīng)過預(yù)處理操作后,碳酸鹽巖光譜典型吸收特征被放大,進(jìn)而更加突出土壤光譜吸收顯著的區(qū)域,具體包括1500nm、1900nm和2300nm處附近。
2.2建模精度對比評價表2是建模集中各模型精度對比表。
表2模型總體精度對比分析表
根據(jù)表2可得,從各模型平均精度來看,主成分分析模型(PCA)>偏最小二乘回歸模型(PLSR)>逐步回歸模型(SR)>多元線性回歸模型(MLR),其中主成分分析模型平均精度為75.19%;從各采樣間隔模型平均精度來看,各采樣間隔模型精度排序為4nm>2nm>0nm(原始光譜)>6nm>8nm>10nm,可得在采樣間隔為4nm時候,光譜模型平均精度最高(74.43%)。整體而言,各模型平均精度為71.62%。為了解各模型建立方法的精度隨光譜采樣距離的變化趨勢,結(jié)合表2,繪制得到各模型精度變化折線圖(圖5)。
圖5不同模型不同光譜采樣間隔精度變化
根據(jù)圖5,可以發(fā)現(xiàn)雖然在4nm時,四種建模方法平均精度最高,但并非所有模型都在4nm時,模型精度最高。具體而言,主成分分析模型(PCA)和逐步回歸模型(SR)在采樣間隔為2nm時,模型精度最高;而偏最小二乘回歸模型(PLSR)和多元線性回歸模型(MLR)在采樣間隔為4nm時,模型精度最高。綜合分析可得,主成分分析模型(PCA)在光譜采樣間隔為2nm時,模型精度最高,為79.78%,接近于80%;而多元線性回歸模型(MLR)在對原始光譜曲線進(jìn)行建模時,精度最低,為64.34%;另外,光譜采樣間隔為10nm時,四種模型構(gòu)建方法精度均較低,均低于70%。
3結(jié)論
本研究通過對野外采集的 340 塊碳酸鹽巖樣品進(jìn)行高光譜測量,經(jīng)過光譜預(yù)處理及光譜重采樣等操作后,選擇四種方法進(jìn)行模型的構(gòu)建。通過對結(jié)果進(jìn)行分析,得到如下結(jié)論:(1)主成分分析模型在光譜采樣間隔為 2nm 時,具有最高的模型精度(79.78%),其次是采樣間隔為 2 nm 時的逐步回歸模型(76.61%),最后是采樣間隔為 4 nm 時的偏最小二乘回歸模型和多元線性回歸模型,其精度分別為 73.48%和 73.21%;(2)隨著光譜采樣間隔的增加,四種模型的精度均基本表現(xiàn)為先增加,后下降的變化趨勢;(3)當(dāng)光譜采樣間隔較大時,所有模型精度均低于 70.00%。然而,本研究也存在一定的不足之處,首先是所有模型的精度均未超過 80%,其次是模型的預(yù)處理過程相對較粗糙,未能使得模型構(gòu)建精度更高。總體而言,本研究可為區(qū)域地質(zhì)判斷及油氣區(qū)識別等提供有效的技術(shù)和方法手段。
萊森光學(xué)(深圳)有限公司是一家提供光機電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應(yīng)用系統(tǒng)的研發(fā)、生產(chǎn)和銷售。
審核編輯 黃昊宇
-
光譜測量
+關(guān)注
關(guān)注
1文章
24瀏覽量
9475 -
高光譜
+關(guān)注
關(guān)注
0文章
328瀏覽量
9908
發(fā)布評論請先 登錄
相關(guān)推薦
評論