0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于機(jī)器學(xué)習(xí)的水體化學(xué)需氧量高光譜反演模型對(duì)比研究

萊森光學(xué) ? 來源:萊森光學(xué) ? 作者:萊森光學(xué) ? 2023-03-23 09:58 ? 次閱讀

引言

化學(xué)需氧量(COD)是以化學(xué)方法測(cè)量水樣中需要被氧化的還原性物質(zhì)的量。水樣在一定條件下的COD以氧化1升水樣中還原性物質(zhì)縮小化的氧化劑的量為指標(biāo),折算成每升水樣全部被氧化后,需要的氧的毫克數(shù),以mg·L-1來表示。COD測(cè)試可以很容易地量化水中有機(jī)物的含量。COD最常見的應(yīng)用是量化地表水(如湖泊和河流)或廢水中可氧化污染物的量,在水質(zhì)監(jiān)測(cè)中起到了巨大的作用。傳統(tǒng)的有重鉻酸鹽滴定法和分光光度法等方法,電化學(xué)方法和流動(dòng)注射分析法用于COD檢測(cè),但這些檢測(cè)方法都存在檢測(cè)周期較長(zhǎng)?消耗試劑等缺點(diǎn),對(duì)水體的批量檢測(cè)也難以實(shí)現(xiàn)。

而利用高光譜技術(shù)和機(jī)器學(xué)習(xí)手段對(duì)水質(zhì)參數(shù)進(jìn)行反演近期已成為國內(nèi)外熱點(diǎn)研究問題。高光譜技術(shù)能夠獲得物體連續(xù)的光譜信息,近年來逐步應(yīng)用于水農(nóng)產(chǎn)品檢測(cè)?生植被和水資源調(diào)控等領(lǐng)域。在水質(zhì)參數(shù)高光譜反演建模中,國內(nèi)外學(xué)者采取機(jī)器學(xué)習(xí)方法對(duì)不同水質(zhì)參數(shù)進(jìn)行建模,如總氮?總磷?水質(zhì)濁度?一般懸浮物?化學(xué)需氧量等,并取得了一定成果。

實(shí)驗(yàn)部分

2.1 預(yù)處理

高光譜數(shù)據(jù)通常包含由相機(jī)或儀器產(chǎn)生的隨機(jī)噪聲和光譜變化。光譜預(yù)處理可以減少或消除數(shù)據(jù)中與自身性質(zhì)無關(guān)的信息,降低模型的復(fù)雜性,提高數(shù)據(jù)和模型的可解釋性(魯棒性和準(zhǔn)確性)。光譜數(shù)據(jù)的預(yù)處理在進(jìn)行多變量分析之前是必不可少的。SG平滑能夠使光譜曲線平滑,MSC方法能夠消除基線漂移和平移現(xiàn)象。采用SG平滑?MSC以及SG平滑結(jié)合MSC光譜預(yù)處理手段對(duì)原始光譜進(jìn)行預(yù)處理并進(jìn)行比較。

2.2 特征波段提取

高光譜波段由大量的波段組成,有些波段的相關(guān)性較高而且存在冗余以及噪聲等。對(duì)特征波段的提取在一定程度上可以規(guī)避這兩種情況。

2.3 反演模型

選取線性回歸?隨機(jī)森林?AdaBoost?XGBoost四種機(jī)器學(xué)習(xí)建模方法。線性回歸是一種確定兩個(gè)或多個(gè)變量間相互依賴定量關(guān)系的機(jī)器學(xué)習(xí)方法;隨機(jī)森林算法是決策樹的集成,通過平均決策樹可以大大降低過擬合的風(fēng)險(xiǎn),是比單一決策樹性能更優(yōu)的模型;Adaboost是將弱學(xué)習(xí)器結(jié)合創(chuàng)造一個(gè)強(qiáng)學(xué)習(xí)器的機(jī)器學(xué)習(xí)方法;XGBoost是一種改進(jìn)的梯度提升迭代決策樹(GBDT)算法。

2.4 模型評(píng)估

采取RMSE,R2和RPD三個(gè)指標(biāo)對(duì)反演模型進(jìn)行對(duì)比和評(píng)價(jià)。

poYBAGQbsk-AVbcYAAAYqOGNwY4539.png

pYYBAGQbslCADJpQAAEiJNOykM4286.png

結(jié)果與討論

3.1 原始光譜及數(shù)值統(tǒng)計(jì)分析

圖1為樣本水體的原始光譜曲線,水體在550~600nm的反射率較高,在700~750nm的反射率較低。從圖中可以看出每個(gè)水體樣本曲線的變化趨勢(shì)類似,沒有呈現(xiàn)較大的差異,而且難以直接通過光譜曲線對(duì)其COD含量進(jìn)行判斷。水體樣本的COD值統(tǒng)計(jì)結(jié)果如表1所示。

poYBAGQbslCAFGPfAAMTZxrnSnY079.png

圖1 水體樣本原始光譜反射率曲線

表1 COD含量描述統(tǒng)計(jì)分析

poYBAGQbslGAVcV6AABLGBFGjAQ784.png

圖 2 土壤樣本去包絡(luò)的反射率

3.2 光譜預(yù)處理結(jié)果

使用三種光譜預(yù)處理方法對(duì)原始光譜進(jìn)行預(yù)處理,預(yù)處理后的光譜分布如圖3(a,b,c)所示。經(jīng)過光譜預(yù)處理后,高光譜的數(shù)據(jù)質(zhì)量得到了一定改善,但還是無法直觀的從光譜曲線上判斷水體的COD含量,因此還需要通過機(jī)器學(xué)習(xí)方法對(duì)其建模進(jìn)行分析。

pYYBAGQbslKAJHyYAAISudVvB8k574.png

圖3 水體樣本預(yù)處理后的光譜分布

3.3 反演模型

對(duì)原始光譜數(shù)據(jù)和三種不同的預(yù)處理方法分別使用四種機(jī)器學(xué)習(xí)模型建模。模型的反演精度與建模的訓(xùn)練時(shí)間如表2—表5所示。由表2—表5中數(shù)據(jù)可以看到,XGBoost在原始光譜以及三種經(jīng)過預(yù)處理數(shù)據(jù)上的建模精度均優(yōu)于其他模型,且訓(xùn)練時(shí)間小于隨機(jī)森林模型以及Adaboost模型。線性回歸所建的反演模型表現(xiàn)較差,說明COD與光譜數(shù)據(jù)并沒有直接的線性關(guān)系。在所有的模型中,通過XGBooost對(duì)經(jīng)過SG平滑和MSC處理的數(shù)據(jù)所建的反演模型精度最高,其中R2為0.92,RMSE為7.1mg·L-1,RPD為3.4。通過不同預(yù)處理方式所得的XGBoost反演模型散點(diǎn)圖如圖4(a—d)所示。

poYBAGQbslOAP6rqAAIjgyjr5Jg098.png

poYBAGQbslOAMuvyAALUrSWmnzM928.png

圖4 不同預(yù)處理方法下XGBoost反演模型COD預(yù)測(cè)值與實(shí)測(cè)值關(guān)系散點(diǎn)圖

結(jié)論

在實(shí)際生產(chǎn)過程中可根據(jù)實(shí)際需求,綜合考慮模型精度?模型訓(xùn)練時(shí)間等因素進(jìn)行模型的選擇。研究結(jié)果表明,基于機(jī)器學(xué)習(xí)的高光譜COD反演模型精度可以達(dá)到較高水平,為機(jī)器學(xué)習(xí)在高光譜水質(zhì)監(jiān)測(cè)領(lǐng)域的應(yīng)用提供了參考。此外,機(jī)器學(xué)習(xí)模型可解釋性需要進(jìn)一步研究。

歡迎關(guān)注公眾號(hào):萊森光學(xué),了解更多光譜知識(shí)。

萊森光學(xué)(深圳)有限公司是一家提供光機(jī)電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應(yīng)用系統(tǒng)的研發(fā)、生產(chǎn)和銷售。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131842
  • 高光譜
    +關(guān)注

    關(guān)注

    0

    文章

    317

    瀏覽量

    9857
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    光學(xué)知識(shí)水體COD光譜特性分析

    有機(jī)污染物是引起水體污染的主要原因,對(duì)水質(zhì)、水中生物及生態(tài)平衡影響極為嚴(yán)重。由于有機(jī)污染物種類復(fù)雜,在水質(zhì)評(píng)價(jià)中多采用綜合性指標(biāo)來表征有機(jī)污染的程度。化學(xué)需氧量(COD)便是評(píng)價(jià)水體
    的頭像 發(fā)表于 04-12 10:40 ?1268次閱讀
    光學(xué)知識(shí)<b class='flag-5'>水體</b>COD<b class='flag-5'>光譜</b>特性分析

    水體參數(shù)光譜反演模型對(duì)比研究

    引言 經(jīng)濟(jì)的發(fā)展提升了人們的生活水平,但有時(shí)會(huì)對(duì)環(huán)境造成嚴(yán)重而不可逆的影響,其中水污染尤其嚴(yán)重。對(duì)水體而言,最嚴(yán)重的問題就是氮磷的超標(biāo)導(dǎo)致水體富營(yíng)養(yǎng)化,導(dǎo)致水中營(yíng)養(yǎng)元素過剩,引起水質(zhì)惡化。因此
    的頭像 發(fā)表于 04-17 16:47 ?1122次閱讀
    <b class='flag-5'>水體</b>參數(shù)<b class='flag-5'>高</b><b class='flag-5'>光譜</b><b class='flag-5'>反演</b><b class='flag-5'>模型</b><b class='flag-5'>對(duì)比</b><b class='flag-5'>研究</b>

    部署基于嵌入的機(jī)器學(xué)習(xí)模型

    1、如何在生產(chǎn)中部署基于嵌入的機(jī)器學(xué)習(xí)模型  由于最近大量的研究機(jī)器學(xué)習(xí)
    發(fā)表于 11-02 15:09

    光譜傳感器CASI與SASI支持下的水體精準(zhǔn)提取_張東輝

    光譜傳感器CASI與SASI支持下的水體精準(zhǔn)提取_張東輝
    發(fā)表于 03-19 19:04 ?1次下載

    機(jī)器學(xué)習(xí)在遙感光譜圖像中的應(yīng)用

    為了克服遙感光譜圖像中地面特征的自動(dòng)化和智能化分類困難,在遙感成像過程中逐漸引入機(jī)器學(xué)習(xí)方法。研究人員提出了基于支持向量機(jī)(SVM)、極值
    的頭像 發(fā)表于 10-16 15:43 ?5755次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>在遙感<b class='flag-5'>高</b><b class='flag-5'>光譜</b>圖像中的應(yīng)用

    機(jī)器學(xué)習(xí)中的無模型強(qiáng)化學(xué)習(xí)算法及研究綜述

    強(qiáng)化學(xué)習(xí)( Reinforcement learning,RL)作為機(jī)器學(xué)習(xí)領(lǐng)域中與監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)并列的第三種
    發(fā)表于 04-08 11:41 ?11次下載
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>中的無<b class='flag-5'>模型</b>強(qiáng)<b class='flag-5'>化學(xué)習(xí)</b>算法及<b class='flag-5'>研究</b>綜述

    模型化深度強(qiáng)化學(xué)習(xí)應(yīng)用研究綜述

    深度強(qiáng)化學(xué)習(xí)(DRL)作為機(jī)器學(xué)習(xí)的重要分攴,在 Alphago擊敗人類后受到了廣泛關(guān)注。DRL以種試錯(cuò)機(jī)制與環(huán)境進(jìn)行交互,并通過最大化累積獎(jiǎng)賞最終得到最優(yōu)策略。強(qiáng)化學(xué)習(xí)可分為無
    發(fā)表于 04-12 11:01 ?9次下載
    <b class='flag-5'>模型</b>化深度強(qiáng)<b class='flag-5'>化學(xué)習(xí)</b>應(yīng)用<b class='flag-5'>研究</b>綜述

    利用反射率、偏振度光譜特性進(jìn)行葉綠素濃度反演

    對(duì)于內(nèi)陸湖泊等二類水體,由于水體組成成分復(fù)雜,不同成分之間光譜特性的相互影響,使得單純的利用反射率光譜進(jìn)行遙感監(jiān)測(cè)出現(xiàn)了信息量不足的情況,導(dǎo)致所建立的葉綠素濃度
    發(fā)表于 05-12 10:43 ?1526次閱讀
    利用反射率、偏振度<b class='flag-5'>光譜</b>特性進(jìn)行葉綠素濃度<b class='flag-5'>反演</b>

    光譜遙感技術(shù)在懸沙水體研究中的應(yīng)用說明

    0引 ?言 水體中懸浮泥沙影響到水體的透明度和水色等光學(xué)性質(zhì),?還密切關(guān)系到河口海岸沖淤變化過程。采用光譜遙感技術(shù)獲得懸沙水體的反射
    的頭像 發(fā)表于 05-13 10:25 ?1266次閱讀
    <b class='flag-5'>高</b><b class='flag-5'>光譜</b>遙感技術(shù)在懸沙<b class='flag-5'>水體</b><b class='flag-5'>研究</b>中的應(yīng)用說明

    光譜遙感技術(shù)在地質(zhì)領(lǐng)域的應(yīng)用研究

    光譜遙感技術(shù)在地質(zhì)領(lǐng)域的應(yīng)用主要集中在地物分布反演方向。這一應(yīng)用是基于提取光譜影像中不同地物在不同波段對(duì)電磁波的不同反射率特征,并與實(shí)驗(yàn)室測(cè)量已知礦物得到的參照
    的頭像 發(fā)表于 05-17 10:16 ?2760次閱讀

    手持式地物光譜儀對(duì)水體葉綠素的光譜特性測(cè)試研究

    為什么用地物光譜儀對(duì)地物進(jìn)行測(cè)試? 對(duì)于地物的測(cè)試,傳統(tǒng)的方法有化學(xué)法等。隨著光譜學(xué)的發(fā)展,現(xiàn)在可以運(yùn)用光譜法去對(duì)地物進(jìn)行測(cè)試,獲取地物自身的信息。無論是植被、土壤、
    的頭像 發(fā)表于 07-03 15:51 ?947次閱讀
    手持式地物<b class='flag-5'>光譜</b>儀對(duì)<b class='flag-5'>水體</b>葉綠素的<b class='flag-5'>光譜</b>特性測(cè)試<b class='flag-5'>研究</b>

    機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的對(duì)比與區(qū)別

    機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的對(duì)比與區(qū)別? 機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘是當(dāng)前互聯(lián)網(wǎng)行業(yè)中最熱門的領(lǐng)域之一。雖然它們之間存在一些
    的頭像 發(fā)表于 08-17 16:11 ?1374次閱讀

    光譜技術(shù)估測(cè)煙草生化成分的機(jī)理和研究進(jìn)展

    ,同時(shí)篩選出一些監(jiān)測(cè)參數(shù),并建立了相應(yīng)的估算模型。煙草生化參數(shù)主要包括有:水分、色素、糖、N、P、K和微量元素等。在農(nóng)業(yè)遙感信息模型研究、作物冠層光譜、葉片
    的頭像 發(fā)表于 09-19 11:22 ?487次閱讀
    <b class='flag-5'>高</b><b class='flag-5'>光譜</b>技術(shù)估測(cè)煙草生化成分的機(jī)理和<b class='flag-5'>研究</b>進(jìn)展

    基于光譜的模擬壁畫鹽含量反演

    膨脹松弛,使得顏料表層出現(xiàn)酥堿、鹽霜,甚至發(fā)展為起甲、 脫落病害,造成壁畫的永久損傷。因此利用非接觸式的光譜技術(shù)對(duì)壁畫所含可溶性鹽進(jìn)行定量反演具有重要意義。
    的頭像 發(fā)表于 11-06 17:52 ?395次閱讀

    內(nèi)陸水體藻藍(lán)蛋白遙感反演研究進(jìn)展

    生物化學(xué)生態(tài)系統(tǒng)的平衡。在內(nèi)陸水體中浮游藻類,因其含有的色素可以捕獲太陽光并將其轉(zhuǎn)化成能量,充當(dāng)著一切能量的提供者。有研究表明,色素組成及其比例的不同是引起藻類間吸收光譜變化的主要原因
    的頭像 發(fā)表于 02-23 10:38 ?268次閱讀
    內(nèi)陸<b class='flag-5'>水體</b>藻藍(lán)蛋白遙感<b class='flag-5'>反演</b><b class='flag-5'>研究</b>進(jìn)展