基于無人機(jī)高光譜遙感的冬小麥全氮含量反演-萊森光學(xué)

引言
氮素是作物生長(zhǎng)發(fā)育最需要的營(yíng)養(yǎng)元素之一,對(duì)作物的光合作用和產(chǎn)量具有顯著影響。植株的全氮含量是表征作物氮素狀況的主要指標(biāo),因此有必要從植株氮素含量來評(píng)價(jià)作物氮素營(yíng)養(yǎng)狀況。作物氮素狀況的有效診斷需建立在對(duì)作物生長(zhǎng)特性和氮素水平實(shí)時(shí)監(jiān)測(cè)的基礎(chǔ)上。目前,測(cè)定作物氮含量的傳統(tǒng)方法主要依靠田間取樣和實(shí)驗(yàn)室化學(xué)分析。近年來,人們提出了利用葉綠素儀、葉綠素?zé)晒獾确椒▽?duì)植物氮素狀況進(jìn)行無損估測(cè)。然而,這些方法僅針對(duì)單個(gè)植株單個(gè)葉片點(diǎn)對(duì)點(diǎn)的監(jiān)測(cè),在實(shí)際應(yīng)用中難以反映作物植株的種群狀況。相比之下,無人機(jī)遙感近年來在精準(zhǔn)農(nóng)業(yè)領(lǐng)域得到了廣泛的應(yīng)用,能夠?qū)崿F(xiàn)對(duì)作物生長(zhǎng)狀況由點(diǎn)到面的監(jiān)測(cè),并能夠快速評(píng)估農(nóng)作物的空間差異性。無人機(jī)遙感平臺(tái)可以攜帶多光譜和高光譜傳感器,近十幾年來,高光譜遙感以其高分辨率、強(qiáng)連續(xù)性和海量信息獲取的優(yōu)勢(shì),進(jìn)一步推動(dòng)了定量農(nóng)業(yè)遙感的發(fā)展。結(jié)合無人機(jī)高光譜遙感技術(shù)提取小麥長(zhǎng)勢(shì)信息已經(jīng)逐漸成為國(guó)內(nèi)外學(xué)者研究熱點(diǎn)。Xia等利用該技術(shù)從高光譜數(shù)據(jù)中選取歸一化差異植被指數(shù)(NDVI)和比值植被指數(shù)(RVI)構(gòu)建了冬小麥生物量遙感反演模型。從無人機(jī)影像提取出來的植被指數(shù)可以提取小麥籽粒產(chǎn)量信息,支持向量回歸(SVR)結(jié)合順序前向選擇(SFS)技術(shù)能夠較好的用于提取籽粒信息。Liu等利用無人機(jī)高光譜數(shù)據(jù)和實(shí)測(cè)高光譜數(shù)據(jù)計(jì)算光譜指標(biāo),構(gòu)建了用于反演不同生育期的冬小麥葉片含氮量(LNC)的反演模型并分析了LNC與光譜反射率的相關(guān) 性。Wang等針對(duì)江蘇北部某實(shí)驗(yàn)點(diǎn)小麥拔節(jié)、孕穗期和開花3個(gè)生育階段的葉片葉綠素進(jìn)行了反演并發(fā)現(xiàn)與支持向量回 歸(SVR)和反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)相比,基于隨機(jī)森林(RF)算法的葉綠素反演模型有較好的預(yù)測(cè)效果。在同一生育期,不同施肥處理的冬小麥光譜特征存在顯著差異,因此,有必要引入適用于不同肥力條件下的具有較強(qiáng)泛化能力的算法構(gòu)建冬小麥全氮含量遙感反演模型。近年來,集成學(xué)習(xí)作為一種新的機(jī)器學(xué)習(xí)范式,通過增加學(xué)習(xí)器數(shù)目提高了其化能力并被廣泛應(yīng)用于解決各類回歸問題。本研究以位于安徽蒙城的農(nóng)業(yè)部蒙城砂姜黑土生態(tài)環(huán)境站內(nèi)冬小麥為研究對(duì)象,基于無人機(jī)高光譜遙感數(shù)據(jù)和田間采樣數(shù)據(jù),采用梯度提升樹類集成學(xué)習(xí)算法構(gòu)建不同土壤肥力條件下拔節(jié)期冬小麥全氮含量遙感反演模型,提取不同肥力條件的田塊冬小麥全氮含量信息,以期為其田間施肥管理提供科學(xué)參考。
實(shí)驗(yàn)部分
2.1 研究區(qū)及概況
以安徽蒙城的農(nóng)業(yè)部蒙城砂姜黑土生態(tài)環(huán)境站(116°37′ E,33°13′N)為研究區(qū)(如圖1)。本站位于安徽北部平原區(qū), 屬于暖溫帶半濕潤(rùn)季風(fēng)氣候,年平均氣溫14.8℃,無霜期 212d,年降水量600~900mm。試驗(yàn)土為常見的普通砂姜黑土。試驗(yàn)站始于1982年。試驗(yàn)開始時(shí)耕層土壤(0~20cm)的肥力性狀為:有機(jī)質(zhì)10.4g·kg-1,全 氮0.96g·kg-1,堿 解氮84.5mg·kg-1,全磷0.28g·kg-1,有效磷9.8mg· kg-1。設(shè)置7種不同的施肥處理,分 別為撂荒、不施肥、施氮磷鉀化肥、氮磷鉀+低量麥秸、氮磷鉀+全量麥秸、氮磷鉀+豬糞、氮磷鉀+牛糞。全部肥料于秋季小麥種植整地前 一次性施入各處理小區(qū),人工或機(jī)械耕翻,與土壤充分 混勻。長(zhǎng)期以來,形成了具有較大肥力差異的小麥種植田塊。
2.2 數(shù)據(jù)獲取
使用的數(shù)據(jù)包括無人機(jī)高光譜成像數(shù)據(jù)和小麥全氮含量數(shù)據(jù)。如圖1,在研究區(qū)域試驗(yàn)田內(nèi)均勻地布設(shè)126個(gè)采樣點(diǎn),每個(gè)采樣點(diǎn)取3-5株小麥,封裝保鮮帶回實(shí)驗(yàn)室。將植株樣品置于70℃干燥箱內(nèi)恒溫干燥,粉碎,使用凱氏定氮法測(cè)定小麥全氮含量。對(duì)于每個(gè)采樣點(diǎn),?。场抵晷←湹木底鳛樵擖c(diǎn)全氮含量。計(jì)算公 式如式(1)
N=(V ×0.05×14×100)/(1000×M) (1)
式(1)中:N為全氮含量(%);V為鹽酸體積變量(mL);M為樣品質(zhì)量(g)。

圖1 研究區(qū)域試驗(yàn)田分布
?
2.3 數(shù)據(jù)預(yù)處理
無人機(jī)高光譜圖像的處理包括以下步驟:第一是鏡頭校正,消除 圖像畸變;第二步,輻射定標(biāo),將數(shù)字灰度值轉(zhuǎn)換為反射率;然后進(jìn)行大氣校正,以消除大氣、水汽等因素的影響。通過軟件對(duì)多景遙感影像進(jìn)行拼接;最后,從每個(gè)田塊中提取感興趣區(qū)域的平均光譜。因此,每個(gè)田塊在176個(gè)波段都有對(duì)應(yīng)的平均譜,作為模型輸入的自變量,這里將整個(gè)大田均勻地劃分成了126個(gè)田塊。對(duì)于小麥全氮含量實(shí)測(cè)數(shù)據(jù),為避免異常值對(duì)建模產(chǎn)生影響,去除了異常實(shí)測(cè)值。
2.4 方法
XGBoost是由陳天奇等改進(jìn)的一種GBDT算法,它與GBDT算法有較多不同點(diǎn),比如在優(yōu)化時(shí),GBDT僅僅用到了一階導(dǎo)數(shù),XGBoost則另外引入了二階導(dǎo)數(shù)對(duì)損失函數(shù)進(jìn)行調(diào)優(yōu);在目標(biāo)函數(shù)里,XGBoost算法為了避免過擬合現(xiàn)象,將樹模型復(fù)雜度作為正則項(xiàng)。此外,XGBoost在訓(xùn)練過程中參考了隨機(jī)森林的思想,每次迭代過程中不使用全數(shù)樣本,且不采用樣本的所有特征,而是有選擇地采取部分樣本的部分特征進(jìn)行訓(xùn)練,這樣可有效提高模型的泛化能力,削弱模型欠擬合和過擬合現(xiàn)象,而且XGBoost算法支持并行計(jì)算以提高運(yùn)行速度。該算法原理是將原始數(shù)據(jù)集分割成多個(gè)數(shù)據(jù)子集,將每個(gè)子集隨機(jī)地分配給基學(xué)習(xí)器進(jìn)行預(yù)測(cè),然 后將基學(xué)習(xí)器的結(jié)果按照一定的權(quán)重進(jìn)行計(jì)算,從而預(yù)測(cè)最后的結(jié)果。圖2為整體實(shí)驗(yàn)的技術(shù)路線圖,分為3個(gè)步驟。第一步,構(gòu)建模型訓(xùn)練集,將176個(gè)波段的光譜反射率信息作為模型輸入的自變量,實(shí)測(cè)全氮含量數(shù)據(jù)作為模型因變量,隨機(jī)選取70%的采樣點(diǎn)的數(shù)據(jù)作為訓(xùn)練集并對(duì)自變量進(jìn)行歸一化處理;第二步,反演模型 構(gòu)建與驗(yàn)證,采用貝葉斯優(yōu)化算法對(duì)模型進(jìn)行超參數(shù)調(diào)優(yōu),該優(yōu) 化方法可以看做一個(gè)高斯過程,考慮了先驗(yàn)參數(shù)信息且不斷更新知識(shí)而傳統(tǒng)的網(wǎng)格搜索或隨機(jī)不考慮先驗(yàn)參數(shù)信息。此外,貝葉斯優(yōu)化方法迭代次少運(yùn)行速度快,可以優(yōu)化XGBoost這種具有多個(gè)參數(shù)的算法,表1為本研究中XGBoost遙感反演模型中關(guān)鍵超參數(shù)的含義及其調(diào)優(yōu)后的結(jié)果,其他參數(shù)設(shè)置為默認(rèn)值。利用30%的驗(yàn)證集數(shù)據(jù)進(jìn)行模型驗(yàn)證和精度評(píng)估,第三步,基于第二步構(gòu)建好的全氮含量遙感反演模型預(yù)測(cè)大田小麥的全氮含量,提取無人機(jī)高光譜影像上所有像元的光譜反射率信息作為模型的輸入,輸出預(yù)測(cè)的全氮含量并成圖。

圖2基于XGBoost模型的冬小麥全氮含量 遙感預(yù)測(cè)技術(shù)路線圖
表1 XGBoost模型中一些超參數(shù)的含義及其最優(yōu)值

結(jié)果與討論
3.1 模型反演精度分析
在長(zhǎng)期定位試驗(yàn)下,不同的肥料處理導(dǎo)致不同田塊上的土壤肥力存在顯著差異,田塊間冬小麥的長(zhǎng)勢(shì)存在顯著差異,其葉片光合作用性能不同,故其對(duì)光的吸收和反射也不同,如圖3所示,不同田塊冬小麥冠層光譜特征呈現(xiàn)出顯著差異。為了篩選出用于構(gòu)建該區(qū)域冬小麥全氮含量遙感反演的敏感波段,首先對(duì)光譜反射率和實(shí)測(cè)全氮含量進(jìn)行了相關(guān)性分析,計(jì)算了全氮含量與各波段光譜反射率之間的皮爾遜相關(guān)系數(shù)。由圖4可知,總體上各波段反射率與冬小麥全氮含量之間存在較高的相關(guān)性,在各波段的絕對(duì)相關(guān)系數(shù)均值 達(dá)0.732。在波長(zhǎng)為795.3nm時(shí),全氮含量與該波段相關(guān)性達(dá)到最大值,為0.794。波長(zhǎng)小于735.5nm時(shí),各波段的光譜反射率與全氮含量均成負(fù)相關(guān);波長(zhǎng)大于等于735.5nm 時(shí),各波段

圖3 不同田塊冬小麥冠層光譜圖

圖4 光譜反射率與全氮含量之間的相關(guān)系數(shù)
的光譜反射率與全氮含量均成正相關(guān)。當(dāng)波長(zhǎng)為735.5nm時(shí),反射率與全氮含量之間的相關(guān)性最低,為0.232,其余波段的相關(guān)系數(shù)絕對(duì)值均高于0.5,這可能是由于各田塊在該波段上的光譜反射率幾乎一致(圖3),故各田塊在該波段上無光譜差異性。因此,本研究不采用全波段作為建模的自變量,采用了除735.5nm波段以外的所有波段作為模型輸入自變量,使用XGBoost方法構(gòu)建冬小麥全氮含量遙感反演模型,模型驗(yàn)證精度使用決定系數(shù)R2、均方根誤差和平均絕對(duì)百分比誤差作為評(píng)價(jià)指標(biāo),其中,MAPE用來評(píng)價(jià)模型預(yù)測(cè)結(jié)果的相對(duì)誤差。由圖5可知,XGBoost模型預(yù)測(cè)的和實(shí)測(cè)的小麥全氮含量較為接近,模型反演精度較高,R2達(dá)到 0.76,RMSE值較低,僅為2.68,MAPE值也較低,為11.8%,這說明XGBoost算法具有相對(duì)較強(qiáng)的學(xué)習(xí)性能,可以應(yīng)用于構(gòu)建冬小麥全氮含量遙感反演模型。

圖5 XGBoost模型反演的與實(shí)測(cè)全氮含量之間的散點(diǎn)圖
3.2 TNC預(yù)測(cè)結(jié)果分析
基于XGBoost算法的拔節(jié)期冬小麥全氮含量反演模型具有較好的驗(yàn)證精度,現(xiàn)將該模型應(yīng)用到整片小麥大田上, 提取出不同土壤肥力條件下的小麥大田影像上所有像元在176個(gè)波段的反射率,輸入該反演模型進(jìn)行預(yù)測(cè)整片小麥大田的全氮含量。
由圖6可知,XGBoost模型預(yù)測(cè)的拔節(jié)期冬小麥全氮含量總體上呈現(xiàn)較為顯著的空間分布差異,這是由長(zhǎng)期試驗(yàn)不同田塊不同的土壤肥力導(dǎo)致,該算法具有較強(qiáng)的泛化能力,構(gòu)建的遙感反演模型適用于預(yù)測(cè)不同土壤肥力條件的整片大田的冬小麥全氮含量空間分布。模型預(yù)測(cè)的冬小麥(拔節(jié)期)全氮含量范圍介于14%~29%之 間,平均全氮含量為19.66%。
3.3 冬小麥全氮含量與土壤全氮含量相關(guān)性分析
針對(duì)長(zhǎng)期定位試驗(yàn)下,不同壤肥力的田塊上的冬小麥全氮含量進(jìn)行了遙感反演研究,由2.2節(jié)研究發(fā)現(xiàn),在不同土壤肥力的田塊,冬小麥的全氮含量存在顯著空間分布差異性,這是由于土壤養(yǎng)分對(duì)冬小麥長(zhǎng)勢(shì)有著一定的影響。因 此,本節(jié)針對(duì)冬小麥全氮含量與土壤全氮含量進(jìn)行了相關(guān)性分析。如圖7所示,冬小麥全氮含量與土壤全氮含量之間存在著較為顯著的相關(guān)性,其中,冬小麥全氮含量范圍為12%~32%,土壤全氮含量范圍為29%~55%,兩者之間的決定系數(shù)(R2)為0.47。

圖6 XGBoost反演模型預(yù)測(cè)的TNC空間分布圖

圖7 冬小麥全氮含量與土壤全氮含量之間的相關(guān)性
4、結(jié)論
(1)基于XGBoost算法,結(jié)合無人機(jī)高光譜遙感數(shù)據(jù)和田間采樣冬小麥全氮含量數(shù)據(jù)可以構(gòu)建全氮含量遙感反演模型,模型驗(yàn)證精度較高。
(2)在不同土壤肥力的田塊,XGBoost模型預(yù)測(cè)的拔節(jié)期冬小麥全氮含量呈現(xiàn)較為顯著的空間分布差異,平均全氮含量為19.66%。
(3)冬小麥全氮含量與土壤全氮含量之間存在著較為顯著的相關(guān)性,兩者之間的決定系數(shù)(R2)為0.47。
歡迎關(guān)注公眾號(hào):萊森光學(xué),了解更多光譜知識(shí)。
萊森光學(xué)(深圳)有限公司是一家提供光機(jī)電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應(yīng)用系統(tǒng)的研發(fā)、生產(chǎn)和銷售。