高光譜成像技術(shù)鑒別菠菜葉片農(nóng)藥殘留種類-萊森光學
菠菜是我國普遍栽培的品種,為極常見的蔬菜之一,以其鮮、嫩的品質(zhì)以及較高的營養(yǎng)價值,深受廣大消費者喜愛,市場需求量大且較容易種植,具有很好的經(jīng)濟價值。在菠菜的生長過程中,有的農(nóng)戶為保證其免受各種病蟲害影響,會使用多種農(nóng)藥或殺蟲劑,農(nóng)藥大部分都殘留在菠菜葉子上,即使采取專業(yè)的清洗也難以消除其表面的農(nóng)藥。更可怕的是有些農(nóng)戶在剛打完藥后沒多久就采摘進行銷售,這樣就會進一步增加農(nóng)藥殘留的量,長期食用含有農(nóng)藥殘留的蔬菜,會誘發(fā)各種疾病,甚至可能導致癌癥和基因突變。菠菜中的農(nóng)藥殘留是否達標是評判菠菜質(zhì)量的關(guān)鍵因素之一,而農(nóng)藥殘留檢測中鑒別有無農(nóng)藥殘留及農(nóng)藥殘留的種類是農(nóng)藥殘留檢測的前提。果蔬表面的農(nóng)藥殘留檢測有許多成熟可行的方法,例如:?氣相色譜法和高效液相色譜法,但這些方法有檢測時間長、需要依賴化學試劑、對樣品有一定的損壞、操作復雜等缺點。

研究表明,高光譜成像技術(shù)被廣泛用于農(nóng)產(chǎn)品品質(zhì)檢測,但將高光譜成像技術(shù)結(jié)合特征選擇算法和多種分類建模算法用于菠菜葉片表面多種類農(nóng)藥鑒別的研究未見報道。本文以不含農(nóng)藥的菠菜葉片及分別含有常用4?種農(nóng)藥(?菊酯、樂果、滅多威、辛硫磷)?殘留的菠菜葉片為研究對象,利用高光譜成像技術(shù)、光譜預處理技術(shù)、主成分分析技術(shù)、卡方檢驗特征提取算法和分類機器學習算法對菠菜葉片農(nóng)藥殘留種類鑒別進行研究,并結(jié)合?10?折交叉驗證技術(shù)選擇出了最佳特征波段和分類模型,減少了模型的運行時間,實現(xiàn)了快捷無損識別出菠菜葉片上的農(nóng)藥殘留種類。
1實 驗
1.1材 料
實驗用的菠菜購于北京某批發(fā)市場,實驗農(nóng)藥為:?氯氰菊酯、樂果、滅多威和辛硫磷。對樂果農(nóng)藥,用蒸餾水將其配置成?1∶?500?的溶液;?由于氯氰菊酯、滅多威和辛硫磷這?3?種農(nóng)藥難溶于水,所以用甲醇分別將其配置成?1∶?500?的溶液。甲醇作為一種溶解劑被添加進來,它可能會影響到含有農(nóng)藥葉片的真實光譜信息,但其作為背景因素對農(nóng)藥殘留種類的判別影響很小。如圖?1?為只噴灑甲醇的菠菜葉片的平均光譜曲線。把同濃度的農(nóng)藥和蒸餾水均勻噴灑到?125?個菠菜葉片表面,每種類噴灑?25?個葉片,將葉片放置?12?h?后晾干,采集高光譜圖像。

圖?1?噴灑甲醇后菠菜葉片的平均光譜曲線
1.2?高光譜數(shù)據(jù)采集與校正
采集高光譜數(shù)據(jù)時,將樣品放置于電動平移臺上,為了得到清晰的圖像需要多次的相機調(diào)焦和平臺運動速度的調(diào)整,經(jīng)過多次調(diào)試,最終確定平臺的運動速度為?0.?3?cm/s,曝光時間?0.?08?s。采集到的高光譜成像數(shù)據(jù)為樣品的光譜數(shù)據(jù)和圖像數(shù)據(jù)組成的三維數(shù)據(jù)立方體,為了盡可能降低圖像噪聲和暗電流的影響,需要將采集的原始高光譜圖像進行黑白校正,在采集高光譜數(shù)據(jù)時將相機對準白板采集的數(shù)據(jù)為?W,蓋上?CCD?相機鏡頭采集的數(shù)據(jù)為?D,其校正公式為

式中:?R?為校正后的高光譜圖像;?I?為原始高光譜圖像;?D?為全黑的標定圖像;?W?為全白的標定圖像。校正的工具為高光譜系統(tǒng)自帶的軟件?Spec?VIEW。后續(xù)所用到的分析軟件包括:?Matlab?2016b、Envi5.?1、IBM?SPSS?Statistics?22.0?和?python3.6。
2結(jié)果與討論
2.1?樣品光譜曲線分析
首先利用?Envi5.1?軟件選取菠菜葉片上的感興趣區(qū)域(?Region?of?interest,ROI)?,為了充分利用每個菠菜樣品同時增加模型訓練樣本數(shù),每個菠菜葉片樣品選取?4?個?ROI,ROI?的選取避開主莖干,選取?ROI?的位置如圖?2?所示。ROI選取的像素點數(shù)為?50?個,計算出?ROI?內(nèi)像素點光譜的平均值,以該平均值作為該樣品其中的一條光譜記錄,最后一共搜集到?500?條光譜曲線,每類樣品100?條。為了清晰分辨出不同種類的樣本之間的光譜信息差異,對每類樣品?100?條光譜曲線求平均,平均光譜曲線如圖?3?所示。從圖?3?中可以看出,不同種類農(nóng)藥殘留的菠菜葉片光譜反射率有一定的差異,與正常葉片不同,滴過農(nóng)藥的葉片的光譜反射率在某些波段明顯低于正常葉片,而不同種類的農(nóng)藥殘留葉片光譜反射率也有一定的差異。目前已有相關(guān)研究表明:?農(nóng)藥脅迫會導致植物的某些生理生化指標(?如植物內(nèi)部的組織形態(tài)、葉綠素、可溶性多糖等)?發(fā)生改變,這些改變將會影響近紅外波段的植被反射率,所以可以利用光譜信息來判別菠菜是否有農(nóng)藥殘留及殘留農(nóng)藥的種類。

圖?3?無殘留和不同種類農(nóng)藥殘留菠菜葉片表面?ROI?平均光譜曲線
?
2.2?菠菜葉片?ROI?光譜信息預處理
在菠菜葉片高光譜數(shù)據(jù)的采集過程中,所測樣品的色澤差異、葉片表面的不平整性、葉片的水分含量以及質(zhì)地不完全相同等因素可能會引起樣品發(fā)生散射現(xiàn)象進而掩蓋與農(nóng)藥相關(guān)的光譜信息。農(nóng)藥殘留分析屬于痕量分析的一種,因此由于散射所引起的光譜差異可能會大于農(nóng)藥種類不同所引起的光譜差異,所以需要用多元散射校正算法(?Multiplicative?scatter?correction,MSC)?對原始光譜曲線進行校正,MSC?可以消除漫反射光譜的基線漂移,對樣品不均勻性造成的噪聲也有較好的效果,經(jīng)過散射校正后能最大程度消除光譜散射的影響。校正前后光譜曲線的對比如圖?4所示。

圖?4?原始光譜曲線(?a)?和?MSC?校正后的光譜曲線(?b)
2.3?基于主成分投影的樣品識別
主成分分析?(?Principal?components?analysis,PCA)?是通過線性數(shù)據(jù)轉(zhuǎn)換的方法提取最重要的信息,從而降低數(shù)據(jù)的維度,被廣泛應用于高光譜數(shù)據(jù)降維和分析中。在本文中,利用?PCA?對不同菠菜樣品的光譜數(shù)據(jù)進行可視化判別,如圖5?所示,前兩個主成分的累計貢獻率達到了?96.?5%?,故用前?2?個主成分能較好地表示出原來的高維光譜數(shù)據(jù),從圖中可以看出在經(jīng)過多元散射校正后不同種類菠菜樣品光譜數(shù)據(jù)分布差異明顯,因此,PCA?可以更直觀地對五類菠菜樣品進行定性識別。但?PCA?是無監(jiān)督算法,它分析出來的結(jié)果只和樣品的光譜數(shù)據(jù)有關(guān)而和樣品的類別無關(guān),那些貢獻率小的主成分對于葉片殘留農(nóng)藥種類的鑒別也可能很重要,經(jīng)過?PCA?降維后的數(shù)據(jù)也失去了原數(shù)據(jù)的意義,不適合用于日后在線分析檢測的研制。綜上,有必要使用有監(jiān)督的學習算法對其進行研究。

圖5?含有不同種類農(nóng)藥殘留菠菜樣品的高光譜數(shù)據(jù)?PCA?分析
?
2.4?最佳波段和分類模型
本研究中需要處理的菠菜葉片的高光譜圖像的特征維數(shù)高達?256?維,有必要對其進行特征選擇以剔除冗余的特征,從而減少模型的運行時間,為日后在線檢測設備的研制提供便利。為了選擇出最優(yōu)的特征波長子集和分類預測模型,本文嘗試了統(tǒng)計學上的卡方檢驗特征選擇方法并結(jié)合常用的4?種?機?器?學?習?分?類?算?法,分?別?為:?支?持?向?量?機(?Support?vector?machine,SVM)?、樸素貝葉斯模型(?Naive?bayesian?model,NBM)?、決策樹(?Decision?tree)和線性判別分析(?Linear?discriminant?analysis,LDA)???ǚ綑z驗(?Chi-squared?test)?是分類問題常用的特征選擇方法之一,該方法采用了統(tǒng)計學上的卡方檢驗,需要計算并排序各維特征與類別間的相關(guān)程度,然后只保留最相關(guān)的?k?維特征,k?可由程序設定。為了增加模型的穩(wěn)定性,采用了?10?折交叉驗證的方法對樣本進行劃分訓練集和測試集,取?10?次交叉驗證預測準確率的平均值和標準差對模型進行評估。如圖6中實心淺藍線和實心紅線所示,紅線的長度代表標準差的大小,標準差為?0?時紅線消失,結(jié)合模型的預測準確率和選擇的波長個數(shù),藍色虛線畫出了各個模型的最優(yōu)參與分類的特征個數(shù)占總特征個數(shù)的百分比,具體的波長選擇結(jié)果及模型的預測性能如表?1?所示。

圖?6?卡方檢驗結(jié)合不同分類模型預測結(jié)果示意圖。(?a)?卡方檢驗結(jié)合支持向量機;?(?b)?卡方檢驗結(jié)合樸素貝葉斯;?(?c)卡方檢驗結(jié)合線性判別分析;?(?d)?卡方檢驗結(jié)合決策樹。
注:?圖中橫坐標為卡方檢驗篩選出的變量個數(shù)百分比,縱坐標為該模型預測的準確率。
表?1?波長的選擇結(jié)果及模型的預測性能

從表?1?的分析可以得出,Chi-squared?test?結(jié)合?LDA?的判別模型相比其他模型選出的特征子集的個數(shù)最少,選擇波長的范圍為?1?439.3?~1?462?nm共?8?個波長,分別為:?1?439.3,1?442.?5,1?445.8,1?449,1?452.3,1?455.5,1?458.7,1?462nm,預測的準確率達到?0.993,預測準確率的標準差?為?0.009,故?可?認?為?Chi-squared?test?結(jié)?合LDA?的判別模型為判別菠菜葉片上的農(nóng)藥殘留種類的最佳模型。
3結(jié)??論
基于高光譜成像系統(tǒng)利用?PCA?對菠菜葉片上的農(nóng)藥殘留種類進行可視化的判別分析,結(jié)果表明?PCA?可以直觀地對菠菜葉片上的農(nóng)藥殘留種類進行定性識別。PCA?雖然有比較直觀的優(yōu)點,但對本研究也有不利的地方,基于此,采用了Chi-squared?test?結(jié)合常用的?4?種分類建模算法篩選出了最佳波段和最優(yōu)的?LDA?判別模型。篩選出的?8?個特征波長為:?1?439.?3,1?442.?5,1?445.?8,1?449,1?452.?3,1?455.?5,1?458.?7,1?462?nm,縮短了模型的運行時間。將這?8?個特征波長代入?LDA模型結(jié)合?10?折交叉驗證技術(shù),預測準確率達到0.?993?且?10?次交叉驗證的標準差為?0.?009。本研究中,從將準備好的樣品送進實驗室開始到檢測結(jié)束,平均每個樣品花費時間?2?min?左右,未來可考慮將實驗流程實現(xiàn)自動化從而進一步提高檢測效率。本研究可基于高光譜成像技術(shù)、光譜預處理多元散射校正技術(shù)、Chi-squared?test?特征選擇算法和分類建模算法準確鑒別出菠菜葉片表面的農(nóng)藥殘留種類,為菠菜葉片的農(nóng)藥殘留種類在線檢測提供了參考。
萊森光學(LiSen Optics)作為世界領(lǐng)先的光譜學解決方案提供商,是一家提供光機電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應用系統(tǒng)的研發(fā)、生產(chǎn)和銷售。致力于為客戶提供高品質(zhì)、專業(yè)化、精細化的光電技術(shù)服務。憑借著在光學行業(yè)中豐富的經(jīng)驗,我們能夠為每一位客戶“量身定做”滿足個性化需求的光機電一體化解決方案。