最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

小波變換在腦電數(shù)據(jù)處理中的特征工程

2023-03-26 11:30 作者:茗創(chuàng)科技  | 我要投稿

導讀

在生物信號中,高效的特征工程和特征提取(FE)是獲得最優(yōu)結(jié)果的必要條件。特征可以從時域、頻域和時頻域三個方面進行提取。時頻域特征是最先進的特征,在大多數(shù)基于人工智能的信號分析問題中表現(xiàn)良好。本文介紹了小波散射變換(WST)在神經(jīng)疾病分類中的應用,并對連續(xù)小波變換(CWT)和離散小波變換(DWT)在精神分裂癥分類中的應用進行了比較研究。本研究是最早將WST應用于腦電數(shù)據(jù)以分類神經(jīng)系統(tǒng)疾病的研究之一。本研究在將數(shù)據(jù)發(fā)送給分類器進行分類之前,還從數(shù)據(jù)中提取了12個統(tǒng)計特征。本研究從核心/傳統(tǒng)機器學習(ML)(邏輯回歸和支持向量機)和集成學習(EL)(決策樹,隨機森林,自適應增強和梯度提升)兩大類中構(gòu)建了6種機器學習算法??偣策M行了18個實驗,研究結(jié)果發(fā)現(xiàn),當從CWT和DWT中提取特征時,集成方法表現(xiàn)更好。同時,當從WST中提取特征時,傳統(tǒng)ML方法優(yōu)于EL方法。SVM總體性能較好,但決策樹的結(jié)果最佳。97.98%,98.2%,97.72%,95.94分別為準確度、靈敏度、特異度和Kappa值,執(zhí)行時間為48.04s;本研究所提方法的性能優(yōu)于報道的最先進的方法。

引言

據(jù)研究,盡管現(xiàn)有的臨床和技術(shù)干預措施取得了重大進展,但精神障礙患者的現(xiàn)實生活功能仍有損傷,并且護理需求未得到滿足。在神經(jīng)計算功能的精神保健方面,有許多非侵入性腦成像技術(shù)(BIT)可用,例如功能磁共振成像(fMRI),計算機斷層掃描(CT),正電子發(fā)射斷層掃描(PET),腦電圖(EEG)和腦磁圖(MEG),功能近紅外光譜(fNIRS)等。EEG因其無創(chuàng)、便攜、經(jīng)濟、良好的噪聲信噪比等特點而成為最好的BIT之一。大腦信號總是由幾種基本頻率混合而成;根據(jù)頻率范圍或頻段的不同,這些信號值大致分為五種類型:delta(1-4Hz),theta(4-7Hz),alpha(7-12Hz),beta(13-30Hz)和gamma(>30Hz),這些值可能因研究問題的不同而略有變化。由于不同的頻段與不同的疾病相關(guān),因此這些頻段在研究各種腦部疾病中起著至關(guān)重要的作用。它們被用于測量大腦活動并研究中樞神經(jīng)系統(tǒng)的結(jié)構(gòu)和功能。本文主要關(guān)注從腦電圖設(shè)備收集的信號。在這里,我們可以看到實時呈現(xiàn)的大腦活動,并且可精確到千分之一秒,同時可以找到電極位置和PSD。
許多研究人員已將腦電信號用于各種腦部疾病的診斷,如精神分裂癥(SZ)檢測、帕金森病、癲癇發(fā)作檢測、情緒分類、睡眠障礙,以及腦機接口(BCI)的發(fā)展等。本研究致力于對精神分裂癥的探索,因為它是全球每300人中就有1人(0.0032%)的主要精神問題之一,這在成年人中更加令人擔憂,每222人中就有1人(0.0045%)。這一領(lǐng)域的任何貢獻對廣大群眾都是非常有益的。SZ是一種嚴重的精神病性神經(jīng)障礙,SZ患者會出現(xiàn)不同類型的妄想、幻覺、思維障礙、行為紊亂、易激惹等。它可能會導致一種幻覺和高度紊亂的思維,影響日常功能甚至致殘。這些人通常在認知或思維能力方面存在困難,比如解決問題和記憶注意力。NIMHANS近年來進行的一項全國心理健康調(diào)查(2015-2016)報告稱,印度人目前的精神分裂癥患病率為0.5%,終身患病率為1.4%。這種疾病的發(fā)病主要見于青春期末和二十多歲的人群。SZ患者的死亡時間可能比正常人早2~3倍。這種疾病通常始于青春期晚期或成年早期。精神分裂癥與幾個關(guān)鍵大腦系統(tǒng)的結(jié)構(gòu)和功能變化有關(guān),包括分別參與工作記憶和陳述性記憶的前額葉和內(nèi)側(cè)顳葉區(qū)域。這種腦部疾病可以通過研究腦成像技術(shù)(BIT)來檢測和診斷。

特征提取

特征提取是將原始數(shù)據(jù)轉(zhuǎn)換為可處理的數(shù)值特征,同時保留原始數(shù)據(jù)集中的信息的過程。對于任何基于ML的解決方案,特征提取在獲得最佳結(jié)果方面起著至關(guān)重要的作用,將ML應用于不同神經(jīng)系統(tǒng)疾病的生物信號也是如此。從數(shù)據(jù)中選擇適當?shù)奶卣魇侵陵P(guān)重要的一步,良好的特征提取可以在任何疾病的分類和預測中獲得更好的結(jié)果。特征表示從模式部分獲得的獨特屬性、可識別的度量和功能組件。提取的特征旨在優(yōu)化嵌入在信號中的重要信息的丟失。此外,它們還用于降維,從而減少準確描述大量數(shù)據(jù)所需的計算資源。根據(jù)分析和提取特征的領(lǐng)域不同,特征提取方法大致可以分為以下三類:
①時域特征提取當對信號、數(shù)學函數(shù)或時間序列數(shù)據(jù)進行時間分析時,這被稱為時域分析。它涵蓋了主成分分析(PCA),線性判別分析(LDA),獨立成分分析(ICA),經(jīng)驗模態(tài)分解(EMD)等技術(shù)。

②頻域特征提取

在頻域方法中,對信號、數(shù)學函數(shù)或時間序列數(shù)據(jù)進行頻率而不是時間分析。傅里葉變換(FT)、短時傅里葉變換(STFT)、功率譜密度(PSD)、移動平均線(MA)、自回歸(AR)、自回歸移動平均線等都是頻域特征的例子。

③時頻域特征提取

時頻域方法將時域和頻域方法相結(jié)合,克服了時域和頻域方法的局限性。時頻分析同時涉及時間和頻率的信號。時頻域分析包括基于頻譜圖的特征、基于小波分析的特征、短時傅里葉變換等。小波方法是時頻域特征提取方法中應用最為廣泛的一種方法。小波方法主要有兩種類型:連續(xù)小波變換(CWT),離散小波變換(DWT),但這些方法有許多變體,WST、FBSE-EWT只是少數(shù)幾種。

小波方法

小波相較于以往傳統(tǒng)方法的主要優(yōu)勢是:WT將復雜的信息片段(如音樂、語音、圖像、模式等)分解成不同位置和尺度的基本形式,并對其進行高精度的重建。另外,小波方法在分析非平穩(wěn)信號方面具有很好的優(yōu)勢,而且小波在時域和頻域中都有很好的局域性。WTs具有良好的多分辨率適應能力,非常適合于動態(tài)結(jié)構(gòu)信號的分解和去噪。小波變換,將定義在時域的函數(shù)映射為具有時間尺度表征的函數(shù)。也就是說,小波變換是一維函數(shù)的二維表征。小波分析以母小波為中心,母小波是一個基本小波,通常由希臘字母upsilon(ψ)表示。小波函數(shù)的能量通常為1。小波變換可以呈現(xiàn)具有良好時間分辨率或頻率分辨率的信號。小波變換大致可以分為兩種類型:可逆變換和不可逆變換??赡孀儞Q在變換后可以很容易地恢復。不可逆小波是為信號分析而設(shè)計的,適用于研究生物醫(yī)學信號(如EEG、MEG、ECG等)、從傳感器測量中檢測機械故障,以及研究頻率內(nèi)容如何隨時間的變化而變化。與可逆小波變換相比,它需要更多的計算時間。本研究將研究三種類型的小波變換:

①連續(xù)小波變換(CWT)

連續(xù)小波變換用于將信號分解為小波,這些小波是高度局域性的時間振蕩。術(shù)語“連續(xù)小波”指的是它可以被縮放到任何時間尺度。在傅里葉變換中,信號被分解為無限長的正弦和余弦函數(shù),但此時會丟失時間局域化信息。在CWT中,基函數(shù)是時間局域母小波的縮放和平移版本。利用CWT從頻率表征中構(gòu)建良好的時頻局域化。CWT是反映非平穩(wěn)信號變化特性的一種很好的工具。它也是確定信號在全局情況下是平穩(wěn)還是非平穩(wěn)的一個出色的工具,當信號被識別為非平穩(wěn)時,CWT用于查找數(shù)據(jù)中的平穩(wěn)段。CWT的墨西哥帽小波函數(shù)如下所示。

②離散小波變換(DWT)

離散小波由兩個函數(shù)組成:縮放函數(shù)和小波函數(shù)。單位階躍函數(shù)用作縮放函數(shù),小波函數(shù)由與單位階躍函數(shù)的偏移量組成。CWT的主要缺點是它會產(chǎn)生大量冗余數(shù)據(jù)。DWT克服了這一缺點,它通過消除冗余來生成緊湊的數(shù)據(jù)。Daubechies用Haar小波創(chuàng)建了一個完整的小波家族。與連續(xù)小波相比,離散小波僅使用特定的時間尺度進行縮放;縮放通常是2的冪。DWT為信號編碼提供了一種有效的工具;它類似于其他離散變換,例如DFT(離散傅立葉變換)或DCT(離散余弦變換)。DWT因其能夠給出最優(yōu)的特征提取結(jié)果而被廣泛用于許多信號處理領(lǐng)域。Haar小波是離散小波的一種,公式如下:

③小波散射變換(WST)

改進后的時頻分析方法是基于小波變換的WST,來自深度學習的卷積神經(jīng)網(wǎng)絡(luò)啟發(fā)了WST設(shè)計。小波散射是由小波模塊、非線性和低通濾波器級聯(lián)形成的等效深度卷積網(wǎng)絡(luò),以最小配置從實值時間序列和圖像數(shù)據(jù)中得出用于ML和DL應用的低方差特征。WST不需要訓練,并且在低數(shù)據(jù)量下表現(xiàn)較好。WST的優(yōu)點是不受平移、旋轉(zhuǎn)、縮放、形變的限制,具有豐富的特征信息表征,同時也解決了小波變換隨時間變化的缺點。WST的公式如下:

其中*是卷積算子,ψ是母小波(零均值函數(shù))。每個小波ψλ用尺度λ參數(shù)化后進行非線性運算|.|,并在2J樣本的時域上取平均值,其中

。
根據(jù)以往文獻可以發(fā)現(xiàn),已有研究人員將WST應用于ECG信號,用于對酒精性和非酒精性腦電信號進行分類等。WST也被用于天文學和宇宙學來建立模型,但在醫(yī)學領(lǐng)域,尤其是在神經(jīng)科學和EEG方面,它仍然是非常新的。這也是本研究將WST引入EEG信號進行特征提取的動機,并與最流行的小波方法(如CWT和DWT)進行比較研究。研究者選取神經(jīng)系統(tǒng)疾病精神分裂癥來對這些不同的小波方法進行研究。

機器學習算法

機器學習算法在數(shù)據(jù)中查找模式。這些模式有助于創(chuàng)建一個準確預測的模型。通過更多的數(shù)據(jù)和訓練,可以提高模型的精度。本研究使用傳統(tǒng)和集成學習算法來開發(fā)ML模型并對疾病進行分類。在集成過程中,將多個模型或算法結(jié)合起來以解決特定的計算問題。它大致可分為三類:混合模型、混合組合和混合訓練數(shù)據(jù)。集成學習的兩個最重要的技術(shù)是:BaggingBoosting。bagging和boosting之間的主要區(qū)別在于這些算法從弱分類器訓練的方式。在bagging中,弱分類是并行訓練,而在boosting中,弱分類器是按順序訓練的。一般來說,當弱分類器表現(xiàn)出高方差時,采用低偏差bagging方法;當弱分類存在低方差和高偏差時,使用boosting方法。本研究總共創(chuàng)建了六個ML分類器:邏輯回歸(LR)、支持向量機(SVM)、決策樹(DT)、隨機森林(RF)、AdaBoost(AB)、梯度提升(GB)。LR和SVM是傳統(tǒng)的ML模型,DT和RF是Bagging模型,AB和GB是Boosting模型。

①邏輯回歸(LR)

LR是一種借鑒自統(tǒng)計學領(lǐng)域的分類技術(shù)。LR主要用于結(jié)果取決于兩種可能性或二元(事件是否會發(fā)生)的情況。LR還可用于有多項輸出的情況,也可以應用于有序結(jié)果。邏輯回歸有許多優(yōu)點:實現(xiàn)簡單、計算高效、訓練效率高、易于正則化。輸入特征不需要縮放。

②支持向量機(SVM)

SVM是一種用于執(zhí)行分類、回歸和異常值檢測的監(jiān)督技術(shù)。SVM和其他方法的主要區(qū)別在于選擇決策邊界的方式,即最大化與所有類別中最近數(shù)據(jù)點的距離。SVM可用于線性和非線性分類,采用各種核函數(shù),如齊次多項式、復多項式、高斯徑向基函數(shù)、雙曲正切函數(shù)進行非線性分類。

③隨機森林(RF)

RF是一個基于樹的集成,每棵樹都依賴于一組隨機變量。RF可用于分類響應變量(分類)和連續(xù)響應變量(回歸)。隨機森林有很多優(yōu)點:它們可以處理回歸和多分類問題,訓練和預測速度更快,使用較少的(一個或兩個)參數(shù)進行調(diào)優(yōu),易于實現(xiàn),并且可以直接用于高維問題。

④決策樹(DT)

DT可用于分類和回歸任務(wù)。DT背后的主要思想是創(chuàng)建一個可以預測目標值的模型,對于該模型,DT使用樹的表征來解決問題,其中葉節(jié)點對應于類標簽,屬性表示為樹的內(nèi)部節(jié)點。

⑤自適應增強(AB)

AdaBoost(自適應增強)背后的核心是使用相同訓練數(shù)據(jù)的加權(quán)版本,而不是隨機子樣本。重復使用相同的訓練數(shù)據(jù)集,使得AdaBoost在小數(shù)據(jù)集上也能表現(xiàn)良好。這是AdaBoost與已有的boosting算法相比的主要優(yōu)勢。從訓練數(shù)據(jù)中依次得到弱分類器,使用重加權(quán)版本的訓練數(shù)據(jù),其權(quán)重主要來自前一個分類器的精度。在為基分類器選擇WLs時,必須選擇此分類器,這不會減少從之前正確分類的實例中學習到的權(quán)重。

⑥梯度提升(GB)

偏差誤差和方差誤差是機器學習算法中兩種廣義分類誤差;梯度提升使用最小化偏差誤差來構(gòu)建模型。在AdaBoost中,構(gòu)建模型的人提到了基估計器,而在梯度提升算法中,基估計器是固定的,即決策樹樁。梯度提升既可用于連續(xù)目標變量(作為回歸器),也可用于分類目標變量(作為分類器);當使用梯度提升進行回歸時,它使用均方誤差(MSE)作為代價函數(shù),作為分類器時使用對數(shù)損失函數(shù)作為代價函數(shù)。
總的來說,本研究應用小波散射變換(WST)從健康對照預測精神分裂癥患者,是最早將WST應用于這類數(shù)據(jù)集的研究之一,據(jù)了解,本研究也是最早將WST引入EEG信號以進行神經(jīng)系統(tǒng)疾病分類的研究之一。本研究在六個ML分類器上對三種不同的小波方法進行了比較研究。在經(jīng)過詳細的文獻調(diào)查后,尚未發(fā)現(xiàn)有應用小波散射變換(WST)的報道。目前的一種小波方法是受卷積神經(jīng)網(wǎng)絡(luò)(CNN)的啟發(fā),用于分離精神分裂癥患者和健康對照組。此次文獻調(diào)研延伸了人工智能對醫(yī)療保健支持、精神分裂癥的ML模型和信號處理特征工程的相關(guān)研究,并且對小波變換在腦電數(shù)據(jù)處理中的特征工程非常有針對性。表1給出了各研究人員針對不同問題對腦電信號采用不同特征提取方法的詳細情況。

表1.腦電信號相關(guān)研究及特征提取方法概覽表。

研究方法

本研究以精神分裂癥患者為研究對象,構(gòu)建了腦電信號小波變換特征工程的端到端處理管道。接下來,本研究將詳細闡述研究過程中使用的數(shù)據(jù)集、構(gòu)建的模型和分類器、進行的實驗以及在整個工作中所遵循的方法。實驗設(shè)計和工作流程如圖1所示。

圖1.實驗設(shè)計和工作流程。

數(shù)據(jù)描述

本研究使用了公開可用的開放數(shù)據(jù)集,該數(shù)據(jù)集總共包含28名被試的數(shù)據(jù),其中14例為波蘭華沙精神病學和神經(jīng)病學研究所住院的偏執(zhí)型精神分裂癥患者(7名男性:27.9±3.3歲;7名女性:28.3±4.1歲),以及14名健康對照者(7名男性:26.8±2.9歲;7名女性:28.7±3.4歲)。對照組在性別和年齡上與完成研究的14例患者相匹配。28名被試在閉眼靜息狀態(tài)下共采集了8小時35秒的腦電數(shù)據(jù)。采用標準的10-20 EEG蒙太奇和19個EEG通道:Fp1、Fp2、F7、F3、Fz、F4、F8、T3、C3、Cz、C4、T4、T5、P3、Pz、P4、T6、O1、O2,采樣率為250Hz,F(xiàn)Cz為參考電極。圖2和圖3分別為健康對照和精神分裂癥患者所有通道的箱形圖,這有助于分析通道及其對信號變化的相應貢獻,以便進一步研究。

圖2.健康對照信號的通道箱形圖。
圖3.精神分裂癥患者信號的通道箱形圖。

預處理

本研究使用python的“mne”庫讀取數(shù)據(jù)集中的‘.edf’數(shù)據(jù)文件,成功讀取數(shù)據(jù)后,使用?mne.Epochs()函數(shù)將信號分成epochs。每個epoch為5秒,兩個epoch之間有1秒的重疊。對于8小時35秒的腦電數(shù)據(jù),本研究從健康對照組中獲得了3257500個條目,從精神分裂癥患者組獲得了3958250個條目。然后,提取了7201個5秒的epoch,每個epoch總共有1250[(250Hz采樣頻率)×5(秒)]條記錄。在epoch之后,從19個通道的數(shù)據(jù)集中得到了7201個事件,因此得到的NumPy數(shù)組的維度是(7201,19,1250)。這些epochs分別使用Pandas和NumPy庫轉(zhuǎn)換為數(shù)據(jù)幀和數(shù)組。此外,應用帶通濾波濾除信號中的高頻噪聲,使用0.5Hz的低通頻率值和45Hz的高通頻率值。應用濾波器去噪前后的腦電信號如圖4(a)、(b)和5(a)、(b)所示。

圖4.(a)應用帶通濾波前健康對照者的信號。(b)應用帶通濾波后健康對照者的信號。
圖5.(a)應用帶通濾波前精神分裂癥患者的信號。(b)應用帶通濾波后精神分裂癥患者的信號。

特征提取

本研究進行了兩階段的特征提取。在第一階段,提取每個通道的統(tǒng)計特征,如均值、標準差、峰峰值、方差、最小值、最大值、參數(shù)最小值、參數(shù)最大值、均方根、信號絕對差、峰度和偏度。在第二階段,采用CWT、DWT和WST三種類型的小波變換來提取小波特征。提取的統(tǒng)計特征如表2(a)和表2(b)所示。然后,將這些特征轉(zhuǎn)換為numpy數(shù)組,用于各種ML算法的分類。

表2a.健康對照組的參數(shù)分析。
表2b.精神分裂癥患者的參數(shù)分析。

交叉驗證

ML模型的泛化在基于學習的模型中非常重要,為了使本研究開發(fā)的模型獨立于受試者數(shù)據(jù),采用k折交叉驗證法,取k值為10。十折交叉驗證有助于驗證本研究開發(fā)的ML模型,并有助于將其推廣到其他新數(shù)據(jù)中。

模型構(gòu)建

本節(jié)完整地描述了已開發(fā)的小波變換。討論了特征提取和本研究為分類構(gòu)建的六個機器學習模型,以及每個模型和三種小波變換中的不同參數(shù)。將已開發(fā)的ML模型分為三類:核心/傳統(tǒng)ML(邏輯回歸和支持向量機)、Bagging模型(決策樹和隨機森林)和Boosting模型(AdaBoost和梯度提升)。三種小波變換的細節(jié)如圖6所示。表3提供了使用所有參數(shù)建模的六個分類器的詳細信息。這些模型是在Scikit-learn庫中執(zhí)行的。

圖6.使用參數(shù)的小波變換方法。
表3.具有優(yōu)化參數(shù)的ML分類器的模型架構(gòu)。

評估指標

本研究使用五個指標來評估已開發(fā)的分類器:準確度、靈敏度、特異度、kappa分數(shù)和執(zhí)行時間,下面將逐一討論。

真陽性(TP):如果分類模型對某一特定情緒的預測結(jié)果為陽性,并且實際值也為陽性(正確的特定情緒),則稱為真陽性。

真陰性(TN):如果分類模型對某一特定情緒的預測結(jié)果為陰性,并且實際值也是陰性(錯誤的特定情緒),則稱為真陰性。

假陽性(FP):如果分類模型對某一特定情緒的預測結(jié)果為陽性,但對于該特定情緒的實際值為陰性(錯誤的特定情緒),則稱為假陽性。

假陰性(FN):如果分類模型對某一特定情緒的預測結(jié)果為陰性(錯誤的特定情緒),但實際值為陽性(正確的特定情緒),則稱為假陰性。
準確度:模型的總體精度由以下公式得到

靈敏度(真陽性率):是指檢測結(jié)果為陽性的概率,以真陽性為條件,公式如下

特異度(真陰性率):是指檢測結(jié)果為陰性的概率,以真陰性為條件,公式如下

科恩的Kappa系數(shù)(Kappa分數(shù)):用于衡量定性(分類)項目的兩個評分者或評估者之間的一致性程度,公式如下

式中的P0為評估者之間相對觀察到的一致性;Pe為假設(shè)的機會協(xié)議概率。
執(zhí)行時間:除了矩陣計算之外,本研究還觀察到由于轉(zhuǎn)換技術(shù)的復雜性,在執(zhí)行管道時的性能問題。因此,本研究將執(zhí)行所需的時間視為另一個度量標準,并計算了所有六個模型的執(zhí)行時間。計算程序的執(zhí)行時間或運行時間是指執(zhí)行完整程序而不出錯所需的時間。本研究以秒為單位測量了執(zhí)行時間(執(zhí)行時間取決于執(zhí)行時可用的資源、執(zhí)行時正在運行的進程數(shù)量等)。

計算復雜度

計算復雜度是任何模型或算法都應該考慮的最重要的指標之一。它是一個算法所消耗的計算資源的數(shù)量。即運行時所需的存儲時間和空間。圖7給出了已開發(fā)的六個ML模型的計算復雜度。

圖7.六種已開發(fā)的ML算法的計算復雜度。

實驗配置

首先,在谷歌Colab上進行實驗。在從所有28名被試的數(shù)據(jù)中創(chuàng)建一個numpy數(shù)組后,它生成了一個3.7GB的數(shù)組,Colab無法為其分配內(nèi)存并崩潰。在這里,本研究需要一個具有高計算能力的計算資源來解決這個問題。因此,本研究計劃使用印度最快的超級計算機Param Siddhi-AI來執(zhí)行此實驗。所有代碼都在Param Siddhi-AI的計算節(jié)點上執(zhí)行,并且僅使用CPU的計算能力。表4(a)中列出了單個計算節(jié)點的硬件規(guī)格,表4(b)提供了軟件、軟件包、庫等方面的詳細信息,以及本研究用于運行實驗的版本。

表4a.單個計算節(jié)點的硬件規(guī)格。
表4b.軟件規(guī)格。

結(jié)果和分析

在這項工作中,研究者在六個AI模型上考察了三種小波變換技術(shù)??偣策\行了18個機器學習實驗[6(2個線性模型+4個集成模型)×3(小波方法)],并記錄了各種性能指標,如準確度、靈敏度、特異度、kappa分數(shù)和執(zhí)行時間。評估指標的詳細信息如表5所示。

表5.評估指標的詳細信息。

六個ML模型在特征提取后的性能參數(shù)如下圖所示。準確度、靈敏度、特異度、kappa分數(shù)和執(zhí)行時間的性能參數(shù)如圖8-12所示。本研究分別計算了所有開發(fā)的ML算法的混淆矩陣,并計算了每個開發(fā)的ML模型的TN、TP、FN 和FP結(jié)果,如下圖13-15所示。


圖8.六個分類器在三種小波方法下的準確度(%)。
圖9.六個分類器在三種小波方法下的靈敏度(%)。
圖10.六個分類器在三種小波方法下的特異度(%)。
圖11.六個分類器在三種小波方法下的Kappa分數(shù)。
圖12.六個分類器在三種小波方法下的執(zhí)行時間(秒)。
圖13.提取CWT和SF后的六個分類器模型的混淆矩陣。
圖14.提取DWT和SF后的六個分類器模型的混淆矩陣。
圖15.提取WST和SF后的六個分類器模型的混淆矩陣。

結(jié)論

在這項工作中,研究者考察了三種不同類型的小波時頻特征提取方法以及統(tǒng)計特征提取,并應用了傳統(tǒng)、bagging和boosting中六種不同類型的機器學習模型來區(qū)分精神分裂癥患者與健康對照組。本研究的主要發(fā)現(xiàn)是:對于DWT和CWT特征提取方法,集成方法的性能均優(yōu)于邏輯回歸和SVM等核心ML方法。在WST上,核心ML方法的效果優(yōu)于bagging和boosting方法。核心ML方法的執(zhí)行時間遠小于bagging方法,而bagging方法的執(zhí)行時間小于boosting技術(shù)。在時間-空間復雜度和性能指標方面,DWT特征提取在所有六種分類器中都取得了最好的結(jié)果。經(jīng)過WST特征提取后的ML模型的分類器執(zhí)行時間是經(jīng)過CWT和DWT后的分類器執(zhí)行時間的15~20倍?;贑WT特征提取的決策樹ML分類器是18個實驗中效果最好的,準確度為97.98%,靈敏度為98.2%,特異度為97.72%,Kappa分數(shù)為95.94,執(zhí)行時間為48.04s。將該開發(fā)模型與目前最先進的方法進行比較,取得了更好的效果。


原文:Wavelet transforms for feature engineering in EEG data processing: An?application on Schizophrenia.

https://doi.org/10.1016/j.bspc.2023.104811


小伙伴們點關(guān)注茗創(chuàng)科技,將第一時間收到精彩內(nèi)容推送哦~



小波變換在腦電數(shù)據(jù)處理中的特征工程的評論 (共 條)

分享到微博請遵守國家法律
偃师市| 杭锦后旗| 石台县| 措美县| 聂拉木县| 巍山| 凉山| 江陵县| 天祝| 博白县| 时尚| 华阴市| 阳泉市| 呼和浩特市| 资兴市| 凉山| 博客| 博兴县| 阿坝县| 温州市| 揭西县| 吉首市| 城口县| 都江堰市| 榆林市| 乌鲁木齐市| 女性| 健康| 区。| 临沧市| 河北省| 揭东县| 龙陵县| 玉山县| 定襄县| 石台县| 池州市| 长顺县| 泰安市| 舞钢市| 鹿邑县|