最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

腦電機(jī)器學(xué)習(xí):理論與應(yīng)用

2023-03-14 14:40 作者:茗創(chuàng)科技  | 我要投稿

導(dǎo)讀

EEG是一種廣泛用于研究記錄和監(jiān)測(cè)腦電活動(dòng)的方法。已經(jīng)開發(fā)了機(jī)器學(xué)習(xí)算法來從EEG中提取信息,以幫助診斷多種疾病(例如癲癇、阿爾茨海默癥和精神分裂癥),并識(shí)別各種大腦狀態(tài)。盡管機(jī)器學(xué)習(xí)算法在神經(jīng)科學(xué)中具有精妙且易于使用的特性,但如果執(zhí)行不當(dāng),可能會(huì)產(chǎn)生不準(zhǔn)確甚至錯(cuò)誤的結(jié)果。本文概述了基于EEG的機(jī)器學(xué)習(xí)、模式識(shí)別和分類的一般方法。首先,描述了從各個(gè)領(lǐng)域提取的特征。其次,概述了監(jiān)督和無監(jiān)督特征降維方法。重點(diǎn)關(guān)注分類算法、性能評(píng)估和防止過擬合的方法。最后,討論了基于EEG機(jī)器學(xué)習(xí)的兩個(gè)應(yīng)用:腦機(jī)接口(BCI)和微睡眠的檢測(cè)與預(yù)測(cè)。

前言

EEG是一種非侵入性方法,可通過頭皮上的電極直接測(cè)量神經(jīng)活動(dòng)。大量神經(jīng)元的同步活動(dòng)會(huì)產(chǎn)生一個(gè)強(qiáng)到足以到達(dá)頭皮的電場(chǎng),這被記錄為具有高時(shí)間分辨率的腦電圖。與其他神經(jīng)成像方法(如fMRI和fNIRS)相比,直接記錄神經(jīng)活動(dòng)是EEG的優(yōu)勢(shì)之一。此外,由于EEG具有高時(shí)間分辨率,可以捕獲大范圍的神經(jīng)振蕩。這些節(jié)律分為五個(gè)標(biāo)準(zhǔn)波段:δ(0.5-4Hz)、θ(4-8Hz)、α(8-12Hz)、β(13-30Hz)和γ(>30Hz)。研究表明,每個(gè)頻段的大腦活動(dòng)與不同的認(rèn)知功能有關(guān)。這些優(yōu)點(diǎn)使EEG不僅可以研究神經(jīng)工程和神經(jīng)科學(xué)中的重要問題,而且是臨床應(yīng)用和疾病診斷過程中的一種可行和實(shí)用的選擇。EEG信號(hào)包含有關(guān)空間、時(shí)間和頻譜方面的大量信息。這使得EEG成為研究大腦功能和認(rèn)知等方面的合適方法。然而,EEG的豐富性是有代價(jià)的,其中數(shù)據(jù)可能是高維的,并且可能具有低信噪比,這對(duì)處理EEG和識(shí)別感興趣的模式提出了相當(dāng)大的挑戰(zhàn)。為了解決EEG固有的挑戰(zhàn),機(jī)器學(xué)習(xí)在該領(lǐng)域得到了相當(dāng)多的關(guān)注。

EEG通常受到噪聲和偽影的影響,如眼動(dòng)、慢漂移和肌肉偽影。為了提高信噪比,通常包括預(yù)處理步驟,都會(huì)最大限度地減少偽跡和不必要的噪聲。該步驟可以包括各種程序,例如帶通濾波、偽影子空間重建、獨(dú)立成分分析、空間濾波器、最小化肌肉偽影和偽影拒絕。然而,在預(yù)處理中,必須謹(jǐn)慎并可視化數(shù)據(jù),以避免去除任何有意義和信息豐富的EEG成分。

機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)是一組算法,使我們能夠自動(dòng)識(shí)別數(shù)據(jù)中的模式,并對(duì)新觀察到的測(cè)量值進(jìn)行預(yù)測(cè)。在神經(jīng)科學(xué)研究領(lǐng)域中,通常會(huì)出現(xiàn)這些情況:①對(duì)比各種條件,②診斷疾病,③識(shí)別與行為相關(guān)的電生理變化。盡管具體應(yīng)用不同,但機(jī)器學(xué)習(xí)的過程在大多數(shù)情況下是相似的,如圖1所示。

圖1.基于EEG的機(jī)器學(xué)習(xí)的概覽圖。

一般來說,機(jī)器學(xué)習(xí)有兩個(gè)階段:訓(xùn)練和測(cè)試。在訓(xùn)練階段,有一組可用的示例(即帶有相應(yīng)標(biāo)簽的數(shù)據(jù))。使用給定的機(jī)器學(xué)習(xí)算法,示例數(shù)據(jù)被用于訓(xùn)練模型(即調(diào)整其參數(shù)),以便它可以識(shí)別輸入數(shù)據(jù)和標(biāo)簽之間的關(guān)系。在測(cè)試階段,沒有標(biāo)簽的輸入數(shù)據(jù)經(jīng)過與訓(xùn)練階段相同的方法進(jìn)行預(yù)處理、特征提取和特征約簡(jiǎn),訓(xùn)練階段估計(jì)的訓(xùn)練模型預(yù)測(cè)輸出(即標(biāo)簽)。訓(xùn)練階段的主要目標(biāo)是估計(jì)在測(cè)試時(shí)具有最大預(yù)測(cè)性能的模型。

特征提取

特征提取是指通過測(cè)量和提取特定信息來降低輸入數(shù)據(jù)維數(shù)的一套方法。對(duì)于EEG數(shù)據(jù),有多種方法可以從時(shí)域、頻域或空間域的一個(gè)或組合中提取特征。①時(shí)域特征EEG信號(hào)的時(shí)域特征提取無需任何變換。過零是一種時(shí)域特征,表示信號(hào)越過零的次數(shù)。該測(cè)量方法和過零間隔已用于癲癇檢測(cè)、情緒識(shí)別和睡眠分期。

Hjorth參數(shù)是描述EEG單通道的三個(gè)時(shí)域特征集。這些特征是活動(dòng)性、移動(dòng)性和復(fù)雜度。Hjorth活動(dòng)性(HA)是EEG信號(hào)的方差(即信號(hào)功率),表示信號(hào)的寬度。Hjorth移動(dòng)性(HM)估計(jì)信號(hào)的平均頻率。Hjorth復(fù)雜度(HC)通過計(jì)算EEG的一階導(dǎo)數(shù)相對(duì)于EEG本身的移動(dòng)性來估計(jì)EEG信號(hào)的帶寬。Hjorth參數(shù)可以計(jì)算為:

其中σ0是信號(hào)的標(biāo)準(zhǔn)差,σ1和σ2是信號(hào)的一階和二階導(dǎo)數(shù)的標(biāo)準(zhǔn)差。Hjorth參數(shù)已用于睡眠分期、情緒識(shí)別和癲癇檢測(cè)。

非線性能量,也稱為平均Teager能量,是EEG的一個(gè)特征,已被廣泛用于癲癇發(fā)作預(yù)測(cè)。非線性能量估計(jì)信號(hào)的瞬時(shí)能量,特別是識(shí)別瞬態(tài)變化,如睡眠紡錘波和發(fā)作尖峰。它還被用于自動(dòng)睡眠分期,在這方面它是最重要的功能之一。假設(shè)時(shí)域信號(hào)用x={x1,x2,...,xN}表示,計(jì)算的非線性能量為:

分形維數(shù)是不同尺度上的自相似性度量,常用于量化信號(hào)或過程的復(fù)雜性。由于估計(jì)復(fù)雜信號(hào)的分形維數(shù)存在計(jì)算上的挑戰(zhàn),目前已經(jīng)開發(fā)了幾種方法來近似分形維數(shù)。Petrosian分形維數(shù)是分形維數(shù)的最簡(jiǎn)單近似。Petrosian分形維數(shù)特征通過將信號(hào)轉(zhuǎn)換為二進(jìn)制表示,并用符號(hào)變化的次數(shù)近似分形維數(shù)來簡(jiǎn)化分形維數(shù)的計(jì)算:

其中NEEG是EEG信號(hào)的采樣點(diǎn)數(shù),NΔ是信號(hào)的符號(hào)變化數(shù)。Petrosian分形維數(shù)已用于檢測(cè)嗜睡水平和估計(jì)睡眠階段。

Katz分形維數(shù)是估計(jì)信號(hào)分形維數(shù)的另一種方法。該方法比Petrosian分形維數(shù)更精確,但計(jì)算成本更高。Katz分形維數(shù)計(jì)算為:

其中NEEG為EEG信號(hào)點(diǎn)的數(shù)量,d為直徑,L為曲線長(zhǎng)度。假設(shè)x=x1,x2,...,xNEEG是EEG信號(hào)的序列,則直徑和曲線長(zhǎng)度分別為:

Katz分形維數(shù)已用于阿爾茨海默癥的診斷、精神分裂癥的診斷以及嗜睡水平的估計(jì)等。

平均曲線(線)長(zhǎng)度是Katz分形維數(shù)的近似值。令x={x1,x2,...,xN}為EEG信號(hào),平均曲線長(zhǎng)度的計(jì)算公式為:

曲線長(zhǎng)度已被用于預(yù)測(cè)癲癇發(fā)作和估計(jì)睡眠的不同階段。

Hurst指數(shù)是時(shí)間序列中的長(zhǎng)程自相似性度量。Hurst指數(shù)可以取0到1之間的值,其中值0.5對(duì)應(yīng)隨機(jī)數(shù)據(jù)。為了計(jì)算Hurst指數(shù),假設(shè)信號(hào)由x={x1,x2,...,xN}給出。前k個(gè)數(shù)據(jù)點(diǎn)與前n個(gè)數(shù)據(jù)點(diǎn)均值的偏差由下式得到:

范圍R(n)定義為前n個(gè)點(diǎn)的偏差之間的最大差值:

Hurst指數(shù)為:

其中CH是獨(dú)立于n的有限常數(shù),S(n)是前n個(gè)點(diǎn)的經(jīng)驗(yàn)標(biāo)準(zhǔn)差。Hurst指數(shù)可以通過在(12)的右側(cè)擬合一條直線來計(jì)算。Hurst指數(shù)已被用于識(shí)別癲癇樣EEG,識(shí)別情緒和估計(jì)睡眠階段。

②頻域特征

從EEG信號(hào)的頻率表征中提取頻域特征??焖俑道锶~變換(FFT)是EEG信號(hào)頻率分量識(shí)別的常用方法,由下式得到:

其中f為頻率,N為信號(hào)中的總點(diǎn)數(shù),xn為第N個(gè)信號(hào)點(diǎn),Ts為采樣時(shí)間。信號(hào)的頻率分量可以測(cè)量到Nyquist頻率(即采樣頻率Fs的一半)。此外,對(duì)于長(zhǎng)度為N的信號(hào),可以計(jì)算從0到Nyquist頻率均勻分布的

個(gè)頻率分量(即

)。例如,采樣頻率為250Hz的4s EEG片段的頻率分辨率為

。從這個(gè)例子中可以清楚地看出,頻率分辨率取決于信號(hào)的長(zhǎng)度,與采樣頻率無關(guān)。傅里葉變換的一個(gè)假設(shè)是信號(hào)是平穩(wěn)的,這意味著信號(hào)的統(tǒng)計(jì)量(例如,均值和標(biāo)準(zhǔn)差)不隨時(shí)間變化。然而,EEG反映的是大腦功能的動(dòng)態(tài),其本質(zhì)上是非平穩(wěn)的。解決此問題的一種方法是將FFT應(yīng)用于相當(dāng)平穩(wěn)的EEG片段。盡管如此,但這種方法仍然會(huì)降低結(jié)果的頻率分辨率。此外,為了減少頻譜泄漏,在計(jì)算FFT之前,需要對(duì)信號(hào)應(yīng)用一個(gè)加窗函數(shù),例如漢明窗或漢寧窗。還有其他信號(hào)處理方法可以量化頻率分量和執(zhí)行頻譜分析,例如小波變換,希爾伯特變換和匹配追蹤。這些方法通常用于識(shí)別數(shù)據(jù)的時(shí)頻表征。接下來將重點(diǎn)介紹從信號(hào)的頻域表征中提取特征。功率譜密度估計(jì)給定信號(hào)中功率在頻率分量上的分布。Welch方法,也稱為修正周期圖法,是一種應(yīng)用廣泛的功率譜密度估計(jì)方法。Welch方法(修正周期圖法)通過對(duì)重疊較小加窗段的周期圖進(jìn)行平均來計(jì)算信號(hào)的功率譜密度,因此與整個(gè)epoch的周期圖相比,該方法的方差較小。功率譜密度已被用于檢測(cè)和預(yù)測(cè)微睡眠、識(shí)別阿爾茨海默癥的幻覺、估計(jì)睡眠階段和預(yù)測(cè)嗜睡。

頻譜熵表征EEG的復(fù)雜性或規(guī)律性。為了計(jì)算頻譜熵,信號(hào)的概率分布近似于其功率譜密度。然后由下式計(jì)算頻譜熵:

其中Nf為頻率箱的數(shù)量,fl和fu分別為頻率下限和上限。頻譜熵已被用于對(duì)精神分裂癥患者進(jìn)行分類,檢測(cè)癲癇發(fā)作,并估計(jì)睡眠階段。

強(qiáng)度加權(quán)平均頻率(IWMF),也稱為重力頻率,通過下式計(jì)算信號(hào)相對(duì)于功率譜密度的加權(quán)平均頻率:

強(qiáng)度加權(quán)帶寬(IWBW),也稱為頻率變異性,定義為頻率的方差。使用IWMF和頻譜密度,IWBW的計(jì)算公式為:

IWMF和IWBW均已用于檢測(cè)嗜睡和癲癇發(fā)作。

③空間域特征

共空間模式(CSP)是一種從多通道EEG信號(hào)中提取特征的監(jiān)督算法。這是一種數(shù)據(jù)驅(qū)動(dòng)的方法,旨在找到EEG信號(hào)的分解,使新空間中兩種條件之間的距離最大化。設(shè)Xk={Xk,1,Xk,2,...,Xk,Nk}為條件k∈{1,2}下的所有EEG段。CSP的目標(biāo)是找到一組J空間濾波器W={w1,w2,...,wJ},將EEG信號(hào)投影到兩種條件之間距離最大的新空間中。對(duì)于每個(gè)空間濾波器,則有:

其中Σk∈{1,2}是第k個(gè)條件下的協(xié)方差矩陣,‖wj‖=1,空間濾波器正交。協(xié)方差矩陣可以計(jì)算為:

求解(17)等價(jià)于求解廣義特征值問題。在Matlab中,這可以簡(jiǎn)單地通過W=eig(Σ1,Σ12)來找到最佳空間濾波器。然后使用這些濾波器將EEG數(shù)據(jù)投影到新空間中,即使用空間濾波器乘以EEG數(shù)據(jù)(WX)。投影信號(hào)的方差(或?qū)?shù)變換)被提取為特征。濾波器組CSP(FBCSP)是經(jīng)典CSP的擴(kuò)展,首先將輸入數(shù)據(jù)過濾到不同的頻段,然后為每個(gè)頻帶中的數(shù)據(jù)找到一個(gè)CSP。盡管與經(jīng)典的CSP相比,F(xiàn)BCSP表現(xiàn)出了優(yōu)越的性能,但由于它生成了大量的特征,因此更有可能導(dǎo)致過擬合。

CSP的一個(gè)缺點(diǎn)是它容易受到噪聲的影響,這可能導(dǎo)致過擬合。為了克服這個(gè)問題,有研究開發(fā)了不同的方法。其中一種方法是通過加入正則化項(xiàng)來懲罰模型的復(fù)雜度。這些方法試圖通過降低復(fù)雜度來優(yōu)化CSP的性能和通用性。貝葉斯框架也被研究納入稀疏先驗(yàn)自動(dòng)選擇空間濾波器的最佳數(shù)量。還有一些方法執(zhí)行特征選擇技術(shù),迭代地選擇最佳濾波器數(shù)量。

特征降維

從EEG數(shù)據(jù)中提取的特征通常具有高維數(shù)。例如,可以將采集自60個(gè)電極的EEG過濾為0-80Hz的2Hz子帶,并為每個(gè)電極和子帶提取3個(gè)特征??偣灿?×60×40=7200個(gè)特征,這可能超過觀測(cè)值的數(shù)量。在機(jī)器學(xué)習(xí)中,這被稱為維度詛咒,可能導(dǎo)致過擬合。當(dāng)一個(gè)模型過擬合時(shí),它可以準(zhǔn)確地識(shí)別它所見過的示例,但它在新的和之前未見過的觀測(cè)值上表現(xiàn)不佳。特征降維旨在通過減少預(yù)測(cè)模型中使用的特征數(shù)量來提高機(jī)器學(xué)習(xí)模型的可泛化性。此外,特征降維可以更好地理解科學(xué)問題的潛在神經(jīng)過程。特征降維分為兩大類:有監(jiān)督和無監(jiān)督。

①無監(jiān)督

無監(jiān)督特征降維是指在不使用訓(xùn)練數(shù)據(jù)標(biāo)簽的情況下減少特征數(shù)量的技術(shù)。一般來說,減少特征數(shù)量的方法有兩種:特征選擇和特征變換。在特征選擇中,選擇輸入特征的子集,而在?特征變換中,簡(jiǎn)化的特征(即元特征)是輸入數(shù)據(jù)的低秩近似。已經(jīng)開發(fā)了幾種無監(jiān)督特征降維方法。Mitra等人開發(fā)了一種選擇特征以減少冗余的方法。類似地,Singh等人開發(fā)了一種基于排名的特征選擇(FSULR)的無監(jiān)督學(xué)習(xí),以消除冗余特征。特征變換方法,如獨(dú)立成分分析(ICA)、主成分分析(PCA)和t分布隨機(jī)鄰域嵌入(t-SNE)等已用于特征降維。這里將重點(diǎn)關(guān)注PCA,這是一種廣泛用于執(zhí)行無監(jiān)督特征降維的技術(shù)。

PCA是一種線性特征降維方法,將相關(guān)特征分解為不相關(guān)的主成分(潛在變量或元特征)。形式上,設(shè)X∈RN×D是具有N個(gè)觀測(cè)值的特征矩陣,每個(gè)觀測(cè)值都有D個(gè)特征。PCA旨在線性投影數(shù)據(jù),則有:

其中W∈RL×D為載荷矩陣,Z為潛在變量(元特征)的矩陣。PCA假設(shè)載荷矩陣W是正交的(即,WW?=I)。為了找到載荷矩陣,可以對(duì)特征矩陣

的協(xié)方差進(jìn)行特征值分解。然后將元特征計(jì)算為原始特征在協(xié)方差矩陣特征向量上的投影,如圖2所示。為了降低特征的維數(shù),保留與較高特征值對(duì)應(yīng)的主要特征向量,并丟棄其余的特征向量。這些成分將解釋原始特征矩陣中的大部分方差。然而,對(duì)于保留的主成分應(yīng)該解釋多少差異,尚未達(dá)成共識(shí)。一些研究人員使用固定值(例如95%)作為臨界值,而另一些研究人員則選擇預(yù)定義數(shù)量的成分(例如十個(gè)成分)。另一種選擇最佳成分?jǐn)?shù)量的方法是使用交叉驗(yàn)證法。

圖2.使用PCA在兩個(gè)相關(guān)特征上查找不相關(guān)的元特征。紅線對(duì)應(yīng)協(xié)方差矩陣的主方向(特征向量的方向)。PCA是一種強(qiáng)大的特征降維技術(shù),尤其是在處理高維數(shù)據(jù)時(shí)。然而,PCA對(duì)數(shù)據(jù)規(guī)模很敏感,這意味著高方差的特征可能會(huì)誤導(dǎo)PCA。這可以通過在應(yīng)用PCA之前對(duì)特征矩陣進(jìn)行標(biāo)準(zhǔn)化來解決;也就是說,對(duì)于每個(gè)特征,刪除其均值并除以其標(biāo)準(zhǔn)差。執(zhí)行PCA后,元特征(即轉(zhuǎn)換后的特征)將用于分類步驟。

為了克服PCA的缺點(diǎn),已經(jīng)開發(fā)了其他的PCA變體。核主成分分析(KPCA)是對(duì)主成分分析進(jìn)行非線性特征降維的一種擴(kuò)展。概率主成分分析(PPCA)是以概率生成模型的形式重新表述PCA。與PCA相比,PPCA的一個(gè)優(yōu)點(diǎn)是它為觀測(cè)數(shù)據(jù)顯式地建立了加性高斯噪聲模型。PCA的貝葉斯變體也被開發(fā)來合并稀疏性增強(qiáng)先驗(yàn)(例如,自動(dòng)相關(guān)性確定),以自動(dòng)識(shí)別最佳成分?jǐn)?shù)量。

②監(jiān)督

監(jiān)督特征降維技術(shù)在減少特征數(shù)量時(shí)利用結(jié)果標(biāo)簽(分類或連續(xù))。特征選擇包含了大多數(shù)有監(jiān)督的特征降維方法,在這種方法中,選擇相關(guān)特征的子集,丟棄冗余和不相關(guān)的特征。特征選擇方法可以分為三類:過濾器、包裝器和嵌入式方法。過濾器方法使用一種秩函數(shù),根據(jù)特征與結(jié)果標(biāo)簽的相關(guān)性對(duì)特征進(jìn)行評(píng)分。過濾器方法計(jì)算效率高,可降低過擬合的傾向。有不同的秩函數(shù)來估計(jì)特征的相關(guān)性,例如相關(guān)和互信息。然后為預(yù)測(cè)模型選擇最相關(guān)的特征。

相關(guān)系數(shù)通常用于對(duì)特征進(jìn)行排序,衡量?jī)蓚€(gè)隨機(jī)變量之間的線性關(guān)聯(lián)程度。它的值在-1和1之間,分別對(duì)應(yīng)完全負(fù)相關(guān)和完全正相關(guān)。相關(guān)性為0表示沒有線性關(guān)聯(lián)。形式上,設(shè)fi∈RN為特征i對(duì)應(yīng)的向量,y∈RN為N個(gè)觀測(cè)值的結(jié)果標(biāo)簽(即黃金標(biāo)準(zhǔn))向量。皮爾遜相關(guān)系數(shù)可以計(jì)算為:

其中


分別是特征i和結(jié)果標(biāo)簽的平均值。皮爾遜相關(guān)性容易受到異常值的影響,當(dāng)應(yīng)用于有噪聲的數(shù)據(jù)時(shí),可能會(huì)獲得較差的結(jié)果。為了緩解這一問題,可以使用皮爾遜相關(guān)的非參數(shù)版本斯皮爾曼相關(guān)。斯皮爾曼相關(guān)首先對(duì)數(shù)據(jù)進(jìn)行排序,然后計(jì)算排序后的數(shù)據(jù)的相關(guān)系數(shù)。對(duì)數(shù)據(jù)進(jìn)行排序可以在不刪除異常值的情況下消除異常值帶來的影響,因此,斯皮爾曼相關(guān)不太容易受到異常值的影響。

互信息測(cè)量?jī)蓚€(gè)變量之間的依賴關(guān)系。互信息的值為0表示兩個(gè)變量是獨(dú)立的,而正值表示兩個(gè)變量之間的依賴程度。從形式上講,互信息可以計(jì)算為:

其中fi和y分別對(duì)應(yīng)于兩個(gè)變量(即第i個(gè)特征向量和結(jié)果標(biāo)簽),H(x)為變量x的熵,H(x|y)為給定y條件下x的條件熵。結(jié)果標(biāo)簽y的熵由下式得到:

其中p(x)為離散變量x的概率質(zhì)量函數(shù)。當(dāng)x連續(xù)時(shí),(22)中的求和被積分取代,p(x)成為概率密度函數(shù)。在給定結(jié)果標(biāo)簽的情況下,特征i的條件熵由下式計(jì)算:


其中,使用貝葉斯法則,給定特征i的結(jié)果的條件概率為:

給定特征i和結(jié)果標(biāo)簽的概率函數(shù),可以使用(22)-(24)計(jì)算兩個(gè)變量的互信息。然而,這些變量的概率分布不是先驗(yàn)已知的,因此需要從數(shù)據(jù)中估計(jì)。一種方法是將特征i的觀測(cè)值擬合為高斯分布,這等效于根據(jù)數(shù)據(jù)經(jīng)驗(yàn)估計(jì)的平均值和標(biāo)準(zhǔn)差的正態(tài)分布。該方法對(duì)于正態(tài)分布的特征計(jì)算快速且高效,但無法準(zhǔn)確建模非正態(tài)分布的數(shù)據(jù)或具有多模態(tài)分布的數(shù)據(jù)。在這種情況下,可以使用高斯混合模型或核密度估計(jì)來估計(jì)數(shù)據(jù)的概率分布,其精度較高,但這些模型計(jì)算復(fù)雜度較高,計(jì)算時(shí)間也較長(zhǎng)。包裝器方法使用分類或回歸方法來迭代地選擇特征。這些技術(shù)根據(jù)機(jī)器學(xué)習(xí)算法的性能查找特征的子集。包裝器方法一般分為前向選擇和后向消除兩大類。在前向選擇中,每個(gè)特征首先分別用于訓(xùn)練分類(或回歸)模型。選擇性能最高(或誤差最低)的特征。然后,將最佳特征和另一個(gè)特征結(jié)合起來訓(xùn)練另一個(gè)模型。選擇性能最高的特征組合。此過程一直持續(xù)到滿足停止標(biāo)準(zhǔn)為止。這可以是預(yù)先選擇的特征數(shù)量,對(duì)感興趣的性能測(cè)量的預(yù)定義閾值(例如,90%的準(zhǔn)確率),或者在迭代過程中的性能改進(jìn)(例如,0.1%的改進(jìn))。后向消除實(shí)現(xiàn)了類似的想法,但從所有的特征開始。在每次迭代中,都會(huì)消除一個(gè)特征并評(píng)估性能。消除對(duì)性能影響最小的特征。

嵌入式方法是在訓(xùn)練階段實(shí)現(xiàn)的,在參數(shù)值估計(jì)過程中選擇特征。例如,使用L1范數(shù)正則化分類算法在訓(xùn)練階段將不相關(guān)特征的系數(shù)縮小為零。這基本上從最終的預(yù)測(cè)模型中刪除了不相關(guān)和冗余的特征。

分類算法

分類器學(xué)習(xí)如何在訓(xùn)練階段和根據(jù)訓(xùn)練數(shù)據(jù)(包含特征及其相應(yīng)的分類標(biāo)簽)進(jìn)行預(yù)測(cè)。在訓(xùn)練階段之后,分類器可以對(duì)新的未知數(shù)據(jù)進(jìn)行預(yù)測(cè)。當(dāng)手頭的問題具有連續(xù)的結(jié)果時(shí),使用回歸方法來識(shí)別訓(xùn)練數(shù)據(jù)中的模式。當(dāng)結(jié)果標(biāo)簽可以取兩個(gè)唯一值(例如阿爾茨海默病的診斷)時(shí),分類問題是二元的。在多類分類問題中,結(jié)果標(biāo)簽具有兩種以上的狀態(tài),例如睡眠分期,情緒識(shí)別和BCI。

①線性判別分析

線性判別分析(LDA)的目標(biāo)是找到一個(gè)能最大限度地分離不同類特征的超平面。LDA是一種生成分類器,它假設(shè)每個(gè)類的數(shù)據(jù)是正態(tài)分布的,并且兩個(gè)類的數(shù)據(jù)具有相同的協(xié)方差矩陣。假設(shè)Fk∈RNk×D是第k類(即,k∈{1,2})的特征矩陣。LDA的均值和協(xié)方差矩陣可計(jì)算為:

其中fn,k是一個(gè)列向量,對(duì)應(yīng)于第k類的第n個(gè)觀測(cè)值的特征。由于這里重點(diǎn)關(guān)注二元結(jié)果,可以將新的觀察結(jié)果分類為:

其中Nk是k∈{1,2}類的觀測(cè)值數(shù),d為負(fù)值,則新觀測(cè)值

屬于第一類;d為正值,則對(duì)應(yīng)第二類觀測(cè)值。

LDA的另一種觀點(diǎn)是Fisher判別分析,它旨在最大化類間方差,同時(shí)最小化類內(nèi)方差。這可以寫為瑞利商(Rayleigh quotient),可以通過廣義特征值分解來求解。LDA的生成和判別觀點(diǎn)都得到了相同的結(jié)果。

②支持向量機(jī)

支持向量機(jī)(SVM)是一個(gè)線性分類器,用于查找兩個(gè)類的數(shù)據(jù)之間的超平面。支持向量機(jī)是一種最大邊界分類器,這意味著決策邊界的確定使決策超平面與其周圍數(shù)據(jù)點(diǎn)之間的裕度最大化,如圖3所示。

圖3.線性SVM分類器的決策邊界(黑線)及其裕度。藍(lán)點(diǎn)和紅方塊分別對(duì)應(yīng)兩個(gè)類的數(shù)據(jù)。

藍(lán)點(diǎn)和紅方塊分別對(duì)應(yīng)兩個(gè)類的數(shù)據(jù)。找到與兩類數(shù)據(jù)距離最大的決策邊界可降低錯(cuò)誤分類的可能性。最接近決策邊界的數(shù)據(jù)點(diǎn)稱為支持向量。這些支持向量對(duì)決策邊界的影響最大。

假設(shè)fn∈RD為第n次觀測(cè)的特征向量,其對(duì)應(yīng)的結(jié)果標(biāo)簽為yn∈{?1,1}。對(duì)于沒有最大化邊界的分類器(如LDA),最優(yōu)邊界由下式給出:

其中w是權(quán)重向量,b是偏差項(xiàng)。假設(shè)數(shù)據(jù)是線性可分的,SVM的最佳邊界為:

這將使訓(xùn)練階段的邊界最大化。但是,一個(gè)較大的權(quán)向量w可以滿足此約束。因此,SVM的目標(biāo)函數(shù)是最小化

,受(29)給出的約束。這種優(yōu)化可以用二次規(guī)劃來完成。SVM的測(cè)試階段與LDA的測(cè)試階段相似。給定一個(gè)測(cè)試數(shù)據(jù)點(diǎn)

,通過以下計(jì)算實(shí)現(xiàn)SVM的預(yù)測(cè):

其中

是預(yù)測(cè)的類,sign(x)是符號(hào)函數(shù)。

然而,在大多數(shù)實(shí)際應(yīng)用中,數(shù)據(jù)不是線性可分的。在這種情況下,不存在完美的決策邊界,分類器至少會(huì)犯一個(gè)錯(cuò)誤。因此,目標(biāo)是找到一個(gè)具有最高精度的決策邊界。這是通過添加松弛變量ξn≥0來完成的,以說明每個(gè)觀測(cè)值的分類誤差。當(dāng)一個(gè)觀測(cè)值是正確的且具有高邊界時(shí),其相關(guān)松弛變量為零。但是,當(dāng)松弛變量的相關(guān)觀測(cè)值落在邊界內(nèi)或被錯(cuò)誤分類時(shí),松弛變量的值會(huì)增加。在(31)中加入松弛變量得到:

與線性可分?jǐn)?shù)據(jù)的情況類似,需要一個(gè)目標(biāo)函數(shù)。為了合并松弛變量(誤差項(xiàng)),最小化的目標(biāo)函數(shù)由下式得到:

其中C>0是一個(gè)正則化參數(shù),用于控制誤差項(xiàng)和邊界之間的平衡。C的值較大,可查找較小的裕度以減少訓(xùn)練誤差,而C的值越小,則試圖尋找較大的裕度以減少訓(xùn)練誤差。

當(dāng)兩類數(shù)據(jù)間的真實(shí)決策邊界為非線性時(shí),尋找線性超平面可能導(dǎo)致分類性能較差。在這種情況下,可以使用核技巧將輸入數(shù)據(jù)映射到?jīng)Q策邊界為線性的不同空間。然后,線性分類器可以在新空間中以最佳方式找到?jīng)Q策邊界。兩種最常用的核是徑向基函數(shù)和多項(xiàng)式。然而,核技巧大大增加了計(jì)算復(fù)雜度。當(dāng)處理具有許多觀測(cè)和特征的大型數(shù)據(jù)集時(shí),這就成為一個(gè)問題。

③k-最近鄰

K-最近鄰(kNN)是對(duì)數(shù)據(jù)做最小假設(shè)的非線性分類器。對(duì)于給定的測(cè)試觀測(cè)值,kNN會(huì)在訓(xùn)練數(shù)據(jù)中找出k個(gè)與測(cè)試觀測(cè)距離最小的觀測(cè)值。然后使用這些訓(xùn)練點(diǎn)的多數(shù)標(biāo)簽作為測(cè)試觀測(cè)值的預(yù)測(cè)類。數(shù)據(jù)點(diǎn)之間的接近度由距離度量來定義,其中歐氏距離是常見的選擇。

kNN分類器使用一種簡(jiǎn)單的方法來預(yù)測(cè)新觀測(cè)值的標(biāo)簽,而無需顯式建模訓(xùn)練數(shù)據(jù)。然而,在實(shí)際操作中,kNN可能會(huì)變得不穩(wěn)定,特別是在處理EEG等有噪聲的數(shù)據(jù)時(shí)。在這種情況下,增加k將改善泛化誤差。此外,kNN需要從所有訓(xùn)練數(shù)據(jù)中計(jì)算新的觀測(cè)結(jié)果的距離,計(jì)算復(fù)雜度很高。

④決策樹

決策樹是一種簡(jiǎn)單靈活的分類方法,目前得到了廣泛的應(yīng)用。決策樹通過一組形成樹形結(jié)構(gòu)的層次規(guī)則對(duì)觀測(cè)結(jié)果進(jìn)行分類?;谟?xùn)練數(shù)據(jù)形成決策樹的算法有CART,ID3,C4.5和C5.0等。決策樹在訓(xùn)練階段執(zhí)行特征選擇,允許在不同規(guī)則中多次使用一個(gè)特征,并且易于解釋。然而,決策樹容易過擬合,樹的大小可能會(huì)過度增長(zhǎng)。

⑤集成方法

集成學(xué)習(xí)是指使用多個(gè)分類器進(jìn)行預(yù)測(cè)。我們希望實(shí)現(xiàn)具有最大性能的分類器,但這可能無法通過單個(gè)分類器實(shí)現(xiàn)。集成學(xué)習(xí)的思想是,當(dāng)多個(gè)弱分類器(其各自的性能優(yōu)于隨機(jī)分類器)組合在一起時(shí),可以獲得更高的性能。集成學(xué)習(xí)的性能預(yù)期要高于單個(gè)分類器的性能。三種常用的集成方法是堆疊法、提升法和自助法(bagging)。堆疊法,也稱為堆疊泛化,是一種組合了多個(gè)分類器輸出的集成方法。首先對(duì)基分類器進(jìn)行獨(dú)立訓(xùn)練。基分類器也稱為弱學(xué)習(xí)器、弱分類器或基學(xué)習(xí)器。堆疊法是對(duì)多個(gè)分類器的輸出進(jìn)行加權(quán)平均,使分類性能最大化,可以看作是一種模型平均。與單個(gè)分類器相比,堆疊法顯示出優(yōu)越的性能。提升法是一種迭代方法,它結(jié)合了多個(gè)弱分類器以創(chuàng)建強(qiáng)大的自適應(yīng)模型。在提升法的每次迭代中,首先對(duì)數(shù)據(jù)進(jìn)行加權(quán),以突出顯示先前分類器的誤差。然后用加權(quán)數(shù)據(jù)來訓(xùn)練一個(gè)新的基學(xué)習(xí)器,旨在校正先前分類器的錯(cuò)誤?;鶎W(xué)習(xí)器可以是任何分類算法。盡管如此,最常用的基學(xué)習(xí)器是LDA、SVM和決策樹。

自助法已在文獻(xiàn)中被廣泛使用,并開發(fā)了不同的自助法變體。使用最廣泛的自助法是自適應(yīng)增強(qiáng)(AdaBoost)。形式上,設(shè)F={f1,...,fN}為N個(gè)觀測(cè)值的特征矩陣,設(shè)y={y1,...,yN}為相應(yīng)的結(jié)果標(biāo)簽(1或-1)。在第一次迭代中,將每個(gè)觀測(cè)值的初始權(quán)值設(shè)置為

。使用權(quán)向量、特征矩陣和結(jié)果標(biāo)簽,訓(xùn)練一個(gè)基分類器h1。隨后,h1的錯(cuò)誤分類誤差計(jì)算為:

其中h1(fn)是分類器h1對(duì)觀測(cè)值fn的預(yù)測(cè)。下一步是計(jì)算該分類器的權(quán)重,由:

此時(shí),第一次迭代完成。對(duì)于連續(xù)迭代,權(quán)向量wt更新如下:

其中Zt是歸一化因子。在(35)中可以看出,在計(jì)算下一次迭代的權(quán)向量時(shí),已經(jīng)考慮了當(dāng)前迭代的分類誤差。迭代過程繼續(xù)進(jìn)行,直到完成預(yù)定義數(shù)量的迭代T(即,訓(xùn)練T基分類器)。對(duì)未知的觀測(cè)值

進(jìn)行預(yù)測(cè)是通過計(jì)算分類器輸出的加權(quán)平均值來完成的,由下式可得:

預(yù)測(cè)是根據(jù)分類精度對(duì)基學(xué)習(xí)器進(jìn)行加權(quán)平均。AdaBoost的缺點(diǎn)是其過擬合訓(xùn)練數(shù)據(jù)的傾向。在存在標(biāo)簽噪聲的情況下,AdaBoost高度過擬合錯(cuò)誤的標(biāo)簽,因?yàn)樗啻螄L試正確分類所有的訓(xùn)練數(shù)據(jù)。然而,AdaBoost的這一特性已被用于識(shí)別和消除帶有標(biāo)簽噪聲的觀測(cè)值。自助法(bagging)也使用混合基分類器來預(yù)測(cè)觀測(cè)結(jié)果。與按順序訓(xùn)練基學(xué)習(xí)器的增強(qiáng)方法不同,bagging對(duì)所有分類器執(zhí)行并行訓(xùn)練。最初,通過引導(dǎo)創(chuàng)建訓(xùn)練數(shù)據(jù)的多個(gè)子集。然后用每個(gè)子集訓(xùn)練一個(gè)基分類器。在訓(xùn)練階段之后,每個(gè)分類器都用于預(yù)測(cè)新的未知觀測(cè)值的標(biāo)簽。最終預(yù)測(cè)是通過使用基分類器的多數(shù)投票來完成的。研究表明,與boosting相比,當(dāng)數(shù)據(jù)存在噪聲時(shí),bagging更穩(wěn)健。此外,與boosting相比,bagging對(duì)標(biāo)簽噪音的抗噪性更強(qiáng)。

決策樹通常用作bagging方法的基分類器。決策樹本身是一種簡(jiǎn)單的方法,具有較高的靈活性,但往往會(huì)導(dǎo)致過擬合。然而,在bagging算法中,當(dāng)使用決策樹作為基分類器時(shí),通??梢垣@得較高的性能。這種組合被稱為隨機(jī)森林。隨機(jī)森林已被證明具有較高的準(zhǔn)確性,并在文獻(xiàn)中得到了廣泛的應(yīng)用。


⑥正則化

機(jī)器學(xué)習(xí)的一大挑戰(zhàn)是避免過擬合,在這種情況下,機(jī)器學(xué)習(xí)模型可以正確識(shí)別已知的所有(或大多數(shù))例子的結(jié)果標(biāo)簽,但在估計(jì)新的未知觀測(cè)結(jié)果標(biāo)簽時(shí)表現(xiàn)很差。因此,訓(xùn)練后的模型對(duì)新的觀測(cè)結(jié)果的泛化能力較差。當(dāng)機(jī)器學(xué)習(xí)算法具有高度的靈活性并能夠與訓(xùn)練數(shù)據(jù)中的噪聲密切擬合時(shí),過擬合變得更加明顯。降低過擬合可能性的一個(gè)重要方法是進(jìn)行特征降維。

最小化過擬合的一個(gè)更明確的方法是使用正則化項(xiàng)。正則化模型的概念在于降低模型的復(fù)雜度,從而平滑決策邊界并允許在訓(xùn)練階段出現(xiàn)錯(cuò)誤。最常用的正則化是L1和L2范數(shù)。對(duì)于向量w={w1,...,wK},Lp范數(shù)由:

如果沒有正則化項(xiàng),訓(xùn)練階段的目標(biāo)是最小化實(shí)際結(jié)果標(biāo)簽和估計(jì)結(jié)果標(biāo)簽之間的誤差。這是通過最小化損失函數(shù)

來完成的,其中y是實(shí)際結(jié)果標(biāo)簽,

是使用預(yù)測(cè)模型G的估計(jì)結(jié)果,該預(yù)測(cè)模型使用權(quán)向量w來預(yù)測(cè)特征矩陣F的標(biāo)簽。為了合并正則化,在訓(xùn)練階段最小化的目標(biāo)函數(shù)J應(yīng)該是損失函數(shù)和正則化項(xiàng)的組合:

其中R(w)是正則化項(xiàng),λ是用戶定義的參數(shù),用于控制模型的復(fù)雜度和訓(xùn)練精度之間的平衡。當(dāng)λ=0時(shí),不應(yīng)用正則化,(38)中給出的目標(biāo)函數(shù)簡(jiǎn)化為損失函數(shù)。當(dāng)λ>0時(shí),目標(biāo)函數(shù)J成為訓(xùn)練精度和決策邊界平滑度之間的折衷。λ的值越大,決策邊界的平滑度就越重要,而較小的λ值更強(qiáng)調(diào)訓(xùn)練樣本的正確識(shí)別。

交叉驗(yàn)證方法用于選擇λ的最佳值。這是通過對(duì)不同的λ值執(zhí)行交叉驗(yàn)證,并選擇對(duì)應(yīng)于最高預(yù)測(cè)性能的值來實(shí)現(xiàn)的。在交叉驗(yàn)證中,從整個(gè)數(shù)據(jù)集中選擇λ的最佳值可能會(huì)導(dǎo)致對(duì)預(yù)測(cè)性能的估計(jì)有所偏差。嵌套交叉驗(yàn)證可用于緩解此問題,它是指在另一個(gè)交叉驗(yàn)證的訓(xùn)練數(shù)據(jù)上執(zhí)行交叉驗(yàn)證。

交叉驗(yàn)證

機(jī)器學(xué)習(xí)算法,無論是分類模型還是回歸模型,都需要一組獨(dú)立的測(cè)試數(shù)據(jù)來評(píng)估訓(xùn)練階段后的預(yù)測(cè)性能和泛化誤差。但是,我們并不總是能夠獲得一個(gè)獨(dú)立的測(cè)試數(shù)據(jù)集。因此,不僅要利用手頭的數(shù)據(jù)來訓(xùn)練模型,還要評(píng)估訓(xùn)練模型的性能和可泛化性。當(dāng)機(jī)器學(xué)習(xí)模型高度靈活時(shí),這一點(diǎn)變得更加重要。例如,一個(gè)k=1的kNN分類器正確分類了所有的訓(xùn)練數(shù)據(jù),但決策邊界是高度非線性的,并且偏向于訓(xùn)練數(shù)據(jù)。這個(gè)模型在預(yù)測(cè)新的未知觀測(cè)結(jié)果的正確標(biāo)簽方面可能表現(xiàn)很差。另一方面,當(dāng)k非常大時(shí),kNN分類器傾向于支持訓(xùn)練觀測(cè)值數(shù)量最多的類,這也可能無法正確預(yù)測(cè)新觀測(cè)值的標(biāo)簽,特別是對(duì)于高度不平衡的數(shù)據(jù)集。在這種情況下,可以使用交叉驗(yàn)證來評(píng)估訓(xùn)練模型在不同參數(shù)下的分類性能,然后選擇能夠?qū)崿F(xiàn)最高預(yù)測(cè)性能的參數(shù)。交叉驗(yàn)證是一種評(píng)估模型泛化誤差的簡(jiǎn)單技術(shù)。交叉驗(yàn)證將訓(xùn)練數(shù)據(jù)劃分為K個(gè)不重疊的分區(qū),其中K-1分區(qū)的一個(gè)子集用于訓(xùn)練模型,另一個(gè)分區(qū)用于測(cè)試模型。這稱為K折交叉驗(yàn)證。在K折交叉驗(yàn)證中,整個(gè)訓(xùn)練和測(cè)試過程重復(fù)K次,這樣每個(gè)分區(qū)都被用作一次測(cè)試數(shù)據(jù)集。然后將模型的總體性能估計(jì)為K個(gè)模型的預(yù)測(cè)性能的平均值。通常使用5折和10折交叉驗(yàn)證。留一交叉驗(yàn)證是也常用的方法,當(dāng)K等于訓(xùn)練觀測(cè)值數(shù)時(shí)是一種特殊情況。在使用交叉驗(yàn)證時(shí)必須謹(jǐn)慎,以避免對(duì)性能估計(jì)產(chǎn)生偏差,例如,當(dāng)特征降維方法應(yīng)用于訓(xùn)練數(shù)據(jù)時(shí)??梢曰谡麄€(gè)訓(xùn)練數(shù)據(jù)集應(yīng)用特征選擇,并僅對(duì)所選特征應(yīng)用交叉驗(yàn)證。交叉驗(yàn)證計(jì)算該模型的預(yù)測(cè)性能(即特征選擇后)將導(dǎo)致有偏估計(jì),因?yàn)闇y(cè)試數(shù)據(jù)已經(jīng)用于特征選擇。在這種情況下,要執(zhí)行無偏交叉驗(yàn)證,必須首先將數(shù)據(jù)劃分為K個(gè)分區(qū),并留下一個(gè)分區(qū)進(jìn)行測(cè)試。然后,其余的K-1分區(qū)用于執(zhí)行特征選擇,并隨后用于訓(xùn)練分類器。重復(fù)此過程K次,以實(shí)現(xiàn)對(duì)分類性能的無偏估計(jì)。

如前所述,預(yù)測(cè)性能的無偏估計(jì)需要一個(gè)獨(dú)立的測(cè)試數(shù)據(jù)集。這在處理EEG數(shù)據(jù)時(shí)尤其重要,因?yàn)檫@些數(shù)據(jù)可能在時(shí)間上是相關(guān)的。Li等人發(fā)現(xiàn)靜息-覺醒條件下的EEG動(dòng)態(tài)與執(zhí)行任務(wù)時(shí)誘發(fā)相關(guān)電位的P3成分之間存在被試內(nèi)相關(guān)性。其他研究利用EEG的被試內(nèi)特征開發(fā)基于EEG的指紋和生物識(shí)別系統(tǒng)應(yīng)用。這些研究結(jié)果表明,數(shù)據(jù)中存在EEG的被試特異性特征,甚至來自多個(gè)session;因此,來自不同時(shí)間點(diǎn)的被試內(nèi)EEG片段可能不是獨(dú)立的。因此,在評(píng)估與被試無關(guān)的模型性能時(shí),對(duì)來自多個(gè)被試EEG的連接特征執(zhí)行K折交叉驗(yàn)證可能會(huì)導(dǎo)致對(duì)性能的有偏估計(jì),這并不能反映真正的泛化誤差。為了實(shí)現(xiàn)無偏估計(jì),劃分被試進(jìn)行交叉驗(yàn)證是必要的。

性能評(píng)估

在訓(xùn)練階段之后評(píng)估機(jī)器學(xué)習(xí)算法的性能時(shí),需要定量的度量。為了評(píng)估預(yù)測(cè)模型性能的各個(gè)方面,已經(jīng)開發(fā)了幾種度量方法。接下來,將概述常用的性能度量?;煜仃?,也稱為列聯(lián)表,是一個(gè)包含關(guān)于每個(gè)類別正確和錯(cuò)誤分類數(shù)量信息的矩陣。在二元分類問題中,有兩個(gè)類通常被標(biāo)識(shí)為陽性和陰性;陽性類是感興趣的類別(例如,癲癇發(fā)作)。真陽性是指正確預(yù)測(cè)了陽性類,而假陽性(I類錯(cuò)誤)是指將陰性類錯(cuò)誤地預(yù)測(cè)為陽性類。陰性類的相同概念有真陰性和假陰性(II類錯(cuò)誤)。因此,二元問題的混淆矩陣有四個(gè)元素,即真陽性(TP)、假陽性(FP)、真陰性(TN)和假陰性(FN)的總數(shù)。這些為訓(xùn)練過的模型提供了預(yù)測(cè)性能的概述。

靈敏度(Sn),也稱為真陽性率或召回率,是正確識(shí)別的觀測(cè)值在陽性類中的比例。同樣,特異性(Sp),也稱為真陰性率,是陰性類中正確預(yù)測(cè)實(shí)例的比例。精度(Pr),也稱為陽性預(yù)測(cè)值,是正確識(shí)別的陽性實(shí)例相對(duì)于陽性預(yù)測(cè)總數(shù)的比例。這些度量可以計(jì)算為:

靈敏度度量的是模型在不考慮陰性類預(yù)測(cè)的情況下預(yù)測(cè)陽性類的準(zhǔn)確性。另一方面,特異性是對(duì)模型的陰性類預(yù)測(cè)能力的度量。相反,模型的特異性和精度都受到假陽性的影響。因此,盡管這些度量值量化了預(yù)測(cè)模型性能的各個(gè)方面,但它們并不能單獨(dú)提供整體性能。例如,一個(gè)完美的精度(即Pr=1)表示模型正確預(yù)測(cè)了所有陰性類觀測(cè)值的標(biāo)簽,因此沒有假陽性。但是,它沒有提供有關(guān)模型靈敏度的任何信息。

準(zhǔn)確性是一種廣泛使用的評(píng)估分類模型預(yù)測(cè)性能的指標(biāo)。準(zhǔn)確性度量的是正確預(yù)測(cè)的標(biāo)簽與觀測(cè)值總數(shù)之間的比率,計(jì)算公式為:

當(dāng)數(shù)據(jù)集是平衡的(即陰性觀測(cè)值和陽性觀測(cè)值的數(shù)量相等時(shí)),0.85的準(zhǔn)確性對(duì)應(yīng)于對(duì)85%數(shù)據(jù)標(biāo)簽的正確預(yù)測(cè)。但是,在估計(jì)類不平衡數(shù)據(jù)集的預(yù)測(cè)性能時(shí),準(zhǔn)確性度量可能具有相當(dāng)大的誤導(dǎo)性。例如,在包含來自陰性類的85個(gè)觀測(cè)值和來自陽性類的15個(gè)觀測(cè)值的數(shù)據(jù)集中,將所有內(nèi)容預(yù)測(cè)為陰性類的分類器仍會(huì)顯示0.85的高準(zhǔn)確性。

F度量是一種作為靈敏度和精度的調(diào)和平均數(shù)來估計(jì)預(yù)測(cè)性能的度量方法。它可以取0到1之間的值,分別對(duì)應(yīng)于最差和最佳性能,計(jì)算公式為:

其中β是一個(gè)用戶定義的參數(shù),用于調(diào)整靈敏度與精度的相對(duì)重要性。

幾何平均數(shù)(GM)是一種基于靈敏度和特異性的性能度量,計(jì)算公式為:

phi相關(guān)系數(shù),也稱為Matthews相關(guān)系數(shù),是另一個(gè)性能指標(biāo),已被廣泛用于評(píng)估非平衡數(shù)據(jù)集的性能。其計(jì)算公式為:

上述所有度量方法都利用預(yù)測(cè)標(biāo)簽來估計(jì)預(yù)測(cè)模型在分類器輸出的特定閾值下的性能。相比之下,受試者工作特征(ROC)曲線使用閾值化之前分類器的輸出,并估計(jì)不同閾值下靈敏度和特異性之間的權(quán)衡軌跡。通過使用不同的閾值對(duì)分類器的輸出進(jìn)行二分類,估計(jì)ROC曲線。對(duì)于每個(gè)閾值,評(píng)估靈敏度和假陽性率(即1-Sp)。最后,通過繪制靈敏度與假陽性率的關(guān)系來形成ROC曲線(如圖4所示)。隨機(jī)分類器的ROC曲線是將(0,0)的靈敏度和假陽性率與其對(duì)應(yīng)的(1,1)值連接起來的直線(圖4中的藍(lán)線)。另一方面,完美分類器對(duì)應(yīng)于ROC曲線上的靈敏度為1,假陽性率為0。ROC曲線下面積(AUC-ROC)通常用作分類器的性能指標(biāo)。AUC-ROC取0到1之間的值,其中1對(duì)應(yīng)完美分類器,0.5對(duì)應(yīng)于隨機(jī)分類器,0對(duì)應(yīng)于完全反轉(zhuǎn)分類器。

圖4.三種假設(shè)分類器的ROC曲線。

藍(lán)線對(duì)應(yīng)于隨機(jī)分類器。綠曲線對(duì)應(yīng)的分類器優(yōu)于紅曲線對(duì)應(yīng)的分類器。精度-召回率(PR)曲線是另一種與ROC曲線類似的方法。PR曲線使用閾值化之前的分類器輸出。PR曲線繪制了不同閾值下靈敏度和精度之間的權(quán)衡(如圖5所示)。對(duì)于隨機(jī)分類器,PR曲線是在

處的一條水平線,其中P和N分別是陽性類和陰性類的總數(shù)。性能優(yōu)于隨機(jī)的分類器的PR曲線高于隨機(jī)分類器的PR曲線。例如,類平衡數(shù)據(jù)集的隨機(jī)分類器在0.5處是一條水平線(如圖5中的藍(lán)線所示),而優(yōu)于隨機(jī)分類器的PR曲線高于0.5(如圖5中的紅綠線所示)。有人認(rèn)為當(dāng)數(shù)據(jù)集高度傾斜(即類不平衡)時(shí),PR曲線可以更好地評(píng)估分類器的性能。PR曲線下面積(AUC-PR)提供了可用作性能指標(biāo)的單一度量。

圖5.三種假設(shè)分類器的PR曲線。

當(dāng)數(shù)據(jù)是類平衡時(shí),藍(lán)線對(duì)應(yīng)于隨機(jī)分類器。綠曲線對(duì)應(yīng)的分類器性能優(yōu)于紅曲線對(duì)應(yīng)的分類器。

應(yīng)用

大量的研究集中在基于EEG的機(jī)器學(xué)習(xí)上。基于EEG的機(jī)器學(xué)習(xí)有許多應(yīng)用。一個(gè)重要的應(yīng)用是使用機(jī)器學(xué)習(xí)從EEG中識(shí)別和提取神經(jīng)系統(tǒng)疾病的生物標(biāo)志物,例如阿爾茨海默癥,帕金森,癲癇和癲癇發(fā)作,以及癡呆。機(jī)器學(xué)習(xí)在EEG中的其他應(yīng)用包括腦機(jī)接口(BCI)、睡眠分期、睡意檢測(cè)、以及微睡眠檢測(cè)和預(yù)測(cè)等。盡管應(yīng)用不同,但機(jī)器學(xué)習(xí)過程在這些EEG系統(tǒng)的實(shí)現(xiàn)遵循類似的步驟。接下來,本文將進(jìn)一步詳細(xì)介紹機(jī)器學(xué)習(xí)在EEG中的兩個(gè)應(yīng)用,即BCI與微睡眠檢測(cè)和預(yù)測(cè)。

①腦機(jī)接口(BCI)

BCI系統(tǒng)使用戶能夠通過大腦活動(dòng)與周圍環(huán)境進(jìn)行交互。BCI系統(tǒng)對(duì)重度殘疾患者尤為重要,BCI系統(tǒng)使他們能夠在不使用任何肌肉或周圍神經(jīng)的情況下控制假肢或環(huán)境。這些系統(tǒng)通常使用EEG來記錄大腦的電活動(dòng),因?yàn)镋EG成本低,時(shí)間分辨率高,相關(guān)風(fēng)險(xiǎn)低。

一類BCI系統(tǒng)專注于運(yùn)動(dòng)圖像。在這種范式中,參與者在心理上模擬執(zhí)行一系列動(dòng)作。BCI系統(tǒng)的目的是利用大腦活動(dòng)來區(qū)分不同類型的運(yùn)動(dòng)。一些研究調(diào)查了運(yùn)動(dòng)想象BCI,并取得了相對(duì)可接受的表現(xiàn)。使用類似的概念,目前已經(jīng)開發(fā)了其他系統(tǒng)來控制機(jī)械臂和無人機(jī)。在這些系統(tǒng)中,采用了多種特征提取方法,包括CSP,小波變換系數(shù),頻譜特征,卷積神經(jīng)網(wǎng)絡(luò)和自編碼器。此外,一系列分類器已用于分離運(yùn)動(dòng)圖像任務(wù),例如LDA,SVM,kNN,集成分類器,樸素貝葉斯和深度神經(jīng)網(wǎng)絡(luò)。

P300拼寫器是BCI的另一種范式。在P300拼寫器中,參與者會(huì)看到一個(gè)字母表,其中一行或一列的強(qiáng)度隨機(jī)增加。要求參與者將注意力集中在興趣字母上,該字母會(huì)隨機(jī)突出顯示。這種強(qiáng)度的變化會(huì)在參與者的大腦活動(dòng)中產(chǎn)生反應(yīng),該反應(yīng)發(fā)生在字母突出顯示后大約300ms,即P300。使用P300模式,BCI系統(tǒng)可以識(shí)別感興趣的字母。P300拼寫器范式已在文獻(xiàn)中得到了廣泛研究,并取得了相對(duì)較好的表現(xiàn)。已有幾種分類器被用于在P300拼寫范式中識(shí)別感興趣的字母,例如LDA、SVM、深度神經(jīng)網(wǎng)絡(luò)、集成分類器和隨機(jī)森林。

還有其他BCI范式,例如穩(wěn)態(tài)視覺誘發(fā)電位(SSVEP)、聽覺誘發(fā)電位、視覺誘發(fā)電位和混合誘發(fā)電位。這些范式也是許多研究的主題。有許多研究對(duì)不同的BCI范式進(jìn)行了調(diào)查,并且發(fā)表的數(shù)量正在增加。這些研究結(jié)果表明,改善嚴(yán)重神經(jīng)和肌肉骨骼疾病患者的生活質(zhì)量具有廣闊的前景。

②微睡眠的實(shí)時(shí)檢測(cè)與預(yù)測(cè)

微睡眠是指一種短暫的(<15s)無意識(shí)發(fā)作,是一種與睡眠相關(guān)的意識(shí)喪失。微睡眠是在沒有任何征兆的情況下發(fā)生的,通常伴隨著一些行為線索,如點(diǎn)頭、眼睛下垂和閉眼緩慢。大多數(shù)人在讀書或聽課時(shí)都有過微睡眠的經(jīng)歷。但是,如果微睡眠發(fā)生在駕駛等某些特定任務(wù)中,可能會(huì)導(dǎo)致嚴(yán)重后果。此外,許多正常休息的健康個(gè)體在執(zhí)行一項(xiàng)長(zhǎng)時(shí)間的單調(diào)任務(wù)時(shí),會(huì)頻繁地經(jīng)歷微睡眠。因此,微睡眠的檢測(cè)和預(yù)測(cè)對(duì)于需要長(zhǎng)時(shí)間不受影響的視覺運(yùn)動(dòng)表現(xiàn)的職業(yè)(如駕駛)來說是至關(guān)重要的。一些研究調(diào)查了從EEG信號(hào)中檢測(cè)微睡眠。在這些研究中,參與者執(zhí)行了一個(gè)連續(xù)的跟蹤任務(wù)來模擬駕駛?cè)蝿?wù)。然后從跟蹤表現(xiàn)和面部視頻定義微睡眠。對(duì)于微睡眠的每種狀態(tài),利用相應(yīng)的EEG窗口來提取特征。利用這些特征,然后應(yīng)用各種機(jī)器學(xué)習(xí)算法來檢測(cè)微睡眠。

對(duì)微睡眠的預(yù)測(cè)也是許多研究的主題。在這些研究中,與微睡眠狀態(tài)相對(duì)應(yīng)的EEG窗口的選擇是通過使EEG窗口先于相應(yīng)的微睡眠狀態(tài)一定時(shí)間的方式進(jìn)行的。在性能方面,微睡眠檢測(cè)和預(yù)測(cè)系統(tǒng)已經(jīng)實(shí)現(xiàn)了相對(duì)較高的AUC-ROC值(例如,0.95)。然而,這些系統(tǒng)的精度相對(duì)較低。微睡眠系統(tǒng)存在的挑戰(zhàn)之一是,微睡眠數(shù)據(jù)具有固有的高類別不平衡。此外,類別失衡比例因人而異。這為訓(xùn)練系統(tǒng)和評(píng)估其性能帶來了復(fù)雜性。

結(jié)論

大量的研究集中在EEG及其在醫(yī)學(xué)、神經(jīng)科學(xué)、康復(fù)和其他領(lǐng)域的應(yīng)用。EEG和機(jī)器學(xué)習(xí)領(lǐng)域的整合為開發(fā)基于EEG的精確預(yù)測(cè)系統(tǒng)提供了一個(gè)框架。本文概述了基于EEG系統(tǒng)的機(jī)器學(xué)習(xí)算法。將該過程分為EEG數(shù)據(jù)采集,預(yù)處理,特征提取,特征降維,分類和性能評(píng)估。對(duì)于每個(gè)步驟,都進(jìn)行了介紹并討論了潛在的挑戰(zhàn)。此外,機(jī)器學(xué)習(xí)將在基于EEG的系統(tǒng)及其應(yīng)用中發(fā)揮越來越重要的作用。特別是,深度神經(jīng)網(wǎng)絡(luò)將成為開發(fā)基于EEG的系統(tǒng)越來越受歡迎的選擇。


參考文獻(xiàn):

1. Tong, S.,Thakor, N.V.: Quantitative EEG analysis methods and clinical applications. Artech House engineering in medicine & biology series. Artech House (2009)2. Lopes da Silva, F.: EEG and MEG: Relevance to neuroscience. Neuron 80(5), 1112–1128 (2013). https://doi.org/10.1016/j.neuron.2013.10.0173. Logothetis, N.K.: What we can do and what we cannot do with fMRI. Nature 453, 869 (2008). https://doi.org/10.1038/nature069764. Irani, F., Platek, S.M., Bunce, S., Ruocco, A.C., Chute, D.: Functional near infrared spectroscopy (fNIRS): An emerging neuroimaging technology with important applications for the study of brain disorders. Clin. Neuropsychol. 21(1), 9-37 (2007). https://doi.org/10.1080/138540406009100185. Buzsaki, G.: Rhythms of the brain. Oxford University Press, New York (2006)6. Cohen, M.X.: Analyzing neural time series data: Theory and practice. The MIT Press, Cambridge (2014)7. Widmann, A., Schr?ger, E., Maess, B.: Digital filter design for electrophysiological data - A practical approach. J. Neurosci. Meth. 250, 34–46 (2015). https://doi.org/10.1016/j.jneumeth.2014.08.0028. Mullen, T.R., Kothe, C.A.E., Chi, Y.M., Ojeda, A., Kerth, T., Makeig, S., Jung, T.-P., Cauwenberghs, G.: Real-time neuroimaging and cognitive monitoring using wearable dry EEG. IEEE Trans. Biomed. Eng. 62(11), 2553-2567 (2015). https://doi.org/10.1109/TBME.2015.24814829. Delorme, A., Sejnowski, T., Makeig, S.: Enhanced detection of artifacts in EEG data using higher-order statistics and independent component analysis. NeuroImage 34(4), 1443–1449 (2007). https://doi.org/10.1016/j.neuroimage.2006.11.00410. Cohen, M.X.: Comparison of linear spatial filters for identifying oscillatory activity in multichannel data. J. Neurosci. Meth. 278, 1-12 (2017). https://doi.org/10.1016/j.jneumeth.2016.12.01611. Jonmohamadi, Y., Poudel, G., Innes, C., Weiss, D., Krueger, R., Jones, R.: Comparison of beamformers for EEG source signal reconstruction. Biomed. Signal Process. Control 14(Supplement C), 175-188 (2014). https://doi.org/10.1016/j.bspc.2014.07.01412. Clercq, W.D., Vergult, A., Vanrumste, B., Van Paesschen, W., Van Huffel, S.: Canonical correlation analysis applied to remove muscle artifacts from the electroencephalogram. IEEE Trans. Biomed. Eng. 53(12), 2583-2587 (2006). https://doi.org/10.1109/TBME.2006.87945913. Nolan, H., Whelan, R., Reilly, R.B.: FASTER: Fully automated statistical thresholding for EEG artifact rejection. J. Neurosci. Meth. 192(1), 152-162 (2010). https://doi.org/10.1016/j.jneumeth.2010.07.01514. Hastie, T., Tibshirani, R., Friedman, J.: The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer Series in Statistics, 2nd edn. Springer, New York (2009)15. Murphy, K.P.: Machine Learning: A Probabilistic Perspective. MIT Press, Cambridge (2013)16. Bishop, C.M.: Pattern Recognition and Machine Learning. Springer, Berlin/Heidelberg (2006)17. Müller, K.-R., Tangermann, M., Dornhege, G., Krauledat, M., Curio, G., Blankertz, B.: Machine learning for real-time single-trial EEG-analysis: From brain–computer interfacing to mental state monitoring. J. Neurosci. Meth. 167(1), 82-90 (2008). https://doi.org/10.1016/j.jneumeth.2007.09.02218. Lemm, S., Schafer, C., Curio, G.: BCI competition 2003-data set III: Probabilistic modeling of sensorimotor mu; rhythms for classification of imaginary hand movements. IEEE Trans. Biomed. Eng. 51(6), 1077-1080 (2004). https://doi.org/10.1109/TBME.2004.82707619. Dauwan, M., Linszen, M.M.J., Lemstra, A.W., Scheltens, P., Stam, C.J., Sommer, I.E.: EEGbased neurophysiological indicators of hallucinations in Alzheimer’s disease: Comparison with dementia with Lewy bodies. Neurobiol. Aging 67, 75-83 (2018). https://doi.org/10.1016/j.neurobiolaging.2018.03.01320. Kumar, Y., Dewal, M.L., Anand, R.S.: Epileptic seizure detection using DWT based fuzzy approximate entropy and support vector machine. Neurocomputing 133, 271-279 (2014). https://doi.org/10.1016/j.neucom.2013.11.00921. Buriro, A.B., Shoorangiz, R., Weddell, S.J., Jones, R.D.: Predicting microsleep states using EEG inter-channel relationships. IEEE Trans. Neural Syst. Rehabilitat. Eng. 26(12), 2260-2269 (2018). https://doi.org/10.1109/TNSRE.2018.287858722. Davidson, P.R., Jones, R.D., Peiris, M.T.R.: EEG-based lapse detection with high temporal resolution. IEEE Trans. Biomed. Eng. 54(5), 832-839 (2007). https://doi.org/10.1109/TBME.2007.89345223. Shahidi Zandi, A., Tafreshi, R., Javidan, M., Dumont, G.A.: Predicting epileptic seizures in scalp EEG based on a variational Bayesian Gaussian mixture model of zero-crossing intervals. EEE Trans. Biomed. Eng. 60(5), 1401-1413 (2013). https://doi.org/10.1109/TBME.2012.223739924. Kwon, Y.-H., Shin, S.-B., Kim, S.-D.: Electroencephalography based fusion two-dimensional(2D)-convolution neural networks (CNN) model for emotion recognition system. Sensors 18(5), 1383 (2018). https://doi.org/10.3390/s1805138325. Sen, B., Peker, M., ?avu? soglu, A., ?elebi, F.: A comparative study on classification of sleep stage based on EEG signals using feature selection and classification algorithms. J. Med. Syst. 38(3), 1-21 (2014). https://doi.org/10.1007/s10916-014-0018-026. Hjorth, B.: EEG analysis based on time domain properties. Electroencephalography Clin. Neurophysiol. 29(3), 306-310 (1970). https://doi.org/10.1016/0013-4694(70)90143-427. Vidaurre, C., Kr?mer, N., Blankertz, B., Schl?gl, A.: Time domain parameters as a feature for EEG-based brain-computer interfaces. Neural Netw. 22(9), 1313–1319 (2009). https://doi.org/10.1016/j.neunet.2009.07.02028. Chapotot, F., Becq, G.: Automated sleep–wake staging combining robust feature extraction, artificial neural network classification, and flexible decision rules. Int. J. Adap. Control Signal Process. 24(5), 409-423 (2010). https://doi.org/10.1002/acs.114729. Padilla-Buritica, J.I., Martinez-Vargas, J.D., Castellanos-Dominguez, G.: Emotion discrimination using spatially compact regions of interest extracted from imaging EEG activity. Front. Comput. Neurosci. 10, 55 (2016). https://doi.org/10.3389/fncom.2016.0005530. Cecchin, T., Ranta, R., Koessler, L., Caspary, O., Vespignani, H., Maillard, L.: Seizure lateralization in scalp EEG using Hjorth parameters. Clin. Neurophysiol. 121(3), 290–300(2010). https://doi.org/10.1016/j.clinph.2009.10.03331. Greene, B.R., Faul, S., Marnane, W.P., Lightbody, G., Korotchikova, I., Boylan, G.B.: A comparison of quantitative EEG features for neonatal seizure detection. Clin. Neurophysiol. 119(6), 1248-1261 (2008). https://doi.org/10.1016/j.clinph.2008.02.00132. Imtiaz, S.A., Saremi-Yarahmadi, S., Rodriguez-Villegas, E.: Automatic detection of sleep spindles using Teager energy and spectral edge frequency. In: Proceedings of IEEE Biomedical Circuits System Conference, pp. 262-265. IEEE (2013). https://doi.org/10.1109/BioCAS.2013.667968933. Di Ieva, A., Grizzi, F., Jelinek, H., Pellionisz, A.J., Losa, G.A.: Fractals in the neurosciences, Part I: General principles and basic neurosciences. The Neuroscientist 20(4), 403-417 (2014). https://doi.org/10.1177/107385841351392734. Hosseini, S.A.: A computational framework to discriminate different anesthesia states from EEG signal. Biomed. Eng. Appl. Basis Commun. 30(03), 1850020 (2018). https://doi.org/10.4015/S101623721850020535. Pavithra, M., NiranjanaKrupa, B., Sasidharan, A., Kutty, B.M., Lakkannavar, M.: Fractal dimension for drowsiness detection in brainwaves. In: Proc. Int. Conf. Contemp. Comput. Informat. (IEEE, 2014) pp. 757-761. https://doi.org/10.1109/IC3I.2014.701967636. Yan, R., Zhang, C., Spruyt, K., Wei, L., Wang, Z., Tian, L., Li, X., Ristaniemi, T., Zhang, J., Cong, F.: Multi-modality of polysomnography signals’ fusion for automatic sleep scoring. Biomed. Signal Process. Control 49, 14-23 (2019). https://doi.org/10.1016/j.bspc.2018.10.00137. Paramanathan, P., Uthayakumar, R.: Application of fractal theory in analysis of human electroencephalographic signals. Comput. Biol. Med. 38(3), 372-378 (2008). https://doi.org/10.1016/j.compbiomed.2007.12.00438. Polychronaki, G.E., Ktonas, P.Y., Gatzonis, S., Siatouni, A., Asvestas, P.A., Tsekou, H., Sakas, D., Nikita, K.S.: Comparison of fractal dimension estimation algorithms for epileptic seizure onset detection. J. Neural Eng. 7(4), 046007 (2010)39. Ahmadlou, M., Adeli, H., Adeli, A.: Fractality and a wavelet-chaos-methodology for EEGbased diagnosis of Alzheimer disease. Alzheimer Dis. Assoc. Disorders 25(1) (2011)40. Sabeti, M., Katebi, S.D., Boostani, R., Price, G.W.: A new approach for EEG signalclassification of schizophrenic and control participants. Expert Syst. Appl. 38(3), 2063–2071(2011). https://doi.org/10.1016/j.eswa.2010.07.14541. D’Alessandro, M., Vachtsevanos, G., Hinson, A., Esteller, R., Echauz, J., Litt, B.: A genetic approach to selecting the optimal feature for epileptic seizure prediction. In: Proceedings of International Conference IEEE Engineering Medical Biology Society, Vol. 23, pp. 1703-1706. IEEE (2001). https://doi.org/10.1109/IEMBS.2001.102054442. Blythe, D., Haufe, A.J.S., Müller, K.-R., Nikulin, V.V.: The effect of linear mixing in the EEG on Hurst exponent estimation. NeuroImage 99, 377–387 (2014). https://doi.org/10.1016/j.neuroimage.2014.05.04143. Carreras, B.A., van Milligen, B.P., Pedrosa, M.A., Balbín, R., Hidalgo, C., Newman, D.E., Sánchez, E., Frances, M., García-Cortés, I., Bleuel, J., Endler, M., Riccardi, C., Davies, S., Matthews, G.F., Martines, E., Antoni, V., Latten, A., Klinger, T.: Self-similarity of the plasma edge fluctuations. Phys. Plasmas 5(10), 3632–3643 (1998). https://doi.org/10.1063/1.87308144. Yuan, Q., Zhou, W., Li, S., Cai, D.: Epileptic EEG classification based on extreme learning machine and nonlinear features. Epilepsy Res. 96(1–2), 29–38 (2011) . https://doi.org/10.1016/j.eplepsyres.2011.04.01345. Wang, X.-W., Nie, D., Lu, B.-L.: Emotional state classification from EEG data using machine learning approach. Neurocomputing 129, 94–106 (2014). https://doi.org/10.1016/j.neucom.2013.06.04646. Oppenheim, A.V., Willsky, A.S., Nawab, S.H.: Signals & Systems. Prentice-Hall, Inc., Upper Saddle River (1996)47. Kaplan, A.Y., Fingelkurts, A.A., Fingelkurts, A.A., Borisov, S.V., Darkhovsky, B.S.: Nonstationary nature of the brain activity as revealed by EEG/MEG: Methodological, practical and conceptual challenges. Signal Process. 85(11), 2190-2212 (2005) . https://doi.org/10.1016/j.sigpro.2005.07.01048. Muthuswamy, J., Thakor, N.V.: Spectral analysis methods for neurological signals. J. Neurosci. Meth. 83(1), 1-14 (1998). https://doi.org/10.1016/S0165-0270(98)00065-X49. Gross, J.: Analytical methods and experimental approaches for electrophysiological studies of brain oscillations. J. Neurosci. Meth. 228, 57–66 (2014). https://doi.org/10.1016/j.jneumeth.2014.03.00750. Mallat, S.: A wavelet tour of signal processing, 3rd edn (pp. 795–805). Academic Press, Boston (2009)51. Freeman, W.J.: Hilbert transform for brain waves. Scholarpedia 2(1), 1338 (2007). https://doi.org/10.4249/scholarpedia.133852. Mallat, S.G., Zhang, Z.: Matching pursuits with time-frequency dictionaries. IEEE Trans. Signal Process. 41(12), 3397–3415 (1993) . https://doi.org/10.1109/78.25808253. Durka, P.J., Blinowska, K.J.: Analysis of EEG transients by means of matching pursuit. Ann. Biomed. Eng. 23(5), 608–611 (1995) . https://doi.org/10.1007/BF0258445954. Welch, P.: The use of fast Fourier transform for the estimation of power spectra: A method based on time averaging over short, modified periodograms. IEEE Trans. Audio Electroacous. 15(2), 70–73 (1967). https://doi.org/10.1109/TAU.1967.116190155. Babiloni, C., Pistoia, F., Sarà, M., Vecchio, F., Buffo, P., Conson, M., Onorati, P., Albertini, G., Rossini, P.M.: Resting state eyes-closed cortical rhythms in patients with locked-in-syndrome: An EEG study. Clin. Neurophysiol. 121(11), 1816-1824 (2010) . https://doi.org/10.1016/j.clinph.2010.04.02756. Shoorangiz, R., Weddell, S.J., Jones, R.D.: Bayesian multi-subject factor analysis to predict microsleeps from EEG power spectral features. In: Proceedings of International Conference of the IEEE Engineering in Medicine and Biology Society, Vol. 39, pp. 4183–4186. IEEE(2017) . https://doi.org/10.1109/EMBC.2017.803777857. Lin, F., Ko, L., Chuang, C., Su, T., Lin, C.: Generalized EEG-based drowsiness prediction system by using a self-organizing neural fuzzy system. IEEE Trans. Circuits Syst. I Regular Papers 59(9), 2044–2055. (2012) https://doi.org/10.1109/TCSI.2012.218529058. Sabeti, M., Katebi, S., Boostani, R.: Entropy and complexity measures for EEG signal classification of schizophrenic and control participants. Artif. Intell. Med. 47(3), 263–274(2009). https://doi.org/10.1016/j.artmed.2009.03.00359. Kannathal, N., Choo, M.L., Acharya, U.R., Sadasivan, P.K.: Entropies for detection of epilepsy in EEG. Comput. Meth. Prog. Biomed. 80(3), 187–194 (2005). https://doi.org/10.1016/j.cmpb.2005.06.01260. Chen, L.-l., Zhao, Y., Zhang, J., Zou, J.-Z.: Automatic detection of alertness/drowsiness from physiological signals using wavelet-based nonlinear features and machine learning. Expert Syst. Appl. 42(21), 7344–7355 (2015). https://doi.org/10.1016/j.eswa.2015.05.02861. Yeo, M.V.M., Li, X., Shen, K., Wilder-Smith, E.P.V.: Can SVM be used for automatic EEG detection of drowsiness during car driving? Safety Sci. 47(1), 115–124 (2009). https://doi.org/10.1016/j.ssci.2008.01.00762. Ramoser, H., Muller-Gerking, J., Pfurtscheller, G.: Optimal spatial filtering of single trial EEG during imagined hand movement. IEEE Trans. Rehabilitat. Eng. 8(4), 441–446 (2000). https://doi.org/10.1109/86.89594663. Blankertz, B., Tomioka, R., Lemm, S., Kawanabe, M., Muller, K.-R.: Optimizing spatial filters for robust EEG single-trial analysis. IEEE Signal Process. Mag. 25(1), 41–56 (2008). https://doi.org/10.1109/MSP.2008.440844164. Ang, K.K., Chin, Z.Y., Zhang, H., Guan, C.: Filter bank common spatial pattern (FBCSP) in brain-computer interface. In: Proceedings of International Joint Conference on Neural Network, pp. 2390–2397. IEEE, (2008). https://doi.org/10.1109/IJCNN.2008.463413065. Ang, K.K., Chin, Z.Y., Wang, C., Guan, C., Zhang, H.: Filter bank common spatial pattern algorithm on BCI competition IV datasets 2a and 2b. Front. Neurosci. 6, 39 (2012). https://doi.org/10.3389/fnins.2012.0003966. Lotte, F., Guan, C.: Regularizing common spatial patterns to improve BCI designs: Unified theory and new algorithms. IEEE Trans. Biomed. Eng. 58(2), 355–362 (2011). https://doi.org/10.1109/TBME.2010.208253967. Kang, H., Choi, S.: Bayesian common spatial patterns for multi-subject EEG classification. Neural Netw. 57(Supplement C), 39–50 (2014). https://doi.org/10.1016/j.neunet.2014.05.01268. Wu, W., Chen, Z., Gao, X., Li, Y., Brown, E.N., Gao, S.: Probabilistic common spatial patterns for multichannel EEG analysis. IEEE Trans. Pattern Anal. Mach. Intell. 37(3), 639-653 (2015). https://doi.org/10.1109/TPAMI.2014.233059869. Ang, K.K., Chin, Z.Y., Zhang, H., Guan, C.: Mutual information-based selection of optimal spatial–temporal patterns for single-trial EEG-based BCIs. Pattern Recogn. 45(6), 2137–2144(2012). https://doi.org/10.1016/j.patcog.2011.04.01870. Mwangi, B., Tian, T.S., Soares, J.C.: A review of feature reduction techniques in neuroimaging. Neuroinformatics 12(2), 229–244 (2014). https://doi.org/10.1007/s12021-013-9204-371. Chandrashekar, G., Sahin, F.: A survey on feature selection methods. Comput. Electr. Eng. 40(1), 16–28 (2014) . https://doi.org/10.1016/j.compeleceng.2013.11.02472. Cai, J., Luo, J., Wang, S., Yang, S.: Feature selection in machine learning: A new perspective. Neurocomputing 300, 70–79 (2018). https://doi.org/10.1016/j.neucom.2017.11.07773. Miao, J., Niu, L.: A survey on feature selection. Proc. Comput. Sci. 91, 919–926 (2016). https://doi.org/10.1016/j.procs.2016.07.11174. Mitra, P., Murthy, C.A., Pal, S.K.: Unsupervised feature selection using feature similarity. IEEE Trans. Pattern Anal. Mach. Intell. 24(3), 301–312 (2002). https://doi.org/10.1109/34.99013375. Lee, J.A., Verleysen, M.: Nonlinear Dimensionality Reduction, 1st edn. Springer Publishing Company, Incorporated (2007)76. Singh, D.A.A.G., Balamurugan, S.A.A., Leavline, E.J.: An unsupervised feature selection algorithm with feature ranking for maximizing performance of the classifiers. Int. J. Automat. Comput. 12(5), 511–517 (2015) . https://doi.org/10.1007/s11633-014-0859-577. Subasi, A., Gursoy, M.I.: EEG signal classification using PCA, ICA, LDA and support vector machines. Expert Syst. Appl. 37(12), 8659–8666 (2010). https://doi.org/10.1016/j.eswa.2010.06.06578. ai Li, M., Yong Luo, X., fu Yang, J.: Extracting the nonlinear features of motor imagery EEG using parametric t-SNE. Neurocomputing 218, 371–381 (2016). https://doi.org/10.1016/j.neucom.2016.08.08379. Birjandtalab, J., Pouyan, M.B., Cogan, D., Nourani, M., Harvey, J.: Automated seizure detection using limited-channel EEG and non-linear dimension reduction. Comput. Biol. Med. 82, 49–58 (2017). https://doi.org/10.1016/j.compbiomed.2017.01.01180. Yu, X., Chum, P., Sim, K.-B.: Analysis the effect of PCA for feature reduction in nonstationary EEG based motor imagery of BCI system. Optik 125(3), 1498–1502 (2014). https://doi.org/10.1016/j.ijleo.2013.09.01381. Sch?lkopf, B., Smola, A., Müller, K.-R.: Nonlinear component analysis as a kernel eigenvalue problem. Neural Comput. 10(5), 1299–1319 (1998)82. Tipping, M.E., Bishop, C.M.: Probabilistic principal component analysis. J. R. Stat. Soc. Ser. B (Statistical Methodology) 61(3), 611–622 (1999). https://doi.org/10.1111/1467-9868.0019683. Bishop, C.M.: Variational principal components. In: Proceedings of International Conference on Artificial Neural Networks, Vol. 9, pp. 509–514. Institution of Engineering and Technology(1999). https://doi.org/10.1049/cp_1999116084. Ding, X., He, L., Carin, L.: Bayesian robust principal component analysis. IEEE Trans. Image Process. 20(12), 3419–3430 (2011). https://doi.org/10.1109/TIP.2011.215680185. Guyon, I.: An introduction to variable and feature selection. J. Mach. Learn. Res. 3, 1157–1182 (2003)86. Kwak, N., Choi, C.-H.: Input feature selection by mutual information based on Parzen window. IEEE Trans. Pattern Anal. Mach. Intell. 24(12), 1667–1671 (2002). https://doi.org/10.1109/TPAMI.2002.111486187. Battiti, R.: Using mutual information for selecting features in supervised neural net learning. IEEE Trans. Neural Netw. 5(4), 537–550 (1994). https://doi.org/10.1109/72.29822488. Arvaneh, M., Guan, C., Ang, K., Quek, C.: Mutual information-based optimization of sparse spatio-spectral filters in brain-computer interface. Neural Comput. Appl. 25(3–4), 625–634(2014). https://doi.org/10.1007/s00521-013-1523-789. Yang, J., Zhang, L., Xu, Y., Yang, J.-Y.: Beyond sparsity: the role of L1-optimizer in pattern classification. Pattern Recogn. 45(3), 1104–1118 (2012). https://doi.org/10.1016/j.patcog.2011.08.02290. Tibshirani, R.: Regression shrinkage and selection via the lasso. J. R. Stat. Soc. Ser. B(Methodological) 58(1), 267–288 (1996)91. Liu, M., Zhang, D., Shen, D.: Ensemble sparse classification of Alzheimer’s disease. NeuroImage 60(2), 1106–1116 (2012). https://doi.org/10.1016/j.neuroimage.2012.01.05592. Fell, J., R?schke, J., Mann, K., Sch?ffner, C.: Discrimination of sleep stages: A comparison between spectral and nonlinear EEG measures. Electroencephalography Clin. Neurophysiol. 98(5), 401–410 (1996). https://doi.org/10.1016/0013-4694(96)95636-993. Lin, Y., Wang, C., Jung, T., Wu, T., Jeng, S., Duann, J., Chen, J.: EEG-based emotion recognition in music listening. IEEE Trans. Biomed. Eng. 57(7), 1798–1806 (2010). https://doi.org/10.1109/TBME.2010.204856894. Schl?gl, A., Lee, F., Bischof, H., Pfurtscheller, G.: Characterization of four-class motor imagery EEG data for the BCI-competition 2005. J. Neural Eng. 2(4), L14–L22 (2005). https://doi.org/10.1088/1741-2560/2/4/l0295. Quitadamo, L.R., Cavrini, F., Sbernini, L., Riillo, F., Bianchi, L., Seri, S., Saggio, G.: Support vector machines to detect physiological patterns for EEG and EMG-based human–computer interaction: A review. J. Neural Eng. 14(1), 011001 (2017)96. Hearst, M.A., Dumais, S.T., Osuna, E., Platt, J., Scholkopf, B.: Support vector machines. IEEE Intell. Syst. Appl. 13(4), 18–28 (1998). https://doi.org/10.1109/5254.70842897. Sch?lkopf, B.: The kernel trick for distances. In: Leen, T.K., Dietterich, T.G., Tresp, V. (eds.) Advances in Neural Information Processing Systems, pp. 301–307. MIT Press (2001)98. Roth, V., Steinhage, V.: Nonlinear discriminant analysis using kernel functions. In: Solla, S.A., Leen, T.K., Müller, K. (eds.) Advances in Neural Information Processing Systems, pp. 568–574. MIT Press (2000)99. Nicolaou, N., Georgiou, J.: Detection of epileptic electroencephalogram based on permutation entropy and support vector machines. Expert Syst. Appl. 39(1), 202–209 (2012). https://doi.org/10.1016/j.eswa.2011.07.008100. Tito, M., Cabrerizo, M., Ayala, M., Jayakar, P., Adjouadi, M.: A comparative study of intracranial EEG files using nonlinear classification methods. Ann. Biomed. Eng. 38(1), 187–99 (2010)101. Lawrence, N.D., Sch?lkopf, B.: Estimating a kernel Fisher discriminant in the presence of label noise. In: Proceedings of International Conference on Machine Learning, ICML’01, Vol. 18, pp. 306–313. ACM (2001)102. Kayikcioglu, T., Aydemir, O.: A polynomial fitting and k-NN based approach for improving classification of motor imagery BCI data. Pattern Recogn. Lett. 31(11), 1207–1215 (2010). https://doi.org/10.1016/j.patrec.2010.04.009103. Safavian, S.R., Landgrebe, D.: A survey of decision tree classifier methodology. IEEE Trans. Syst. Man Cybern. 21(3), 660–674 (1991). https://doi.org/10.1109/21.97458104. Polat, K., Güne? s, S.: Classification of epileptiform EEG using a hybrid system based on decision tree classifier and fast Fourier transform. Appl. Math. Comput. 187(2), 1017–1026(2007). https://doi.org/10.1016/j.amc.2006.09.022


小伙伴們點(diǎn)星標(biāo)關(guān)注茗創(chuàng)科技,將第一時(shí)間收到精彩內(nèi)容推送哦~


腦電機(jī)器學(xué)習(xí):理論與應(yīng)用的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
莲花县| 陆河县| 巩留县| 中方县| 西乡县| 靖远县| 永昌县| 呼伦贝尔市| 两当县| 乳山市| 七台河市| 宁阳县| 靖边县| 临夏市| 宣恩县| 汝南县| 凌海市| 溆浦县| 浮山县| 衡阳市| 保山市| 韩城市| 尼勒克县| 谢通门县| 白银市| 二连浩特市| 朝阳县| 东明县| 房山区| 比如县| 鸡西市| 独山县| 兰溪市| 江城| 寿宁县| 浠水县| 丘北县| 抚远县| 台南县| 玉门市| 龙岩市|