基于DDTBOX,使用線性支持向量回歸(SVR)從ERP數(shù)據(jù)中解碼連續(xù)變量
導(dǎo)讀
事件相關(guān)電位(ERP)數(shù)據(jù)的多變量分類分析是預(yù)測(cè)認(rèn)知變量的強(qiáng)大工具。然而,分類通常僅限于分類變量,并未充分利用連續(xù)數(shù)據(jù),如反應(yīng)時(shí)間、反應(yīng)力或主觀評(píng)分。另一種方法是支持向量回歸(SVR),它使用單試次數(shù)據(jù)來預(yù)測(cè)感興趣的連續(xù)變量。在這篇教程式的文章中,研究者演示了如何在決策解碼工具箱(DDTBOX)中實(shí)現(xiàn)SVR。為了更詳細(xì)地說明結(jié)果如何取決于特定的工具箱設(shè)置和數(shù)據(jù)特征,本研究報(bào)告了兩個(gè)模擬研究(類似于真實(shí)的EEG數(shù)據(jù)和真實(shí)的ERP數(shù)據(jù)集)的結(jié)果,并預(yù)測(cè)了一系列分析參數(shù)的連續(xù)變量。結(jié)果發(fā)現(xiàn),SVR對(duì)于2-100ms的分析窗口有效,并且相對(duì)不受時(shí)間平均的影響。當(dāng)只有少量通道編碼真實(shí)信息時(shí),預(yù)測(cè)仍然是成功的,并且分析對(duì)信號(hào)中相關(guān)信息的時(shí)間抖動(dòng)具有魯棒性??傊?,本研究證明了線性SVR是研究與連續(xù)變量相關(guān)的單試次EEG數(shù)據(jù)的有力工具,并為用戶提供了實(shí)用性指導(dǎo)。
前言
用于非侵入性獲取神經(jīng)成像數(shù)據(jù)的多變量分析技術(shù)(如EEG和MEG數(shù)據(jù)),具有高時(shí)間分辨率的特點(diǎn),在認(rèn)知神經(jīng)科學(xué)研究中越來越受歡迎。特別是通過多變量模式分析(MVPA)使用分類器的優(yōu)點(diǎn)是,與使用經(jīng)典的單變量方法相比,它可以在給定時(shí)間點(diǎn)從信號(hào)中提取更多的信息。這可以讓我們深入了解在非常短的時(shí)間尺度內(nèi),大腦活動(dòng)模式代表了什么信息或認(rèn)知過程,并可以揭示神經(jīng)表征隨時(shí)間的動(dòng)態(tài)發(fā)展。
近年來,已經(jīng)發(fā)布了一些工具箱,允許研究人員將這些技術(shù)應(yīng)用于EEG/MEG數(shù)據(jù),包括ADAM、CoSMoMVPA、DDTBOX、FieldTrip、MNE-Python、MVPA-Light和神經(jīng)解碼工具箱,并對(duì)fMRI的類似工具箱進(jìn)行了補(bǔ)充。此外,還發(fā)表了一些教程式論文,為用戶提供了實(shí)用的建議。
多變量模式分類器的一個(gè)重要約束是,它們僅限于預(yù)測(cè)分類變量,因?yàn)樗鼈兪褂枚嘧兞啃盘?hào)將試次分配給不同的類。最近,人們對(duì)多變量M/EEG信號(hào)中連續(xù)變量的預(yù)測(cè)越來越感興趣,而分類分析并不適用于此情況。例如,研究人員試圖使用中值分割來區(qū)分連續(xù)變量的高值和低值,但這種方法通常會(huì)受到統(tǒng)計(jì)功效降低的影響。另一種方法是支持向量回歸(SVR),可用于從單個(gè)試次數(shù)據(jù)中預(yù)測(cè)感興趣的連續(xù)變量,例如反應(yīng)時(shí)間、反應(yīng)力、主觀評(píng)分(情緒狀態(tài)、效價(jià)等),以及任何與EEG模式相關(guān)的其他變量。如果人們對(duì)解碼行為上有意義的連續(xù)變量感興趣,而這些連續(xù)變量很難劃分為不同的類別時(shí),這種方法尤其有用。
本研究將描述決策解碼工具箱(DDTBOX)中SVR的實(shí)現(xiàn),該工具箱已越來越多地用于解碼不同的認(rèn)知過程,從低層視覺到高級(jí)抽象表征。本文的目的是首先為潛在用戶提供關(guān)于使用SVR處理過(或能夠處理)哪些類型的問題的背景信息,然后提供如何在工具箱中實(shí)施此類分析的實(shí)用指南。注意,本文并非旨在全面比較不同的多變量方法(例如,線性判別分析、隨機(jī)森林分類),也不是為了證明一種方法優(yōu)于另一種方法。相反,本研究重點(diǎn)關(guān)注DDTBOX中的特定實(shí)現(xiàn)上,它旨在為用戶提供易于適應(yīng)新研究問題的代碼,以及包括所選擇的數(shù)據(jù)參數(shù)和特征映射到認(rèn)知神經(jīng)科學(xué)研究中最常見的分析決策,用戶可以從本研究提供的概述和分析中受益匪淺。
本文首先解釋了在DDTBOX中進(jìn)行SVR的一般原理,包括一些分析參數(shù)的簡(jiǎn)要概述,這些參數(shù)可以由用戶自定義。這些包括a)分析中所包括的特征,即是進(jìn)行空間分析還是時(shí)空分析;以及b)為試次中的滑動(dòng)分析窗口選擇適當(dāng)?shù)拇伴L(zhǎng),以捕獲信號(hào)中的潛在信息。然后,簡(jiǎn)要回顧了使用SVR研究的認(rèn)知過程類型。接下來,對(duì)模擬EEG數(shù)據(jù)進(jìn)行分析,以展示關(guān)鍵參數(shù)改變時(shí)結(jié)果的變化。最后,為用戶提供了如何在DDTBOX中根據(jù)自己的研究目的定制SVR的建議,并簡(jiǎn)要討論了SVR的一般使用。
DDTBOX中的支持向量回歸(SVR)分析
在DDTBOX中執(zhí)行SVR分析
DDTBOX的最新版本(v1.0.5)允許用戶執(zhí)行支持向量機(jī)(SVM)分類,與LIBSVM或LIBLEAR接口,或執(zhí)行支持向量回歸(SVR;與LIBSVM接口)來分析EEG振幅數(shù)據(jù)(注意,它還可以用于分析其他格式,如頻譜功率數(shù)據(jù);但該選項(xiàng)尚未常規(guī)集成)。DDTBOX中默認(rèn)實(shí)現(xiàn)的epsilon-insensitive線性SVR方法賦予了SVM的許多優(yōu)點(diǎn),可以基于EEG數(shù)據(jù)的多變量模式進(jìn)行回歸。與標(biāo)準(zhǔn)線性回歸相比,在εSVR中,任何小于ε設(shè)定值的殘差(誤差)都將被忽略,只有大于該值的殘值才決定回歸模型的結(jié)構(gòu)。
在運(yùn)行SVR分析之前,以與經(jīng)典ERP分析相同的方式對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。有人建議,對(duì)于MVPA而言,數(shù)據(jù)清理可以不那么嚴(yán)格,因?yàn)槔?,噪聲和非信息通道以及非系統(tǒng)偽影不會(huì)損害分類器,因?yàn)樵诜诸愡^程中會(huì)為這些特征分配較低的權(quán)重;然而,我們更傾向于對(duì)數(shù)據(jù)應(yīng)用與ERP分析相同的嚴(yán)格偽跡拒絕程序。這也可以使數(shù)據(jù)與經(jīng)典ERP分析的結(jié)果進(jìn)行全面比較。用戶可能會(huì)選擇執(zhí)行電流源密度(CSD)分析作為最后的預(yù)處理步驟。此處不詳細(xì)討論該方法(也不對(duì)報(bào)告的數(shù)據(jù)執(zhí)行)。簡(jiǎn)而言之,對(duì)于CSD分析,應(yīng)用拉普拉斯濾波器將數(shù)據(jù)重參考到周圍電極。這樣做的好處是:數(shù)據(jù)獨(dú)立于特定參考通道,并且每個(gè)通道的獨(dú)特貢獻(xiàn)被放大,同時(shí)數(shù)據(jù)中的冗余被衰減。有人建議使用類似的拉普拉斯濾波器來改進(jìn)分類。由于減少了相鄰電極位置信號(hào)的冗余,CSD信號(hào)的較高地形精度也有利于使用SVR進(jìn)行模式分類分析。對(duì)于SVR,預(yù)處理的數(shù)據(jù)以以下格式導(dǎo)出到MATLAB數(shù)據(jù)矩陣中:通道×數(shù)據(jù)點(diǎn)×試次。第二個(gè)矩陣,以單列的形式包含每個(gè)試次(對(duì)應(yīng)于EEG數(shù)據(jù)矩陣中包括的試次)的感興趣變量。每個(gè)參與者的矩陣用作參與者內(nèi)SVR的輸入,以根據(jù)EEG振幅數(shù)據(jù)的分布模式預(yù)測(cè)感興趣變量。
DDTBOX使用滑動(dòng)窗口法,在分析時(shí)間窗口內(nèi)分析試次數(shù)據(jù)(通常包含基線周期,并根據(jù)個(gè)別研究問題進(jìn)行劃分),該時(shí)間窗在整個(gè)試次中以小的(重疊或非重疊)步驟移動(dòng),每次都包含下一步的數(shù)據(jù)。也可以使用預(yù)定義的感興趣時(shí)間段,但本文將重點(diǎn)討論滑動(dòng)窗口法。每個(gè)分析步驟/窗口都被視為一個(gè)獨(dú)立的分析。在DDTBOX中,應(yīng)用交叉驗(yàn)證程序,將試次隨機(jī)分為不同的集合(例如,十個(gè)集合進(jìn)行十折交叉驗(yàn)證)。除了一個(gè)數(shù)據(jù)集之外,所有數(shù)據(jù)集都用于訓(xùn)練,而獨(dú)立的留一數(shù)據(jù)集用于測(cè)試訓(xùn)練后的回歸模型對(duì)未知數(shù)據(jù)的泛化程度。通過使用每個(gè)數(shù)據(jù)集進(jìn)行一次測(cè)試,同時(shí)對(duì)所有其他數(shù)據(jù)集進(jìn)行獨(dú)立訓(xùn)練,對(duì)交叉驗(yàn)證的每一折重復(fù)此過程。此外,DDTBOX允許實(shí)現(xiàn)整個(gè)交叉驗(yàn)證過程的多次迭代,每次都將試次重新隨機(jī)排序?yàn)樾碌募?DDTBOX中的默認(rèn)值是十折交叉驗(yàn)證的十次迭代)。這一步驟增加了總體時(shí)間和計(jì)算處理成本,但它大大降低了數(shù)據(jù)初始排序過程中偶然產(chǎn)生的假陽(yáng)性結(jié)果的概率。SVR為真實(shí)標(biāo)簽(即每個(gè)試次中興趣變量的值)和預(yù)測(cè)標(biāo)簽(即興趣變量的預(yù)測(cè)值)之間的相關(guān)性輸出一個(gè)Fisher Z轉(zhuǎn)換相關(guān)系數(shù)。所有交叉驗(yàn)證步驟的所有迭代的平均結(jié)果是最終輸出,并分配給相應(yīng)的分析時(shí)間窗口。然后對(duì)每個(gè)分析時(shí)間窗口的數(shù)據(jù)重復(fù)相同的分析,直到試次結(jié)束(即最后一個(gè)分析窗口)(圖1)。

圖1.支持向量回歸的示意圖。
注意,為了執(zhí)行SVR,DDTBOX與LIBSVM交互??梢詾镾VR選擇不同的內(nèi)核,但本研究將專注于默認(rèn)設(shè)置,大多數(shù)此類認(rèn)知神經(jīng)科學(xué)研究都使用該默認(rèn)設(shè)置,即線性內(nèi)核。LIBSVM還允許用戶更改各種其他設(shè)置,如epsilon和cost參數(shù),這里不做詳細(xì)討論。
然后將參與者的個(gè)人結(jié)果提交到組水平的統(tǒng)計(jì)測(cè)試。DDTBOX中的默認(rèn)選項(xiàng)是根據(jù)同一時(shí)間窗的經(jīng)驗(yàn)機(jī)會(huì)分布獨(dú)立檢驗(yàn)每個(gè)分析時(shí)間窗的結(jié)果,通過對(duì)每個(gè)參與者重復(fù)相同次數(shù)的相同交叉驗(yàn)證過程,獲得完全相同的數(shù)據(jù)和相同的標(biāo)簽,唯一的區(qū)別是將標(biāo)簽分配給數(shù)據(jù)是隨機(jī)化的。這構(gòu)成了一種比理論機(jī)會(huì)水平測(cè)試更保守的方法,它允許控制數(shù)據(jù)中固有的任何偏差。然后,可以使用配對(duì)樣本t檢驗(yàn)或基于最小統(tǒng)計(jì)量的組水平分析方法來檢驗(yàn)每個(gè)分析時(shí)間窗的解碼結(jié)果的統(tǒng)計(jì)顯著性。
DDTBOX中SVR的具體參數(shù)設(shè)置
為了初步設(shè)置SVR分析,DDTBOX首先需要用戶修改一個(gè)MATLAB腳本,該腳本定義了特定數(shù)據(jù)集的所有輸入?yún)?shù)(包括數(shù)據(jù)在計(jì)算機(jī)上的位置、通道數(shù)、采樣率等),以及要執(zhí)行的分析參數(shù)。
第一解碼分析參數(shù)要求用戶在空間、時(shí)間或時(shí)空SVR分析之間進(jìn)行選擇。這里將忽略時(shí)間分析,因?yàn)樗鼪]有利用信號(hào)的完整空間模式。時(shí)空分析和空間分析之間的區(qū)別在于,時(shí)空方法提取所有(或所有指定)通道的分析時(shí)間窗內(nèi)的所有可用數(shù)據(jù)點(diǎn)作為特征(例如,如果數(shù)據(jù)以500Hz記錄,分析時(shí)間窗口寬度為10ms,數(shù)據(jù)集包含64個(gè)通道,則有:5×64=320個(gè)特征)。另一方面,空間分析首先在此分析時(shí)間窗內(nèi)對(duì)每個(gè)通道的數(shù)據(jù)點(diǎn)進(jìn)行平均,結(jié)果是每個(gè)通道只有一個(gè)特征代表各自窗口中的每個(gè)通道的平均信號(hào)。
接下來,用戶需要指定分析時(shí)間窗的寬度和在試次中移動(dòng)的步長(zhǎng)。如果兩者相同,則分析時(shí)間窗口以非重疊的步長(zhǎng)移動(dòng),而如果步長(zhǎng)小于窗口寬度,則使用重疊的分析時(shí)間窗口,該窗口從部分相同的數(shù)據(jù)中采樣。反過來,在解釋時(shí)必須考慮這一點(diǎn);但是為了本文的目的,這里將簡(jiǎn)單地使用10ms的步長(zhǎng)。最常用的分析時(shí)間窗長(zhǎng)范圍從1個(gè)數(shù)據(jù)點(diǎn)(500Hz為2ms,1000Hz為1ms)到100ms。
用戶還可以更改多個(gè)其他設(shè)置,包括在解碼之前是否應(yīng)該對(duì)數(shù)據(jù)進(jìn)行歸一化(默認(rèn)設(shè)置是對(duì)數(shù)據(jù)進(jìn)行歸一化;歸一化還可以大大減少計(jì)算時(shí)間),以及是否應(yīng)提取特征權(quán)重。請(qǐng)參考工具箱Wiki了解更多詳細(xì)信息(https://github.com/DDTBOX/DDTBOX/wiki)。如上所述,組水平分析腳本還允許為統(tǒng)計(jì)檢驗(yàn)選擇不同的選項(xiàng),但本研究著重關(guān)注使用一系列配對(duì)樣本t檢驗(yàn)的標(biāo)準(zhǔn)組水平統(tǒng)計(jì)檢驗(yàn),并使用基于聚類質(zhì)量統(tǒng)計(jì)的聚類置換檢驗(yàn)進(jìn)行多重比較校正。
方法
所有SVR數(shù)據(jù)分析均使用DDTBOX 1.0.5版本進(jìn)行。對(duì)于食物屬性解碼研究,首先使用EEGLab v13.4.4b進(jìn)行數(shù)據(jù)預(yù)處理。這兩個(gè)工具箱都在Matlab 2018b(Mathworks)中運(yùn)行。使用bisemi Active II系統(tǒng)記錄食物屬性解碼研究中的電生理活動(dòng),該系統(tǒng)有64個(gè)通道,采樣率為512Hz,記錄帶寬為DC-102Hz。對(duì)模擬研究1和模擬研究2進(jìn)行SVR分析。
模擬研究1:SVR分析類型和分析窗長(zhǎng)
數(shù)據(jù)
模擬研究中使用的所有代碼和數(shù)據(jù)可在https://osf.io/ef4an/上獲得。對(duì)于每種條件,模擬了37個(gè)數(shù)據(jù)集(與Schubert等人(2021)的研究樣本量相匹配,并使用相同的程序進(jìn)行分析),包括100個(gè)時(shí)間段(-100到1000ms)。通道數(shù)為64,采樣率為500Hz。為了在EEG信號(hào)中產(chǎn)生噪聲,對(duì)于每個(gè)通道和每個(gè)試次,將1-40Hz(步長(zhǎng)為0.1Hz)之間的多個(gè)隨機(jī)相位正弦波信號(hào)相加。對(duì)每個(gè)正弦波的振幅進(jìn)行縮放,這樣頻率越高的振幅越小。該時(shí)間段的前100ms被視為刺激前基線,并使用這100ms基線的平均振幅對(duì)產(chǎn)生的時(shí)間段進(jìn)行基線校正。該方法被用于施加一定程度的時(shí)間自相關(guān),就如同在真實(shí)EEG數(shù)據(jù)中的那樣;然而,通過在每個(gè)時(shí)間點(diǎn)獨(dú)立生成高斯噪聲也可以獲得類似的結(jié)果。
除了噪聲之外,還系統(tǒng)地在特定時(shí)間段內(nèi)將信號(hào)添加到8個(gè)通道中。信號(hào)是通過在8個(gè)特定通道的噪聲中添加高斯曲線而生成的。高斯的峰值(即最大振幅的時(shí)間點(diǎn))位于距離刺激開始400ms處。高斯標(biāo)準(zhǔn)差為20ms,這意味著95%的附加信號(hào)位于峰值時(shí)間點(diǎn)的±40ms內(nèi)。在每個(gè)試次中,信號(hào)的峰值振幅(即高斯的高度)隨連續(xù)變量的值線性縮放,該變量包含SVR條件標(biāo)簽。為了模擬EEG信號(hào)的時(shí)間變異性,研究者進(jìn)一步根據(jù)boxcar分布改變了試次中高斯形狀信號(hào)的峰值時(shí)間點(diǎn)。選擇了±30ms的抖動(dòng),這意味著給定試次中的信號(hào)高斯峰值同樣可能出現(xiàn)在370-430ms之間。通過從平均值為0、標(biāo)準(zhǔn)差為1的高斯分布中隨機(jī)抽取,生成包括SVR條件標(biāo)簽的連續(xù)值。在DDTBOX中使用SVR分析的各種設(shè)置,以根據(jù)多變量數(shù)據(jù)預(yù)測(cè)連續(xù)變量。
SVR分析
使用DDTBOX(v1.0.5)中的線性SVR,接口LIBSVM(使用默認(rèn)設(shè)置:epsilon-insensitive SVR算法;cost參數(shù)C=0.1)。分別應(yīng)用A)空間SVR和B)時(shí)空SVR分析數(shù)據(jù)。在每個(gè)分析流中,分別使用不同的分析窗長(zhǎng)(2ms、10ms、20ms、50ms和100ms)運(yùn)行所有分析。2ms分析時(shí)間窗相當(dāng)于一個(gè)數(shù)據(jù)點(diǎn)。由于這是可能的最小分析窗長(zhǎng),它自然無法包含分析窗口內(nèi)的時(shí)間信息(因此被視作空間分析)。表1顯示了不同的分析條件。
表1.用于模擬研究1和2的數(shù)據(jù)生成和解碼分析設(shè)置。

為了簡(jiǎn)化參數(shù)空間,始終使用10ms的步長(zhǎng)來移動(dòng)分析時(shí)間窗口(注意,2ms的分析窗口需要2ms的步長(zhǎng),以避免產(chǎn)生信息時(shí)間過程中的間隙)。運(yùn)行了十折交叉驗(yàn)證的標(biāo)準(zhǔn)十次迭代。對(duì)于統(tǒng)計(jì)檢驗(yàn),基于聚類質(zhì)量統(tǒng)計(jì)(5000次置換迭代,聚類形成ɑ=0.05),在p<0.05時(shí)應(yīng)用了基于聚類的置換檢驗(yàn)。分組結(jié)果表示預(yù)測(cè)標(biāo)簽和真實(shí)標(biāo)簽之間的非概率Fisher-Z轉(zhuǎn)換相關(guān)性,即解碼性能。
模擬研究2:信息通道數(shù)量和時(shí)間方差
數(shù)據(jù)
每個(gè)實(shí)驗(yàn)條件的數(shù)據(jù)集的生成方法與模擬研究1相同,再次使用N=37個(gè)具有相同屬性的數(shù)據(jù)集。在本研究中,研究者測(cè)試了四種條件,其中包含兩個(gè)實(shí)驗(yàn)因素的可能組合:①包含信號(hào)的通道數(shù)(低:8個(gè)通道;高:16個(gè)通道)和②信號(hào)在這些通道中跨時(shí)間分布時(shí)的抖動(dòng)(?。?5個(gè)數(shù)據(jù)點(diǎn)/±30ms;大:30個(gè)數(shù)據(jù)點(diǎn)/±60ms,同模擬研究1中的boxcar分布)。再次在DDTBOX中應(yīng)用線性SVR來分別分析所有實(shí)驗(yàn)條件。
SVR分析
分析管道和參數(shù)與模擬研究1相同。唯一的區(qū)別是,這里只使用空間SVR,同樣采用2ms、10ms、20ms、50ms和100ms的時(shí)間窗長(zhǎng)(最小窗長(zhǎng)的步長(zhǎng)為2ms,所有其他窗長(zhǎng)的步長(zhǎng)為10ms)。在p<0.05處,再次采用基于聚類的置換檢驗(yàn)進(jìn)行組水平統(tǒng)計(jì)檢驗(yàn)(5000次置換迭代,聚類形成α=0.05),以控制多重比較。
食物屬性ERP解碼實(shí)驗(yàn)
接下來,研究者重新分析了之前發(fā)表的一項(xiàng)實(shí)驗(yàn)(Schubert等人2021的實(shí)驗(yàn)),在該實(shí)驗(yàn)中,參與者對(duì)視覺呈現(xiàn)的食物的美味程度和健康程度進(jìn)行了明確的評(píng)級(jí),同時(shí)記錄64通道的EEG。從該原始實(shí)驗(yàn)報(bào)告的分析中可以了解到,使用20ms分析窗口的時(shí)空SVR進(jìn)行解碼是成功的。在這里,研究者使用與模擬研究1中相同的參數(shù)重新分析了數(shù)據(jù),即結(jié)合2ms、10ms、20ms、50ms和100ms分析時(shí)間窗,使用空間和時(shí)空線性SVR進(jìn)行分析。這有助于將模擬研究結(jié)果與真實(shí)EEG研究的結(jié)果進(jìn)行定性比較,因?yàn)樵谡鎸?shí)的EEG研究中,信號(hào)的特性(例如,信息通道和信號(hào)抖動(dòng)的程度)是未知的。
參與者
研究招募了39名參與者,均為右利手,英語(yǔ)書寫和口語(yǔ)流利,視力正?;虺C正至正常,沒有特殊飲食限制或進(jìn)食障礙史。兩名參與者的數(shù)據(jù)由于過于嘈雜被排除在外。最終樣本為37名參與者,年齡為18~36歲(M=24.08歲,SD=4.74;29名女性,8名男性)。參與者在參與實(shí)驗(yàn)前簽署了書面知情同意書,該實(shí)驗(yàn)得到墨爾本大學(xué)人類研究倫理委員會(huì)(ID1955772)的批準(zhǔn),并根據(jù)《赫爾辛基宣言》進(jìn)行。
刺激
刺激由來自食物圖片數(shù)據(jù)庫(kù)(Food-Pics)的174張食物圖片組成(如水果、蔬菜、巧克力、魚、肉、堅(jiān)果、零食/膳食-甜味和咸味,以及具有廣泛感知美味的圖片)。有關(guān)完整的圖像選擇程序、問卷調(diào)查以及更詳細(xì)的程序說明,請(qǐng)參閱Schubert等人2021的文章。
腦電圖預(yù)處理
使用BioSemi Active II系統(tǒng)記錄電生理活動(dòng),該系統(tǒng)具有64個(gè)通道,采樣率為512Hz,記錄帶寬為DC-102Hz。根據(jù)國(guó)際10-20系統(tǒng),將64個(gè)Ag/AgC1電極連接到腦電帽上,在左眼的旁邊和下面(記錄水平和垂直眼電)以及雙側(cè)乳突上添加了四個(gè)額外電極。電極偏移量保持在±50μV以內(nèi)。使用EEGLab v14.1.2,首先將數(shù)據(jù)轉(zhuǎn)換為雙側(cè)乳突平均重參考,然后進(jìn)行高通(0.1Hz)和低通(30Hz)濾波(EEGLab FIR Filter New,默認(rèn)設(shè)置)。以圖片呈現(xiàn)前100ms到圖片呈現(xiàn)后1000ms這個(gè)時(shí)間段對(duì)試次進(jìn)行分段。通過目測(cè)識(shí)別并去除包含肌肉和皮膚電偽影的段。使用球面樣條插值噪聲通道。在EEGLab函數(shù)中使用獨(dú)立成分分析(ICA)識(shí)別和去除眼動(dòng)、眼跳和眨眼等偽跡。任何通道中振幅超過±150μV的段都被排除在分析之外。
線性SVR
對(duì)于每個(gè)分析,使用DDTBOX接口LIBSVM(默認(rèn)設(shè)置:epsilon-insensitive SVR算法;cost參數(shù)C=0.1)估計(jì)多元回歸模型,根據(jù)神經(jīng)數(shù)據(jù)預(yù)測(cè)評(píng)分。十折交叉驗(yàn)證過程的所有十次迭代的平均結(jié)果是評(píng)級(jí)(即標(biāo)簽)和預(yù)測(cè)標(biāo)簽之間相關(guān)性的Fisher-Z變換相關(guān)系數(shù)。與模擬研究1一樣,分別使用空間SVR和時(shí)空SVR進(jìn)行該分析。使用2ms、10ms、20ms、50ms和100ms的分析時(shí)間窗,在試次中以10ms的步長(zhǎng)移動(dòng)(同樣,對(duì)于2ms的分析時(shí)間窗,使用2ms的步長(zhǎng))。使用配對(duì)樣本t檢驗(yàn),在組水平上檢驗(yàn)每個(gè)分析時(shí)間窗的結(jié)果與經(jīng)驗(yàn)機(jī)會(huì)結(jié)果分布的統(tǒng)計(jì)顯著性,并使用基于聚類的置換檢驗(yàn)進(jìn)行多重比較校正。
結(jié)果
模擬研究1
模擬研究1的結(jié)果表明,使用所有分析時(shí)間窗長(zhǎng)的所有空間SVR分析都可以用于成功識(shí)別信號(hào)出現(xiàn)的時(shí)間段(圖2)。使用所有時(shí)間窗長(zhǎng)的所有時(shí)空分析也是如此。結(jié)果表明,與空間SVR分析相比,使用時(shí)空SVR分析沒有明顯優(yōu)勢(shì)。感興趣的變量可以使用任何分析時(shí)間窗口進(jìn)行解碼,包括最短的時(shí)間窗,每個(gè)分析窗口每個(gè)通道僅包含一個(gè)數(shù)據(jù)點(diǎn)。不同分析方法之間的平均解碼性能沒有差異。然而,對(duì)于空間和時(shí)空SVR,存在一些時(shí)間拖尾效應(yīng),這意味著隨著分析窗長(zhǎng)的增加,試次早期的時(shí)間窗口變得顯著。重要的是,這并沒有反映出對(duì)信息的更高敏感性。這是由于構(gòu)建分析時(shí)間窗口的方式導(dǎo)致的:DDTBOX根據(jù)包含的最早時(shí)間點(diǎn)定義窗口,并將窗口從時(shí)間段開始移動(dòng)到時(shí)間段結(jié)束。因此,當(dāng)預(yù)測(cè)信息被包含在窗口的尾端時(shí),在時(shí)間段中移動(dòng)的任何分析時(shí)間窗口都變得很重要。這意味著,對(duì)于不區(qū)分窗口內(nèi)信息的較長(zhǎng)窗口,真實(shí)信息實(shí)際上位于窗口的后面(即靠后的時(shí)間點(diǎn))。這原則上可以通過分析詳細(xì)的特征權(quán)重結(jié)構(gòu)(包括通道和時(shí)間點(diǎn)作為特征)來控制;然而,正如本研究所示,可以通過使用更短的分析窗口來完全避免這種情況。

圖2.模擬研究1中使用空間SVR(左側(cè))和時(shí)空SVR(右側(cè))時(shí)的解碼性能,窗長(zhǎng)分別為2、10、20、50和100ms。藍(lán)線表示使用原始數(shù)據(jù)的解碼性能;橙線表示使用置換數(shù)據(jù)的解碼性能。陰影區(qū)域表示均值標(biāo)準(zhǔn)誤(SEM)。粉色陰影區(qū)域表示統(tǒng)計(jì)上顯著高于概率解碼精度的時(shí)間窗。
模擬研究2
模擬研究2的結(jié)果再次證明,可以使用空間SVR在所有分析窗長(zhǎng)的所有實(shí)驗(yàn)條件下解碼感興趣變量(圖3顯示了10ms和100ms的分析窗長(zhǎng))。對(duì)于較短的分析窗口(2ms、10ms、20ms),解碼結(jié)果的準(zhǔn)確性和時(shí)間擴(kuò)展同樣具有高度可比性,這些分析窗口都準(zhǔn)確地恢復(fù)了信息信號(hào)的潛在時(shí)間過程。當(dāng)使用更長(zhǎng)的分析時(shí)間窗時(shí),特別是對(duì)于100ms的分析窗時(shí),可以發(fā)現(xiàn)信息在較早的時(shí)間點(diǎn)出現(xiàn)了相同的時(shí)間拖尾。
正如預(yù)期的那樣,隨著信息通道的減少,解碼精度明顯降低;然而,仍然有可能顯著地(高于概率)預(yù)測(cè)興趣變量。在這些通道的信息分布中引入時(shí)間抖動(dòng)進(jìn)一步降低了解碼性能,并導(dǎo)致解碼結(jié)果在時(shí)間上的預(yù)期時(shí)間拖尾。值得注意的是,抖動(dòng)并不妨礙對(duì)任何分析時(shí)間窗口的信息檢測(cè)。

圖3.模擬研究2中使用空間SVR時(shí)的解碼性能,窗長(zhǎng)為10ms(上半部分)和100ms(下半部分)。藍(lán)線表示使用原始數(shù)據(jù)的解碼性能,橙線表示使用置換數(shù)據(jù)的解碼性能。陰影區(qū)域表示均值標(biāo)準(zhǔn)誤(SEM)。
食物屬性ERP解碼實(shí)驗(yàn)
味覺等級(jí)解碼。使用空間SVR,味覺評(píng)分明顯高于所有分析時(shí)間窗長(zhǎng)的概率預(yù)測(cè)(圖4,左側(cè))。在所有分析時(shí)間窗中,信息時(shí)間過程的總體形狀也非常相似,這證實(shí)了該方法對(duì)真實(shí)數(shù)據(jù)的魯棒性。2ms和10ms窗口的信息時(shí)間過程看起來非常相似,時(shí)間過程再次用20-100ms的更大窗口寬度進(jìn)行平滑。這也意味著,隨著窗長(zhǎng)的增加,獨(dú)立的顯著聚類合并為更大的聚類,這是意料之中的,因?yàn)檫B續(xù)分析是從窗口寬度更大的重疊數(shù)據(jù)部分中采樣的。從圖中可以看出,在分析窗口寬度設(shè)置之間,精確的顯著聚類略有不同。再次以更大的窗口寬度在時(shí)間上系統(tǒng)地向前傳播,10ms的分析時(shí)間窗口從540ms開始,100ms的分析時(shí)間窗口從470ms開始。對(duì)于100ms的窗口寬度,該窗口包括470到570ms之間的數(shù)據(jù),這意味著該窗口的尾端很可能包含了足夠的信號(hào),從而使分析變得重要。當(dāng)使用時(shí)空SVR時(shí),對(duì)于所有分析時(shí)間窗長(zhǎng),味覺評(píng)分再次顯著高于概率預(yù)測(cè)(圖4,右側(cè))。所有時(shí)空分析時(shí)間窗的信息時(shí)間過程的總體形狀與其空間SVR對(duì)應(yīng)信息高度相似,這種相似性在較小的分析時(shí)間窗中最強(qiáng),特別是在10ms時(shí)。與空間分析相比,使用時(shí)空分析沒有優(yōu)勢(shì)。無論窗長(zhǎng)如何,與空間SVR相比,時(shí)空SVR的結(jié)果在參與者數(shù)據(jù)集中略低,且變化更大。

圖4.SVR味覺等級(jí)解碼結(jié)果。左側(cè)和右側(cè)分別為空間和時(shí)空解碼分析結(jié)果。
健康等級(jí)解碼。使用空間SVR,健康評(píng)分在所有分析時(shí)間窗(圖5,左側(cè))上的預(yù)測(cè)也顯著高于概率水平,盡管總體信息時(shí)間過程比味覺評(píng)分更嘈雜。信息時(shí)間過程的總體形狀在所有分析時(shí)間窗之間是相似的,并且與之前一樣,隨著窗口寬度的增加,信息時(shí)間過程變得更加平滑,對(duì)于50ms和100ms的分析窗口,最初的兩個(gè)獨(dú)立的顯著簇合并為一個(gè)。我們可以看到,聚類是否顯著(在應(yīng)用了嚴(yán)格的基于聚類的校正后)取決于所使用的分析時(shí)間窗口寬度。對(duì)于時(shí)空SVR,與來自空間SVR的信息時(shí)間過程相比,沒有實(shí)質(zhì)性的差異,特別是對(duì)于短的10ms窗口寬度(圖5,右側(cè))。當(dāng)分析窗口寬度為20ms時(shí),與空間SVR相比,時(shí)空SVR顯示出更大的顯著聚類,而對(duì)于50ms的窗口,則相反,空間SVR比時(shí)空SVR出現(xiàn)了略大的顯著聚類。在100ms的分析窗口下,與空間SVR相比,時(shí)空SVR的顯著聚類更大。

圖5.SVR健康等級(jí)解碼結(jié)果。左側(cè)和右側(cè)分別為空間和時(shí)空解碼分析結(jié)果。
總之,這些結(jié)果表明,這兩個(gè)刺激維度的結(jié)果大體上相似。然而,就特定的時(shí)間步長(zhǎng)而言,空間SVR在某些情況下略好,而在其他情況下,時(shí)空SVR稍優(yōu)一些,這些細(xì)微的差異也因分析時(shí)間窗的寬度而略有不同。
結(jié)論
支持向量回歸(SVR)是一種強(qiáng)大但未被充分利用的多變量M/EEG數(shù)據(jù)分析方法,但目前仍缺乏系統(tǒng)驗(yàn)證和全面描述。盡管分類技術(shù)僅限于預(yù)測(cè)分類變量(即類),但DDTBOX中實(shí)現(xiàn)的SVR可以從EEG數(shù)據(jù)中預(yù)測(cè)連續(xù)變量的信息。在這里,研究者使用了真實(shí)和模擬的EEG數(shù)據(jù)來證明其有效性,以幫助研究人員決定如何在DDTBOX中為他們的特定研究問題定制SVR,從而從EEG測(cè)量的ERP的多變量模式中預(yù)測(cè)感興趣的連續(xù)變量。為了幫助用戶更好地理解不同參數(shù)設(shè)置的效果,本研究進(jìn)行了一系列的分析。這些表明SVR分析可以預(yù)測(cè)模擬和真實(shí)EEG數(shù)據(jù)中的連續(xù)變量??臻g和時(shí)空SVR的結(jié)果非常相似,并且在各種分析時(shí)間窗口寬度上都很穩(wěn)定,即使是每個(gè)通道只包含一個(gè)數(shù)據(jù)點(diǎn)的非常短的分析窗口。當(dāng)分析時(shí)間窗較大時(shí),會(huì)出現(xiàn)一些時(shí)間拖尾。即使在信息通道數(shù)量較少、時(shí)域信號(hào)抖動(dòng)較大的情況下,SVR也能成功預(yù)測(cè)感興趣的變量。這些結(jié)果以及先前發(fā)表的成功預(yù)測(cè)各種連續(xù)變量的證據(jù)表明,SVR是一種有用的數(shù)據(jù)驅(qū)動(dòng)分析方法,它允許從高時(shí)間分辨率的神經(jīng)活動(dòng)分布模式中預(yù)測(cè)感興趣變量的細(xì)微變化??傊?,本研究希望為用戶提供有價(jià)值的資源,以優(yōu)化用戶在自己數(shù)據(jù)中的SVR分析。
原文:Decoding continuous variables from event-related potential (ERP) data with linear support vector regression (SVR) using the Decision Decoding Toolbox (DDTBOX).
Doi: 10.3389/fnins.2022.989589
小伙伴們點(diǎn)個(gè)“在看”,加
(星標(biāo))關(guān)注茗創(chuàng)科技,將第一時(shí)間收到精彩內(nèi)容推送哦~
