基于機器學習的fNIRS信號質(zhì)量控制方法

摘要
盡管功能性近紅外光譜(fNIRS)在神經(jīng)系統(tǒng)研究中的應用越來越廣泛,但fNIRS信號處理仍未標準化,并且受到經(jīng)驗和手動操作的高度影響。在任何信號處理過程的開始階段,信號質(zhì)量控制(SQC)對于防止錯誤和不可靠結(jié)果至關(guān)重要。在fNIRS分析中,SQC目前依賴于將經(jīng)驗閾值應用于手動操作的信號質(zhì)量指標(SQIs)。本研究使用了67名受試者的fNIRS信號數(shù)據(jù)集(N=1340),并手動標記了一部分片段(N=548)的信號質(zhì)量,以考察當前研究中存在的問題,并探索深度學習方法提供的機會。本研究發(fā)現(xiàn),SQIs在統(tǒng)計上可以區(qū)分質(zhì)量較差的信號,但通過經(jīng)驗閾值進行識別的敏感性較低。與手動閾值相比,基于SQIs的傳統(tǒng)機器學習模型被證明更準確,而基于卷積神經(jīng)網(wǎng)絡的端到端方法能夠進一步提高性能。本文提出的基于機器學習的方法為fNIRS提供了更客觀的SQC,并朝著使用完全自動化和標準化程序的方向發(fā)展。
前言
近年來,功能性近紅外光譜(fNIRS)在神經(jīng)影像研究中的應用迅速發(fā)展,特別是在嬰兒神經(jīng)影像和認知神經(jīng)科學等領(lǐng)域。fNIRS是一種非侵入性神經(jīng)成像技術(shù),通過使用近紅外光來檢測大腦皮層區(qū)域的活動。具體而言,fNIRS根據(jù)不同的光吸收來測量氧合和脫氧血紅蛋白濃度的相對變化,反映了大腦激活和失活。盡管fNIRS被廣泛采用,但對于最佳的fNIRS信號處理方法尚未達成共識,據(jù)報道使用不同的處理步驟組合會導致不同的研究結(jié)果。
fNIRS數(shù)據(jù)分析中的一個關(guān)鍵預處理步驟是對原始信號進行信號質(zhì)量控制(SQC),以從下游分析中去除低質(zhì)量的信號。由于沒有可用的fNIRS信號質(zhì)量的基準參考,因此基線是由人工對信號進行目視檢查得出的。然而,目測評估使得SQC依賴于研究人員的專業(yè)知識和期望“良好”質(zhì)量信號的主觀判斷。目前的方法傾向于避免將目測評估作為唯一的SQC方法,盡管它經(jīng)常用于驗證fNIRS信號處理流程的結(jié)果。最后,目測評估有望在參考數(shù)據(jù)集的創(chuàng)建中發(fā)揮關(guān)鍵作用,其中質(zhì)量標簽是由人工評估得出的。
SQC目前依賴于信號質(zhì)量指標(SQIs)的計算,這些指標基于一些旨在量化fNIRS信號形態(tài)特征的算法。決定從下游分析中刪除哪些信號,是基于應用于SQIs的經(jīng)驗固定閾值。目前已提出多種SQIs,例如頭皮耦合(SC)和頭皮耦合功率(SCP),變異系數(shù)(CV)和波長變異系數(shù)(CVW),信號質(zhì)量指數(shù),與心臟信號的關(guān)聯(lián)等等。
除閾值法外,機器學習(ML)算法已被廣泛應用于各種生理信號質(zhì)量的分類。例如,Li等人開發(fā)了一種用于脈搏信號和心電圖(ECG)信號的自動質(zhì)量評估方法,而Gabrieli等人則使用不同的ML分類器來識別瞳孔測量信號的質(zhì)量。關(guān)于fNIRS信號,Sappia等人提出了信號質(zhì)量指數(shù),并開發(fā)了基于信號質(zhì)量指數(shù)的ML算法,取得了較好的效果。然而,信號質(zhì)量指數(shù)是在非常有限的樣本量上進行開發(fā)和測試的(開發(fā)N=123,評估N=40),并且數(shù)據(jù)是在存在潛在利益沖突的環(huán)境中收集的。
除了傳統(tǒng)的機器學習方法外,基于人工神經(jīng)網(wǎng)絡(ANN)的深度學習方法如今被應用于各種領(lǐng)域,通常會改善傳統(tǒng)機器學習方法所取得的結(jié)果。在基于醫(yī)療數(shù)據(jù)的應用中,ANN的應用正在迅速增長,而且應用范圍廣泛。卷積神經(jīng)網(wǎng)絡(CNN)是一類基于一系列連續(xù)非線性濾波單元(層)的ANNs。CNN能夠創(chuàng)建端到端模型,因為原始數(shù)據(jù)(例如:圖像或信號)直接用作輸入,無需計算手動定義的特征:CNN的層次結(jié)構(gòu)允許獲取高層特征,從而將輸入數(shù)據(jù)轉(zhuǎn)換為解決分類任務所需的多維表征。這是與傳統(tǒng)機器學習方法的一個關(guān)鍵區(qū)別,傳統(tǒng)ML方法基于關(guān)系型數(shù)據(jù),其中特征是由用戶根據(jù)先驗信息手動定義的。
關(guān)于深度學習方法在fNIRS信號中的應用,只有一項研究涉及信號質(zhì)量的分類,而其他示例則涉及腦機接口應用的任務和手勢識別。Gabrieli等人的研究旨在使用基于CNN的方法對510個短fNIRS數(shù)據(jù)進行質(zhì)量分類。值得注意的是,質(zhì)量標簽是通過專家用于對fNIRS信號語料庫進行評級的web界面收集的。他們的研究首次證實了使用CNN對fNIRS信號質(zhì)量進行分類,并使用Matthew相關(guān)系數(shù)(MCC)來衡量分類的性能。所提出的CNN在訓練集上實現(xiàn)了MCC=0.18的性能,在測試集上實現(xiàn)了MCC=0.25的性能。雖然ML方法在解決fNIRS數(shù)據(jù)的SQC方面顯示出了有前景的結(jié)果,但它們尚未得到徹底的研究,關(guān)于該主題的文獻仍然很少。
本研究對fNIRS數(shù)據(jù)的SQC所涉及的幾個方面進行了詳細的研究。首先,本研究分析了人類主觀評估的作用,并測量了四名不同評分者之間的一致性。其次,測試了5種最常用的手動SQI的適用性:首先進行統(tǒng)計測試,然后基于SQI閾值評估SQC的性能。第三,本研究探索了使用傳統(tǒng)機器學習和深度學習方法進行SQC的潛力;特別是評估了兩個基于手動SQI訓練的傳統(tǒng)機器學習模型以及基于原始信號訓練的CNN的性能。最后,應用模型檢驗技術(shù)來探索從訓練好的模型中提取知識的可能性,旨在為SQC的實施和數(shù)據(jù)采集設置的優(yōu)化提供實用指南。
材料和方法
A.數(shù)據(jù)集
在一項旨在評估男性和女性對帶有性別歧視言論對話的不同大腦反應實驗中收集數(shù)據(jù)。該實驗獲得了南洋理工大學心理學項目倫理委員會(PSY-IRB-2020-007)的批準。研究中構(gòu)建了八個假設情境的實驗片段,每個片段持續(xù)50s。這些片段呈現(xiàn)了四個情境,其中一個主角收到了來自四個不同伙伴的性別歧視言論,每個情境有兩種類型的言論(贊揚和批評)。實驗共包含67名參與者(38名女性)。參與者需要閱讀所有八個實驗片段;閱讀完畢后,他們將回答一組問題,以衡量他們對每個片段的情緒反應。
在實驗過程中,采集fNIRS信號來測量背外側(cè)前額葉皮層的激活。使用NIRS設備(NIRSport,NIRx Medical Technologies LLC,Glen Head,NY,USA)采集信號,并配備有8個發(fā)光二極管(波長760-850nm)和7個光電二極管探測器的電極帽,共計20個多距離通道(采樣率:7.81Hz)。采用NIRStar 15.0軟件記錄數(shù)據(jù)。這項研究重點關(guān)注由光電二極管收集的每個通道的原始數(shù)據(jù),每個通道由兩個信號組成。通過三次樣條插值對信號進行10Hz的重采樣。
該數(shù)據(jù)集包括1340個通道信號(20個通道×67個受試者)。為了進行信號質(zhì)量的手動標記,本研究將樣本限制為與片段呈現(xiàn)(長度為50s)相關(guān)的548個片段,這些片段是隨機選擇的。采用分層隨機選擇方法,首先隨機選擇條件,然后隨機選擇情境,最后隨機選擇通道。所選的子集包含來自64個不同受試者的數(shù)據(jù);每個受試者的片段數(shù)在3-15之間(中位數(shù)=8,均值=8.6,標準差=2.8);每個通道包含的片段數(shù)介于18-41之間(中位數(shù)=27,均值=27.4,標準差=5.2)。
與Gabrieli等人(2021)的操作類似,4名訓練有素的專家根據(jù)fNIRS信號的圖像手動評估每個片段的質(zhì)量。圖像大小為1500×1000像素,時間分辨率為23.6?pixels/s(見圖1中的圖像縮放示例)。要求評分者將每個片段的質(zhì)量標記為“好”(即,該信號可以使用)或“差”(即,該信號應該舍棄)。通過多數(shù)投票將4名評分者的評分匯總,以得到每個片段的最終標簽。如果出現(xiàn)平局,則將該片段視為信號質(zhì)量差。

然后,將具有548個標記分段的數(shù)據(jù)集隨機分為兩個不同的部分,以測試每種信號質(zhì)量分析(SQC)方法的泛化能力:75%(N=411)的分段用于訓練,其余25%(N=137)用于測試。在訓練集中,良好類別的信號比例為66.2%,在測試集中良好類別的信號比例為62.0%。
B.信號質(zhì)量指標(SQIs)
在fNIRS信號最常用的SQI中,本研究選取了4種SQIs:頭皮耦合(SC)和頭皮耦合功率(SCP),變異系數(shù)(CV)和波長變異系數(shù)(CVW)。對于每個SQI,文獻還定義了通常應用于自動化管道的閾值,以對信號質(zhì)量進行分類。通常情況下,良好質(zhì)量的信號滿足以下條件:SC>0.7,SCP>0.1,CV<7.5,以及CVW<5。
此外,本研究還計算了心臟功率(CP),類似于SC,旨在量化心臟成分的存在。從濾波后的fNIRS信號(帶通濾波器:0.83-2.5Hz)開始,估計心臟頻率(fc)為0.83-2.5Hz范圍內(nèi)功率最高的頻率。然后計算fc-0.2—fc+0.2Hz頻段功率與fc-0.5—fc+0.5Hz頻段功率的比值CP。預期良好分類的信號滿足條件:CP≥0.5。
C.機器學習
本研究采用了兩種傳統(tǒng)的機器學習方法來對fNIRS信號的質(zhì)量進行分類:第一種方法中,本研究測試了基于五個SQIs的兩個標準模型:線性核支持向量機(SVM)和隨機森林(RF);在第二種方法中,本研究使用了直接應用于原始信號的端到端卷積神經(jīng)網(wǎng)絡(CNN)。
為了訓練標準模型,首先優(yōu)化了SVM和RF的模型參數(shù):正則化參數(shù)C(C:0.00001,0.0001,0.001,0.01,0.1,1,10,100,1000,10000)和樹的數(shù)量n(n:1,5,10,50,100,250)。為了防止過擬合,還校準了RF模型的以下參數(shù):樹的最大深度設置為3,葉節(jié)點的最小樣本數(shù)量設置為10。
該優(yōu)化基于傳統(tǒng)的10次5折交叉驗證方案。將訓練集數(shù)據(jù)隨機分成5份:其中1份用于驗證,剩下的4份用于訓練模型,然后在驗證集上對模型進行評估。該過程對5折進行迭代,然后重復10次,在每次重復之前對數(shù)據(jù)進行重排。
在每次迭代中,通過對留出折上的Matthew相關(guān)系數(shù)(MCC)得分進行自舉法估計得到每個模型參數(shù)值的性能。MCC的計算方法如下:

其中,TB和TG分別是正確分配給“差”和“好”信號質(zhì)量類別的段數(shù),而FB和FG分別是錯誤分配給“差”和“好”信號質(zhì)量類別的段數(shù)。選擇MCC較高的模型參數(shù)值作為最優(yōu)值。使用模型參數(shù)的最優(yōu)值在整個訓練數(shù)據(jù)集上進行最終模型訓練。
這里采用的CNN架構(gòu)靈感來自Bizzego等人(2021)研究中的架構(gòu)。原始架構(gòu)是在fNIRS信號數(shù)據(jù)集(來自訓練集)上訓練的,訓練集和測試集上的MCC分別為0.648和0.622。本研究進行了額外的實驗來評估替代網(wǎng)絡架構(gòu)。具體而言,本研究測試了不同的解決方案,這些解決方案在卷積塊的數(shù)量(從2到4)、輸出通道數(shù)(從16到256)和卷積核大小(從3到21)方面有所不同。表現(xiàn)最好的架構(gòu)是由兩個連續(xù)部分組成的架構(gòu):(i)卷積分支和(ii)全連接層(見圖2)。

該網(wǎng)絡的輸入是fNIRS信號中的20s長度部分。在訓練期間,在與插圖表示相對應的50s內(nèi)隨機選擇20s的部分;在評估期間,這20s的部分對應于情境呈現(xiàn)的中心部分。訓練期間隨機選擇的部分用于執(zhí)行數(shù)據(jù)增強:每次用于訓練的信號,都選擇不同的部分。這個過程為網(wǎng)絡的輸入增加了一定的隨機可變性,從而降低了過擬合的風險。
訓練過程使用反向傳播算法進行,目標是最小化真實類別與預測類別之間的加權(quán)交叉熵。由于“差”和“好”兩個類別的樣本量不同,因此“好”類別的權(quán)重設置為0.66,“差”類別的權(quán)重設置為0.34。
該網(wǎng)絡在訓練集信號上進行了200個epochs的訓練,隨機批次大小為64、使用Adadelta優(yōu)化器和初始學習率為0.01。在每個epoch中,訓練集信號被隨機打亂,并分成64個批次的信號。每個批次經(jīng)網(wǎng)絡處理后輸出預測的類別概率,然后將其與真實類別進行比較。利用加權(quán)交叉熵計算預測誤差,然后對誤差進行反向傳播,并使用Adadelta算法優(yōu)化網(wǎng)絡的權(quán)值。
D.分析計劃分析1:人的主觀評價對信號質(zhì)量的影響
由于缺少關(guān)于fNIRS信號質(zhì)量的真實參照標準,因此對信號質(zhì)量的評估依賴于人類主觀評估。定義有效的SQI及其閾值,或開發(fā)自動化方法的所有后續(xù)工作都依賴于人類提供可靠評估的能力。本研究根據(jù)四名評分者之間的一致性和每個評分者的表現(xiàn)來量化這種能力。基于雙向隨機效應模型平均類內(nèi)相關(guān)性(ICC)對一致性進行量化。通過計算評分者與其他評分者的之間的MCC分數(shù)來量化每個評分者的表現(xiàn)。
分析2:手動SQI的有效性
然后,本研究重點評估了5個SQI的適用性。首先,對每個SQI進行雙側(cè)Mann-Whitney檢驗,以評估“好”信號和“差”信號之間是否存在統(tǒng)計學差異。本研究預期所有的SQI都會顯示出顯著的結(jié)果(α<0.05)。此外,本研究評估了SQIs之間的Spearman相關(guān)性。本研究預期SC、SCP和CP指標具有高度相關(guān)性(ρ>0.7),因為它們旨在量化原始fNIRS信號中的心臟成分。其次,基于SQIs的值及其閾值進行SQC,這是當前研究實踐中用于識別信號質(zhì)量好壞的最常見方法。在實踐中,對于每個fNIRS分段,檢測每個SQI的值是否位于與良好質(zhì)量相關(guān)的區(qū)間內(nèi),如果所有五個SQIs的值都在各自的區(qū)間內(nèi),則認為該段具有良好的質(zhì)量。
分析3:機器學習方法
最后,本研究探索了使用機器學習方法來替代當前的SQC實踐。SVM模型和CNN都使用訓練集數(shù)據(jù)進行訓練。為了客觀地比較不同的SQC方法(人工評分,SQI閾值,SVM模型和CNN),分類性能總是在訓練集和測試集上進行計算。具體而言,本研究使用自舉法(bootstrapping)生成總體MCC及其90%置信區(qū)間(90%CI)。在自舉過程中,使用重復抽樣的方式隨機選擇25%的樣本,并在所選的子集上計算MCC得分;然后重復這個過程1000次。以MCC得分生成分布的第50、5和95百分位數(shù)分別計算總體MCC及其90%CI。
分析4:模型檢查
本研究采用兩種模型檢測技術(shù)從訓練好的ML模型中提取知識,旨在為SQC的實施和數(shù)據(jù)采集設置的優(yōu)化提供實際指導。對于兩個傳統(tǒng)的機器學習模型(SVM和RF),本研究計算了SQIs的排序,以獲得哪些SQIs對預測信號質(zhì)量最重要的信息。對于深度學習(DL)模型,本研究對卷積分支的輸出節(jié)點進行了無監(jiān)督探索。為了獲得SQIs的排序,首先基于訓練模型和測試集數(shù)據(jù)計算SQIs的排列重要性。SQI的排列重要性是指在對該SQI的值進行隨機打亂后,MCC分數(shù)的下降情況。在本研究中,排列重要性被計算30次,然后取平均值,以確定SQIs的排名。
使用均勻流形近似和投影(UMAP)多維投影方法對卷積分支的1280個輸出節(jié)點進行無監(jiān)督探索。具體而言,采用二維UMAP以便于投影結(jié)果的可視化。然后,本研究旨在考察低質(zhì)量信號之間的主要差異,以確定關(guān)鍵的診斷模式,從而提出改進實驗設置中信號質(zhì)量的策略。本研究在UMAP投影上應用K-means聚類,使用肘部法則基于每個數(shù)據(jù)點與其最近質(zhì)心之間距離的平方和選擇最佳的聚類數(shù)。然后,根據(jù)信號模式定性分析了每個聚類的主要特征。
E.數(shù)據(jù)和代碼的可用性
本研究執(zhí)行的分析是在Python(v.3.8.10)中實現(xiàn)的。使用Numpy(v.1.19.4)、Pandas(v.1.1.4)、scikit-learn(v.0.23.2)和pyTorch(v.1.9.0+cu102)庫構(gòu)建了機器學習管道。UMAP和聚類管道使用了umap-learn(v.0.5.3)、scikit-learn(v.0.23.2)和yellowbrick(v.1.4)庫構(gòu)建。本研究使用的數(shù)據(jù)和復制分析的代碼可在以下網(wǎng)址獲得:https://gitlab.com/abp-san-public/fnirs-qsi-ml
結(jié)果
A.評分者一致性和表現(xiàn)
評分者間的一致性為ICC=0.774(p<.001),盡管理想值通常在0.9以上,但該值被認為是可接受的。四個評分者在訓練集和測試集上的總體MCC值范圍分別為[0.629-0.759]和[0.672-0.802]。(見表I)

值得注意的是,評分者似乎最大限度地提高了靈敏度或精度(圖3)。評分者1最大限度地提高了靈敏度而不是精度,訓練集上的精度為0.865,測試集上的精度為0.840(90%CI分別為[0.80-0.92]和[0.71-0.96]),同時在訓練集和測試集上的靈敏度均為1.000。同樣,評分者3在訓練集上的精度為0.840,測試集上的精度為0.800(90%CI分別為[0.77-0.90]和[0.67-0.92]),同時在訓練集和測試集上的靈敏度均為1.000。相反,評分者2將精度最大化而犧牲了一定的靈敏度,在訓練集上的精度為0.979,在測試集上的精度為1.000(訓練集的90%CI為[0.93-1.00]),同時在訓練集和測試集上的靈敏度分別為0.706和0.750(90%CI分別為[0.61-0.79]和[0.57-0.89])。

B.手動SQI驗證
Mann-Whitney檢驗結(jié)果(表II)表明,對于信號質(zhì)量好或差的信號,SQIs的分布存在顯著差異。

此外,所有SQIs均顯著相關(guān)(表III),SC和SCP之間的相關(guān)性最高(ρ=0.80,p<.001),其次是SCP與CP之間的相關(guān)性(ρ=0.72,p<.001)。

表III.五個信號質(zhì)量指標之間的Spearman相關(guān)值。***:p<.001
基于SQI閾值的信號質(zhì)量控制(SQC)(表I和圖3)在訓練集和測試集上的MCC分別為0.476和0.533(90%CI分別為[0.38-0.58]和[0.38-0.70]),具有較高的精度(訓練集:0.976,90%CI:[0.93-1.00];測試集為1.00),但靈敏度較低(訓練集:0.493,90%CI:[0.40-0.60];測試集為0.520,90%CI:[0.33-0.69])。這種方法會導致許多信號質(zhì)量較好的信號無法使用(表IV)。

C.機器學習(ML)
傳統(tǒng)ML模型的性能與之相當?;赟QI的SVM模型(最佳C=100)在訓練集和測試集上的MCC分別為0.671和0.717(90%CI分別為[0.53-0.79]和[0.51-0.89]),與人工評分者的性能相當(表I)。基于SQI的RF模型(最優(yōu)樹數(shù)=100)在訓練集和測試集上的MCC分別為0.712和0.722(90%CI分別為[0.59-0.82]和[0.52-0.89])。無論是在訓練集還是測試集上,兩種模型的結(jié)果都與SVM模型相當(表I)。
深度學習(DL)模型的應用進一步提高了性能。應用于原始信號的卷積神經(jīng)網(wǎng)絡(CNN)在訓練集和測試集上的MCC分別為0.726和0.757(90%CI分別為[0.60-0.84]和[0.53-0.94])。CNN在所有機器學習方法中取得了最好的性能,在訓練集上的精度為0.890(90%CI:[0.53-0.79]),在測試集上的精度為0.900(90%CI:[0.77-1.00]),在訓練集和測試集上的靈敏度分別為0.938和0.917(90%CI分別為[0.88-0.97]和[0.81-1.00])(表V和圖3)。

使用CNN實現(xiàn)的性能明顯優(yōu)于傳統(tǒng)的機器學習模型:SVM(p<0.001)和RF(p<0.001)。SVM和RF方法之間沒有顯著差異(p=0.092)。而SVM模型的性能顯著優(yōu)于基于SQIs的閾值分割(p<0.001)。
D.模型檢查
兩個模型基于排列重要性的SQIs排名略有不同。對于SVM模型,排序依次為:SC、CV、CP、SCP和CVW。對于RF模型,排序依次為:CV、SC、CVW、SCP和CP。值得注意的是,這兩個模型的前兩個特征相同:SC和CV。這表明,評估信號質(zhì)量需要同時考慮心臟成分指標和信號變異性的全局指標。因此,未來開發(fā)用于自動或半自動識別信號質(zhì)量的工具和算法應考慮這兩個關(guān)鍵的SQIs。
使用UMAP計算的1280個節(jié)點的二維嵌入(圖4A)顯示出兩個類別之間的明顯分離,低質(zhì)量信號聚集更緊密。然后應用K-means聚類算法,將目標聚類數(shù)設置為3,這是根據(jù)肘部法則得到的最優(yōu)聚類數(shù)。

第一個聚類(圖4B)主要包括與高質(zhì)量信號組重疊的低質(zhì)量信號。通過觀察屬于該聚類的一些隨機選擇的信號示例(圖5),可以發(fā)現(xiàn)這些信號總體上質(zhì)量良好,除了可能由于運動引起的尖峰或下降,這在儀器設置過程中很難預見到。

第二個和第三個聚類似乎將低質(zhì)量信號組分割開來,其中第二個聚類在“拓撲上”更接近高質(zhì)量聚類。這兩個聚類在噪聲幅度和兩種波長均值之間的距離上似乎有所不同。在某些情況下,心臟成分和其他一些信號成分可能在第二個聚類的信號中被識別:這表明低質(zhì)量的原因主要是光電極和頭皮之間的耦合不良,或者來自外部光源的干擾。相反,在第三個聚類中,除了白噪聲外,很難在信號中識別出任何成分,這表明光電極的設置需要徹底修改。總的來說,這兩個聚類表明,UMAP中的軌跡與信號質(zhì)量的下降有關(guān)。
結(jié)論
本研究考察了fNIRS數(shù)據(jù)SQC所涉及的幾個方面,旨在確定開發(fā)全自動和可靠SQC程序的開放問題和機會。本研究強調(diào)了主觀性在基于目視檢查信號質(zhì)量評估中的作用,測量了四個不同評分者的一致性和表現(xiàn)。然后,評估了使用手動SQI進行信號質(zhì)量分類的方法,展示了機器學習模型(SVM)相比基于閾值的方法的優(yōu)越性。最后,本研究探索了使用深度學習方法的潛力,使用CNN直接在原始信號上進行分析??偟膩碚f,本研究強調(diào)了自動化SQC的主要限制可能是人工評分者之間缺乏一致性。事實上,CNN的性能與人工評分者相當;此外,一些評分者的90%CI范圍甚至低于CNN本身。這項研究表明,現(xiàn)有的計算方法足以定義可靠的SQC程序,而實現(xiàn)這一發(fā)展的主要障礙似乎是缺乏高一致性標簽的參考數(shù)據(jù)集。因此,科學界的努力應著眼于在開放科學原則下建立一個資源共享庫。
參考文獻:A. Bizzego, M. Neoh, G. Gabrieli and G. Esposito, A Machine Learning Perspective on fNIRS Signal Quality Control Approaches, in IEEE Transactions on Neural Systems and Rehabilitation Engineering, vol. 30, pp. 2292-2300, 2022, doi: 10.1109/TNSRE.2022.3198110.
小伙伴們關(guān)注茗創(chuàng)科技,將第一時間收到精彩內(nèi)容推送哦~
