最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

利用深度聚類改進(jìn)fMRI動(dòng)態(tài)功能連接分析

2022-10-10 16:40 作者:茗創(chuàng)科技  | 我要投稿

導(dǎo)讀

靜息態(tài)fMRI數(shù)據(jù)的動(dòng)態(tài)功能連接(dFC)分析通常通過(guò)計(jì)算滑動(dòng)窗口相關(guān)(SWC)來(lái)執(zhí)行,然后進(jìn)行k均值聚類,以便將每個(gè)窗口分配到給定的狀態(tài)。使用合成數(shù)據(jù)的研究表明,k均值性能高度依賴于滑動(dòng)窗口參數(shù)和信噪比。此外,被試間的異質(zhì)性來(lái)源可能會(huì)影響組級(jí)聚類的準(zhǔn)確性,從而影響dFC狀態(tài)時(shí)間屬性的測(cè)量,如停留時(shí)間和分?jǐn)?shù)占有率。這可能會(huì)導(dǎo)致關(guān)于組間差異的虛假結(jié)論(例如,將臨床人群與健康對(duì)照組進(jìn)行比較時(shí))。因此,當(dāng)應(yīng)用于多被試隊(duì)列并探索實(shí)現(xiàn)聚類性能最大化的方法時(shí),量化k均值估計(jì)dFC狀態(tài)時(shí)間屬性的能力是否重要?在這里,本研究探索在聚類之前使用降維方法,以便將高維數(shù)據(jù)映射到低維空間,為后續(xù)的聚類步驟提供顯著特征。在將k均值聚類應(yīng)用于編碼數(shù)據(jù)之前,研究者評(píng)估了使用深度自編碼器進(jìn)行降維的效果。將這種深度聚類方法與使用主成分分析(PCA)、均勻流形近似和投影(UMAP)以及使用L1或L2距離對(duì)原始特征空間應(yīng)用k均值的降維方法進(jìn)行了比較。研究者使用合成數(shù)據(jù)集(來(lái)自多個(gè)異質(zhì)被試的數(shù)據(jù))對(duì)聚類性能進(jìn)行了定量評(píng)估。結(jié)果發(fā)現(xiàn),深度聚類提供了最佳的性能,而其他方法通常不足以捕獲dFC狀態(tài)的時(shí)間屬性。然后,本研究展示了每種方法在真實(shí)人類被試數(shù)據(jù)中的應(yīng)用,并表明降維方法的選擇對(duì)狀態(tài)時(shí)間屬性的組級(jí)測(cè)量有顯著影響。

前言

功能磁共振成像(fMRI)數(shù)據(jù)的功能連接(FC)分析被用于表征和量化大腦活動(dòng)的時(shí)空模式。在該分析中,將腦區(qū)或節(jié)點(diǎn)之間的血氧水平依賴(BOLD)信號(hào)的統(tǒng)計(jì)相似性(例如相關(guān)性)用作構(gòu)建FC網(wǎng)絡(luò)的邊緣。這有助于使用圖論來(lái)量化全腦動(dòng)態(tài)。近年來(lái),動(dòng)態(tài)功能連接(dFC)被廣泛應(yīng)用于研究靜息態(tài)下大腦活動(dòng)的時(shí)變組織。一種常見(jiàn)的方法是計(jì)算滑動(dòng)窗口相關(guān)(SWC),從而產(chǎn)生一組FC矩陣,然后可以將這些FC矩陣聚類成一組重復(fù)出現(xiàn)的FC模式或狀態(tài),如圖1所示。根據(jù)每個(gè)dFC狀態(tài)的穩(wěn)定性和可變性,使用諸如停留時(shí)間(狀態(tài)改變前處于狀態(tài)的平均持續(xù)時(shí)間)和分?jǐn)?shù)占有率(在給定狀態(tài)下所花時(shí)間的比例)等統(tǒng)計(jì)數(shù)據(jù)來(lái)量化大腦的時(shí)空動(dòng)態(tài)。



圖1.SWC框架概述,包括從BOLD fMRI數(shù)據(jù)構(gòu)建FC矩陣,然后進(jìn)行聚類以確定dFC狀態(tài)。

因此,dFC分析的一個(gè)重要假設(shè)是能夠?qū)⒋竽X動(dòng)態(tài)分割成具有特定空間相關(guān)模式的狀態(tài),并且這些模式在比掃描長(zhǎng)度更短的一段時(shí)間內(nèi)保持靜止(類似于EEG微狀態(tài))。這通常在實(shí)踐中通過(guò)使用聚類方法(例如k均值)來(lái)實(shí)現(xiàn),以識(shí)別哪些加窗FC矩陣屬于有限數(shù)量狀態(tài)中的哪一個(gè),并根據(jù)相似性指標(biāo)對(duì)矩陣進(jìn)行分組。由于N個(gè)節(jié)點(diǎn)的FC矩陣維數(shù)為N(N?1)/2,并且分割可以有多達(dá)數(shù)百個(gè)節(jié)點(diǎn),因此將FC矩陣聚類為dFC狀態(tài)是一個(gè)高維(無(wú)監(jiān)督)學(xué)習(xí)任務(wù)。然而,此步驟通常使用k均值聚類(盡管其他研究使用了譜聚類或分層方法)來(lái)執(zhí)行。

一些研究評(píng)估了SWC檢測(cè)大腦活動(dòng)動(dòng)態(tài)變化的能力,以及特定窗口參數(shù)對(duì)其有效性的影響。然而,很少有人對(duì)聚類步驟的性能進(jìn)行定量評(píng)估。一些研究使用合成或替代數(shù)據(jù)驗(yàn)證了dFC聚類方法。這些研究一致表明,k均值性能高度依賴于滑動(dòng)窗口形狀和長(zhǎng)度以及信噪比。Gonzalez-Castillo等人(2015)使用任務(wù)態(tài)fMRI來(lái)加強(qiáng)認(rèn)知狀態(tài)之間的切換,將每個(gè)任務(wù)block(休息、記憶、視頻、數(shù)學(xué))視為不同的dFC狀態(tài),因此提供了真實(shí)數(shù)據(jù)中的地面真值。該研究結(jié)果表明,當(dāng)在被試水平聚類且分割中有大量區(qū)域(>100)時(shí),準(zhǔn)確率很高,但對(duì)于較少的分割和更短的滑動(dòng)窗長(zhǎng)時(shí),性能會(huì)下降。

K均值已被廣泛用于隊(duì)列研究中的dFC分析,以評(píng)估一系列神經(jīng)系統(tǒng)疾病(包括帕金森病、精神分裂癥、路易體癡呆和自閉癥)以及健康認(rèn)知和睡眠的分?jǐn)?shù)占有率和停留時(shí)間。在比較不同組間大腦時(shí)空動(dòng)態(tài)的應(yīng)用中,被試間的異質(zhì)性來(lái)源,如血流動(dòng)力學(xué)響應(yīng)函數(shù)(HRF)的形狀和噪聲水平,可能導(dǎo)致被試間的差異掩蓋了潛在的dFC狀態(tài)。很明顯,聚類步驟中的誤差將導(dǎo)致分?jǐn)?shù)占有率和停留時(shí)間等屬性的測(cè)量不準(zhǔn)確,因此可能得出關(guān)于組間差異的虛假結(jié)論。

因此,當(dāng)應(yīng)用于多被試隊(duì)列時(shí),評(píng)估k均值準(zhǔn)確量化時(shí)空dFC模式及其轉(zhuǎn)換統(tǒng)計(jì)量的能力至關(guān)重要。在對(duì)高維數(shù)據(jù)進(jìn)行聚類的其他應(yīng)用中,通常在聚類之前應(yīng)用降維方法,以便將數(shù)據(jù)映射到低維空間。這為后續(xù)的聚類步驟提供了顯著特征,減少了不相關(guān)或噪聲特征的影響。本研究評(píng)估了在聚類dFC狀態(tài)之前使用降維方法的情況(圖1),并建議在對(duì)編碼數(shù)據(jù)應(yīng)用k均值聚類之前使用深度自編碼器進(jìn)行降維。本研究將這種深度聚類方法與使用主成分分析(PCA)、均勻流形近似和投影(UMAP)以及使用L1或L2距離對(duì)原始特征空間應(yīng)用k均值的降維方法進(jìn)行了比較。使用了合成數(shù)據(jù)集對(duì)聚類性能進(jìn)行了廣泛的定量評(píng)估,這些數(shù)據(jù)集來(lái)自多個(gè)異質(zhì)性被試的數(shù)據(jù)。通過(guò)聚類精度、提取狀態(tài)的FC矩陣與真實(shí)狀態(tài)的FC矩陣之間的相似性、以及分?jǐn)?shù)占有率和停留時(shí)間測(cè)量的誤差來(lái)衡量性能。在合成數(shù)據(jù)中發(fā)現(xiàn),深度聚類優(yōu)于其他方法。本研究展示了每種方法在真實(shí)人類被試數(shù)據(jù)中的應(yīng)用,并表明降維方法的選擇對(duì)狀態(tài)時(shí)間屬性的組級(jí)測(cè)量有顯著影響。

方法

數(shù)據(jù)

本研究使用了合成和真實(shí)的fMRI數(shù)據(jù)。一般來(lái)說(shuō),SWC分析所獲得的數(shù)據(jù)通常包括每個(gè)被試數(shù)分鐘的靜息態(tài)fMRI數(shù)據(jù)。節(jié)點(diǎn)由預(yù)先確定的結(jié)構(gòu)或功能分割方案定義,或通過(guò)在組水平上應(yīng)用獨(dú)立成分分析(ICA)生成特定研究地圖。然后通過(guò)計(jì)算每個(gè)區(qū)域內(nèi)的BOLD信號(hào)平均值,構(gòu)造出N個(gè)節(jié)點(diǎn)的T個(gè)時(shí)間點(diǎn)的時(shí)間序列。

合成數(shù)據(jù)

使用SimTB(https://trendscenter.org/software/simtb/)合成數(shù)據(jù),在時(shí)空分離模型下模擬一組N個(gè)節(jié)點(diǎn)的BOLD活動(dòng)。在該模型中,時(shí)間序列數(shù)據(jù)是由神經(jīng)事件序列與HRF的線性卷積構(gòu)造的。生成了由底層dFC狀態(tài)的時(shí)間過(guò)程控制的數(shù)據(jù),其中在給定時(shí)間占用的狀態(tài)決定了每個(gè)節(jié)點(diǎn)的活動(dòng)對(duì)所有其他節(jié)點(diǎn)的影響。在每個(gè)時(shí)間點(diǎn),特定于狀態(tài)的神經(jīng)事件以一定的概率發(fā)生(設(shè)置為默認(rèn)值0.5)。當(dāng)節(jié)點(diǎn)中發(fā)生特定于狀態(tài)的事件時(shí),這對(duì)功能上連接到該節(jié)點(diǎn)的所有節(jié)點(diǎn)中的事件振幅具有加法或減法效應(yīng),由該時(shí)間步長(zhǎng)處的dFC狀態(tài)定義。除了這些特定于狀態(tài)的神經(jīng)事件外,隨機(jī)發(fā)生的獨(dú)特事件被添加到每個(gè)節(jié)點(diǎn)的時(shí)間過(guò)程中,代表大腦活動(dòng)中自發(fā)的特定于節(jié)點(diǎn)的波動(dòng)。為了驗(yàn)證這些獨(dú)特事件發(fā)生的振幅和概率是不同的,從而創(chuàng)建了具有不同噪聲水平的合成數(shù)據(jù)。

本研究旨在評(píng)估dFC聚類在應(yīng)用于包含多被試隊(duì)列時(shí)的性能,因此研究者創(chuàng)建了具有模擬FC時(shí)間進(jìn)程的被試數(shù)據(jù)。對(duì)于每個(gè)模擬數(shù)據(jù),從隱馬爾可夫模型(HMM)中對(duì)dFC狀態(tài)的潛在時(shí)間過(guò)程進(jìn)行采樣。這確保了狀態(tài)變化之間的可變間隔。不同被試之間的dFC差異可能是由噪聲水平(即神經(jīng)噪聲和測(cè)量噪聲)和HRF形狀等屬性的個(gè)體差異造成的。因此,獨(dú)特神經(jīng)事件的概率和振幅、BOLD信號(hào)中添加的高斯噪聲的振幅以及HRF的參數(shù)在不同的模擬數(shù)據(jù)中是不同的。HRF參數(shù)是從SimTB定義的默認(rèn)分布中采樣。本研究還旨在確保聚類性能獨(dú)立于狀態(tài)FC矩陣和狀態(tài)轉(zhuǎn)移矩陣,因此研究者創(chuàng)建了多個(gè)數(shù)據(jù)集,每個(gè)數(shù)據(jù)集包含多個(gè)被試。狀態(tài)FC矩陣和HMM的轉(zhuǎn)換矩陣是隨機(jī)生成的,以便對(duì)每個(gè)數(shù)據(jù)集來(lái)說(shuō)都是唯一的,但在數(shù)據(jù)集中的被試之間共享。

每個(gè)數(shù)據(jù)集的重復(fù)時(shí)間(即抽樣率)TR為2s,總持續(xù)時(shí)間為270 TR(9 min)。圖2顯示了隨機(jī)生成的dFC狀態(tài)集(a),隨機(jī)生成的轉(zhuǎn)換矩陣(b),以及相應(yīng)狀態(tài)的時(shí)間進(jìn)程(c)的示例。注意,這里并沒(méi)有改變SimTB模型的功能,只是將生成批量合成數(shù)據(jù)的過(guò)程自動(dòng)化了。



圖2.隨機(jī)狀態(tài)、轉(zhuǎn)移矩陣和時(shí)間進(jìn)程的示例。

該模型用于生成訓(xùn)練數(shù)據(jù)集,以優(yōu)化降維方法的參數(shù),以及用具有不同噪聲水平、節(jié)點(diǎn)數(shù)、狀態(tài)數(shù)、被試數(shù)量和HRF模型的驗(yàn)證數(shù)據(jù)集來(lái)評(píng)估一系列實(shí)驗(yàn)條件下的聚類性能。

人類數(shù)據(jù)

為了應(yīng)用于真實(shí)世界的數(shù)據(jù),研究者從人類連接組項(xiàng)目(https://www.humanconnectome.org)發(fā)布的HCP1200中獲得靜息態(tài)fMRI數(shù)據(jù)。已經(jīng)應(yīng)用于這些數(shù)據(jù)的處理步驟包括Glasser等人(2013)的空間預(yù)處理和Smith等人(2013)的時(shí)間預(yù)處理。空間預(yù)處理包括校正由梯度非線性引起的空間畸變,頭動(dòng)校正,B0畸變?nèi)謴?qiáng)度歸一化的校正,以及2mm全寬半最大值(FWHM)平滑。時(shí)間預(yù)處理包括高通時(shí)間濾波(>2000s FWHM)、偽影和運(yùn)動(dòng)相關(guān)時(shí)間進(jìn)程的回歸,然后是時(shí)間中心化和方差歸一化。預(yù)處理后,使用FSL中的MELODIC進(jìn)行空間ICA分析,從而獲得組水平分割。然后將ICA空間地圖集映射到每個(gè)被試的BOLD時(shí)間序列上,得到每個(gè)個(gè)體的節(jié)點(diǎn)時(shí)間序列。研究者使用了N=50的腦區(qū)分割,并選擇了沒(méi)有明顯質(zhì)量控制問(wèn)題的數(shù)據(jù)。這些數(shù)據(jù)的TR=720ms,持續(xù)時(shí)間為1200 TR(14分24秒)。

滑動(dòng)窗口相關(guān)

由T個(gè)時(shí)間點(diǎn)和N個(gè)腦區(qū)組成的多變量時(shí)間序列,通過(guò)SWC轉(zhuǎn)換為一系列FC矩陣。窗口用于為所有節(jié)點(diǎn)選擇時(shí)間序列的一小段。然后,窗口按給定的步長(zhǎng)時(shí)間移動(dòng),以提取給定被試的整個(gè)時(shí)間序列中相同長(zhǎng)度的重疊片段。在合成數(shù)據(jù)中,研究者檢驗(yàn)了矩形和錐形(漢明和漢寧)窗形狀,以及步長(zhǎng)為1TR(2s)的30-60s范圍內(nèi)的窗長(zhǎng)。通過(guò)從精度矩陣中估計(jì)協(xié)方差來(lái)測(cè)量每個(gè)窗口的FC,用L1范數(shù)進(jìn)行正則化,其中正則化參數(shù)λL1使用交叉驗(yàn)證對(duì)每個(gè)被試進(jìn)行估計(jì)。

聚類和降維

由于FC矩陣是對(duì)稱的,因此提取了上三角區(qū)并進(jìn)行了向量化。因此,在加窗和向量化之后,BOLD數(shù)據(jù)被轉(zhuǎn)換為X×Y矩陣,其中Y表示被試數(shù)量乘以每個(gè)被試的窗口數(shù)量,X表示成對(duì)相關(guān)性(等于N(N-1)/2)。然后,將該數(shù)據(jù)的每列分配到一個(gè)團(tuán)簇。在聚類之前引入一個(gè)降維步驟,將X×Y矩陣轉(zhuǎn)換為d×Y矩陣,其中d是低維表征中的維數(shù)。研究者測(cè)試了原始k均值與降維步驟后應(yīng)用k均值的性能(圖1)。使用的降維步驟是PCA、UMAP和深度聚類(自動(dòng)編碼器和k均值)。所有方法均采用相同的k均值過(guò)程。通過(guò)給每個(gè)窗口隨機(jī)分配狀態(tài)標(biāo)簽,將結(jié)果與隨機(jī)聚類進(jìn)行了比較。

由于降維方法需要參數(shù)調(diào)優(yōu),這里生成了包含50名被試、5個(gè)狀態(tài)、標(biāo)準(zhǔn)HRF和中等噪聲的訓(xùn)練數(shù)據(jù)集,并使用長(zhǎng)度為40s的矩形窗口進(jìn)行處理。這些數(shù)據(jù)用于優(yōu)化每種方法的參數(shù),使用網(wǎng)格搜索參數(shù)值以最大化聚類精度。采用參數(shù)值的粗網(wǎng)格來(lái)防止過(guò)擬合。分別用15、25和50個(gè)節(jié)點(diǎn)生成單獨(dú)的訓(xùn)練數(shù)據(jù)集,以針對(duì)這些情景的不同輸入數(shù)據(jù)維數(shù)重新調(diào)整聚類方法。

K均值

采用dFC分析中常用的k均值聚類方法。選擇局部方差最大值的示例FC窗口,并對(duì)這些窗口對(duì)應(yīng)的FC矩陣應(yīng)用128次k均值重復(fù)(最多1000次迭代),每個(gè)都用k均值++算法初始化。給出每個(gè)數(shù)據(jù)點(diǎn)與其最近質(zhì)心之間的最小平方和的質(zhì)心集,然后用于初始化所有窗口的k均值聚類(最大10000次迭代)。除了默認(rèn)的歐氏(L2)距離指標(biāo)外,本研究還測(cè)試了曼哈頓(L1)距離指標(biāo),由于其高維數(shù)而常用于dFC分析。

主成分分析(PCA)

將PCA應(yīng)用于所有FC矩陣,然后將第一個(gè)p主成分作為k均值聚類的特征,其中選擇p以最大化使用合成訓(xùn)練數(shù)據(jù)的聚類精度。每個(gè)分割區(qū)域的結(jié)果p如表1所示。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 表一


均勻流形近似和投影(UMAP)

UMAP是一種非線性降維技術(shù),通過(guò)構(gòu)建高維圖表征,將數(shù)據(jù)投射到低維流形上,然后優(yōu)化低維圖,使其結(jié)構(gòu)盡可能類似于高維圖。高維圖的結(jié)構(gòu)是根據(jù)到最近鄰m的距離確定的。更高的m會(huì)導(dǎo)致低維投影,更準(zhǔn)確地捕捉數(shù)據(jù)的全局結(jié)構(gòu),而不是保留到鄰居的局部距離。必須選擇的其他參數(shù)是低維子空間中的維數(shù)u,以及低維表征中的點(diǎn)之間的最小距離v。使用UMAP將所有FC矩陣嵌入到一個(gè)低維子空間中,然后對(duì)嵌入數(shù)據(jù)進(jìn)行k均值聚類。如前所述,選擇u、v和m的值是為了使合成訓(xùn)練數(shù)據(jù)的聚類精度最大化(表1)。

深度聚類

深度學(xué)習(xí)為神經(jīng)成像分析提供了強(qiáng)大的工具,包括結(jié)構(gòu)MRI中解剖結(jié)構(gòu)或病變的分割,基于任務(wù)態(tài)fMRI數(shù)據(jù)中的認(rèn)知狀態(tài)標(biāo)注,或從功能連接網(wǎng)絡(luò)中進(jìn)行臨床診斷。盡管這些有監(jiān)督的深度學(xué)習(xí)應(yīng)用需要大量的地面真值數(shù)據(jù)進(jìn)行訓(xùn)練,但自動(dòng)編碼器可以用作無(wú)監(jiān)督應(yīng)用的降維方法。

自動(dòng)編碼器是一種人工神經(jīng)網(wǎng)絡(luò),通過(guò)低維編碼層將輸入數(shù)據(jù)復(fù)制到輸出。這個(gè)低維編碼層形成的瓶頸效應(yīng)迫使網(wǎng)絡(luò)提取特征,從而通過(guò)解碼層再現(xiàn)原始數(shù)據(jù)。在這種情況下,輸入數(shù)據(jù)被用作訓(xùn)練目標(biāo),因此自動(dòng)編碼器可以用于無(wú)監(jiān)督聚類應(yīng)用中的降維。在這里,研究者使用自動(dòng)編碼器作為數(shù)據(jù)驅(qū)動(dòng)的方法來(lái)確定組水平的特征空間,允許聚類應(yīng)用于低維編碼層提供的顯著特征。這個(gè)框架稱為深度聚類。

提出的深度聚類框架包括在所有FC窗口上訓(xùn)練一個(gè)自動(dòng)編碼器,然后對(duì)編碼數(shù)據(jù)應(yīng)用k均值聚類(圖3)。本研究使用了一個(gè)具有三個(gè)編碼層和一個(gè)對(duì)稱解碼器的全連接自動(dòng)編碼器。使用Adam優(yōu)化器訓(xùn)練權(quán)重,以最小化輸入和輸出之間的均方誤差(MSE),訓(xùn)練了100個(gè)epoch,批尺寸為50。隱藏層采用整流線性單元(ReLU)激活函數(shù),低維層和輸出層采用線性激活函數(shù)。如前所述,選擇每層中的單元數(shù)是為了使合成訓(xùn)練數(shù)據(jù)的聚類精度最大化(表1)。


圖3.自編碼器架構(gòu)。

實(shí)驗(yàn)

合成數(shù)據(jù)聚類

研究者改變了模型的參數(shù)和預(yù)處理步驟,以評(píng)估以下每種情況下的聚類分析性能:

a)被試數(shù)量:10、50和100。

b)分割區(qū)域數(shù)量:15、25、50。

c)狀態(tài)數(shù):3、5、7。

d)血流動(dòng)力學(xué)響應(yīng)函數(shù)(HRF):對(duì)SimTB中提供的兩種HRF模型進(jìn)行測(cè)試;標(biāo)準(zhǔn)HRF和Windkessel-Balloon模型。

e)噪聲:低、中、高噪聲數(shù)據(jù)集是通過(guò)改變基礎(chǔ)神經(jīng)時(shí)間進(jìn)程中獨(dú)特事件的概率和振幅而生成的,并將高斯噪聲的振幅添加到BOLD信號(hào)中。

f)滑動(dòng)窗口形狀:矩形、漢明、漢寧。

g)滑動(dòng)窗口長(zhǎng)度:30s、40s、60s。

在每個(gè)數(shù)據(jù)集中,沒(méi)有變化的參數(shù)設(shè)置為以下默認(rèn)值:50個(gè)被試;25節(jié)點(diǎn);標(biāo)準(zhǔn)HRF;高噪聲;矩形滑動(dòng)窗長(zhǎng)為40s。為了驗(yàn)證聚類狀態(tài),通過(guò)配對(duì)對(duì)應(yīng)FC矩陣之間的余弦相似性最大的狀態(tài),將聚類狀態(tài)匹配為真狀態(tài)。為了比較不同聚類方法之間的dFC狀態(tài)質(zhì)心,通過(guò)對(duì)屬于該狀態(tài)的所有FC窗口進(jìn)行平均(而不是使用由k均值步驟導(dǎo)出的低維質(zhì)心)來(lái)構(gòu)造給定狀態(tài)的代表性FC矩陣。聚類性能通過(guò)聚類精度(正確標(biāo)記窗口的百分比)、聚類質(zhì)心與真實(shí)狀態(tài)之間的平均余弦相似性、停留時(shí)間(狀態(tài)變化前占用的平均時(shí)間)和分?jǐn)?shù)占有率(在給定狀態(tài)下的總掃描持續(xù)時(shí)間的比例)的均方誤差來(lái)衡量。為了計(jì)算停留時(shí)間MSE和分?jǐn)?shù)占有率MSE,為每個(gè)被試的每個(gè)狀態(tài)計(jì)算這些屬性,然后計(jì)算這些測(cè)量值與真實(shí)值之間的平方誤差,并在被試和狀態(tài)中取平均值。對(duì)于每個(gè)參數(shù)集,研究者構(gòu)建了5個(gè)數(shù)據(jù)集,并在每個(gè)數(shù)據(jù)集上執(zhí)行每種方法的10次運(yùn)行。然后,在給定的參數(shù)集上對(duì)每種方法的所有50次運(yùn)行的性能指標(biāo)進(jìn)行平均。為了證明在每個(gè)數(shù)據(jù)集中跨被試的時(shí)間屬性測(cè)量之間的差異,本研究從每種方法的一次運(yùn)行中獲得結(jié)果,并執(zhí)行非配對(duì)雙尾t檢驗(yàn),以檢驗(yàn)與每個(gè)狀態(tài)的分?jǐn)?shù)占有率和停留時(shí)間測(cè)量的真實(shí)分布的顯著差異。

聚類真實(shí)數(shù)據(jù)

從人類連接組項(xiàng)目數(shù)據(jù)集中選擇了五組不重疊的100名被試。在每組中,應(yīng)用矩形窗口長(zhǎng)度為55 TR(39.6s)的SWC,步長(zhǎng)為2 TR(1.44s),每個(gè)被試有573個(gè)窗口。這是基于前人研究的基礎(chǔ)上,結(jié)果表明在運(yùn)動(dòng)噪聲不大的情況下,矩形窗口適合于檢測(cè)dFC。在聚類示例FC窗口時(shí),使用簇內(nèi)到簇間距離的肘形判據(jù)為每個(gè)數(shù)據(jù)集選擇簇?cái)?shù)k。在所有100名被試的組中,確定了最佳聚類數(shù)為k=4。然后,使用表1所示的N=50個(gè)節(jié)點(diǎn)中相應(yīng)的參數(shù)對(duì)每種方法進(jìn)行聚類。為了進(jìn)行后續(xù)的比較,通過(guò)對(duì)對(duì)應(yīng)的FC矩陣之間的余弦相似性最大的狀態(tài)進(jìn)行匹配。

為了評(píng)估每種方法提供的狀態(tài)時(shí)間屬性測(cè)量值,研究者計(jì)算了每個(gè)被試中每個(gè)狀態(tài)的占有率和停留時(shí)間。為了確定訓(xùn)練自編碼器引入的隨機(jī)性是否影響了重復(fù)運(yùn)行深度聚類時(shí)狀態(tài)時(shí)間屬性的測(cè)量,對(duì)每個(gè)數(shù)據(jù)集執(zhí)行了10次深度聚類分析,并使用單因素方差分析(ANOVA)來(lái)測(cè)試每個(gè)狀態(tài)的分?jǐn)?shù)占有率和停留時(shí)間運(yùn)行之間的差異。為了確定降維方法的選擇是否影響了狀態(tài)時(shí)間屬性的測(cè)量,對(duì)每種方法執(zhí)行了一次運(yùn)行,并使用單向方差分析來(lái)測(cè)試分?jǐn)?shù)占有率和停留時(shí)間方法之間的差異。采用Benjamini-Hochberg方法進(jìn)行錯(cuò)誤發(fā)現(xiàn)率(FDR)校正。如果產(chǎn)生了顯著的結(jié)果(FDR校正p<0.05),則使用未配對(duì)雙尾t檢驗(yàn)進(jìn)行方法之間的事后兩兩比較。

結(jié)果

驗(yàn)證

為了檢驗(yàn)每種降維方法的有效性,本研究使用合成數(shù)據(jù)量化了聚類性能。在檢驗(yàn)的方法中,深度聚類在所有合成數(shù)據(jù)集中呈現(xiàn)出最高的精度(圖4)。深度聚類方法在提取狀態(tài)和真實(shí)狀態(tài)之間具有最高的平均余弦相似性,最低的分?jǐn)?shù)占有率MSE,以及在大多數(shù)數(shù)據(jù)集中的停留時(shí)間MSE最低(圖4)。但在10個(gè)被試、15個(gè)節(jié)點(diǎn)和30s窗口的數(shù)據(jù)集上的結(jié)果除外,其中PCA和UMAP分別在平均余弦相似性和較低的停留時(shí)間均方誤差上的結(jié)果略好。此外,在所有數(shù)據(jù)集中,深度聚類是在分?jǐn)?shù)占有率和停留時(shí)間測(cè)量上優(yōu)于概率的唯一方法。


圖4.合成數(shù)據(jù)驗(yàn)證結(jié)果。

圖5顯示了應(yīng)用于高噪聲數(shù)據(jù)集的每種聚類算法結(jié)果的示例數(shù)據(jù)??梢钥闯?,深度聚類的停留時(shí)間測(cè)量值的分布在統(tǒng)計(jì)上與地面真值沒(méi)有區(qū)別。另一方面,對(duì)于使用L1距離的PCA或k均值的狀態(tài)1、2和5,以及使用L2距離的k均值的狀態(tài)1,這些結(jié)果與地面真值顯著不同(圖5c)。此外,使用L1或L2距離、PCA和UMAP從k均值測(cè)量的分?jǐn)?shù)占有率與狀態(tài)3的真值顯著不同。狀態(tài)3的高分?jǐn)?shù)占有率測(cè)量結(jié)果表明,大量FC窗口被錯(cuò)誤地分配給該聚類。這對(duì)狀態(tài)3的狀態(tài)FC矩陣有明顯的影響(圖5a),其中大多數(shù)元素由于在大量FC窗口上平均而接近于零。相反,使用深度聚類得到的所有五種狀態(tài)FC矩陣在視覺(jué)上具有與地面真值相似的結(jié)構(gòu)。


圖5.聚類分析結(jié)果來(lái)自應(yīng)用于高噪聲合成數(shù)據(jù)的每種降維方法的一次運(yùn)行。

在真實(shí)數(shù)據(jù)中的應(yīng)用

將每種方法應(yīng)用于來(lái)自人類連接組項(xiàng)目中五組100名被試的真實(shí)數(shù)據(jù)。第一組的聚類結(jié)果如圖6所示。除了UMAP之外,所有方法估計(jì)的狀態(tài)FC矩陣在很大程度上都具有可比性,但與其他方法相比,深度聚類的狀態(tài)4也存在差異(圖6a)。狀態(tài)1和狀態(tài)3的分?jǐn)?shù)占有率測(cè)量結(jié)果;狀態(tài)2-4的停留時(shí)間測(cè)量結(jié)果存在顯著差異(圖6b;單因素方差分析,F(xiàn)DR校正p<0.05)。圖6c繪制了5個(gè)被試的狀態(tài)時(shí)間進(jìn)程,并展示了每種方法的差異。



圖6.每種降維方法的聚類結(jié)果(來(lái)自人類連接組計(jì)劃項(xiàng)目中的數(shù)據(jù))。

結(jié)論

本研究證明深度聚類框架(包括用于在k均值聚類之前進(jìn)行降維的自動(dòng)編碼器)可提高合成數(shù)據(jù)的dFC聚類性能。當(dāng)應(yīng)用于現(xiàn)實(shí)世界的數(shù)據(jù)時(shí),與標(biāo)準(zhǔn)方法相比,這種性能的提高導(dǎo)致大腦狀態(tài)的時(shí)間特征測(cè)量方面存在顯著差異。這些差異定性地反映了在合成聚類結(jié)果中觀察到的差異。

人類連接組項(xiàng)目數(shù)據(jù):https://www.humanconnectome.org

SimTB模型:https://trendscenter.org/software/simtb/

本研究中使用的代碼:https://github.com/apcspencer/ dFC_DimReduction

原文:Using deep clustering to improve fMRI dynamic functional connectivity analysis.

https://doi.org/10.1016/j.neuroimage.2022.119288

小伙伴們點(diǎn)個(gè)“在看”,加

(星標(biāo))關(guān)注茗創(chuàng)科技,將第一時(shí)間收到精彩內(nèi)容推送哦~



利用深度聚類改進(jìn)fMRI動(dòng)態(tài)功能連接分析的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
大邑县| 乌鲁木齐市| 达日县| 元阳县| 襄汾县| 鸡西市| 固原市| 永和县| 通许县| 鹤壁市| 若羌县| 峨山| 时尚| 阿拉尔市| 汾西县| 锡林郭勒盟| 南城县| 衡南县| 宜章县| 监利县| 兰考县| 宜昌市| 罗山县| 竹溪县| 福泉市| 冕宁县| 邢台市| 广安市| 普宁市| 浦县| 武城县| 开封市| 夏津县| SHOW| 柳河县| 奉新县| 阜新| 临沧市| 特克斯县| 克拉玛依市| 石景山区|