最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

神經(jīng)影像分析的統(tǒng)計學(xué)方法

2023-04-21 09:40 作者:茗創(chuàng)科技  | 我要投稿

線性模型概述

模型是對現(xiàn)實的一種數(shù)學(xué)近似,其中給定輸入變量集的某個函數(shù)旨在重建一個輸出變量。以fMRI范式為例,在這個范式中,給受試者呈現(xiàn)面孔和房屋的圖像。該模型的目標是利用體素對面孔和房屋反應(yīng)時的預(yù)期時間進程,并產(chǎn)生與測量體素對面孔/房屋反應(yīng)信號密切匹配的輸出(見圖1)。設(shè)Y為長度為N的向量,其中包含一個體素的時間序列數(shù)據(jù),設(shè)X1和X2分別為面孔和房屋激活的預(yù)期時間過程。由于測量和模型并不完美,因此有一個額外的誤差項向量,用來描述剩余項的可變性:

參數(shù)β0描述的是被試在沒有看到面孔或房屋時(X1和X2為零)fMRI信號的基線值,而β1和β2分別描述的是面孔或房屋的激活量。最后,包含來自數(shù)據(jù)噪聲的可變性以及模型未捕獲到的任何未知結(jié)構(gòu)可變性。圖1底部圖顯示了擬合模型與原始數(shù)據(jù)和參數(shù)估計的匹配程度。


圖1.BOLD建模示例。

模型可以用矩陣形式表示,其中所有回歸量在一個矩陣中,所有βi在一個列向量中,表示為Y=Xβ+∈,其中Y是一個長度為N的向量,X是一個維數(shù)N×p的矩陣,p是回歸量的數(shù)量,β是一個長度為p的列向量,同時也是一個長度為N的向量。圖2展示了fMRI任務(wù)的這些矩陣(左),以及研究分數(shù)各向異性(FA)組間差異的模型(右)。線性模型被廣泛應(yīng)用于神經(jīng)成像分析,用于將各種大腦測量指標與不同變量關(guān)聯(lián)起來,并在組間進行比較。該方法還可用于靜息態(tài)fMRI數(shù)據(jù)的預(yù)處理步驟,以去除偽影。它可以直接用于預(yù)測分析,也可以擴展用于構(gòu)建更高級的機器學(xué)習(xí)算法,如神經(jīng)網(wǎng)絡(luò)。接下來將討論該模型在用于預(yù)測和解釋方面的廣泛差異。

圖2.兩種矩陣形式的模型示例。

線性模型:預(yù)測與解釋的比較

線性模型的參數(shù)估計

偏差與方差

最小二乘估計是無偏的,這意味著如果你重復(fù)許多研究并在每個研究中估計β,那么均值將等于真實值。此外,該估計在所有無偏估計中具有最小的方差,這是指在重復(fù)研究中估計值的變異性??赡苁遣煌墓烙嬈鳟a(chǎn)生了方差更小的有偏估計,但為什么要使估計有偏差呢?這是解釋和預(yù)測之間的另一個區(qū)別。方差會影響預(yù)測效果,因此某些特征權(quán)重會產(chǎn)生偏差,通常將其縮小或設(shè)置為0來提高預(yù)測效果。另一方面,有偏的參數(shù)估計可能會干擾解釋。一般來說,解釋模型堅持在無偏估計的范疇內(nèi),通過避免共線性和需要比參數(shù)更多的樣本(N>p)來避免解釋中的潛在問題。預(yù)測模型通常具有N<P和平衡偏差和方差,以改進使用正則化估計器而不是最小二乘法的樣本外預(yù)測。
共線性

圖3.共線性對解釋和預(yù)測的影響。

與解釋相關(guān)的主題

解釋性分析通常用于檢驗涉及模型參數(shù)的統(tǒng)計假設(shè)。假設(shè)檢驗有兩部分:①零假設(shè)或H0;②備擇假設(shè)或HA。圖2列出了兩個模型和每個模型的假設(shè)。第二個模型的目標是發(fā)現(xiàn)對照組是否比患者有更大的FA,使HA:β1>β2和H0:β1=β2??梢允褂靡韵峦普摬襟E來檢驗這一假設(shè)。

對比度估計

推斷

此外,p值經(jīng)常被誤解。我們假設(shè)零假設(shè)為真,然后計算在零分布下觀測到統(tǒng)計量的概率或者比它更極端的概率。注意,“更極端”指的是備擇假設(shè)的方向。最常用的閾值是p=0.05。這個閾值的含義是,如果我們的數(shù)據(jù)中沒有任何真正的信號,那么做出這一結(jié)論犯錯誤的概率為5%(假陽性)。
在神經(jīng)影像學(xué)中,大多數(shù)假設(shè)檢驗都是單側(cè)的。在所有標準統(tǒng)計軟件中,默認p值反映的是雙側(cè)檢驗,用于檢驗效應(yīng)是與0存在顯著差異。雙側(cè)p值通常是前者的兩倍大,因此,單側(cè)檢驗應(yīng)該在有強有力的證據(jù)表明效應(yīng)是在某個方向上的情況下使用。用兩個單側(cè)檢驗代替一個雙側(cè)檢驗是一種不好的做法,因為這會增加假陽性率,稍后將討論這個問題。盡管在神經(jīng)影像學(xué)中經(jīng)常會忽視這一問題,但有必要改變這種做法,要么默認運行雙側(cè)檢驗,要么在運行兩個單側(cè)檢驗時進行適當(dāng)調(diào)整。
多重比較

假設(shè)你要分析101000個體素,其中100000個體素不包含信號,而1000個體素包含信號(表1)。假設(shè)體素是獨立的,p值臨界值為0.05意味著將有5000個假陽性或I類錯誤。而事實上,我們的體素并不是獨立的,所以這種假陽性通常很容易被解釋為真實的效應(yīng)。為了解決這個問題,可以采用控制錯誤率的方法。雖然Bonferroni校正是一種控制I類錯誤的著名方法;但它假設(shè)所有檢驗都是獨立的,這對于成像數(shù)據(jù)來說過于保守。相反,我們通常專注于基于聚類的統(tǒng)計數(shù)據(jù),并校正這些統(tǒng)計數(shù)據(jù)的錯誤率。

表1

功效

有效性

如前所述,由于參數(shù)估計的高變異性,共線性會干擾解釋模型的解釋。在fMRI分析中,大多數(shù)時間進程數(shù)據(jù)的回歸量在數(shù)據(jù)收集之前就已經(jīng)知道了,因為它們主要依賴于任務(wù)設(shè)計的參數(shù),例如刺激的時間和順序。在fMRI研究中測量的BOLD信號與實際的神經(jīng)信號相比是延遲的,因為我們測量的是血氧變化。如果刺激不隨時間間隔開來,這通常會導(dǎo)致模型中的共線性。例如,在一個項目識別任務(wù)中,首先向被試呈現(xiàn)一組字母,例如{a,T,E,M}?(目標刺激),然后在短暫的停頓后向其呈現(xiàn)一個字母,例如T,并且要求他們判斷這個字母是否包含在前面的集合中(探測刺激),以“是”或“否”來回答。在這個示例中,“是”/“否”響應(yīng)和正確性將被忽略。為了分別研究目標刺激和探測刺激誘發(fā)的大腦過程,需要為任務(wù)的每個目標和探測部分分別使用單獨的回歸器。如圖4所示,如果目標和探測之間的時間很短,回歸量的相關(guān)性越強。t統(tǒng)計量分母(公式6)的倒數(shù)c(XTX)-1cT稱為有效性,可用于對設(shè)計進行排名。在圖4的兩種設(shè)計中,第二種設(shè)計的目標或探測的對比度估計效率是第一種設(shè)計的1.97倍,這表明使用第一種設(shè)計的對比度的方差估計將增大1.97倍!有效性并沒有一個特定的閾值,因為它只是一個相對的衡量標準,可以用來對一組研究設(shè)計進行排名。此外,在fMRI研究前進行行為試驗是很重要的,以確保任何發(fā)現(xiàn)的行為效應(yīng)不會因為刺激間隔而受到影響。

圖4.項目識別fMRI任務(wù)的回歸量,由目標(橙色)和探測(藍色)組成。

避免共線性的一種方法是使用共線性評估工具——方差膨脹因子(VIF)。它為模型中的每個參數(shù)提供了一個VIF,目標是所有VIF都小于5。圖4中兩種設(shè)計的參數(shù)VIFs均小于5(頂部模型的各參數(shù)VIF為2.28,底部模型的VIF為1.56)。VIF可以確保避免共線性,有效性可以進一步細化模型選擇,從而進一步降低方差。

與預(yù)測相關(guān)的主題

雖然很少直接使用線性回歸模型進行預(yù)測分析,但大多數(shù)預(yù)測模型都可以看作是該模型的擴展。此外,必須結(jié)合交叉驗證來估計預(yù)測性能。

交叉驗證

正則化

通常,人們不會使用標準的線性回歸進行預(yù)測,因為特征通常比觀測值更多。這通常被稱為“寬數(shù)據(jù)”,因為設(shè)計矩陣X的寬度大于其高度。正則化的思想可以追溯到之前提到的偏差-方差權(quán)衡。盡管無偏參數(shù)估計聽起來很有吸引力,但它們可能導(dǎo)致高度可變的預(yù)測。正則化分別關(guān)注偏差和方差,允許兩者達到某種平衡,與最小二乘估計相比,最終減少了總體預(yù)測誤差。Lasso回歸是一種常用的L1正則化回歸模型。另一種常用的正則化策略稱為“L2”,L2是逐漸地縮小所有特征權(quán)重,而不是嚴格地縮小到0。嶺回歸是該策略中最著名的一種方法。此時參數(shù)估計的可解釋性更強,但賦予不同特征重要性仍然是有風(fēng)險的。即使使用最小二乘回歸,回歸量也會協(xié)同變化。

更高級的預(yù)測模型

最簡單的機器學(xué)習(xí)方法依賴于人工干預(yù),輸入可以很好預(yù)測的、有意義的特征。例如,如果試圖將視網(wǎng)膜圖像分類為健康或疾病,可能需要首先對圖像進行處理,以開發(fā)有意義的特征,如病變數(shù)量。深度學(xué)習(xí)方法的不同之處在于,算法接管了創(chuàng)建更有意義的特征以改善預(yù)測工作。盡管這些方法似乎與線性回歸相去甚遠,但線性回歸和簡單的神經(jīng)網(wǎng)絡(luò)之間存在聯(lián)系,這可以與更現(xiàn)代的深度學(xué)習(xí)方法聯(lián)系起來。

假設(shè)一名墻面專家、水管工和電工一起裝修房屋,一般的想法是將每個工人在房屋上花費的時間與裝修質(zhì)量(RQ)聯(lián)系起來。在這種情況下,模型為RQ=β1tdw+β2telec+β3tplumb+∈。圖5左圖給出了該模型的描述,反映了一個標準的線性回歸模型。實際上,這些工人在房屋上花費的時間和最終的裝修質(zhì)量取決于他們在不同類型的房間上共同工作的時間,然后,整體的裝修質(zhì)量可以更好地解釋為每個房間類型的集體努力的函數(shù)。假設(shè),對于每一所房子,電工的時間將以相同的方式分配到所有房子的不同房間類型上,還假設(shè)所有房子在每種類型的房間數(shù)量方面都是相似的。那么,花費的時間和裝修質(zhì)量之間的真實關(guān)系可能更接近圖5的右圖。這是一個簡單的、具有一個隱藏層的線性前饋神經(jīng)網(wǎng)絡(luò)。這個單一的隱藏層包含兩個節(jié)點或神經(jīng)元,它們實際上是新的和改進的特征。雖然其中指定了節(jié)點和層的數(shù)量,但沒有指定節(jié)點代表什么。它們將在評估過程中確定,可能沒有直觀的含義,例如房間類型。無論哪種方式,這一層中的每個節(jié)點都由每個工人的部分時間的加權(quán)和組成。例如,l1=β11tdw+β12telec+β13tplumb,這看起來很像一個更大的線性模型中的線性模型。這種線性關(guān)系之外的一個復(fù)雜層次是允許每個節(jié)點都存在非線性。例如,l1=f1(β11tdw+β12telec+β13tplumb),其中f1是某個非線性函數(shù),其取值范圍在0和1之間。通常還包括偏差項,通過添加一個常數(shù)來進一步控制每個節(jié)點的貢獻,即l1=f1(β11tdw+β12telec+β13tplumb+β10)。該模型涉及的參數(shù)數(shù)量非常多,模型估計比最小二乘回歸更復(fù)雜。

圖5.左圖以圖形的形式說明了一個簡單的線性回歸模型。右圖是一個簡單的前饋線性神經(jīng)網(wǎng)絡(luò),其中一層由兩個節(jié)點組成。


參考文獻(上下滑動查看):

Bausell, R., Li, Y.F., 2002. Power Analysis for Experimental Research: A Practical Guide for the Biological, Medical and Social Sciences. Cambridge University Press.

Eklund, A., Nichols, T., Knutsson, H., 2016. Cluster failure: why fmri inferences for spatial extent have inflated false-positive rates. Proceedings of the National Academy of Sciences 114, E4929. https://doi.org/10.1073/pnas.1602413113.

Hastie, T., Tibshirani, R., Friedman, J., 2001. The Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer Series in Statistics.

Kao, M.H., Mandal, A., Lazar, N., Stufken, J., 2009. Multi-objective optimal experimental designs for event-related fmri studies. NeuroImage 44, 849–856. https://doi.org/10.1016/j.neuroimage.2008.09.025.

Lindquist, M., Mejia, A., 2015. Zen and the art of multiple comparisons. Psychosomatic Medicine 77, 114–125. https://doi.org/10.1097/PSY.0000000000000148.

Liu, T., Frank, L., Buxton, R., 2001. Detection power, estimation efficiency, and predictability in event-related fmri. NeuroImage 13, 759–773. https://doi.org/10.1006/nimg.2000.0728.

Mumford, J., 2011. A power calculation guide for fmri studies. Social Cognitive and Affective Neuroscience 7, 738–742. https://doi.org/10.1093/scan/nss059.

Nielsen, M., 2015. Neural Networks and Deep Learning. Determination Press.

Poldrack, R., Mumford, J., Nichols, T., 2011. Handbook of Functional MRI Data Analysis. Cambridge University Press.

Rawlings, J., Pantula, S.G., Dickey, D.A., 1998. Applied Regression Analysis: A Research Tool. Springer Texts in Statistics.


小伙伴們關(guān)注茗創(chuàng)科技,將第一時間收到精彩內(nèi)容推送哦~


神經(jīng)影像分析的統(tǒng)計學(xué)方法的評論 (共 條)

分享到微博請遵守國家法律
大竹县| 常州市| 克山县| 巴楚县| 汾西县| 垫江县| 南昌市| 正镶白旗| 大足县| 台州市| 东港市| 平顶山市| 罗定市| 桐城市| 海宁市| 于都县| 上犹县| 永丰县| 肇庆市| 万安县| 龙游县| 正镶白旗| 娱乐| 湖口县| 温州市| 永胜县| 高台县| 民权县| 新巴尔虎右旗| 揭东县| 会宁县| 怀来县| 红河县| 宁津县| 新干县| 庆云县| 鹿邑县| 绥中县| 庆安县| 宝坻区| 上蔡县|