拓端tecdat:R語言估計多元標(biāo)記的潛過程混合效應(yīng)模型(LCMM)分析心理測試的認(rèn)知過程
原文鏈接:http://tecdat.cn/?p=24172
原文出處:拓端數(shù)據(jù)部落公眾號
背景和定義
每個動態(tài)現(xiàn)象都可以用一個潛過程(Λ(t))來表征,這個潛過程在連續(xù)的時間t中演化。有時,這個潛過程是通過幾個標(biāo)志來衡量的,因此潛過程是它們的共同因素。
多元標(biāo)記的潛過程混合模型
Proust-Lima 等人引入了潛在過程混合模型。(2006 -?A Nonlinear Model with Latent Process for Cognitive Evolution Using Multivariate Longitudinal Data - Proust - 2006 - Biometrics - Wiley Online Library?和 2013 -?Analysis of multivariate mixed longitudinal data: A flexible latent process approach - Proust‐Lima - 2013 - British Journal of Mathematical and Statistical Psychology - Wiley Online Library?).
使用線性混合模型根據(jù)時間對定義為潛過程的感興趣量進(jìn)行建模:

其中:
X(t) 和 Z(t) 是協(xié)變量的向量(Z(t) 包含在 X(t) 中;
β是固定效應(yīng)(即總體平均效應(yīng));
ui 是隨機效應(yīng)(即個體效應(yīng));它們根據(jù)具有協(xié)方差矩陣 B 的零均值多元正態(tài)分布進(jìn)行分布;
(wi(t)) 是一個高斯過程。
根據(jù)時間和協(xié)變量的 Λ(t) 結(jié)構(gòu)模型與單變量情況完全相同。
現(xiàn)在,我們不再定義一個觀察方程,而是定義 K 個不同標(biāo)記的 K 個觀察方程,其中 Yijk是對主體 i、標(biāo)記 k 和場合 j?的觀察。在單變量情況下,可以通過定義特定于標(biāo)記的鏈接函數(shù) Hk 來處理幾種類型的標(biāo)記。特定于標(biāo)記的觀察方程還可能包括協(xié)變量上的一些對比 γk 以及標(biāo)記和主體特定的隨機截距:
?
其中:
αik~N(0,σ2k)
Xcijk協(xié)變量向量
γk 是對比(k?上的總和等于 0)
tijk 對象 i、標(biāo)記 k 和場合 j 的測量時間;
?ijk一個獨立的高斯誤差,均值為 0,方差為 σ2?kσ?k2;
Hk將潛過程轉(zhuǎn)換為標(biāo)記 k?的尺度和度量的鏈接函數(shù)(由 ηk 參數(shù)化)。
目前只考慮連續(xù)鏈接函數(shù)。這些與單變量情況(在 lcmm 中)相同。H?1 是一組遞增單調(diào)函數(shù)的參數(shù)族:
線性變換:這簡化為線性混合模型(2 個參數(shù))
Beta 累積分布族重新調(diào)整(4 個參數(shù))
具有 m 個節(jié)點的二次 I 樣條的基(m+2 個參數(shù))
可識別性
與任何潛在變量模型一樣,必須定義潛在變量的度量。這里第一個隨機效應(yīng) ui的方差設(shè)置為 1,平均截距(在 β 中)設(shè)置為 0。
認(rèn)知過程示例
在這個例子中,當(dāng)認(rèn)知被定義為三種心理測試的共同因素時,我們研究了認(rèn)知隨時間變化的軌跡:MMSE、BVRT和IST。這里的時間尺度是進(jìn)入隊列后的年數(shù),軌跡被假定為時間上的二次方(在個人和人群層面),模型被調(diào)整為進(jìn)入時的年齡。為了進(jìn)一步研究性別的影響,包括對共同因素的平均效應(yīng)和對每個標(biāo)志的差異效應(yīng)(對比)(在這個例子中不與時間相互作用)。
模型考慮:
其中:
和?
,?
?是布朗過程,?
?對于 k = 1,2,3:?
,?
?和?
不同鏈接函數(shù)的估計
我們首先創(chuàng)建變量標(biāo)準(zhǔn)化,?避免數(shù)值問題:
tie <- (ae - ag_it)/10
ag75 <- (ae_it - 75)/10
線性鏈接函數(shù)
默認(rèn)情況下,所有鏈接函數(shù)都設(shè)置為線性:
mlmm( ubc'ID', dt = pud, radom = T, cr =B(tme))
非線性鏈接函數(shù)
根據(jù)數(shù)據(jù)的性質(zhì),可能需要一些非線性鏈接函數(shù)。例如,這里的 MMSE 是高度偏斜的:
hist(MMSE)
在單變量情況下,可以考慮 Beta CDF 或樣條。鏈接函數(shù)族可以對所有標(biāo)記都相同(即使參數(shù)不同):
# 以Beta為例
mlmm( lnk = 'beta')
或者可以不同地選擇鏈接函數(shù)。例如,
# 樣條曲線中不同數(shù)量的結(jié)點
mlmm( lik = c('eta','3-uan-spes','3-antpln'))
修復(fù)一些轉(zhuǎn)換參數(shù)
請注意,樣條變換有時可能涉及非常接近 0 的參數(shù),從而導(dǎo)致無法收斂(因為參數(shù)位于參數(shù)空間的邊界)。這經(jīng)常發(fā)生在 MMSE 中。例如,在下面的示例中,由于 MMSE 變換的第三個參數(shù)低于 10e-4,因此不容易達(dá)到收斂。
# 樣條曲線
mlmm( axe=50, ink = c('3asin'))
通過使用 fix 選項修復(fù)此參數(shù),可以輕松解決此問題。為此,可以從估計向量(此處為第 21 個參數(shù))中識別參數(shù)的位置:?
best
并且可以根據(jù)這些估計值和新固定的參數(shù)重新擬合模型:
# 樣條曲線
mult(B=mp$best)
有了這個約束,模型就可以正確收斂。
模型比較
mult對象是多元潛在過程混合模型,它們假設(shè)潛過程的軌跡完全相同,但鏈接函數(shù)不同。在單變量情況下,可以使用信息標(biāo)準(zhǔn)來比較模型。該?summary
?給我們這樣的信息。
sumrtbe(ml)
涉及 Beta 變換和樣條變換的模型在 AIC 方面似乎比顯示偏離正態(tài)性的線性變換要好得多。
可以在模型之間繪制和比較轉(zhuǎn)換:
par(mrow=c(1,1))
plot(llnes2, col = c(ol[2],ol[3]ol4]), ld =1,ly=4)
除了線性變換,所有的估計變換都非常接近。
后擬合輸出
估計的鏈接函數(shù):
鏈接函數(shù)的置信區(qū)間可以通過蒙特卡羅方法獲得:
predict(ml_btapl)
plt(Cl)
概括
該模型的摘要包括收斂性、擬合優(yōu)度標(biāo)準(zhǔn)和估計參數(shù)。
summary
?
從估計結(jié)果來看,基礎(chǔ)認(rèn)知隨著時間的推移有一個二次方的軌跡,基線時年齡較大的受試者的認(rèn)知水平系統(tǒng)地較低。根據(jù)性別沒有差異。然而,性別對心理測試有明顯的差異性影響(P=0.0003),男性的BVRT系統(tǒng)性較高,女性的IST水平較高。
方差解釋
對于多元數(shù)據(jù),潛在過程是不同標(biāo)記的共同潛在因素。因此,我們可以計算解釋潛在過程的每個標(biāo)記的殘差方差。解釋的這種方差取決于協(xié)變量并在特定時間計算。
VarE(tbsp,dtafme(tme=0))
例如,公因子解釋了 42% 的 MMSE 殘差變化,而它解釋了時間 0 時 26% 的 BVRT 殘差變化。
標(biāo)記的預(yù)測軌跡圖
可以根據(jù)協(xié)變量分布計算標(biāo)記的預(yù)測軌跡,然后繪制。
predct(btapl,nwdta=dtew,va.tim='ime')
plt(prec_we, ld=c(1)
擬合優(yōu)度:殘差圖
與任何混合模型一樣,我們希望特定主題的殘差(右下圖)是高斯分布的。
plt(mlep, 0.8)
擬合優(yōu)度:預(yù)測與觀察的關(guān)系圖
可以根據(jù)時間繪制平均預(yù)測和觀察結(jié)果。請注意,預(yù)測和觀察是在潛過程的范圍內(nèi)(觀察被轉(zhuǎn)換為估計的鏈接函數(shù)):?
plot(beal, whch="fit", time="ti")?
最受歡迎的見解
1.基于R語言的lmer混合線性回歸模型
2.R語言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
3.R語言線性混合效應(yīng)模型實戰(zhàn)案例
4.R語言線性混合效應(yīng)模型實戰(zhàn)案例2
5.R語言線性混合效應(yīng)模型實戰(zhàn)案例
6.線性混合效應(yīng)模型Linear Mixed-Effects Models的部分折疊Gibbs采樣
7.R語言LME4混合效應(yīng)模型研究教師的受歡迎程度
8.R語言中基于混合數(shù)據(jù)抽樣(MIDAS)回歸的HAR-RV模型預(yù)測GDP增長
9.使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM