R語(yǔ)言如何用潛類(lèi)別混合效應(yīng)模型(LCMM)分析抑郁癥狀|附代碼數(shù)據(jù)
全文下載鏈接:http://tecdat.cn/?p=22206
最近我們被客戶(hù)要求撰寫(xiě)關(guān)于潛類(lèi)別混合效應(yīng)模型(LCMM)的研究報(bào)告,包括一些圖形和統(tǒng)計(jì)輸出。
每一個(gè)動(dòng)態(tài)現(xiàn)象都可以用一個(gè)潛過(guò)程(Λ(t)來(lái)描述,這個(gè)潛過(guò)程在連續(xù)的時(shí)間t內(nèi)演化。
模型背景
當(dāng)對(duì)重復(fù)測(cè)量的標(biāo)志變量進(jìn)行建模時(shí),我們通常不會(huì)把它看成是一個(gè)有誤差測(cè)量的潛過(guò)程。然而,這正是混合模型理論所做的基本假設(shè)。潛過(guò)程混合模型利用這個(gè)框架將線性混合模型理論擴(kuò)展到任何類(lèi)型的結(jié)果(有序、二元、連續(xù)、類(lèi)別與任何分布)。
潛類(lèi)別混合模型
潛類(lèi)別混合模型在Proust-Lima等人中介紹(2006 ?https://doi.org/10.1111/j.1541-0420.2006.00573.x?和2013?https://doi.org/10.1111/bmsp.12000??)。
使用線性混合模型根據(jù)時(shí)間對(duì)定義為潛過(guò)程感興趣的變量進(jìn)行建模:
其中:
X(t) 和Z(t) 是協(xié)變量的向量(Z(t) ;
β 是固定效應(yīng)(即總體均值效應(yīng));
ui 是隨機(jī)效應(yīng)(即個(gè)體效應(yīng));它們根據(jù)具有協(xié)方差矩陣B 的零均值多元正態(tài)分布進(jìn)行分布;
(wi(t)) 是高斯過(guò)程,可以添加到模型中以來(lái)放寬對(duì)象內(nèi)部相關(guān)結(jié)構(gòu)。
同時(shí)在觀察方程中定義了感興趣的潛過(guò)程標(biāo)志變量Yij (針對(duì)對(duì)象i和場(chǎng)合j)的觀察之間的關(guān)系:
其中
tij 是主題i 和場(chǎng)合j 的測(cè)量時(shí)間;
?ij 是一個(gè)獨(dú)立的零均值高斯誤差;
H 是鏈接函數(shù),可將潛過(guò)程轉(zhuǎn)換為比例和度量。
使用了不同的參數(shù)族。?當(dāng)標(biāo)志變量為連續(xù)時(shí),H-1 是遞增單調(diào)函數(shù)的參數(shù)族,其中:
線性變換:這簡(jiǎn)化為線性混合模型(2個(gè)參數(shù))
Beta累積分布族重新調(diào)整(4個(gè)參數(shù))
當(dāng)標(biāo)志變量是離散類(lèi)別(二元或有序的)時(shí):? H是閾值函數(shù),即Y的每個(gè)級(jí)別對(duì)應(yīng)于要估計(jì)Λ(tij)+ ?ij區(qū)間的邊界。
可識(shí)別性
與任何潛變量模型一樣,必須定義潛變量的度量。在lcmm中,誤差的方差為1,平均截距(在β中)為0。
示例
在本文中,lcmm
?通過(guò)研究年齡65歲左右男性的抑郁癥狀(由CES-D量表測(cè)量)的線性軌跡來(lái)說(shuō)明潛過(guò)程混合模型?。包括截距和age65的相關(guān)隨機(jī)效應(yīng)。
考慮的模型:
,
固定效應(yīng)部分?是
估計(jì)不同連續(xù)鏈接函數(shù)的模型H
我們使用65歲左右的年齡變量進(jìn)行中心化,并以十年為單位。
潛過(guò)程混合模型可以用不同的鏈接函數(shù)進(jìn)行擬合,如下所示。這是用參數(shù)鏈接來(lái)完成的。
線性鏈接函數(shù)
定義線性鏈接函數(shù)時(shí),模型將簡(jiǎn)化為標(biāo)準(zhǔn)線性混合模型。默認(rèn)情況下具有線性鏈接函數(shù):
lcmm(CESD?~?age65*male,?random=~?age65?#鏈接=線性
它與hlme安裝的模型完全相同。與hlme對(duì)象的唯一區(qū)別是截距和殘差標(biāo)準(zhǔn)誤差的參數(shù)化。
hlme(CESD?~?age65*male,?random=~?age65?#鏈接=線性
對(duì)數(shù)似然相同,但估計(jì)參數(shù)β不在同一范圍內(nèi)
loglik[1]?-7056.652
非線性鏈接函數(shù)1:Beta累積分布函數(shù)Beta分布的重標(biāo)累積分布函數(shù)(CDF)提供了標(biāo)志變量與其基本潛伏過(guò)程之間的凹、凸或sigmo?d變換。
lcmm(?random=~?age65,?link='beta')
非線性鏈接函數(shù)2:二次I樣條二次I樣條族近似于連續(xù)增加的鏈接函數(shù)。它涉及在標(biāo)志變量范圍內(nèi)分布的節(jié)點(diǎn)。默認(rèn)情況下,使用位于標(biāo)志變量范圍內(nèi)的5個(gè)等距結(jié):
lcmm(random=~?age65,?subject='ID',?link='splines')
可以指定結(jié)的數(shù)量及其位置。首先輸入節(jié)點(diǎn)的數(shù)目,接著?,再指定位置?equi
,?quant
?或?manual
?用于分別等距節(jié)點(diǎn),在標(biāo)志變量分布分位數(shù)或內(nèi)部結(jié)在參數(shù)intnodes手動(dòng)輸入。例如,?7-equi-splines
?意味著具有7個(gè)等距節(jié)點(diǎn),6-quant-splines
?I樣條,?意味著具有6個(gè)節(jié)點(diǎn)的I樣條,其位于標(biāo)志變量分布的分位數(shù)處。
例如,在分位數(shù)處有5個(gè)結(jié):
lcmm(link='5-quant-splines')
選擇最佳模型
要選擇最合適的鏈接函數(shù),可以比較這些不同的模型。通常,這可以通過(guò)使用AIC?或?UACV等順著根據(jù)擬合優(yōu)度對(duì)模型進(jìn)行比較來(lái)實(shí)現(xiàn)?。
AIC(每個(gè)模型的輸出中都有UACV):
在這種情況下,根據(jù)AIC標(biāo)準(zhǔn),由I-splines和5個(gè)分位數(shù)結(jié)點(diǎn)鏈接函數(shù)的模型提供了最佳擬合度??梢栽趫D中比較不同的估計(jì)鏈接函數(shù):
plot(mli,?which="linkfunction",xlab="潛過(guò)程")legend(x="topleft",?legend=c("線性",?"beta","樣條曲線?(5個(gè)等距結(jié)點(diǎn))","樣條曲線(5個(gè)分位數(shù)結(jié)點(diǎn))"))
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
R語(yǔ)言線性混合效應(yīng)模型(固定效應(yīng)&隨機(jī)效應(yīng))和交互可視化3案例
左右滑動(dòng)查看更多
01
02
03
04
我們看到2個(gè)樣條曲線轉(zhuǎn)換非常接近。線性模型似乎不合適,如線性曲線和樣條曲線之間的差值所示。Beta轉(zhuǎn)換僅在潛過(guò)程的高值時(shí)才與樣條曲線不同。變換的置信帶可以通過(guò)蒙特卡洛方法獲得:
predict(mspl5q,ndraws=2000)legend(legend=c("95%?置信帶","分位數(shù)樣條"),lty=c(2,NA))
用離散鏈接函數(shù)H估計(jì)模型
有時(shí),對(duì)于僅具有有限數(shù)量級(jí)別的標(biāo)志變量,連續(xù)鏈接函數(shù)不合適,并且必須處理標(biāo)志變量的有序性質(zhì)。lcmm函數(shù)通過(guò)考慮閾值鏈接函數(shù)來(lái)處理這種情況。然而,我們必須知道,帶有閾值鏈接函數(shù)的模型的數(shù)值復(fù)雜性要重要得多(由于對(duì)隨機(jī)效應(yīng)分布進(jìn)行了數(shù)值積分)。在擬合這個(gè)模型時(shí),必須牢記這一點(diǎn),隨機(jī)效應(yīng)的數(shù)量要嚴(yán)謹(jǐn)?shù)剡x擇。
注意,該模型成為累積概率混合模型。這里是一個(gè)使用HIER變量(4級(jí))的例子,因?yàn)榭紤]到0-52的范圍(例如52個(gè)閾值參數(shù)),CESD的閾值鏈接函數(shù)會(huì)涉及太多參數(shù)。
?lcmm(HIER?~?age65*male,?link='thresholds')
擬合后的輸出
概要
該模型的摘要包括收斂性,擬合標(biāo)準(zhǔn)的優(yōu)度和估計(jì)的參數(shù)。
根據(jù)協(xié)變量的分布預(yù)測(cè)的軌跡圖,可以根據(jù)因變量的比例并根據(jù)協(xié)變量的分布來(lái)計(jì)算預(yù)測(cè)的軌跡:
predict(msp,?newdata=datnew,?var.time="age"
然后繪制:
plot(women,xlab="年齡")plot(men,?add=TRUE)legend(legend=c("女性","男性",?"95%?置信區(qū)間",?"95%?置信區(qū)間"))
擬合優(yōu)度1:殘差圖
特定的殘差(右下方面板中的qqplot)應(yīng)為高斯分布。
擬合優(yōu)度2:預(yù)測(cè)與觀察圖
可以根據(jù)年齡繪制平均預(yù)測(cè)和觀察值。請(qǐng)注意,預(yù)測(cè)和觀察是在潛過(guò)程的范圍內(nèi)(觀察是通過(guò)估計(jì)的鏈接函數(shù)進(jìn)行轉(zhuǎn)換的):
plot(?var.time="age65",?xlab="(年齡-65)/10",?break.times=8,?ylab="潛過(guò)程")
點(diǎn)擊文末?“閱讀原文”
獲取全文完整代碼數(shù)據(jù)資料。
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
R語(yǔ)言線性混合效應(yīng)模型(固定效應(yīng)&隨機(jī)效應(yīng))和交互可視化3案例
非線性混合效應(yīng) NLME模型對(duì)抗哮喘藥物茶堿動(dòng)力學(xué)研究
生態(tài)學(xué)模擬對(duì)廣義線性混合模型GLMM進(jìn)行功率(功效、效能、效力)分析power analysis環(huán)境監(jiān)測(cè)數(shù)據(jù)
有限混合模型聚類(lèi)FMM、廣義線性回歸模型GLM混合應(yīng)用分析威士忌市場(chǎng)和研究專(zhuān)利申請(qǐng)數(shù)據(jù)
如何用潛類(lèi)別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)
R語(yǔ)言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級(jí)調(diào)查數(shù)據(jù)R語(yǔ)言 線性混合效應(yīng)模型實(shí)戰(zhàn)案例
R語(yǔ)言混合效應(yīng)邏輯回歸(mixed effects logistic)模型分析肺癌數(shù)據(jù)
R語(yǔ)言如何用潛類(lèi)別混合效應(yīng)模型(LCMM)分析抑郁癥狀
R語(yǔ)言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語(yǔ)言建立和可視化混合效應(yīng)模型mixed effect model
R語(yǔ)言LME4混合效應(yīng)模型研究教師的受歡迎程度
R語(yǔ)言 線性混合效應(yīng)模型實(shí)戰(zhàn)案例
R語(yǔ)言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
R語(yǔ)言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語(yǔ)言如何解決線性混合模型中畸形擬合(Singular fit)的問(wèn)題
基于R語(yǔ)言的lmer混合線性回歸模型
R語(yǔ)言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測(cè)驗(yàn)建立層次(分層)貝葉斯模型
R語(yǔ)言分層線性模型案例
R語(yǔ)言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測(cè)驗(yàn)(SAT)建立分層模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM
R語(yǔ)言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測(cè)驗(yàn)建立層次(分層)貝葉斯模型
SPSS中的多層(等級(jí))線性模型Multilevel linear models研究整容手術(shù)數(shù)據(jù)
用SPSS估計(jì)HLM多層(層次)線性模型模型