拓端tecdat|R語(yǔ)言如何用潛類別混合效應(yīng)模型(lcmm)分析抑郁癥狀
原文鏈接:http://tecdat.cn/?p=22206
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
模型背景
每一個(gè)動(dòng)態(tài)現(xiàn)象都可以用一個(gè)潛過(guò)程(Λ(t)來(lái)描述,這個(gè)潛過(guò)程在連續(xù)的時(shí)間t內(nèi)演化。當(dāng)對(duì)重復(fù)測(cè)量的標(biāo)志變量進(jìn)行建模時(shí),我們通常不會(huì)把它看成是一個(gè)有誤差測(cè)量的潛過(guò)程。然而,這正是混合模型理論所做的基本假設(shè)。潛過(guò)程混合模型利用這個(gè)框架將線性混合模型理論擴(kuò)展到任何類型的結(jié)果(有序、二元、連續(xù)、類別與任何分布)。
潛類別混合模型
潛類別混合模型在Proust-Lima等人中介紹(2006??https://doi.org/10.1111/j.1541-0420.2006.00573.x?和2013?https://doi.org/10.1111/bmsp.12000??)。
使用線性混合模型根據(jù)時(shí)間對(duì)定義為潛過(guò)程感興趣的變量進(jìn)行建模:

其中:
X(t) 和Z(t) 是協(xié)變量的向量(Z(t) ;
β 是固定效應(yīng)(即總體均值效應(yīng));
ui 是隨機(jī)效應(yīng)(即個(gè)體效應(yīng));它們根據(jù)具有協(xié)方差矩陣B 的零均值多元正態(tài)分布進(jìn)行分布;
(wi(t)) 是高斯過(guò)程,可以添加到模型中以來(lái)放寬對(duì)象內(nèi)部相關(guān)結(jié)構(gòu)。
同時(shí)在觀察方程中定義了感興趣的潛過(guò)程標(biāo)志變量Yij (針對(duì)對(duì)象i和場(chǎng)合j)的觀察之間的關(guān)系:

其中
tij 是主題i 和場(chǎng)合j 的測(cè)量時(shí)間;
?ij 是一個(gè)獨(dú)立的零均值高斯誤差;
H 是鏈接函數(shù),可將潛過(guò)程轉(zhuǎn)換為比例和度量。
使用了不同的參數(shù)族。?當(dāng)標(biāo)志變量為連續(xù)時(shí),H-1 是遞增單調(diào)函數(shù)的參數(shù)族,其中:
線性變換:這簡(jiǎn)化為線性混合模型(2個(gè)參數(shù))
beta累積分布族重新調(diào)整(4個(gè)參數(shù))
當(dāng)標(biāo)志變量是離散類別(二元或有序的)時(shí):??H是閾值函數(shù),即Y的每個(gè)級(jí)別對(duì)應(yīng)于要估計(jì)Λ(tij)+ ?ij區(qū)間的邊界。
可識(shí)別性
與任何潛變量模型一樣,必須定義潛變量的度量。在lcmm中,誤差的方差為1,平均截距(在β中)為0。
示例
在本文中,?通過(guò)研究年齡65歲左右男性的抑郁癥狀(由CES-D量表測(cè)量)的線性軌跡來(lái)說(shuō)明潛過(guò)程混合模型?。包括截距和age65的相關(guān)隨機(jī)效應(yīng)。
考慮的模型:


,

固定效應(yīng)部分?是

估計(jì)不同連續(xù)鏈接函數(shù)的模型H
我們使用65歲左右的年齡變量進(jìn)行中心化,并以十年為單位。
潛過(guò)程混合模型可以用不同的鏈接函數(shù)進(jìn)行擬合,如下所示。這是用參數(shù)鏈接來(lái)完成的。
線性鏈接函數(shù)
定義線性鏈接函數(shù)時(shí),模型將簡(jiǎn)化為標(biāo)準(zhǔn)線性混合模型。默認(rèn)情況下具有線性鏈接函數(shù):
它與hlme安裝的模型完全相同。與hlme對(duì)象的唯一區(qū)別是截距和殘差標(biāo)準(zhǔn)誤差的參數(shù)化。
對(duì)數(shù)似然相同,但估計(jì)參數(shù)β不在同一范圍內(nèi)


非線性鏈接函數(shù)1:beta累積分布函數(shù)beta分布的重標(biāo)累積分布函數(shù)(CDF)提供了標(biāo)志變量與其基本潛伏過(guò)程之間的凹、凸或sigmo?d變換。
非線性鏈接函數(shù)2:二次I樣條二次I樣條族近似于連續(xù)增加的鏈接函數(shù)。它涉及在標(biāo)志變量范圍內(nèi)分布的節(jié)點(diǎn)。默認(rèn)情況下,使用位于標(biāo)志變量范圍內(nèi)的5個(gè)等距結(jié):
可以指定結(jié)的數(shù)量及其位置。首先輸入節(jié)點(diǎn)的數(shù)目,接著?,再指定位置?,?
?或?
?用于分別等距節(jié)點(diǎn),在標(biāo)志變量分布分位數(shù)或內(nèi)部結(jié)在參數(shù)intnodes手動(dòng)輸入。例如,?
?意味著具有7個(gè)等距節(jié)點(diǎn),
?I樣條,?意味著具有6個(gè)節(jié)點(diǎn)的I樣條,其位于標(biāo)志變量分布的分位數(shù)處。
例如,在分位數(shù)處有5個(gè)結(jié):
選擇最佳模型
要選擇最合適的鏈接函數(shù),可以比較這些不同的模型。通常,這可以通過(guò)使用AIC?或?UACV等順著根據(jù)擬合優(yōu)度對(duì)模型進(jìn)行比較來(lái)實(shí)現(xiàn)?。
AIC(每個(gè)模型的輸出中都有UACV):

在這種情況下,根據(jù)AIC標(biāo)準(zhǔn),由I-splines和5個(gè)分位數(shù)結(jié)點(diǎn)鏈接函數(shù)的模型提供了最佳擬合度??梢栽趫D中比較不同的估計(jì)鏈接函數(shù):

我們看到2個(gè)樣條曲線轉(zhuǎn)換非常接近。線性模型似乎不合適,如線性曲線和樣條曲線之間的差值所示。beta轉(zhuǎn)換僅在潛過(guò)程的高值時(shí)才與樣條曲線不同。變換的置信帶可以通過(guò)蒙特卡洛方法獲得:

用離散鏈接函數(shù)H估計(jì)模型
有時(shí),對(duì)于僅具有有限數(shù)量級(jí)別的標(biāo)志變量,連續(xù)鏈接函數(shù)不合適,并且必須處理標(biāo)志變量的有序性質(zhì)。lcmm函數(shù)通過(guò)考慮閾值鏈接函數(shù)來(lái)處理這種情況。然而,我們必須知道,帶有閾值鏈接函數(shù)的模型的數(shù)值復(fù)雜性要重要得多(由于對(duì)隨機(jī)效應(yīng)分布進(jìn)行了數(shù)值積分)。在擬合這個(gè)模型時(shí),必須牢記這一點(diǎn),隨機(jī)效應(yīng)的數(shù)量要嚴(yán)謹(jǐn)?shù)剡x擇。
注意,該模型成為累積概率混合模型。這里是一個(gè)使用HIER變量(4級(jí))的例子,因?yàn)榭紤]到0-52的范圍(例如52個(gè)閾值參數(shù)),CESD的閾值鏈接函數(shù)會(huì)涉及太多參數(shù)。
擬合后的輸出
概要
該模型的摘要包括收斂性,擬合標(biāo)準(zhǔn)的優(yōu)度和估計(jì)的參數(shù)。


根據(jù)協(xié)變量的分布預(yù)測(cè)的軌跡圖,可以根據(jù)因變量的比例并根據(jù)協(xié)變量的分布來(lái)計(jì)算預(yù)測(cè)的軌跡:
然后繪制:

擬合優(yōu)度1:殘差圖
特定的殘差(右下方面板中的qqplot)應(yīng)為高斯分布。

擬合優(yōu)度2:預(yù)測(cè)與觀察圖
可以根據(jù)年齡繪制平均預(yù)測(cè)和觀察值。請(qǐng)注意,預(yù)測(cè)和觀察是在潛過(guò)程的范圍內(nèi)(觀察是通過(guò)估計(jì)的鏈接函數(shù)進(jìn)行轉(zhuǎn)換的):


最受歡迎的見(jiàn)解
1.基于R語(yǔ)言的lmer混合線性回歸模型
2.R語(yǔ)言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
3.R語(yǔ)言線性混合效應(yīng)模型實(shí)戰(zhàn)案例
4.R語(yǔ)言線性混合效應(yīng)模型實(shí)戰(zhàn)案例2
5.R語(yǔ)言線性混合效應(yīng)模型實(shí)戰(zhàn)案例
6.線性混合效應(yīng)模型Linear Mixed-Effects Models的部分折疊Gibbs采樣
7.R語(yǔ)言LME4混合效應(yīng)模型研究教師的受歡迎程度
8.R語(yǔ)言中基于混合數(shù)據(jù)抽樣(MIDAS)回歸的HAR-RV模型預(yù)測(cè)GDP增長(zhǎng)
9.使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM