最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

拓端tecdat|R語(yǔ)言潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年

2022-01-24 15:54 作者:拓端tecdat  | 我要投稿

原文鏈接:?http://tecdat.cn/?p=24647

原文出處:拓端數(shù)據(jù)部落公眾號(hào)

背景和定義

線性混合模型假設(shè) N 個(gè)受試者的群體是同質(zhì)的,并且在群體水平上由獨(dú)特的曲線 Xi(t)β 描述。相比之下,潛在類別混合模型在于假設(shè)人口是異質(zhì)的,并且由 G 潛在類別的受試者組成,其特征是 G 平均軌跡曲線。

潛類別混合模型

潛在類別成員由離散隨機(jī)變量 ci 定義,如果主題 i 屬于潛在類別 g (g = 1, …,G),則該變量等于 g。變量 ci 是潛在的;根據(jù)協(xié)變量 Xci 使用多項(xiàng)邏輯模型描述其概率:

其中 ξ0g 是 g 類的截距,ξ1g 是與時(shí)間無(wú)關(guān)協(xié)變量 Xci 的 q1 向量相關(guān)的類特定參數(shù)的 q1 向量。當(dāng)沒(méi)有協(xié)變量預(yù)測(cè)潛在類成員資格時(shí),該模型將簡(jiǎn)化為特定于類的概率。

對(duì)于連續(xù)和高斯變量,Y 的軌跡通過(guò)線性混合模型有條件地定義為潛在類。因此,以類 g 為條件,在 j 時(shí)為主題 i 定義模型:

其中 X2ij、X3ij 和 Zij 是協(xié)變量的向量,它們分別與類 β 上的常見(jiàn)固定效應(yīng)、特定于類的固定效應(yīng) γg 以及稱為 big 的單個(gè)隨機(jī)效應(yīng) bi|ci=g 相關(guān),其分布現(xiàn)在是特定于類的。X2 和 X3 不能有公共變量。

后驗(yàn)分類

在涉及潛在類別的模型中,可以對(duì)每個(gè)潛在類別中的主體進(jìn)行后驗(yàn)分類。它基于類成員概率的后驗(yàn)計(jì)算,用于表征對(duì)象的分類以及評(píng)估模型的擬合優(yōu)度(Proust-Lima et al. 2014 ?).

使用貝葉斯定理計(jì)算后類成員概率作為給定收集信息的潛在類的概率。在縱向模型中,它們?yōu)橹黝} ii 和潛在類別 g 定義為:

其中:??θ^G 是 G 潛在類模型中估計(jì)的參數(shù)向量。

高斯數(shù)據(jù)示例

在這個(gè)例子中,我們研究了一個(gè)認(rèn)知指標(biāo)的二次方軌跡,簡(jiǎn)易智能量表評(píng)分(MMSE)預(yù)先規(guī)范化(具有高斯分布),在對(duì)老年人(納入時(shí)年齡在65歲及以上)的樣本進(jìn)行了長(zhǎng)達(dá)15年的跟蹤,并對(duì)教育水平進(jìn)行了調(diào)整。該模型在此不考慮交互作用,盡管可以考慮任何回歸。
?

數(shù)據(jù)集

子樣本

這是來(lái)自原始前瞻性研究 的 500 名受試者的子樣本。該數(shù)據(jù)集不能用于流行病學(xué)目的,因?yàn)樽訕颖静淮碓缄?duì)列(特別是癡呆病例已被過(guò)度采樣)。

數(shù)據(jù)采用縱向格式,包括一些變量,例如 3 項(xiàng)心理測(cè)量測(cè)試 MMSE、BVRT、IST、抑郁癥狀量表 和變量 年齡、癡呆前的年齡、是否癡呆、教育水平和是否男性。

用于可視化數(shù)據(jù)(僅限表頭):

head(data)

?

在不同的時(shí)間收集不同的標(biāo)記。在數(shù)據(jù)集中,時(shí)間尺度是年齡。

獲取數(shù)據(jù)的快速摘要:



  1. summary(data)




?

一些變量有缺失值。

簡(jiǎn)易智能量表評(píng)分結(jié)果

簡(jiǎn)易智能量表評(píng)分通常被視為結(jié)果。簡(jiǎn)易智能量表評(píng)分是一種非常常見(jiàn)的神經(jīng)心理學(xué)測(cè)試,用于測(cè)量老年人的整體認(rèn)知功能。它具有非常不對(duì)稱的分布,因此通常將其歸一化以應(yīng)用于高斯變量的方法。預(yù)歸一化函數(shù)完成的:


  1. hist( MMSE )


  2. hist( norm )




要建模單個(gè)重復(fù)測(cè)量是:



  1. color <-ID


  2. xyplot




考慮的模型

我們考慮以下潛在類線性混合模型,其中 g 表示類別,i表示主題,j?表示重復(fù)測(cè)量:

其中:

?和?

固定效應(yīng)部分?是?

?混合?

?和?

; 在?隨機(jī)效應(yīng)部分?是?

,

因變量:歸一化 簡(jiǎn)易智能量表評(píng)分

由于 簡(jiǎn)易智能量表評(píng)分的分布非常傾斜,我們使用標(biāo)準(zhǔn)化版本

  1. normMMSE <- norm


估計(jì)只有一個(gè)類的模型 (G=1)

根據(jù)年齡進(jìn)行分析。為了避免任何數(shù)值問(wèn)題,我們重新調(diào)整和標(biāo)準(zhǔn)化年齡:




  1. age65 <- (age - 65)/10



我們?yōu)?norm 擬合線性混合模型:



  1. lme(norm ~ age65+I(age65^2)+CEP rand =~ age65+I(age65^2) subject = 'ID'




估計(jì)具有多個(gè)類的模型 (G > 1)

從通過(guò)假設(shè)單個(gè)潛在類估計(jì)的模型,我們現(xiàn)在可以搜索異構(gòu)概況。下一行提供了使用? G>1 時(shí)初始值對(duì) 2 個(gè)潛在類的模型的估計(jì)。




  1. #考慮到2類的估計(jì)

  2. lme(ng = 2, mix=~age65+I(age65^2))




初始值

初始值在參數(shù)中指定?B。該選項(xiàng)會(huì)?B=m1?根據(jù) 1 類模型(此處為m1)的最大似然估計(jì)自動(dòng)生成初始值?。不指定B?或?不指定?B=NULL?是不推薦的,因?yàn)樗鼤?huì)導(dǎo)致 G=1G=1 的模型的內(nèi)部預(yù)估計(jì)(即?m1),這可能會(huì)顯著增加計(jì)算時(shí)間。

用戶預(yù)先指定的值

在以下示例中,初始值由用戶預(yù)先指定:方差協(xié)方差的參數(shù)取自線性混合模型的估計(jì)值,并針對(duì)特定于類嘗試任意初始值:


  1. lme( B = c(0, 50, 30, 3, -1))




隨機(jī)生成的值

另一種方法是從 1 類模型的估計(jì)值的漸近分布中隨機(jī)生成初始值(此處為?m1):


  1. lme(rand(m1))




網(wǎng)格搜索

最后,grid可用于運(yùn)行自動(dòng)網(wǎng)格搜索。在接下來(lái)的示例中,G=2 和 G=3 類,?hlme?從 100 個(gè)初始值的隨機(jī)向量運(yùn)行最多 30 次迭代。然后,僅針對(duì)在 30 次迭代后提供最佳對(duì)數(shù)似然的偏離完成估計(jì)程序。


  1. grid(lme iter=30,)

推薦使用此方法,因?yàn)樗梢栽谥貜?fù)次數(shù)足夠大且迭代次數(shù)相當(dāng)大時(shí)更好地探索參數(shù)空間。

選擇最佳模型

一組模型(通常具有不同數(shù)量的潛在類)的估計(jì)過(guò)程可以用 來(lái)概括?summary。



  1. summary

我們?cè)谶@里總結(jié)了我們之前估計(jì)的 6 個(gè)模型。我們可以看到所有的 2-class 模型都收斂于同一個(gè)估計(jì)點(diǎn)。

這個(gè)例子說(shuō)明了定義“潛在類的最佳數(shù)量”的復(fù)雜性。事實(shí)上,根據(jù)推薦的 BIC,應(yīng)該保留 2 類模型(因?yàn)樗峁┝俗畹椭担?。但?AIC 和 Size 調(diào)整 BIC(涉及較小的懲罰)都支持 3-class 模型。熵也有利于 3 類模型,因?yàn)樗哂懈玫呐袆e能力(熵接近 1)。最后,3-class 模型創(chuàng)建了一個(gè)非常小的類,這通常不是那些搜索和感興趣的異質(zhì)性。在這個(gè)例子中,根據(jù)統(tǒng)計(jì)和臨床標(biāo)準(zhǔn),2-或 3-可以保留類模型。下面,我們保留了最終輸出描述的 2-class 模型。

2-class 線性混合模型的描述

模型概要




  1. summary(m2d)






模型的預(yù)測(cè)

只要模型中指定的所有協(xié)變量都包含在數(shù)據(jù)框中,就可以為數(shù)據(jù)框中包含的任何數(shù)據(jù)計(jì)算特定于類的預(yù)測(cè)。在接下來(lái)的幾行中,通過(guò)生成年齡值介于 65 和 95 之間的向量并將 CEP定義為 1 或 0,來(lái)創(chuàng)建這樣的數(shù)據(jù)框?。計(jì)算和繪制?預(yù)測(cè)?。

  1. data.frame(age=seq(65,95,l=50))



在點(diǎn)估計(jì)中為每個(gè)類計(jì)算預(yù)測(cè):

  1. predictY




然后可以繪制預(yù)測(cè):



  1. plot(prd0)


  2. plot(prd1,add=TRUE)

如果我們想了解可變性,我們可以計(jì)算具有置信區(qū)間的預(yù)測(cè)并繪制它們:


  1. plot(IC,, shades=TRUE)

最后,1 類、2 類和 3 類模型的預(yù)測(cè)軌跡可以一起表示在下圖中:



  1. par(mfrow=c(1,3))


  2. plot(pr1 )


  3. plot(pr0

  4. plot(pr3)

  5. ?


最終潛在類混合模型的評(píng)估

殘差圖




  1. plot(m)




預(yù)測(cè)與觀察的圖表

為了評(píng)估所選模型的擬合,我們同時(shí)繪制每個(gè)潛在類別的觀察值和預(yù)測(cè)值。



  1. plot(m, shad = TRUE)




該圖在此處顯示了對(duì)數(shù)據(jù)的非常好的擬合。 ?

分類

模型的后驗(yàn)分類通過(guò)以下方式獲得:



  1. postprob(m2d)?





Class 1?由 62 個(gè)樣本 (12.4%) 組成,而 438 個(gè)樣本屬于第二類。

我們還可以通過(guò)以下方式查看有關(guān)模型辨別能力的信息:

  • 后驗(yàn)分類表:分類在?class 1?(resp.??class 2) 中的對(duì)象屬于該類的平均概率為 0.8054 (resp. 0.8730)。這顯示了類別的良好區(qū)分。

  • 高于閾值的分類的比例:這里 90.18%(分別為 61.29%)的第 1 類(分別為 2)的后驗(yàn)概率大于 70%。

?

最受歡迎的見(jiàn)解

1.基于R語(yǔ)言的lmer混合線性回歸模型

2.R語(yǔ)言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)

3.R語(yǔ)言線性混合效應(yīng)模型實(shí)戰(zhàn)案例

4.R語(yǔ)言線性混合效應(yīng)模型實(shí)戰(zhàn)案例2

5.R語(yǔ)言線性混合效應(yīng)模型實(shí)戰(zhàn)案例

6.線性混合效應(yīng)模型Linear Mixed-Effects Models的部分折疊Gibbs采樣

7.R語(yǔ)言LME4混合效應(yīng)模型研究教師的受歡迎程度

8.R語(yǔ)言中基于混合數(shù)據(jù)抽樣(MIDAS)回歸的HAR-RV模型預(yù)測(cè)GDP增長(zhǎng)

9.使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM


拓端tecdat|R語(yǔ)言潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
都江堰市| 延长县| 通化县| 尚义县| 津南区| 将乐县| 兴化市| 婺源县| 横山县| 临夏县| 西和县| 哈密市| 通山县| 玉龙| 泊头市| 长岛县| 西峡县| 渭南市| 台北县| 册亨县| 舒兰市| 塔城市| 射洪县| 遂宁市| 富蕴县| 榕江县| 荔浦县| 台江县| 吐鲁番市| 桐柏县| 韶关市| 织金县| 临高县| 南召县| 正蓝旗| 芮城县| 陆川县| 牟定县| 开化县| 安宁市| 涟源市|