手機站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 生活 »日常 » 如何用潛類別混合效應模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)|附

如何用潛類別混合效應模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)|附

2022-10-23 14:14 作者:拓端tecdat 0人讀過 | 我要投稿

全文下載鏈接：?http://tecdat.cn/?p=24647

線性混合模型假設?N 個受試者的群體是同質(zhì)的，并且在群體水平上由獨特的曲線 Xi(t)β 描述。

背景和定義

相比之下，潛在類別混合模型在于假設人口是異質(zhì)的，并且由 G 潛在類別的受試者組成，其特征是 G 平均軌跡曲線。

潛類別混合模型

潛在類別成員由離散隨機變量 ci 定義，如果主題 i 屬于潛在類別 g (g = 1, …,G)，則該變量等于 g。變量 ci 是潛在的；根據(jù)協(xié)變量 Xci 使用多項邏輯模型描述其概率：

其中 ξ0g 是 g 類的截距，ξ1g 是與時間無關協(xié)變量 Xci 的 q1 向量相關的類特定參數(shù)的 q1 向量。當沒有協(xié)變量預測潛在類成員資格時，該模型將簡化為特定于類的概率。

后驗分類

在涉及潛在類別的模型中，可以對每個潛在類別中的主體進行后驗分類。它基于類成員概率的后驗計算，用于表征對象的分類以及評估模型的擬合優(yōu)度（Proust-Lima et al. 2014 ?).

使用貝葉斯定理計算后類成員概率作為給定收集信息的潛在類的概率。在縱向模型中，它們?yōu)橹黝} ii 和潛在類別 g 定義為：

其中：??θ^G 是 G 潛在類模型中估計的參數(shù)向量。

高斯數(shù)據(jù)示例

在此示例中，我們研究了認知標記的二次軌跡，即在老年人樣本（納入時年齡 65 歲及以上）中進行預先標準化（具有高斯分布）并對簡易智能量表評分 (?MMSE?)進行了長達 15 年的跟蹤研究，可根據(jù)教育水平進行調(diào)整。盡管可以考慮任何回歸，但模型在此處不考慮交互作用。

數(shù)據(jù)集

子樣本

這是來自原始前瞻性研究的 500 名受試者的子樣本。該數(shù)據(jù)集不能用于流行病學目的，因為子樣本不代表原始隊列（特別是癡呆病例已被過度采樣）。

用于可視化數(shù)據(jù)（僅限表頭）：

head(data)

在不同的時間收集不同的標記。在數(shù)據(jù)集中，時間尺度是年齡。

獲取數(shù)據(jù)的快速摘要：

summary(data)

一些變量有缺失值。

簡易智能量表評分結(jié)果

簡易智能量表評分通常被視為結(jié)果。簡易智能量表評分是一種非常常見的神經(jīng)心理學測試，用于測量老年人的整體認知功能。它具有非常不對稱的分布，因此通常將其歸一化以應用于高斯變量的方法。預歸一化函數(shù)完成的：

?hist(?MMSE?) hist(?norm?)

要建模單個重復測量是：

color?<-ID xyplot

考慮的模型

我們考慮以下潛在類線性混合模型，其中 g 表示類別，i表示主題，j 表示重復測量：

其中_：_

?和?

固定效應部分?是?

?混合??和?; 在?隨機效應部分?是?,

因變量：歸一化簡易智能量表評分

由于簡易智能量表評分的分布非常傾斜，我們使用標準化版本

normMMSE?<-?norm

估計只有一個類的模型 (G=1)

根據(jù)年齡進行分析。為了避免任何數(shù)值問題，我們重新調(diào)整和標準化年齡：

? age65?<-?(age?-?65)/10

我們?yōu)?norm 擬合線性混合模型：

? lme(norm?~?age65+I(age65^2)+CEP?rand?=~?age65+I(age65^2)?subject?=?'ID'

估計具有多個類的模型 (G > 1)

從通過假設單個潛在類估計的模型，我們現(xiàn)在可以搜索異構(gòu)概況。下一行提供了使用? G>1 時初始值對 2 個潛在類的模型的估計。

? #考慮到2類的估計 lme(ng?=?2,?mix=~age65+I(age65^2))

初始值

初始值在參數(shù)中指定?B。該選項會?B=m1?根據(jù) 1 類模型（此處為m1）的最大似然估計自動生成初始值?。不指定B?或?不指定?B=NULL?是不推薦的，因為它會導致 G=1G=1 的模型的內(nèi)部預估計（即?m1），這可能會顯著增加計算時間。

點擊標題查閱往期內(nèi)容

R語言如何用潛類別混合效應模型（LCMM）分析抑郁癥狀

左右滑動查看更多

01

02

03

04

用戶預先指定的值

在以下示例中，初始值由用戶預先指定：方差協(xié)方差的參數(shù)取自線性混合模型的估計值，并針對特定于類嘗試任意初始值：

lme(?B?=?c(0,?50,?30,?3,?-1))

隨機生成的值

另一種方法是從 1 類模型的估計值的漸近分布中隨機生成初始值（此處為?m1）：

lme(rand(m1))

網(wǎng)格搜索

最后，grid可用于運行自動網(wǎng)格搜索。在接下來的示例中，G=2 和 G=3 類，?hlme?從 100 個初始值的隨機向量運行最多 30 次迭代。然后，僅針對在 30 次迭代后提供最佳對數(shù)似然的偏離完成估計程序。

grid(lme?iter=30,)

推薦使用此方法，因為它可以在重復次數(shù)足夠大且迭代次數(shù)相當大時更好地探索參數(shù)空間。

選擇最佳模型

一組模型（通常具有不同數(shù)量的潛在類）的估計過程可以用來概括?summary。

summary

我們在這里總結(jié)了我們之前估計的 6 個模型。我們可以看到所有的 2-class 模型都收斂于同一個估計點。

這個例子說明了定義“潛在類的最佳數(shù)量”的復雜性。事實上，根據(jù)推薦的 BIC，應該保留 2 類模型（因為它提供了最低值）。但是 AIC 和 Size 調(diào)整 BIC（涉及較小的懲罰）都支持 3-class 模型。熵也有利于 3 類模型，因為它具有更好的判別能力（熵接近 1）。最后，3-class 模型創(chuàng)建了一個非常小的類，這通常不是那些搜索和感興趣的異質(zhì)性。在這個例子中，根據(jù)統(tǒng)計和臨床標準，2-或 3-可以保留類模型。下面，我們保留了最終輸出描述的 2-class 模型。

2-class 線性混合模型的描述

模型概要

? summary(m2d)

模型的預測

只要模型中指定的所有協(xié)變量都包含在數(shù)據(jù)框中，就可以為數(shù)據(jù)框中包含的任何數(shù)據(jù)計算特定于類的預測。在接下來的幾行中，通過生成年齡值介于 65 和 95 之間的向量并將 CEP定義為 1 或 0，來創(chuàng)建這樣的數(shù)據(jù)框?。計算和繪制?預測?。

data.frame(age=seq(65,95,l=50))

在點估計中為每個類計算預測：

predictY

然后可以繪制預測：

plot(prd0) plot(prd1,add=TRUE)

如果我們想了解可變性，我們可以計算具有置信區(qū)間的預測并繪制它們：

plot(IC,,?shades=TRUE)

最后，1 類、2 類和 3 類模型的預測軌跡可以一起表示在下圖中：

par(mfrow=c(1,3)) plot(pr1?) plot(pr0?? plot(pr3)

最終潛在類混合模型的評估

殘差圖

? plot(m)

預測與觀察的圖表

為了評估所選模型的擬合，我們同時繪制每個潛在類別的觀察值和預測值。

plot(m,?shad?=?TRUE)

該圖在此處顯示了對數(shù)據(jù)的非常好的擬合。

分類

模型的后驗分類通過以下方式獲得：

postprob(m2d)

Class 1?由 62 個樣本 (12.4%) 組成，而 438 個樣本屬于第二類。

我們還可以通過以下方式查看有關模型辨別能力的信息：

后驗分類表：分類在?class 1?(resp.??class 2) 中的對象屬于該類的平均概率為 0.8054 (resp. 0.8730)。這顯示了類別的良好區(qū)分。
高于閾值的分類的比例：這里 90.18%（分別為 61.29%）的第 1 類（分別為 2）的后驗概率大于 70%。

本文摘選《R語言潛類別混合效應模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)》，點擊“閱讀原文”獲取全文完整資料。

本文中分析的數(shù)據(jù)分享到會員群，掃描下面二維碼即可加群！

點擊標題查閱往期內(nèi)容

R語言貝葉斯廣義線性混合（多層次/水平/嵌套）模型GLMM、邏輯回歸分析教育留級影響因素數(shù)據(jù)

R語言估計多元標記的潛過程混合效應模型（lcmm）分析心理測試的認知過程

R語言因子實驗設計nlme擬合非線性混合模型分析有機農(nóng)業(yè)施氮水平

R語言非線性混合效應 NLME模型(固定效應&隨機效應)對抗哮喘藥物茶堿動力學研究

R語言用線性混合效應（多水平/層次/嵌套）模型分析聲調(diào)高低與禮貌態(tài)度的關系

R語言LME4混合效應模型研究教師的受歡迎程度

R語言nlme、nlmer、lme4用（非）線性混合模型non-linear mixed model分析藻類數(shù)據(jù)實例

R語言混合線性模型、多層次模型、回歸模型分析學生平均成績GPA和可視化

R語言線性混合效應模型（固定效應&隨機效應）和交互可視化3案例

R語言用lme4多層次（混合效應）廣義線性模型（GLM），邏輯回歸分析教育留級調(diào)查數(shù)據(jù)

R語言線性混合效應模型實戰(zhàn)案例

R語言混合效應邏輯回歸（mixed effects logistic）模型分析肺癌數(shù)據(jù)

R語言如何用潛類別混合效應模型（LCMM）分析抑郁癥狀

R語言基于copula的貝葉斯分層混合模型的診斷準確性研究

R語言建立和可視化混合效應模型mixed effect model

R語言LME4混合效應模型研究教師的受歡迎程度

R語言線性混合效應模型實戰(zhàn)案例

R語言用Rshiny探索lme4廣義線性混合模型（GLMM）和線性混合模型（LMM）

R語言基于copula的貝葉斯分層混合模型的診斷準確性研究

R語言如何解決線性混合模型中畸形擬合(Singular fit)的問題

基于R語言的lmer混合線性回歸模型

R語言用WinBUGS 軟件對學術能力測驗建立層次（分層）貝葉斯模型

R語言分層線性模型案例

R語言用WinBUGS 軟件對學術能力測驗（SAT）建立分層模型

使用SAS，Stata，HLM，R，SPSS和Mplus的分層線性模型HLM

R語言用WinBUGS 軟件對學術能力測驗建立層次（分層）貝葉斯模型

SPSS中的多層（等級）線性模型Multilevel linear models研究整容手術數(shù)據(jù)

用SPSS估計HLM多層（層次）線性模型模型

欲獲取全文文件，請點擊左下角“閱讀原文”。

標簽：