如何用統(tǒng)計(jì)學(xué)方法尋找量表的截?cái)嘀??——潛在剖面分?/h1>

2023年鄭老師多門(mén)科研統(tǒng)計(jì)課程:多次直播,含孟德?tīng)栯S機(jī)化方法?

量表是一種常用的心理測(cè)量工具,它可以幫助我們?cè)u(píng)估個(gè)體的心理特征、狀態(tài)或癥狀。量表的結(jié)果往往是連續(xù)的數(shù)值,而我們需要的是對(duì)個(gè)體進(jìn)行分類(lèi),比如是否有某種心理問(wèn)題或風(fēng)險(xiǎn)。因此有時(shí)候如果想要使用某個(gè)量表來(lái)對(duì)群體進(jìn)行分類(lèi)(如分為“是”,“否”兩類(lèi)),以便于探討陽(yáng)性事件的影響因素,但是卻發(fā)現(xiàn)這個(gè)量表在開(kāi)發(fā)的時(shí)候沒(méi)有官方明確的截?cái)嘀?,此時(shí)我們就需要自己來(lái)確定一個(gè)將個(gè)體分為不同類(lèi)別的臨界分?jǐn)?shù)。本文將以一篇關(guān)于新冠病毒康復(fù)者感知污名的研究為例,介紹一種有效的方法——潛在剖面分析。

這是一篇于2023年3月發(fā)表在Frontiers in Public Health(IF=5.2, Q1)上的一項(xiàng)關(guān)于新冠病毒康復(fù)者感知污名的橫斷面研究,題名為Perceived stigma among discharged patients of COVID-19 in Wuhan, China: A latent profile analysis,該研究共收集了1,297名武漢第一波新冠康復(fù)者的數(shù)據(jù),使用了12項(xiàng)新冠感知污名量表(CSS-S)來(lái)評(píng)估他們?cè)谶^(guò)去兩周內(nèi)感受到的污名。該量表的總分范圍為12-48,分?jǐn)?shù)越高表示感受到的污名越大。該研究的目的是通過(guò)LPA來(lái)識(shí)別康復(fù)者感知污名的特征,并探索其心理社會(huì)影響因素,以及確定量表的截?cái)嘀怠?br>潛在剖面分析(latent profile analysis,LPA)是一種基于潛在剖面模型(latent profile model,LPM)的統(tǒng)計(jì)方法,它可以根據(jù)一組連續(xù)變量(比如量表的各個(gè)題目或維度)將總體劃分為多個(gè)亞群體(profile),并評(píng)估每個(gè)個(gè)體屬于不同亞群體的概率。

LPA的步驟大致如下:
1. 確定要用于分類(lèi)的變量。這些變量應(yīng)該是連續(xù)的,如果是分類(lèi)變量,則稱(chēng)為“潛在類(lèi)別分析”(LCA),原理都是一樣的。如果你使用的量表的各條目不是連續(xù)尺度,而是分類(lèi)尺度(如“是”,“否”),則使用LCA。
2. 建立不同類(lèi)別數(shù)目(k)的LPM模型,并比較它們的擬合優(yōu)度。常用的擬合優(yōu)度指標(biāo)有赤池信息準(zhǔn)則(Akaike Information Criterion,AIC)、貝葉斯信息準(zhǔn)則(Bayesian Information Criterion,BIC)、調(diào)整后的貝葉斯信息準(zhǔn)則(adjusted Bayesian Information Criterion,aBIC)、熵(entropy)、LMR檢驗(yàn)和BLRT檢驗(yàn)等。一般來(lái)說(shuō),AIC、BIC和aBIC越小、熵越大、LMR檢驗(yàn)和BLRT檢驗(yàn)越顯著,說(shuō)明模型擬合越好。此外,還要考慮模型的簡(jiǎn)潔性和可解釋性,避免過(guò)度擬合或欠擬合。
3.?選擇最優(yōu)的LPM模型,并根據(jù)變量在不同類(lèi)別上的條件均值來(lái)定義和解釋每個(gè)類(lèi)別的特征。此外,還要考慮每個(gè)類(lèi)別的成員數(shù)量和比例,以及模型的可解釋性,避免出現(xiàn)過(guò)小或不確定的類(lèi)別。
4. 探究影響因素。根據(jù)LPM模型的分類(lèi)結(jié)果,并將其作為因變量或自變量與其他變量進(jìn)行關(guān)聯(lián)分析,比如卡方檢驗(yàn)、方差分析、邏輯回歸等,以探索不同類(lèi)別之間的差異或影響因素。

如何用潛在剖面分析尋找量表的截?cái)嘀担?/strong>
在沒(méi)有準(zhǔn)確和精確的參考標(biāo)準(zhǔn)的情況下,LPA可以用來(lái)確定量表的截?cái)嘀担椒ㄈ缦拢?br>1. 將量表的各個(gè)題目或維度進(jìn)行LPA,得到最優(yōu)的LPM模型和類(lèi)別劃分。
2. 將條件均值最低的類(lèi)別定義為“非病例”(即沒(méi)有心理問(wèn)題或風(fēng)險(xiǎn)),將其他類(lèi)別定義為“病例”(即陽(yáng)性事件組)。
3. 以“病例”和“非病例”的二元結(jié)果為標(biāo)準(zhǔn),繪制量表總分的ROC曲線,并計(jì)算曲線下面積(AUC)、敏感度、特異度和Youden指數(shù)等評(píng)價(jià)指標(biāo)。
4. 根據(jù)Youden指數(shù)的最大值確定量表總分的最佳截?cái)嘀?,使得敏感度和特異度達(dá)到最優(yōu)平衡。


這篇研究進(jìn)行了LPA,比較了一至五類(lèi)的LPM模型,結(jié)果發(fā)現(xiàn)三類(lèi)模型擬合最好,將康復(fù)者分為了三個(gè)亞群體:低感知污名組(12.8%)、中等感知污名組(51.1%)和高感知污名組(36.1%)。


然后該研究還進(jìn)行了邏輯回歸分析,探索了不同感知污名組的影響因素。

最后,該研究將低感知污名組定義為“非病例”,將中等和高感知污名組定義為“病例”,并繪制了CSS-S總分的ROC曲線。結(jié)果顯示,ROC曲線下面積為99.96%,說(shuō)明CSS-S可以良好區(qū)分無(wú)感知污名化和有感知污名化的群體。通過(guò)計(jì)算Youden指數(shù),確定了CSS-S總分的最佳截?cái)嘀禐椤?20,此時(shí)敏感度為0.996,特異度為0.982。


詳情請(qǐng)點(diǎn)擊下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650407943&idx=1&sn=8d6a37d36557ec1fbe8158f6c71100e6&chksm=835279afb425f0b9b4bdc0ee890ff3272658e33fdf7a624293d78e3b10536b1f4deede053bc0&token=2058433398&lang=zh_CN#rd
