R語(yǔ)言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
原文鏈接:http://tecdat.cn/?p=3060
?
介紹
在對(duì)診斷測(cè)試準(zhǔn)確性的系統(tǒng)評(píng)價(jià)中,統(tǒng)計(jì)分析部分旨在估計(jì)測(cè)試的平均(跨研究)敏感性和特異性及其變異性以及其他測(cè)量。靈敏度和特異性之間往往存在負(fù)相關(guān),這表明需要相關(guān)數(shù)據(jù)模型。由于用戶(hù),分析在統(tǒng)計(jì)上具有挑戰(zhàn)性
處理兩個(gè)摘要統(tǒng)計(jì),
必須考慮敏感性和特異性之間的相關(guān)性,
必須考慮到研究中的敏感性和特異性的異質(zhì)性
應(yīng)該允許納入?yún)f(xié)變量。
?
?本教程介紹并演示了用于診斷準(zhǔn)確性研究的薈萃分析的分層混合模型。在層次結(jié)構(gòu)的第一級(jí)中,給定每個(gè)研究的靈敏度和特異性,兩個(gè)二項(xiàng)分布用于分別描述患病和健康個(gè)體中真陽(yáng)性和真陽(yáng)性數(shù)的變化。在第二級(jí),我們使用二元分布模擬未觀察到的敏感性和特異性。雖然使用了分層模型,但meta分析的重點(diǎn)在于研究中的匯總平均值,而在給定的研究估算中很少。
使用來(lái)自?xún)蓚€(gè)先前發(fā)布的meta分析的數(shù)據(jù)集來(lái)演示這些方法:
尿液中端粒酶的診斷準(zhǔn)確性作為診斷原發(fā)性膀胱癌的腫瘤標(biāo)志物,因?yàn)樗且粋€(gè)有問(wèn)題的數(shù)據(jù)集,其相關(guān)參數(shù)估計(jì)為-1并且沒(méi)有協(xié)變量而引起收斂問(wèn)題(Glas et al.2003)?
比較病毒檢測(cè)(使用HC2檢測(cè))的敏感性和特異性與重復(fù)細(xì)胞學(xué)檢查對(duì)具有宮頸病變的女性進(jìn)行分類(lèi),以檢測(cè)潛在的宮頸癌前病變(Arbyn等,2013)。第二個(gè)數(shù)據(jù)集用于證明具有一個(gè)協(xié)變量的元回歸,該協(xié)變量可以自然地?cái)U(kuò)展到包括幾個(gè)協(xié)變量。
?
薈萃Meta?分析的統(tǒng)計(jì)方法
?
推理框架和軟件
由于其靈活性和MCMC模擬的使用,復(fù)雜建模通??梢栽谪惾~斯框架內(nèi)更容易地實(shí)現(xiàn)。通過(guò)操縱先驗(yàn)分布,貝葉斯推斷可以規(guī)避可識(shí)別性問(wèn)題,而沒(méi)有先驗(yàn)分布的頻率推理中的數(shù)值逼近算法可能會(huì)因識(shí)別性問(wèn)題而陷入困境。然而,貝葉斯方法通常需要統(tǒng)計(jì)專(zhuān)業(yè)知識(shí)和耐心,因?yàn)镸CMC模擬是計(jì)算密集型的。相反,最頻繁的方法已被包含在標(biāo)準(zhǔn)“程序”中,這些程序需要較少的統(tǒng)計(jì)知識(shí)和編程技能。此外,頻率論方法通過(guò)最大似然估計(jì)(MLE)進(jìn)行優(yōu)化,與MCMC模擬相比,其具有更短的運(yùn)行時(shí)間。??
?JAGS (Plummer等人2003)是Stan的另一種可擴(kuò)展的通用采樣引擎。擴(kuò)展JAGS
需要知道C++
組裝動(dòng)態(tài)鏈接庫(kù)(DLL)模塊。根據(jù)經(jīng)驗(yàn),配置和構(gòu)建模塊是一項(xiàng)艱巨而繁瑣的任務(wù),尤其是在Windows操作系統(tǒng)中。上述缺點(diǎn)加上這樣的事實(shí),Stan
即使從較差的初始值開(kāi)始,往往會(huì)以較少的迭代收斂,而不是JAGS
使我們更喜歡Stan
MCMC采樣引擎。?
該包提供了適合二元β二項(xiàng)分布的函數(shù),這些分布構(gòu)造為前面討論的兩個(gè)β邊際分布和copula密度的乘積。該軟件包還為具有分類(lèi)協(xié)變量或僅具有截距的模型提供森林圖。給定選擇的copula函數(shù),由cdtamodel
返回cdtamodel
對(duì)象的函數(shù)組合β二項(xiàng)分布。主函數(shù)fit
取cdtamodel
對(duì)象和適合的模型給定的數(shù)據(jù)集,并返回一個(gè)cdtafit
為哪個(gè)對(duì)象print
,summary
并plot
提供了用于方法。
?
模型診斷
為了評(píng)估鏈的模型收斂,混合和平穩(wěn)性,有必要檢查潛在的比例縮減因子,有效樣本大?。‥SS),MCMC誤差和參數(shù)的跟蹤圖。當(dāng)所有鏈達(dá)到目標(biāo)后驗(yàn)分布時(shí),估計(jì)后驗(yàn)方差接近于內(nèi)鏈方差,使得兩者的比率接近1,表明鏈?zhǔn)欠€(wěn)定,可能已達(dá)到目標(biāo)分布。有效的樣本大小表示實(shí)際上有關(guān)某個(gè)參數(shù)的信息量。當(dāng)樣本自動(dòng)相關(guān)時(shí),預(yù)期參數(shù)后驗(yàn)分布的信息少于樣本獨(dú)立時(shí)的信息。由于模擬了后驗(yàn)分布,因此近似值有可能偏離一定量;MCMC誤差接近0表示一個(gè)可能已達(dá)到目標(biāo)分布。
?
模型比較和選擇
Watanabe-Alkaike信息準(zhǔn)則(WAIC)(Watanabe 2010)是一種最近的模型比較工具,用于測(cè)量擬合模型在貝葉斯框架中的預(yù)測(cè)精度,將用于比較模型。WAIC可以被視為對(duì)Deviance Information Criterion(DIC)的改進(jìn),盡管流行,但它已經(jīng)存在一些問(wèn)題(Plummer 2008)。WAIC是一個(gè)完全貝葉斯工具,非常接近貝葉斯交叉驗(yàn)證,對(duì)重新參數(shù)化不變,可用于簡(jiǎn)單以及分層和混合模型。
?
數(shù)據(jù)集
端粒酶數(shù)據(jù)
(Glas等,2003)系統(tǒng)地回顧了細(xì)胞學(xué)和其他標(biāo)志物(包括端粒酶)對(duì)膀胱癌初步診斷的敏感性和特異性。他們?cè)谡麄€(gè)研究中對(duì)logit轉(zhuǎn)換的靈敏度和特異性值進(jìn)行了二元正態(tài)分布,從而允許研究之間的異質(zhì)性。從包括10項(xiàng)研究,他們報(bào)告說(shuō),端粒酶有敏感性和特異性0.75 [0.66, 0.74]
,并0.86 [0.71, 0.94]
分別。他們得出結(jié)論,端粒酶不夠靈敏,不宜推薦用于日常使用。
將數(shù)據(jù)加載到R環(huán)境中并生成以下輸出
## ? ?ID TP ?TN FN FP
## 1 ? 1 25 ?25 ?8 ?1
## 2 ? 2 17 ?11 ?4 ?3
## 3 ? 3 88 ?31 16 16
## 4 ? 4 16 ?80 10 ?3
## 5 ? 5 40 137 17 ?1
## 6 ? 6 38 ?24 ?9 ?6
## 7 ? 7 23 ?12 19 ?0
## 8 ? 8 27 ?18 ?6 ?2
## 9 ? 9 14 ?29 ?3 ?3
## 10 10 37 ? 7 ?7 22
ID
是研究的標(biāo)識(shí)符,DIS
是患病的數(shù)量,TP
是真陽(yáng)性NonDis
的數(shù)量,是健康TN
的數(shù)量,是真陰性的數(shù)量。
?
ASCUS分類(lèi)數(shù)據(jù)
(Arbyn等人,2013年)對(duì)人乳頭瘤病毒檢測(cè)的準(zhǔn)確性進(jìn)行了Cochrane評(píng)價(jià),并重復(fù)細(xì)胞學(xué)分析,對(duì)宮頸涂片進(jìn)行模棱兩可的宮頸涂片檢查以診斷宮頸癌前病變。他們SAS
使用BRMA模型進(jìn)行METADAS
了10項(xiàng)研究,其中使用了兩種測(cè)試。他們報(bào)道的絕對(duì)靈敏度0.909 [0.857, 0.944]
和0.715 [0.629, 0.788]
用于HC2和重復(fù)細(xì)胞學(xué)分別。的特異性0.607 [0.539, 0.68]
和0.684 [0.599, 0.758]
分別為HC2和重復(fù)細(xì)胞學(xué)檢查。這些數(shù)據(jù)用于演示如何在元回歸設(shè)置中擴(kuò)展截距模型。此數(shù)據(jù)集也可在包和以下命令中使用
將數(shù)據(jù)加載到R環(huán)境中并生成以下輸出
## ? ?Test ? ? ? ? StudyID ?TP ? FP ?TN FN
## 1 ?RepC ?Andersson 2005 ? 6 ? 14 ?28 ?4
## 2 ?RepC ? Bergeron 2000 ? 8 ? 28 ?71 ?4
## 3 ?RepC Del Mistro 2010 ?20 ?191 483 ?7
## 4 ?RepC Kulasingam 2002 ?20 ? 74 170 ?6
## 5 ?RepC ? ? Lytwyn 2000 ? 4 ? 20 ?26 ?2
## 6 ?RepC ? ? ?Manos 1999 ?48 ?324 570 15
## 7 ?RepC ?Monsonego 2008 ?10 ? 18 168 15
## 8 ?RepC ? ? ?Morin 2001 ?14 ?126 214 ?5
## 9 ?RepC ?Silverloo 2009 ?24 ? 43 105 10
## 10 RepC ? ?Solomon 2001 227 1132 914 40
## 11 ?HC2 ?Andersson 2005 ? 6 ? 17 ?25 ?4
## 12 ?HC2 ? Bergeron 2000 ?10 ? 38 ?61 ?2
## 13 ?HC2 Del Mistro 2010 ?27 ?154 566 ?2
## 14 ?HC2 Kulasingam 2002 ?23 ?115 129 ?3
## 15 ?HC2 ? ? Lytwyn 2000 ? 4 ? 19 ?33 ?1
## 16 ?HC2 ? ? ?Manos 1999 ?58 ?326 582 ?7
## 17 ?HC2 ?Monsonego 2008 ?22 ?110 ?72 ?2
## 18 ?HC2 ? ? ?Morin 2001 ?17 ? 88 253 ?2
## 19 ?HC2 ?Silverloo 2009 ?34 ? 65 ?81 ?2
## 20 ?HC2 ? ?Solomon 2001 256 1050 984 11
Test
是一個(gè)解釋變量,顯示分類(lèi)測(cè)試的類(lèi)型,StudyID
是研究標(biāo)識(shí)符,TP
是真陽(yáng)性FP
的數(shù)量,TN
是誤報(bào)的數(shù)量,FN
是真陰性的數(shù)量,是假陰性的數(shù)量。
?
截距模型
?
默認(rèn)情況下,chains = 3?
cores = 3
。從上面的代碼中,從每個(gè)3
鏈中抽取1000樣本,丟棄第一個(gè)樣本,然后使得每個(gè)鏈具有900個(gè)預(yù)熱后抽取。種子值seed = 3
指定隨機(jī)數(shù)生成器以允許結(jié)果的再現(xiàn)性,并cores = 3
允許通過(guò)使用3
核來(lái)并行處理鏈,每個(gè)鏈一個(gè)核。
下面的跡線圖顯示了鏈和收斂。

接下來(lái),獲得如下的模型概要估計(jì)
## Posterior marginal mean and median sensitivity and specificity
## ?with 95% credible intervals
##
## ? ? ? ? ? ?Parameter ? ? ?Mean ? ? ?Lower ? ?Median ? ?Upper ?n_eff ?Rhat
## MUse[1] ?Sensitivity ?0.756762 ?6.904e-01 ?0.756036 ?0.81658 1196.9 1.001
## MUsp[1] ?Specificity ?0.798289 ?6.171e-01 ?0.813517 ?0.90640 ?704.4 1.004
## ktau[1] ?Correlation -0.820176 -9.861e-01 -0.876343 -0.33334 ?269.2 1.015
## Varse[1] ? Var(Sens) ?0.006198 ?8.321e-06 ?0.005047 ?0.01947 ?165.7 1.007
## Varsp[1] ? Var(Spec) ?0.048111 ?1.357e-02 ?0.041060 ?0.12204 ?169.5 1.007
##
##
## Model characteristics
##
## Copula function: gauss, sampling algorithm: NUTS(diag_e)
##
## Formula(1): ?MUse ~ 1
## Formula(2): ?MUsp ~ 1
## Formula(3): ?Omega ~ 1
## 3 chain(s)each with iter=28000; warm-up=1000; thin=30.
## post-warmup draws per chain=900;total post-warmup draws=2700.
##
## Predictive accuracy of the model
##
## Log point-wise predictive density (LPPD): -38.0607
## Effective number of parameters: 7.5807
## Watanabe-Akaike information Criterion (WAIC): 91.2828
從上面的輸出,所述元分析靈敏度MUse[1]
和特異性MUsp[1]
是0.7568 [0.6904, 0.8166]
和0.7983 [0.6171, 0.9064]
。靈敏度和特異性分別為0.0062 [0, 0.0195]
和0.0048 [0.0136, 0.1220]
。Kendall在敏感性和特異性之間的tau相關(guān)性估計(jì)為-0.8202 [-0.9861, -0.3333]
。
以下命令生成一系列森林圖。
?
## $G1

##
## $G2

##
## $G3
## Warning: Removed 2 rows containing missing values (geom_errorbar).

$G1
是研究特異性敏感性和特異性(品紅色點(diǎn))及其相應(yīng)的95%確切置信區(qū)間(黑線)的圖。$G2
是后驗(yàn)研究敏感性和特異性及其相應(yīng)的95%可信區(qū)間(黑線)的圖。
$G3
是后驗(yàn)研究敏感性和特異性及其相應(yīng)的95%可信區(qū)間(黑線)的圖。還給出了研究特異性的靈敏度和特異性(品紅點(diǎn))及其相應(yīng)的95%確切置信區(qū)間(粗灰線)。
如上圖所示,總體平均敏感性和特異性存在“收縮”:后驗(yàn)研究的估計(jì)取決于全局估計(jì),因此也取決于所有其他研究。
接下來(lái),通過(guò)創(chuàng)建如下列表來(lái)準(zhǔn)備數(shù)據(jù)
在data
塊中,指定了數(shù)據(jù)集中變量的維度和名稱(chēng),此處Ns
指數(shù)據(jù)集中的研究數(shù)量。該parameters
塊引入了待估計(jì)的未知參數(shù)。etarho
;?表示Fisher氏變換的關(guān)聯(lián)參數(shù)的形式的標(biāo)量,mul
表示的靈敏度和特異性在分對(duì)數(shù)尺度的平均值為中心的觀察值,其中隨機(jī)效應(yīng)是矢量零。
在transformed parameters
塊中進(jìn)一步轉(zhuǎn)換參數(shù)。在model
塊中定義所有參數(shù)和數(shù)據(jù)似然的先驗(yàn)分布。最后,在generated quantities
塊中,loglik
是計(jì)算WAIC所需的對(duì)數(shù)似然向量。
接下來(lái),stan
調(diào)用函數(shù)將代碼轉(zhuǎn)換為C++
,編譯代碼并從后驗(yàn)分布中提取樣本,如下所示
提取參數(shù)估計(jì),并使用以下代碼進(jìn)一步檢查鏈?zhǔn)諗亢妥韵嚓P(guān)
## Inference for Stan model: 61572683b29d52354783115614fab729.
## 3 chains, each with iter=5000; warmup=1000; thin=10;
## post-warmup draws per chain=400, total post-warmup draws=1200.
##
## ? ? ? ? ? ? ? mean se_mean ? ? sd ? ?2.5% ? ? 50% ? 97.5% n_eff ? Rhat
## MU[1] ? ? ? 0.7525 ?0.0018 0.0517 ?0.6323 ?0.7562 ?0.8415 ? 796 0.9999
## MU[2] ? ? ? 0.7908 ?0.0034 0.1095 ?0.5273 ?0.8094 ?0.9539 ?1045 1.0008
## mu[1] ? ? ? 0.7668 ?0.0013 0.0388 ?0.6869 ?0.7688 ?0.8369 ? 891 0.9990
## mu[2] ? ? ? 0.8937 ?0.0027 0.0753 ?0.6943 ?0.9115 ?0.9825 ? 789 0.9992
## rho ? ? ? ?-0.9311 ?0.0070 0.1353 -0.9996 -0.9813 -0.5626 ? 372 1.0077
## Sigma[1,1] ?0.3376 ?0.0091 0.2918 ?0.0579 ?0.2554 ?0.9851 ?1026 1.0023
## Sigma[1,2] -1.2291 ?0.0272 0.8765 -3.4195 -1.0031 -0.2724 ?1040 0.9991
## Sigma[2,1] -1.2291 ?0.0272 0.8765 -3.4195 -1.0031 -0.2724 ?1040 0.9991
## Sigma[2,2] ?5.6827 ?0.1282 4.1931 ?1.4720 ?4.6330 16.9031 ?1070 1.0002
##
## Samples were drawn using NUTS(diag_e) at Mon Oct 09 09:19:55 2017.
## For each parameter, n_eff is a crude measure of effective sample size,
## and Rhat is the potential scale reduction factor on split chains (at
## convergence, Rhat=1).
所述元分析靈敏度(MU[1]
)和特異性(MU[2]
)和95%可信區(qū)間是0.7525[0.6323, 0.8415]
和0.7908[0.5273, 0.9539]
。這與作者以?xún)煞N方式發(fā)表的文章(0.75 [0.66,0.74]和0.86 [0.71,0.94])不同。作者將標(biāo)準(zhǔn)雙變量正態(tài)分布擬合到logit轉(zhuǎn)換的敏感性和特異性值,在研究中允許研究之間的異質(zhì)性,并忽略了更高層次的分層模型。因此,作者必須使用0.5的連續(xù)性校正,因?yàn)榈谄唔?xiàng)研究“觀察”特異性等于1,這是分層模型中沒(méi)有遇到的問(wèn)題。
下圖顯示除了Clayton copula模型之外,大多數(shù)擬合模型的鏈條混合效果令人滿(mǎn)意,幾乎沒(méi)有自相關(guān)。
## Loading required package: lattice
## Loading required package: plyr

所有擬合分布估計(jì)的平均靈敏度和特異性如下表所示。
## Warning: 6 (30.0%) p_waic estimates greater than 0.4.
## We recommend trying loo() instead.
## ? ? ? Model ? Parameter ? ? ?Mean ? ? ?Lower ? ?Median ? ? ?Upper ? ?n_eff
## 1 ?Gaussian Sensitivity ?0.756762 ?6.904e-01 ?0.756036 ?8.166e-01 1196.857
## 2 ?Gaussian Specificity ?0.798289 ?6.171e-01 ?0.813517 ?9.064e-01 ?704.379
## 3 ?Gaussian Correlation -0.820176 -9.861e-01 -0.876343 -3.333e-01 ?269.179
## 4 ?Gaussian ? Var(Sens) ?0.006198 ?8.321e-06 ?0.005047 ?1.947e-02 ?165.705
## 5 ?Gaussian ? Var(Spec) ?0.048111 ?1.357e-02 ?0.041060 ?1.220e-01 ?169.508
## 6 ? ? ? C90 Sensitivity ?0.751379 ?6.913e-01 ?0.753546 ?8.098e-01 ? 25.638
## 7 ? ? ? C90 Specificity ?0.807051 ?6.549e-01 ?0.821119 ?9.069e-01 ?119.897
## 8 ? ? ? C90 Correlation -0.528340 -9.766e-01 -0.725178 -4.020e-18 ? ?4.111
## 9 ? ? ? C90 ? Var(Sens) ?0.004885 ?3.400e-04 ?0.003297 ?1.955e-02 ? 11.615
## 10 ? ? ?C90 ? Var(Spec) ?0.045694 ?1.556e-02 ?0.038049 ?1.020e-01 ?137.149
## 11 ? ? C270 Sensitivity ?0.757528 ?6.877e-01 ?0.761163 ?8.210e-01 ?273.236
## 12 ? ? C270 Specificity ?0.803502 ?6.328e-01 ?0.811740 ?9.097e-01 1081.987
## 13 ? ? C270 Correlation -0.697493 -9.827e-01 -0.808717 -3.332e-06 ? 40.012
## 14 ? ? C270 ? Var(Sens) ?0.006662 ?2.667e-04 ?0.005293 ?2.027e-02 ?556.055
## 15 ? ? C270 ? Var(Spec) ?0.044767 ?1.268e-02 ?0.037922 ?1.112e-01 1098.815
## 16 ? ? ?FGM Sensitivity ?0.759407 ?6.891e-01 ?0.761931 ?8.174e-01 2475.208
## 17 ? ? ?FGM Specificity ?0.802588 ?6.453e-01 ?0.812498 ?9.045e-01 2293.332
## 18 ? ? ?FGM correlation -0.174538 -2.222e-01 -0.222221 ?2.222e-01 ?785.016
## 19 ? ? ?FGM ? Var(Sens) ?0.005390 ?7.425e-07 ?0.004181 ?1.813e-02 1019.633
## 20 ? ? ?FGM ? Var(Spec) ?0.041890 ?1.177e-02 ?0.036671 ?9.997e-02 2479.371
## 21 ? ?Frank Sensitivity ?0.756683 ?6.855e-01 ?0.758340 ?8.152e-01 2686.631
## 22 ? ?Frank Specificity ?0.808239 ?6.472e-01 ?0.818777 ?9.110e-01 1910.561
## 23 ? ?Frank Correlation -0.706819 -8.550e-01 -0.692019 ?1.000e+00 2700.000
## 24 ? ?Frank ? Var(Sens) ?0.006678 ?5.896e-04 ?0.005280 ?2.140e-02 2699.766
## 25 ? ?Frank ? Var(Spec) ?0.042067 ?1.201e-02 ?0.035908 ?1.039e-01 1937.653
## 26 ? ? BRMA Sensitivity ?0.752531 ?6.323e-01 ?0.756181 ?8.415e-01 ?796.037
## 27 ? ? BRMA Specificity ?0.790796 ?5.273e-01 ?0.809420 ?9.539e-01 1044.902
## 28 ? ? BRMA Correlation -0.822353 -9.824e-01 -0.876654 -3.804e-01 ?238.268
## 29 ? ? BRMA ?Var(lSens) ?0.337556 ?5.792e-02 ?0.255387 ?9.851e-01 1025.609
## 30 ? ? BRMA ?Var(lSpec) ?5.682692 ?1.472e+00 ?4.632967 ?1.690e+01 1070.481
## ? ? ?Rhat ?WAIC
## 1 ?1.0014 91.28
## 2 ?1.0044 91.28
## 3 ?1.0154 91.28
## 4 ?1.0072 91.28
## 5 ?1.0069 91.28
## 6 ?1.1047 91.40
## 7 ?1.0304 91.40
## 8 ?1.3707 91.40
## 9 ?1.1005 91.40
## 10 1.0311 91.40
## 11 1.0096 90.75
## 12 1.0001 90.75
## 13 1.0407 90.75
## 14 1.0024 90.75
## 15 0.9999 90.75
## 16 0.9998 97.37
## 17 0.9996 97.37
## 18 1.0070 97.37
## 19 1.0034 97.37
## 20 0.9999 97.37
## 21 0.9994 90.55
## 22 0.9997 90.55
## 23 ? ?NaN 90.55
## 24 0.9990 90.55
## 25 0.9992 90.55
## 26 0.9999 86.76
## 27 1.0008 86.76
## 28 1.0218 86.76
## 29 1.0023 86.76
## 30 1.0002 86.76
結(jié)果以圖形方式呈現(xiàn)如下

模型比較
Table1
上面顯示,BRMA模型和高斯copula雙變量β估計(jì)的相關(guān)性更加極端。另一個(gè)極端是來(lái)自模型FGM copula雙變量β的估計(jì),這是由于FGM copula中關(guān)聯(lián)參數(shù)的約束,其中值在| 2/9 |內(nèi)。
在上圖中g1
,盡管相關(guān)結(jié)構(gòu)存在差異,但五個(gè)雙變量β分布的邊際平均靈敏度和特異性與95%可信區(qū)間的細(xì)微差異相當(dāng)。
在沒(méi)有估計(jì)困難的情況下,上表顯示了Pearson估計(jì)的相關(guān)性-0.8224[-0.9824, -0.3804]
。這是因?yàn)樨惾~斯方法不受樣本量的影響,因此能夠處理具有較少問(wèn)題的小樣本量的情況。
基本上,所有六個(gè)模型在第一級(jí)層次結(jié)構(gòu)中是等價(jià)的,并且在指定“研究特異性”敏感性和特異性的先驗(yàn)分布不同。因此,模型應(yīng)具有相同數(shù)量的參數(shù),在這種情況下,比較預(yù)測(cè)密度是有意義的。在檢查時(shí),來(lái)自五個(gè)基于copula的模型的對(duì)數(shù)預(yù)測(cè)密度實(shí)際上是等效的(min=-38.77, max=-37.89
)但是參數(shù)的有效數(shù)量有點(diǎn)不同(min=7.25, max=9.92
)。BRMA具有6
有效參數(shù),但具有較低的對(duì)數(shù)預(yù)測(cè)密度-43.4
。上表的最后一列表明盡管預(yù)測(cè)密度較低,但BRMA是最適合基于WAIC的數(shù)據(jù)。
Meta回歸
ascus
數(shù)據(jù)集有Test
作為協(xié)變量。使用協(xié)變量是有意義的,以研究其對(duì)敏感性和特異性(包括相關(guān)性)的聯(lián)合分布的影響。以下代碼將基于copula的二元beta二項(xiàng)分布擬合到數(shù)據(jù)ascus
數(shù)據(jù)。
?下圖顯示了適用于ascus
數(shù)據(jù)的所有六個(gè)模型的跡線圖,其中所有參數(shù)(包括相關(guān)參數(shù)(BRMA除外))都被建模為協(xié)變量的函數(shù)。除了基于Clayton copula的雙變量β的情況外,存在適當(dāng)?shù)逆溁旌虾褪諗俊?/p>
從基于copula的雙變量β分布來(lái)看,很明顯HC2和重復(fù)細(xì)胞學(xué)中的敏感性和特異性之間的相關(guān)性是不同的。
## Warning: 19 (47.5%) p_waic estimates greater than 0.4.
## We recommend trying loo() instead.
## ? ? ? Model Test ? Parameter ? ? Mean ? Lower ? ? Median ? ? ?Upper
## 9 ?Gaussian ?HC2 Correlation -0.43812 -0.9984 -6.959e-01 ?9.847e-01
## 10 Gaussian Repc Correlation -0.91991 -0.9997 -9.643e-01 -6.103e-01
## 23 ? ? ?C90 ?HC2 Correlation -0.06588 -0.7610 -1.039e-17 -7.624e-19
## 24 ? ? ?C90 Repc Correlation -0.85157 -0.9804 -9.120e-01 -4.906e-01
## 37 ? ? C270 ?HC2 Correlation -0.03038 -0.6452 -7.000e-18 -1.782e-18
## 38 ? ? C270 Repc Correlation -0.77847 -0.9757 -7.058e-01 -5.394e-01
## 51 ? ? ?FGM ?HC2 Correlation -0.07618 -0.2222 -2.215e-01 ?2.222e-01
## 52 ? ? ?FGM Repc Correlation -0.19819 -0.2222 -2.222e-01 ?1.894e-01
## 65 ? ?Frank ?HC2 Correlation -0.48806 -0.8140 -4.497e-01 ?1.000e+00
## 66 ? ?Frank Repc Correlation -0.73784 -0.8627 -7.275e-01 ?1.000e+00
## 81 ? ? BRMA Both Correlation -0.84808 -0.9839 -8.980e-01 -4.497e-01
## ? ? ? n_eff ? Rhat ?WAIC
## 9 ? 154.238 1.0066 236.4
## 10 ? 24.342 1.0542 236.4
## 23 ? 30.089 1.0690 235.7
## 24 ? ?8.532 1.1128 235.7
## 37 ? 76.410 1.0326 227.5
## 38 ? ?2.945 1.4613 227.5
## 51 2422.935 1.0007 245.1
## 52 2550.145 0.9997 245.1
## 65 2700.000 ? ?NaN 238.3
## 66 2700.000 ? ?NaN 238.3
## 81 ?102.983 1.0254 233.7
Clayton90
模型具有最低的WAIC。
因此,這個(gè)例子表明,檢查模型的擬合度和合理性是否充分是至關(guān)重要的,而不是盲目地依賴(lài)信息標(biāo)準(zhǔn)來(lái)選擇最適合數(shù)據(jù)的標(biāo)準(zhǔn)。
從下面繪制的后驗(yàn)相對(duì)敏感性和特異性,所有收斂的模型通常認(rèn)為重復(fù)細(xì)胞學(xué)比HC2敏感性低,而特異性沒(méi)有顯著損失。

討論
基于Copula的模型提供了極大的靈活性和易用性,但它們的使用并非毫不謹(jǐn)慎。雖然本文中使用的copula具有吸引力,因?yàn)樗鼈冊(cè)跀?shù)學(xué)上易于處理,但(Mikosch 2006)和(Genest and Remillard 2006)指出,從數(shù)據(jù)中估算copula可能很困難。此外,copula模型背后的概念稍微復(fù)雜一些,因此需要統(tǒng)計(jì)專(zhuān)業(yè)知識(shí)來(lái)理解和編程它們,因?yàn)樗鼈兩形醋鳛榻y(tǒng)計(jì)軟件中的標(biāo)準(zhǔn)程序/程序。
?
在本文中,簡(jiǎn)要討論了幾種用于診斷準(zhǔn)確性研究的metat分析的先進(jìn)統(tǒng)計(jì)模型。?
在評(píng)估m(xù)eta分析的敏感性和特異性以及相關(guān)性時(shí),模型之間存在一些差異。因此,有必要進(jìn)一步研究以研究某些參數(shù)的影響,例如研究數(shù)量,樣本量和聯(lián)合分布的錯(cuò)誤指定對(duì)meta分析的估計(jì)。
?
結(jié)論
提出的貝葉斯模型使用copula來(lái)構(gòu)建二元β分布,該模型估計(jì)特定研究的敏感性和特異性,具有特定的隨機(jī)效應(yīng)值。
在ASCUS分類(lèi)數(shù)據(jù)中,基于擬合模型的結(jié)論與作者得出的結(jié)論一致:HC2比重復(fù)細(xì)胞學(xué)檢查更敏感但更輕微,并且沒(méi)有明顯低于特異性巴氏涂片診斷宮頸癌前病變的女性。
雖然BRMA對(duì)于兩個(gè)數(shù)據(jù)集都具有最低的WAIC,但我們?nèi)匀唤ㄗh使用雙變量β分布對(duì)靈敏度和特異性進(jìn)行建模,因?yàn)樗鼈兛梢灾苯犹峁﹎eta分析估計(jì)。
?
非常感謝您閱讀本文,有任何問(wèn)題請(qǐng)?jiān)谙旅媪粞裕?/h1>

最受歡迎的見(jiàn)解
1.Python中的Apriori關(guān)聯(lián)算法-市場(chǎng)購(gòu)物籃分析
2.R語(yǔ)言繪制生存曲線估計(jì)|生存分析|如何R作生存曲線圖
3.用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘探索藥物配伍中的規(guī)律
4.通過(guò)Python中的Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘
5.用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘探索藥物配伍中的規(guī)律
6.采用SPSS Modeler的Web復(fù)雜網(wǎng)絡(luò)對(duì)所有腧穴進(jìn)行分析
7.R語(yǔ)言如何在生存分析與COX回歸中計(jì)算IDI,NRI指標(biāo)
8.R語(yǔ)言如何找到患者數(shù)據(jù)中具有差異的指標(biāo)?(PLS—DA分析)
9.R語(yǔ)言中的生存分析Survival analysis晚期肺癌患者4例