最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

R語(yǔ)言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究

2020-12-02 16:31 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=3060

?

介紹

在對(duì)診斷測(cè)試準(zhǔn)確性的系統(tǒng)評(píng)價(jià)中,統(tǒng)計(jì)分析部分旨在估計(jì)測(cè)試的平均(跨研究)敏感性和特異性及其變異性以及其他測(cè)量。靈敏度和特異性之間往往存在負(fù)相關(guān),這表明需要相關(guān)數(shù)據(jù)模型。由于用戶(hù),分析在統(tǒng)計(jì)上具有挑戰(zhàn)性

  • 處理兩個(gè)摘要統(tǒng)計(jì),

  • 必須考慮敏感性和特異性之間的相關(guān)性,

  • 必須考慮到研究中的敏感性和特異性的異質(zhì)性

  • 應(yīng)該允許納入?yún)f(xié)變量。

?

?本教程介紹并演示了用于診斷準(zhǔn)確性研究的薈萃分析的分層混合模型。在層次結(jié)構(gòu)的第一級(jí)中,給定每個(gè)研究的靈敏度和特異性,兩個(gè)二項(xiàng)分布用于分別描述患病和健康個(gè)體中真陽(yáng)性和真陽(yáng)性數(shù)的變化。在第二級(jí),我們使用二元分布模擬未觀察到的敏感性和特異性。雖然使用了分層模型,但meta分析的重點(diǎn)在于研究中的匯總平均值,而在給定的研究估算中很少。

使用來(lái)自?xún)蓚€(gè)先前發(fā)布的meta分析的數(shù)據(jù)集來(lái)演示這些方法:

  • 尿液中端粒酶的診斷準(zhǔn)確性作為診斷原發(fā)性膀胱癌的腫瘤標(biāo)志物,因?yàn)樗且粋€(gè)有問(wèn)題的數(shù)據(jù)集,其相關(guān)參數(shù)估計(jì)為-1并且沒(méi)有協(xié)變量而引起收斂問(wèn)題(Glas et al.2003)?

  • 比較病毒檢測(cè)(使用HC2檢測(cè))的敏感性和特異性與重復(fù)細(xì)胞學(xué)檢查對(duì)具有宮頸病變的女性進(jìn)行分類(lèi),以檢測(cè)潛在的宮頸癌前病變(Arbyn等,2013)。第二個(gè)數(shù)據(jù)集用于證明具有一個(gè)協(xié)變量的元回歸,該協(xié)變量可以自然地?cái)U(kuò)展到包括幾個(gè)協(xié)變量。

?

薈萃Meta?分析的統(tǒng)計(jì)方法

?

推理框架和軟件

由于其靈活性和MCMC模擬的使用,復(fù)雜建模通??梢栽谪惾~斯框架內(nèi)更容易地實(shí)現(xiàn)。通過(guò)操縱先驗(yàn)分布,貝葉斯推斷可以規(guī)避可識(shí)別性問(wèn)題,而沒(méi)有先驗(yàn)分布的頻率推理中的數(shù)值逼近算法可能會(huì)因識(shí)別性問(wèn)題而陷入困境。然而,貝葉斯方法通常需要統(tǒng)計(jì)專(zhuān)業(yè)知識(shí)和耐心,因?yàn)镸CMC模擬是計(jì)算密集型的。相反,最頻繁的方法已被包含在標(biāo)準(zhǔn)“程序”中,這些程序需要較少的統(tǒng)計(jì)知識(shí)和編程技能。此外,頻率論方法通過(guò)最大似然估計(jì)(MLE)進(jìn)行優(yōu)化,與MCMC模擬相比,其具有更短的運(yùn)行時(shí)間。??

?JAGS (Plummer等人2003)是Stan的另一種可擴(kuò)展的通用采樣引擎。擴(kuò)展JAGS需要知道C++組裝動(dòng)態(tài)鏈接庫(kù)(DLL)模塊。根據(jù)經(jīng)驗(yàn),配置和構(gòu)建模塊是一項(xiàng)艱巨而繁瑣的任務(wù),尤其是在Windows操作系統(tǒng)中。上述缺點(diǎn)加上這樣的事實(shí),Stan即使從較差的初始值開(kāi)始,往往會(huì)以較少的迭代收斂,而不是JAGS使我們更喜歡StanMCMC采樣引擎。?

該包提供了適合二元β二項(xiàng)分布的函數(shù),這些分布構(gòu)造為前面討論的兩個(gè)β邊際分布和copula密度的乘積。該軟件包還為具有分類(lèi)協(xié)變量或僅具有截距的模型提供森林圖。給定選擇的copula函數(shù),由cdtamodel返回cdtamodel對(duì)象的函數(shù)組合β二項(xiàng)分布。主函數(shù)fitcdtamodel對(duì)象和適合的模型給定的數(shù)據(jù)集,并返回一個(gè)cdtafit為哪個(gè)對(duì)象print,summaryplot提供了用于方法。

?

模型診斷

為了評(píng)估鏈的模型收斂,混合和平穩(wěn)性,有必要檢查潛在的比例縮減因子,有效樣本大?。‥SS),MCMC誤差和參數(shù)的跟蹤圖。當(dāng)所有鏈達(dá)到目標(biāo)后驗(yàn)分布時(shí),估計(jì)后驗(yàn)方差接近于內(nèi)鏈方差,使得兩者的比率接近1,表明鏈?zhǔn)欠€(wěn)定,可能已達(dá)到目標(biāo)分布。有效的樣本大小表示實(shí)際上有關(guān)某個(gè)參數(shù)的信息量。當(dāng)樣本自動(dòng)相關(guān)時(shí),預(yù)期參數(shù)后驗(yàn)分布的信息少于樣本獨(dú)立時(shí)的信息。由于模擬了后驗(yàn)分布,因此近似值有可能偏離一定量;MCMC誤差接近0表示一個(gè)可能已達(dá)到目標(biāo)分布。

?

模型比較和選擇

Watanabe-Alkaike信息準(zhǔn)則(WAIC)(Watanabe 2010)是一種最近的模型比較工具,用于測(cè)量擬合模型在貝葉斯框架中的預(yù)測(cè)精度,將用于比較模型。WAIC可以被視為對(duì)Deviance Information Criterion(DIC)的改進(jìn),盡管流行,但它已經(jīng)存在一些問(wèn)題(Plummer 2008)。WAIC是一個(gè)完全貝葉斯工具,非常接近貝葉斯交叉驗(yàn)證,對(duì)重新參數(shù)化不變,可用于簡(jiǎn)單以及分層和混合模型。

?

數(shù)據(jù)集

端粒酶數(shù)據(jù)

(Glas等,2003)系統(tǒng)地回顧了細(xì)胞學(xué)和其他標(biāo)志物(包括端粒酶)對(duì)膀胱癌初步診斷的敏感性和特異性。他們?cè)谡麄€(gè)研究中對(duì)logit轉(zhuǎn)換的靈敏度和特異性值進(jìn)行了二元正態(tài)分布,從而允許研究之間的異質(zhì)性。從包括10項(xiàng)研究,他們報(bào)告說(shuō),端粒酶有敏感性和特異性0.75 [0.66, 0.74],并0.86 [0.71, 0.94]分別。他們得出結(jié)論,端粒酶不夠靈敏,不宜推薦用于日常使用。

將數(shù)據(jù)加載到R環(huán)境中并生成以下輸出

  1. ## ? ?ID TP ?TN FN FP

  2. ## 1 ? 1 25 ?25 ?8 ?1

  3. ## 2 ? 2 17 ?11 ?4 ?3

  4. ## 3 ? 3 88 ?31 16 16

  5. ## 4 ? 4 16 ?80 10 ?3

  6. ## 5 ? 5 40 137 17 ?1

  7. ## 6 ? 6 38 ?24 ?9 ?6

  8. ## 7 ? 7 23 ?12 19 ?0

  9. ## 8 ? 8 27 ?18 ?6 ?2

  10. ## 9 ? 9 14 ?29 ?3 ?3

  11. ## 10 10 37 ? 7 ?7 22

ID是研究的標(biāo)識(shí)符,DIS是患病的數(shù)量,TP是真陽(yáng)性NonDis的數(shù)量,是健康TN的數(shù)量,是真陰性的數(shù)量。

?

ASCUS分類(lèi)數(shù)據(jù)

(Arbyn等人,2013年)對(duì)人乳頭瘤病毒檢測(cè)的準(zhǔn)確性進(jìn)行了Cochrane評(píng)價(jià),并重復(fù)細(xì)胞學(xué)分析,對(duì)宮頸涂片進(jìn)行模棱兩可的宮頸涂片檢查以診斷宮頸癌前病變。他們SAS使用BRMA模型進(jìn)行METADAS了10項(xiàng)研究,其中使用了兩種測(cè)試。他們報(bào)道的絕對(duì)靈敏度0.909 [0.857, 0.944]0.715 [0.629, 0.788]用于HC2和重復(fù)細(xì)胞學(xué)分別。的特異性0.607 [0.539, 0.68]0.684 [0.599, 0.758]分別為HC2和重復(fù)細(xì)胞學(xué)檢查。這些數(shù)據(jù)用于演示如何在元回歸設(shè)置中擴(kuò)展截距模型。此數(shù)據(jù)集也可在包和以下命令中使用

將數(shù)據(jù)加載到R環(huán)境中并生成以下輸出

## ? ?Test ? ? ? ? StudyID ?TP ? FP ?TN FN## 1 ?RepC ?Andersson 2005 ? 6 ? 14 ?28 ?4## 2 ?RepC ? Bergeron 2000 ? 8 ? 28 ?71 ?4## 3 ?RepC Del Mistro 2010 ?20 ?191 483 ?7## 4 ?RepC Kulasingam 2002 ?20 ? 74 170 ?6## 5 ?RepC ? ? Lytwyn 2000 ? 4 ? 20 ?26 ?2## 6 ?RepC ? ? ?Manos 1999 ?48 ?324 570 15## 7 ?RepC ?Monsonego 2008 ?10 ? 18 168 15## 8 ?RepC ? ? ?Morin 2001 ?14 ?126 214 ?5## 9 ?RepC ?Silverloo 2009 ?24 ? 43 105 10## 10 RepC ? ?Solomon 2001 227 1132 914 40## 11 ?HC2 ?Andersson 2005 ? 6 ? 17 ?25 ?4## 12 ?HC2 ? Bergeron 2000 ?10 ? 38 ?61 ?2## 13 ?HC2 Del Mistro 2010 ?27 ?154 566 ?2## 14 ?HC2 Kulasingam 2002 ?23 ?115 129 ?3## 15 ?HC2 ? ? Lytwyn 2000 ? 4 ? 19 ?33 ?1## 16 ?HC2 ? ? ?Manos 1999 ?58 ?326 582 ?7## 17 ?HC2 ?Monsonego 2008 ?22 ?110 ?72 ?2## 18 ?HC2 ? ? ?Morin 2001 ?17 ? 88 253 ?2## 19 ?HC2 ?Silverloo 2009 ?34 ? 65 ?81 ?2## 20 ?HC2 ? ?Solomon 2001 256 1050 984 11

Test是一個(gè)解釋變量,顯示分類(lèi)測(cè)試的類(lèi)型,StudyID是研究標(biāo)識(shí)符,TP是真陽(yáng)性FP的數(shù)量,TN是誤報(bào)的數(shù)量,FN是真陰性的數(shù)量,是假陰性的數(shù)量。


?

截距模型

?

默認(rèn)情況下,chains = 3?cores = 3。從上面的代碼中,從每個(gè)3鏈中抽取1000樣本,丟棄第一個(gè)樣本,然后使得每個(gè)鏈具有900個(gè)預(yù)熱后抽取。種子值seed = 3指定隨機(jī)數(shù)生成器以允許結(jié)果的再現(xiàn)性,并cores = 3允許通過(guò)使用3核來(lái)并行處理鏈,每個(gè)鏈一個(gè)核。

下面的跡線圖顯示了鏈和收斂。

接下來(lái),獲得如下的模型概要估計(jì)

## Posterior marginal mean and median sensitivity and specificity## ?with 95% credible intervals#### ? ? ? ? ? ?Parameter ? ? ?Mean ? ? ?Lower ? ?Median ? ?Upper ?n_eff ?Rhat## MUse[1] ?Sensitivity ?0.756762 ?6.904e-01 ?0.756036 ?0.81658 1196.9 1.001## MUsp[1] ?Specificity ?0.798289 ?6.171e-01 ?0.813517 ?0.90640 ?704.4 1.004## ktau[1] ?Correlation -0.820176 -9.861e-01 -0.876343 -0.33334 ?269.2 1.015## Varse[1] ? Var(Sens) ?0.006198 ?8.321e-06 ?0.005047 ?0.01947 ?165.7 1.007## Varsp[1] ? Var(Spec) ?0.048111 ?1.357e-02 ?0.041060 ?0.12204 ?169.5 1.007###### Model characteristics#### Copula function: gauss, sampling algorithm: NUTS(diag_e)#### Formula(1): ?MUse ~ 1## Formula(2): ?MUsp ~ 1## Formula(3): ?Omega ~ 1## 3 chain(s)each with iter=28000; warm-up=1000; thin=30.## post-warmup draws per chain=900;total post-warmup draws=2700.#### Predictive accuracy of the model#### Log point-wise predictive density (LPPD): -38.0607## Effective number of parameters: 7.5807## Watanabe-Akaike information Criterion (WAIC): 91.2828

從上面的輸出,所述元分析靈敏度MUse[1]和特異性MUsp[1]0.7568 [0.6904, 0.8166]0.7983 [0.6171, 0.9064]。靈敏度和特異性分別為0.0062 [0, 0.0195]0.0048 [0.0136, 0.1220]。Kendall在敏感性和特異性之間的tau相關(guān)性估計(jì)為-0.8202 [-0.9861, -0.3333]。

以下命令生成一系列森林圖。

?

## $G1

  1. ##

  2. ## $G2

  1. ##

  2. ## $G3

## Warning: Removed 2 rows containing missing values (geom_errorbar).

$G1是研究特異性敏感性和特異性(品紅色點(diǎn))及其相應(yīng)的95%確切置信區(qū)間(黑線)的圖。$G2是后驗(yàn)研究敏感性和特異性及其相應(yīng)的95%可信區(qū)間(黑線)的圖。

$G3是后驗(yàn)研究敏感性和特異性及其相應(yīng)的95%可信區(qū)間(黑線)的圖。還給出了研究特異性的靈敏度和特異性(品紅點(diǎn))及其相應(yīng)的95%確切置信區(qū)間(粗灰線)。

如上圖所示,總體平均敏感性和特異性存在“收縮”:后驗(yàn)研究的估計(jì)取決于全局估計(jì),因此也取決于所有其他研究。

接下來(lái),通過(guò)創(chuàng)建如下列表來(lái)準(zhǔn)備數(shù)據(jù)

data塊中,指定了數(shù)據(jù)集中變量的維度和名稱(chēng),此處Ns指數(shù)據(jù)集中的研究數(shù)量。該parameters塊引入了待估計(jì)的未知參數(shù)。etarho;?表示Fisher氏變換的關(guān)聯(lián)參數(shù)的形式的標(biāo)量,mul表示的靈敏度和特異性在分對(duì)數(shù)尺度的平均值為中心的觀察值,其中隨機(jī)效應(yīng)是矢量零。

transformed parameters塊中進(jìn)一步轉(zhuǎn)換參數(shù)。在model塊中定義所有參數(shù)和數(shù)據(jù)似然的先驗(yàn)分布。最后,在generated quantities塊中,loglik是計(jì)算WAIC所需的對(duì)數(shù)似然向量。

接下來(lái),stan調(diào)用函數(shù)將代碼轉(zhuǎn)換為C++,編譯代碼并從后驗(yàn)分布中提取樣本,如下所示

提取參數(shù)估計(jì),并使用以下代碼進(jìn)一步檢查鏈?zhǔn)諗亢妥韵嚓P(guān)

  1. ## Inference for Stan model: 61572683b29d52354783115614fab729.

  2. ## 3 chains, each with iter=5000; warmup=1000; thin=10;

  3. ## post-warmup draws per chain=400, total post-warmup draws=1200.

  4. ##

  5. ## ? ? ? ? ? ? ? mean se_mean ? ? sd ? ?2.5% ? ? 50% ? 97.5% n_eff ? Rhat

  6. ## MU[1] ? ? ? 0.7525 ?0.0018 0.0517 ?0.6323 ?0.7562 ?0.8415 ? 796 0.9999

  7. ## MU[2] ? ? ? 0.7908 ?0.0034 0.1095 ?0.5273 ?0.8094 ?0.9539 ?1045 1.0008

  8. ## mu[1] ? ? ? 0.7668 ?0.0013 0.0388 ?0.6869 ?0.7688 ?0.8369 ? 891 0.9990

  9. ## mu[2] ? ? ? 0.8937 ?0.0027 0.0753 ?0.6943 ?0.9115 ?0.9825 ? 789 0.9992

  10. ## rho ? ? ? ?-0.9311 ?0.0070 0.1353 -0.9996 -0.9813 -0.5626 ? 372 1.0077

  11. ## Sigma[1,1] ?0.3376 ?0.0091 0.2918 ?0.0579 ?0.2554 ?0.9851 ?1026 1.0023

  12. ## Sigma[1,2] -1.2291 ?0.0272 0.8765 -3.4195 -1.0031 -0.2724 ?1040 0.9991

  13. ## Sigma[2,1] -1.2291 ?0.0272 0.8765 -3.4195 -1.0031 -0.2724 ?1040 0.9991

  14. ## Sigma[2,2] ?5.6827 ?0.1282 4.1931 ?1.4720 ?4.6330 16.9031 ?1070 1.0002

  15. ##

  16. ## Samples were drawn using NUTS(diag_e) at Mon Oct 09 09:19:55 2017.

  17. ## For each parameter, n_eff is a crude measure of effective sample size,

  18. ## and Rhat is the potential scale reduction factor on split chains (at

  19. ## convergence, Rhat=1).

所述元分析靈敏度(MU[1])和特異性(MU[2])和95%可信區(qū)間是0.7525[0.6323, 0.8415]0.7908[0.5273, 0.9539]。這與作者以?xún)煞N方式發(fā)表的文章(0.75 [0.66,0.74]和0.86 [0.71,0.94])不同。作者將標(biāo)準(zhǔn)雙變量正態(tài)分布擬合到logit轉(zhuǎn)換的敏感性和特異性值,在研究中允許研究之間的異質(zhì)性,并忽略了更高層次的分層模型。因此,作者必須使用0.5的連續(xù)性校正,因?yàn)榈谄唔?xiàng)研究“觀察”特異性等于1,這是分層模型中沒(méi)有遇到的問(wèn)題。

下圖顯示除了Clayton copula模型之外,大多數(shù)擬合模型的鏈條混合效果令人滿(mǎn)意,幾乎沒(méi)有自相關(guān)。

## Loading required package: lattice## Loading required package: plyr

所有擬合分布估計(jì)的平均靈敏度和特異性如下表所示。

  1. ## Warning: 6 (30.0%) p_waic estimates greater than 0.4.

  2. ## We recommend trying loo() instead.

  1. ## ? ? ? Model ? Parameter ? ? ?Mean ? ? ?Lower ? ?Median ? ? ?Upper ? ?n_eff

  2. ## 1 ?Gaussian Sensitivity ?0.756762 ?6.904e-01 ?0.756036 ?8.166e-01 1196.857

  3. ## 2 ?Gaussian Specificity ?0.798289 ?6.171e-01 ?0.813517 ?9.064e-01 ?704.379

  4. ## 3 ?Gaussian Correlation -0.820176 -9.861e-01 -0.876343 -3.333e-01 ?269.179

  5. ## 4 ?Gaussian ? Var(Sens) ?0.006198 ?8.321e-06 ?0.005047 ?1.947e-02 ?165.705

  6. ## 5 ?Gaussian ? Var(Spec) ?0.048111 ?1.357e-02 ?0.041060 ?1.220e-01 ?169.508

  7. ## 6 ? ? ? C90 Sensitivity ?0.751379 ?6.913e-01 ?0.753546 ?8.098e-01 ? 25.638

  8. ## 7 ? ? ? C90 Specificity ?0.807051 ?6.549e-01 ?0.821119 ?9.069e-01 ?119.897

  9. ## 8 ? ? ? C90 Correlation -0.528340 -9.766e-01 -0.725178 -4.020e-18 ? ?4.111

  10. ## 9 ? ? ? C90 ? Var(Sens) ?0.004885 ?3.400e-04 ?0.003297 ?1.955e-02 ? 11.615

  11. ## 10 ? ? ?C90 ? Var(Spec) ?0.045694 ?1.556e-02 ?0.038049 ?1.020e-01 ?137.149

  12. ## 11 ? ? C270 Sensitivity ?0.757528 ?6.877e-01 ?0.761163 ?8.210e-01 ?273.236

  13. ## 12 ? ? C270 Specificity ?0.803502 ?6.328e-01 ?0.811740 ?9.097e-01 1081.987

  14. ## 13 ? ? C270 Correlation -0.697493 -9.827e-01 -0.808717 -3.332e-06 ? 40.012

  15. ## 14 ? ? C270 ? Var(Sens) ?0.006662 ?2.667e-04 ?0.005293 ?2.027e-02 ?556.055

  16. ## 15 ? ? C270 ? Var(Spec) ?0.044767 ?1.268e-02 ?0.037922 ?1.112e-01 1098.815

  17. ## 16 ? ? ?FGM Sensitivity ?0.759407 ?6.891e-01 ?0.761931 ?8.174e-01 2475.208

  18. ## 17 ? ? ?FGM Specificity ?0.802588 ?6.453e-01 ?0.812498 ?9.045e-01 2293.332

  19. ## 18 ? ? ?FGM correlation -0.174538 -2.222e-01 -0.222221 ?2.222e-01 ?785.016

  20. ## 19 ? ? ?FGM ? Var(Sens) ?0.005390 ?7.425e-07 ?0.004181 ?1.813e-02 1019.633

  21. ## 20 ? ? ?FGM ? Var(Spec) ?0.041890 ?1.177e-02 ?0.036671 ?9.997e-02 2479.371

  22. ## 21 ? ?Frank Sensitivity ?0.756683 ?6.855e-01 ?0.758340 ?8.152e-01 2686.631

  23. ## 22 ? ?Frank Specificity ?0.808239 ?6.472e-01 ?0.818777 ?9.110e-01 1910.561

  24. ## 23 ? ?Frank Correlation -0.706819 -8.550e-01 -0.692019 ?1.000e+00 2700.000

  25. ## 24 ? ?Frank ? Var(Sens) ?0.006678 ?5.896e-04 ?0.005280 ?2.140e-02 2699.766

  26. ## 25 ? ?Frank ? Var(Spec) ?0.042067 ?1.201e-02 ?0.035908 ?1.039e-01 1937.653

  27. ## 26 ? ? BRMA Sensitivity ?0.752531 ?6.323e-01 ?0.756181 ?8.415e-01 ?796.037

  28. ## 27 ? ? BRMA Specificity ?0.790796 ?5.273e-01 ?0.809420 ?9.539e-01 1044.902

  29. ## 28 ? ? BRMA Correlation -0.822353 -9.824e-01 -0.876654 -3.804e-01 ?238.268

  30. ## 29 ? ? BRMA ?Var(lSens) ?0.337556 ?5.792e-02 ?0.255387 ?9.851e-01 1025.609

  31. ## 30 ? ? BRMA ?Var(lSpec) ?5.682692 ?1.472e+00 ?4.632967 ?1.690e+01 1070.481

  32. ## ? ? ?Rhat ?WAIC

  33. ## 1 ?1.0014 91.28

  34. ## 2 ?1.0044 91.28

  35. ## 3 ?1.0154 91.28

  36. ## 4 ?1.0072 91.28

  37. ## 5 ?1.0069 91.28

  38. ## 6 ?1.1047 91.40

  39. ## 7 ?1.0304 91.40

  40. ## 8 ?1.3707 91.40

  41. ## 9 ?1.1005 91.40

  42. ## 10 1.0311 91.40

  43. ## 11 1.0096 90.75

  44. ## 12 1.0001 90.75

  45. ## 13 1.0407 90.75

  46. ## 14 1.0024 90.75

  47. ## 15 0.9999 90.75

  48. ## 16 0.9998 97.37

  49. ## 17 0.9996 97.37

  50. ## 18 1.0070 97.37

  51. ## 19 1.0034 97.37

  52. ## 20 0.9999 97.37

  53. ## 21 0.9994 90.55

  54. ## 22 0.9997 90.55

  55. ## 23 ? ?NaN 90.55

  56. ## 24 0.9990 90.55

  57. ## 25 0.9992 90.55

  58. ## 26 0.9999 86.76

  59. ## 27 1.0008 86.76

  60. ## 28 1.0218 86.76

  61. ## 29 1.0023 86.76

  62. ## 30 1.0002 86.76

結(jié)果以圖形方式呈現(xiàn)如下

模型比較

Table1上面顯示,BRMA模型和高斯copula雙變量β估計(jì)的相關(guān)性更加極端。另一個(gè)極端是來(lái)自模型FGM copula雙變量β的估計(jì),這是由于FGM copula中關(guān)聯(lián)參數(shù)的約束,其中值在| 2/9 |內(nèi)。

在上圖中g1,盡管相關(guān)結(jié)構(gòu)存在差異,但五個(gè)雙變量β分布的邊際平均靈敏度和特異性與95%可信區(qū)間的細(xì)微差異相當(dāng)。

在沒(méi)有估計(jì)困難的情況下,上表顯示了Pearson估計(jì)的相關(guān)性-0.8224[-0.9824, -0.3804]。這是因?yàn)樨惾~斯方法不受樣本量的影響,因此能夠處理具有較少問(wèn)題的小樣本量的情況。

基本上,所有六個(gè)模型在第一級(jí)層次結(jié)構(gòu)中是等價(jià)的,并且在指定“研究特異性”敏感性和特異性的先驗(yàn)分布不同。因此,模型應(yīng)具有相同數(shù)量的參數(shù),在這種情況下,比較預(yù)測(cè)密度是有意義的。在檢查時(shí),來(lái)自五個(gè)基于copula的模型的對(duì)數(shù)預(yù)測(cè)密度實(shí)際上是等效的(min=-38.77, max=-37.89)但是參數(shù)的有效數(shù)量有點(diǎn)不同(min=7.25, max=9.92)。BRMA具有6有效參數(shù),但具有較低的對(duì)數(shù)預(yù)測(cè)密度-43.4。上表的最后一列表明盡管預(yù)測(cè)密度較低,但BRMA是最適合基于WAIC的數(shù)據(jù)。

Meta回歸

ascus數(shù)據(jù)集有Test作為協(xié)變量。使用協(xié)變量是有意義的,以研究其對(duì)敏感性和特異性(包括相關(guān)性)的聯(lián)合分布的影響。以下代碼將基于copula的二元beta二項(xiàng)分布擬合到數(shù)據(jù)ascus數(shù)據(jù)。

?下圖顯示了適用于ascus數(shù)據(jù)的所有六個(gè)模型的跡線圖,其中所有參數(shù)(包括相關(guān)參數(shù)(BRMA除外))都被建模為協(xié)變量的函數(shù)。除了基于Clayton copula的雙變量β的情況外,存在適當(dāng)?shù)逆溁旌虾褪諗俊?/p>

從基于copula的雙變量β分布來(lái)看,很明顯HC2和重復(fù)細(xì)胞學(xué)中的敏感性和特異性之間的相關(guān)性是不同的。

  1. ## Warning: 19 (47.5%) p_waic estimates greater than 0.4.

  2. ## We recommend trying loo() instead.

  1. ## ? ? ? Model Test ? Parameter ? ? Mean ? Lower ? ? Median ? ? ?Upper

  2. ## 9 ?Gaussian ?HC2 Correlation -0.43812 -0.9984 -6.959e-01 ?9.847e-01

  3. ## 10 Gaussian Repc Correlation -0.91991 -0.9997 -9.643e-01 -6.103e-01

  4. ## 23 ? ? ?C90 ?HC2 Correlation -0.06588 -0.7610 -1.039e-17 -7.624e-19

  5. ## 24 ? ? ?C90 Repc Correlation -0.85157 -0.9804 -9.120e-01 -4.906e-01

  6. ## 37 ? ? C270 ?HC2 Correlation -0.03038 -0.6452 -7.000e-18 -1.782e-18

  7. ## 38 ? ? C270 Repc Correlation -0.77847 -0.9757 -7.058e-01 -5.394e-01

  8. ## 51 ? ? ?FGM ?HC2 Correlation -0.07618 -0.2222 -2.215e-01 ?2.222e-01

  9. ## 52 ? ? ?FGM Repc Correlation -0.19819 -0.2222 -2.222e-01 ?1.894e-01

  10. ## 65 ? ?Frank ?HC2 Correlation -0.48806 -0.8140 -4.497e-01 ?1.000e+00

  11. ## 66 ? ?Frank Repc Correlation -0.73784 -0.8627 -7.275e-01 ?1.000e+00

  12. ## 81 ? ? BRMA Both Correlation -0.84808 -0.9839 -8.980e-01 -4.497e-01

  13. ## ? ? ? n_eff ? Rhat ?WAIC

  14. ## 9 ? 154.238 1.0066 236.4

  15. ## 10 ? 24.342 1.0542 236.4

  16. ## 23 ? 30.089 1.0690 235.7

  17. ## 24 ? ?8.532 1.1128 235.7

  18. ## 37 ? 76.410 1.0326 227.5

  19. ## 38 ? ?2.945 1.4613 227.5

  20. ## 51 2422.935 1.0007 245.1

  21. ## 52 2550.145 0.9997 245.1

  22. ## 65 2700.000 ? ?NaN 238.3

  23. ## 66 2700.000 ? ?NaN 238.3

  24. ## 81 ?102.983 1.0254 233.7

Clayton90模型具有最低的WAIC。

因此,這個(gè)例子表明,檢查模型的擬合度和合理性是否充分是至關(guān)重要的,而不是盲目地依賴(lài)信息標(biāo)準(zhǔn)來(lái)選擇最適合數(shù)據(jù)的標(biāo)準(zhǔn)。

從下面繪制的后驗(yàn)相對(duì)敏感性和特異性,所有收斂的模型通常認(rèn)為重復(fù)細(xì)胞學(xué)比HC2敏感性低,而特異性沒(méi)有顯著損失。

討論

基于Copula的模型提供了極大的靈活性和易用性,但它們的使用并非毫不謹(jǐn)慎。雖然本文中使用的copula具有吸引力,因?yàn)樗鼈冊(cè)跀?shù)學(xué)上易于處理,但(Mikosch 2006)和(Genest and Remillard 2006)指出,從數(shù)據(jù)中估算copula可能很困難。此外,copula模型背后的概念稍微復(fù)雜一些,因此需要統(tǒng)計(jì)專(zhuān)業(yè)知識(shí)來(lái)理解和編程它們,因?yàn)樗鼈兩形醋鳛榻y(tǒng)計(jì)軟件中的標(biāo)準(zhǔn)程序/程序。

?

在本文中,簡(jiǎn)要討論了幾種用于診斷準(zhǔn)確性研究的metat分析的先進(jìn)統(tǒng)計(jì)模型。?

在評(píng)估m(xù)eta分析的敏感性和特異性以及相關(guān)性時(shí),模型之間存在一些差異。因此,有必要進(jìn)一步研究以研究某些參數(shù)的影響,例如研究數(shù)量,樣本量和聯(lián)合分布的錯(cuò)誤指定對(duì)meta分析的估計(jì)。

?

結(jié)論

提出的貝葉斯模型使用copula來(lái)構(gòu)建二元β分布,該模型估計(jì)特定研究的敏感性和特異性,具有特定的隨機(jī)效應(yīng)值。

在ASCUS分類(lèi)數(shù)據(jù)中,基于擬合模型的結(jié)論與作者得出的結(jié)論一致:HC2比重復(fù)細(xì)胞學(xué)檢查更敏感但更輕微,并且沒(méi)有明顯低于特異性巴氏涂片診斷宮頸癌前病變的女性。

雖然BRMA對(duì)于兩個(gè)數(shù)據(jù)集都具有最低的WAIC,但我們?nèi)匀唤ㄗh使用雙變量β分布對(duì)靈敏度和特異性進(jìn)行建模,因?yàn)樗鼈兛梢灾苯犹峁﹎eta分析估計(jì)。

?

非常感謝您閱讀本文,有任何問(wèn)題請(qǐng)?jiān)谙旅媪粞裕?/h1>

最受歡迎的見(jiàn)解

1.Python中的Apriori關(guān)聯(lián)算法-市場(chǎng)購(gòu)物籃分析

2.R語(yǔ)言繪制生存曲線估計(jì)|生存分析|如何R作生存曲線圖

3.用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘探索藥物配伍中的規(guī)律

4.通過(guò)Python中的Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘

5.用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘探索藥物配伍中的規(guī)律

6.采用SPSS Modeler的Web復(fù)雜網(wǎng)絡(luò)對(duì)所有腧穴進(jìn)行分析

7.R語(yǔ)言如何在生存分析與COX回歸中計(jì)算IDI,NRI指標(biāo)

8.R語(yǔ)言如何找到患者數(shù)據(jù)中具有差異的指標(biāo)?(PLS—DA分析)

9.R語(yǔ)言中的生存分析Survival analysis晚期肺癌患者4例


R語(yǔ)言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
栾城县| 文昌市| 怀化市| 伊宁县| 安庆市| 景宁| 咸丰县| 张家口市| 石屏县| 鄂州市| 乌审旗| 滕州市| 道孚县| 宜兰县| 临湘市| 华坪县| 烟台市| 大英县| 沧州市| 电白县| 镇巴县| 特克斯县| 牡丹江市| 息烽县| 门头沟区| 鄂托克前旗| 西宁市| 平定县| 久治县| 大荔县| 商水县| 呼伦贝尔市| 上高县| 昌都县| 鹤庆县| 洛扎县| 襄汾县| 太和县| 潮安县| 仁布县| 静海县|