R語(yǔ)言混合圖形模型MGM的網(wǎng)絡(luò)可預(yù)測(cè)性分析
原文鏈接:http://tecdat.cn/?p=18279
?
網(wǎng)絡(luò)模型已經(jīng)成為抽象復(fù)雜系統(tǒng),是深入了解許多科學(xué)領(lǐng)域中觀測(cè)變量之間的關(guān)系模式的流行方法。這些應(yīng)用程序大多數(shù)集中于分析網(wǎng)絡(luò)的結(jié)構(gòu)。但是,如果不是直接觀察網(wǎng)絡(luò),而是根據(jù)數(shù)據(jù)進(jìn)行估算(如:吸煙與癌癥之間存在關(guān)聯(lián)),則除了網(wǎng)絡(luò)結(jié)構(gòu)外,我們還可以分析網(wǎng)絡(luò)中節(jié)點(diǎn)的可預(yù)測(cè)性。也就是說(shuō):網(wǎng)絡(luò)中的所有其余節(jié)點(diǎn)如何預(yù)測(cè)網(wǎng)絡(luò)中的給定節(jié)點(diǎn)?
可預(yù)測(cè)性有趣,有幾個(gè)原因:
它給我們提供了一個(gè)關(guān)于邊的實(shí)用性的想法:如果節(jié)點(diǎn)A連接到許多其他節(jié)點(diǎn),但是這些僅說(shuō)明(假設(shè))其方差的1%,那么邊的連接會(huì)是怎樣的?
它告訴我們網(wǎng)絡(luò)的不同部分在多大程度上是由網(wǎng)絡(luò)中的其他因素決定的
在此博文中,我們使用R-估計(jì)網(wǎng)絡(luò)模型并計(jì)算地震災(zāi)民數(shù)據(jù)集上的創(chuàng)傷后應(yīng)激障礙(PTSD)癥狀。我們對(duì)網(wǎng)絡(luò)模型和可預(yù)測(cè)性進(jìn)行可視化,并討論如何將網(wǎng)絡(luò)模型和節(jié)點(diǎn)的可預(yù)測(cè)性相結(jié)合來(lái)設(shè)計(jì)癥狀網(wǎng)絡(luò)的有效干預(yù)措施。
載入資料
我們加載提供的數(shù)據(jù):
data <- as.matrix(data)
p <- ncol(data)
dim(data)
## [1] 312 ?17
數(shù)據(jù)集包含對(duì)344人的17種PTSD癥狀的完整反應(yīng)。癥狀強(qiáng)度的答案類別范圍從1“沒(méi)有”到5“非常強(qiáng)”。?
估計(jì)網(wǎng)絡(luò)模型
我們估計(jì)了混合圖形模型,其中我們將所有變量都視為連續(xù)高斯變量。因此,我們將所有變量的類型設(shè)置為,type = 'g'
并將每個(gè)變量的類別數(shù)設(shè)置為1:
fit_obj <- (data = data,
type = rep('g', p),
level = rep(1, p),
lambdaSel = 'CV',
ruleReg = 'OR',
pbar = FALSE)
計(jì)算節(jié)點(diǎn)的可預(yù)測(cè)性
估計(jì)網(wǎng)絡(luò)模型后,我們準(zhǔn)備計(jì)算每個(gè)節(jié)點(diǎn)的可預(yù)測(cè)性。由于可以通過(guò)依次獲取每個(gè)節(jié)點(diǎn)并對(duì)其上的所有其他節(jié)點(diǎn)進(jìn)行回歸來(lái)估計(jì)該圖,因此可以輕松地計(jì)算節(jié)點(diǎn)的可預(yù)測(cè)性)。作為可預(yù)測(cè)性的度量,我們選擇解釋的方差的比例:0表示當(dāng)前節(jié)點(diǎn)根本沒(méi)有被節(jié)點(diǎn)中的其他節(jié)點(diǎn)解釋,1表示完美的預(yù)測(cè)。我們?cè)诠浪阒皩⑺凶兞恐行幕韵鼐嗟挠绊憽?/p>
有關(guān)如何計(jì)算預(yù)測(cè)和選擇可預(yù)測(cè)性度量的詳細(xì)說(shuō)明,請(qǐng)查看本文。如果網(wǎng)絡(luò)中還有其他變量類型(例如分類),我們可以為這些變量選擇適當(dāng)?shù)亩攘俊?/p>
pred_obj <- predict(object = fit_obj,
data = data
pred_obj$error
## ? ? Variable ? ?R2
## 1 ?intrusion 0.639
## 2 ? ? dreams 0.661
## 3 ? ? ?flash 0.601
## 4 ? ? ?upset 0.636
## 5 ? ?physior 0.627
## 6 ? ?avoidth 0.686
## 7 ? avoidact 0.681
## 8 ? ?amnesia 0.410
## 9 ? ?lossint 0.520
## 10 ? distant 0.498
## 11 ? ? ?numb 0.451
## 12 ? ?future 0.540
## 13 ? ? sleep 0.565
## 14 ? ? anger 0.562
## 15 ? ?concen 0.638
## 16 ? ? hyper 0.676
## 17 ? startle 0.626
我們計(jì)算了網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的解釋方差(R2)的百分比。接下來(lái),我們將估計(jì)的網(wǎng)絡(luò)可視化,并討論與解釋方差有關(guān)的結(jié)構(gòu)。
可視化網(wǎng)絡(luò)和可預(yù)測(cè)性
我們根據(jù)估計(jì)的加權(quán)鄰接矩陣和節(jié)點(diǎn)的可預(yù)測(cè)性度量作為參數(shù),進(jìn)行網(wǎng)絡(luò)可視化:
graph(fit_obj$pairwise$wadj, # 加權(quán)鄰接矩陣作為輸入
layout = 'spring',
pie = pred_obj$error[,2], # 誤差作為餅圖的輸入

?
有關(guān)早期研究不同心理障礙癥狀可預(yù)測(cè)性的文章,請(qǐng)參見(jiàn)本文。

最受歡迎的見(jiàn)解
1.采用spss-modeler的web復(fù)雜網(wǎng)絡(luò)對(duì)所有腧穴進(jìn)行分析
2.用R語(yǔ)言和python進(jìn)行社交網(wǎng)絡(luò)中的社區(qū)檢測(cè)
3.R語(yǔ)言文本挖掘NASA數(shù)據(jù)網(wǎng)絡(luò)分析,tf-idf和主題建模
4.在R語(yǔ)言中使用航空公司復(fù)雜網(wǎng)絡(luò)對(duì)疫情進(jìn)行建模
5.python隸屬關(guān)系圖模型 基于模型的網(wǎng)絡(luò)中密集重疊社區(qū)檢測(cè)
6.使用Python和SAS Viya分析社交網(wǎng)絡(luò)
7.關(guān)聯(lián)網(wǎng)絡(luò)分析:已遷離北京外來(lái)人口的數(shù)據(jù)畫像
8.情感語(yǔ)義網(wǎng)絡(luò):游記數(shù)據(jù)感知旅游目的地形象
9.用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘探索藥物配伍中的規(guī)律