拓端tecdat|R語言復(fù)雜網(wǎng)絡(luò)分析:聚類(社區(qū)檢測)和可視化
原文鏈接:http://tecdat.cn/?p=18770?
原文出處:拓端數(shù)據(jù)部落公眾號
為了用R來處理網(wǎng)絡(luò)數(shù)據(jù),我們使用婚禮數(shù)據(jù)集。
> nflo=network(flo,directed=FALSE)
> plot(nflo, displaylabels = TRUE,
+ boxed.labels =
+ FALSE)

下一步是igraph。由于我們有鄰接矩陣,因此可以使用它
graph_from_adjacency_matrix(flo,
+ mode = "undirected")

我們可以在兩個(gè)特定節(jié)點(diǎn)之間獲得最短路徑。我們給節(jié)點(diǎn)賦予適當(dāng)?shù)念伾?/p>
all_shortest_paths(iflo,
)
> plot(iflo)

我們還可以可視化邊,需要從輸出中提取邊緣
> lins=c(paste(as.character(L)[1:4],
+ "--"
+ as.character(L)[2:5] ?sep="" ,
+ paste(as.character(L) 2:5],
+ "--",
> E(ifl )$color=c("grey","black")[1+EU]
> plot(iflo)

也可以使用D3js可視化
> library( networkD3 )
> simpleNetwork (df)
下一個(gè)問題是向網(wǎng)絡(luò)添加一個(gè)頂點(diǎn)。最簡單的方法是通過鄰接矩陣實(shí)現(xiàn)概率
> flo2["f","v"]=1
> flo2["v","f"]=1

然后,我們進(jìn)行集中度測量。

目的是了解它們之間的關(guān)系。
betweenness(ilo)
> cor(base)
betw close deg eig
betw 1.0000000 0.5763487 0.8333763 0.6737162
close 0.5763487 1.0000000 0.7572778 0.7989789
deg 0.8333763 0.7572778 1.0000000 0.9404647
eig 0.6737162 0.7989789 0.9404647 1.0000000
可以使用層次聚類圖來可視化集中度度量
hclust(dist( ase ?,
+ method="ward")

查看集中度度量的值,查看排名
> for(i in 1:4) rbase[,i]=rank(base[,i])

在此,特征向量測度非常接近頂點(diǎn)的度數(shù)。
最后,尋找聚類(以防這些家庭之間爆發(fā)戰(zhàn)爭)
> kc <- fastgreedy.community ( iflo )
在這里,我們有3類



最受歡迎的見解
1.采用spss-modeler的web復(fù)雜網(wǎng)絡(luò)對所有腧穴進(jìn)行分析
2.用R語言和python進(jìn)行社交網(wǎng)絡(luò)中的社區(qū)檢測
3.R語言文本挖掘NASA數(shù)據(jù)網(wǎng)絡(luò)分析,tf-idf和主題建模
4.在R語言中使用航空公司復(fù)雜網(wǎng)絡(luò)對疫情進(jìn)行建模
5.python隸屬關(guān)系圖模型 基于模型的網(wǎng)絡(luò)中密集重疊社區(qū)檢測
6.使用Python和SAS Viya分析社交網(wǎng)絡(luò)
7.關(guān)聯(lián)網(wǎng)絡(luò)分析:已遷離北京外來人口的數(shù)據(jù)畫像
8.情感語義網(wǎng)絡(luò):游記數(shù)據(jù)感知旅游目的地形象
9.用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘探索藥物配伍中的規(guī)律