拓端tecdat|R語言網(wǎng)絡(luò)社區(qū)檢測(cè)(社群發(fā)現(xiàn))分析女性參加社交活動(dòng)和社區(qū)節(jié)點(diǎn)著色可視化
原文鏈接:http://tecdat.cn/?p=24886?
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
在網(wǎng)絡(luò)上進(jìn)行社區(qū)檢測(cè)時(shí),有時(shí)我們不僅擁有實(shí)體之間的聯(lián)系。這些實(shí)體代表了我們可能也想在網(wǎng)絡(luò)可視化中代表的現(xiàn)實(shí)事物。
plot(g)

我使用數(shù)據(jù)集,代表了觀察到的 18 位女性參加 14 場(chǎng)社交活動(dòng)的情況。
不考慮這個(gè)圖是二向圖,讓我們嘗試將圖劃分為社區(qū)。有自然的分界線嗎?讓我們根據(jù)節(jié)點(diǎn)所屬的社區(qū)為節(jié)點(diǎn)著色:
community(g)
col <- membership + 1
plot

正如我們所看到的,該算法找到了2個(gè)社區(qū),乍一看,這種劃分似乎是合理的。無論如何,還有一種自然的劃分是算法無法找到的:事件/女性的二元關(guān)系。每個(gè)節(jié)點(diǎn)都有這樣的屬性:"是女性 "或 "是事件"。讓我們用不同的方式來描述這個(gè)圖的特征。我們有14個(gè)事件。對(duì)于這些,我們改變它們的形狀。?
shape <- "squa"
shape <- "cice"
plot(g)

如何從給定的網(wǎng)絡(luò)中提取社區(qū)?
在網(wǎng)絡(luò)中尋找社區(qū)是復(fù)雜系統(tǒng)范式下的一項(xiàng)常見任務(wù)。有幾種方法可以使用非常不同的包對(duì)圖進(jìn)行社區(qū)分區(qū)。
網(wǎng)絡(luò)社區(qū)檢測(cè)算法
walktrap.community
該算法通過執(zhí)行隨機(jī)游走找到密集連接的子圖。這個(gè)想法是隨機(jī)游走將傾向于留在社區(qū)內(nèi),而不是跳到其他社區(qū)。
邊緣.中間.社區(qū)
這個(gè)算法就是Girvan-Newman算法。它是一種分割算法,在每一步中,具有最高間性的邊被從圖中移除。對(duì)于每一次劃分,你都可以計(jì)算出圖的模塊化程度。最后,在這個(gè)過程給你帶來最高模塊化值的地方選擇切割樹狀圖。
Newman快速算法(fast greedy)
該算法是紐曼算法。在這種情況下,算法是凝聚的。在每一步,兩組合并。合并是通過優(yōu)化模塊化決定的。這是一種快速算法,但有一個(gè)貪婪算法的缺點(diǎn)。因此,雖然我發(fā)現(xiàn)它有用且準(zhǔn)確,但它可能不會(huì)產(chǎn)生最佳的整體社區(qū)劃分。
自旋玻璃社群發(fā)現(xiàn)
該算法使用自旋玻璃模型和模擬退火來查找網(wǎng)絡(luò)內(nèi)的社區(qū)。
# 首先我們加載ipgrah軟件包
# 讓我們生成兩個(gè)網(wǎng)絡(luò)并將其合并為一個(gè)圖。
graph.union
# 讓我們刪除多線和循環(huán)
simplify
# 讓我們用Grivan-Newman算法看看這里是否有社區(qū)。
# Grivan-Newman算法
# 首先,我們計(jì)算邊緣間性、合并等。
edge.betweenness.community
# 現(xiàn)在我們有了合并/拆分,我們需要計(jì)算模塊化。
# 對(duì)于每個(gè)合并,我們將使用一個(gè)函數(shù),對(duì)于每個(gè)邊被刪除,將創(chuàng)建第二個(gè)圖,檢查其成員資格并使用該成員資格來計(jì)算模塊化程度
membership
# -在原圖g上計(jì)算模塊化
modularit
# 我們現(xiàn)在可以繪制所有模塊化的圖
plot
# 現(xiàn)在,讓我們根據(jù)節(jié)點(diǎn)的成員資格為其著色
removed.edges
color=membership
# 讓我們?yōu)閳D選擇一個(gè)布局
layout
# 繪制
plot
# 使用 fastgreedy.community算法
plot


最受歡迎的見解
1.采用spss-modeler的web復(fù)雜網(wǎng)絡(luò)對(duì)所有腧穴進(jìn)行分析
2.用R語言和python進(jìn)行社交網(wǎng)絡(luò)中的社區(qū)檢測(cè)
3.R語言文本挖掘NASA數(shù)據(jù)網(wǎng)絡(luò)分析,tf-idf和主題建模
4.在R語言中使用航空公司復(fù)雜網(wǎng)絡(luò)對(duì)疫情進(jìn)行建模
5.python隸屬關(guān)系圖模型 基于模型的網(wǎng)絡(luò)中密集重疊社區(qū)檢測(cè)
6.使用Python和SAS Viya分析社交網(wǎng)絡(luò)
7.關(guān)聯(lián)網(wǎng)絡(luò)分析:已遷離北京外來人口的數(shù)據(jù)畫像
8.情感語義網(wǎng)絡(luò):游記數(shù)據(jù)感知旅游目的地形象
9.用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘探索藥物配伍中的規(guī)律