手機(jī)站首頁(yè)散文詩(shī)歌雜文隨筆日記小小說(shuō)

散文網(wǎng) » 筆記 »全部筆記 » 圖數(shù)據(jù)管理與挖掘-第三講社區(qū)發(fā)現(xiàn)算法北京大學(xué)2021暑期-鄒磊教授

圖數(shù)據(jù)管理與挖掘-第三講社區(qū)發(fā)現(xiàn)算法北京大學(xué)2021暑期-鄒磊教授

2023-07-05 22:43 作者:好大的一條船 0人讀過(guò) | 我要投稿

PART I: Community Detection Algorithm

社區(qū)發(fā)現(xiàn)算法，本質(zhì)是聚類方法。

一、傳統(tǒng)方法：層次聚類

?

第三講上 P1 - 03:46

?

【先不考慮社區(qū)之間overlapping的情況】

距離的定義：1. 獨(dú)立路徑條數(shù)；2. 加權(quán)平均距離

?

第三講上 P1 - 10:25

?

怎么度量分得好不好？

modularity（模塊化程度？）

社區(qū)內(nèi)有多少條邊-同e同v情況下的隨機(jī)圖上有多少條邊的期望

怎么理解？就是實(shí)際情況邊數(shù)越大越像是個(gè)社區(qū)（

二、中心度和社區(qū)結(jié)構(gòu)

?

第三講上 P1 - 18:54

?

邊的中心度（betweenness）：某條邊所通過(guò)的最短路徑的數(shù)量

連接社區(qū)之間的邊會(huì)有較高的中心度，刪去這些邊得到的子圖就是不錯(cuò)的社區(qū)了

算法巧妙，但是低效率（任何兩點(diǎn)之間的最小路徑實(shí)際上就很耗復(fù)雜度了）

?

第三講上 P1 - 25:09

?

三、Clique Percolation（可重合社區(qū)的發(fā)現(xiàn)）

?

第三講上 P1 - 28:08

?

社區(qū)發(fā)現(xiàn)希望子圖能夠盡可能接近c(diǎn)lique

?

第三講上 P1 - 31:27

?

有可能重復(fù)，引入X(v)集合記錄已經(jīng)考慮過(guò)的結(jié)點(diǎn)

?

第三講上 P1 - 39:44

?

k-clique社區(qū)算法：

找到所有極大團(tuán)
根據(jù)團(tuán)的大小、分享結(jié)點(diǎn)的情況等信息，建立一個(gè)矩陣
根據(jù)k進(jìn)行矩陣轉(zhuǎn)換和壓縮，得到0-1矩陣
得到的獨(dú)立部分就與k-clique社區(qū)等價(jià)

?

第三講上 P1 - 45:50

?

每個(gè)節(jié)點(diǎn)都至少含k個(gè)連接的最大子圖， “剝洋蔥”，去掉degree小的部分

用k-core可以削去原始圖中的非核心部分，從而極大減小圖的規(guī)模，使用k-clique算法后再還原原始圖

?

第三講上 P1 - 48:03

?

遍歷、迭代。

?

第三講上 P1 - 48:60

?

根據(jù)鄰居在哪個(gè)社區(qū)進(jìn)行劃分

===

PART II: Community-Affiliation Graph

該算法基于圖生成模型

?

第三講下 P2 - 00:07

?

圖生成：Model to Network

社區(qū)關(guān)系：Network to Model to Communities

===

PART III: Community Search

?

第三講下 P2 - 29:38

?

第三講下 P2 - 33:18

?

每一步不斷去掉一個(gè)點(diǎn)（考慮當(dāng)前G中degree最小的點(diǎn)），直到：要么

當(dāng)前query nodes set里的節(jié)點(diǎn)已經(jīng)不再連通
意圖刪除的下一個(gè)節(jié)點(diǎn)是query node

此時(shí)得到的G_t并不是所需的結(jié)果。

過(guò)程中得到的各個(gè)G_s中包含Q的強(qiáng)連通分量的有最小度的結(jié)點(diǎn)，其所對(duì)應(yīng)的G_s即為G_{opt}

?

第三講下 P2 - 46:53

?

使得子圖中的每條邊都包含至少(k-2)個(gè)子圖內(nèi)部的三角形的最大子圖

邊的支持度（在多少個(gè)三角形中）

子圖trussness，邊trussness

優(yōu)點(diǎn)：半徑固定，連通性強(qiáng)，參數(shù)少，多項(xiàng)式時(shí)間復(fù)雜度

====

PART IV: Graph Partition

?

第三講下 P2 - 01:04:59

?

可以用來(lái)為超大圖劃分（圖計(jì)算分布式場(chǎng)景下切分任務(wù)）

標(biāo)簽：

圖數(shù)據(jù)管理與挖掘-第三講社區(qū)發(fā)現(xiàn)算法北京大學(xué)2021暑期-鄒磊教授的評(píng)論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩(shī)歌空間日志經(jīng)典語(yǔ)句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

圖數(shù)據(jù)管理與挖掘-第三講社區(qū)發(fā)現(xiàn)算法北京大學(xué)2021暑期-鄒磊教授

圖數(shù)據(jù)管理與挖掘-第三講社區(qū)發(fā)現(xiàn)算法北京大學(xué)2021暑期-鄒磊教授的評(píng)論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

圖數(shù)據(jù)管理與挖掘-第三講 社區(qū)發(fā)現(xiàn)算法 北京大學(xué)2021暑期-鄒磊教授

本文作者的其他文章

圖數(shù)據(jù)管理與挖掘-第三講 社區(qū)發(fā)現(xiàn)算法 北京大學(xué)2021暑期-鄒磊教授的評(píng)論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

圖數(shù)據(jù)管理與挖掘-第三講社區(qū)發(fā)現(xiàn)算法北京大學(xué)2021暑期-鄒磊教授

圖數(shù)據(jù)管理與挖掘-第三講社區(qū)發(fā)現(xiàn)算法北京大學(xué)2021暑期-鄒磊教授的評(píng)論 (共條)