最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

機(jī)器學(xué)習(xí)譜聚類詳解

2022-11-24 00:20 作者:021usc  | 我要投稿

完整文檔和代碼

https://gitee.com/youryouth/mc/tree/master/spectral_clustering

完整文檔和代碼
文檔截圖

一、概述

對(duì)于下圖所示的數(shù)據(jù)進(jìn)行聚類,可以采用GMM或者K-Means的方法:

數(shù)據(jù)

然而對(duì)于下圖所示的數(shù)據(jù),單純的GMM和K-Means就無(wú)效了,可以通過(guò)核方法對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,然后再進(jìn)行聚類:


數(shù)據(jù)

如果直接對(duì)上圖所示的數(shù)據(jù)進(jìn)行聚類的話可以考慮采用譜聚類(spectral clustering)的方法。

總結(jié)來(lái)說(shuō),聚類算法可以分為兩種思路:

①Compactness,這類有 K-means,GMM 等,但是這類算法只能處理凸集,為了處理非凸的樣本集,必須引?核技巧。
②Connectivity,這類以譜聚類為代表。

關(guān)于凸集和非凸,如下圖左非凸,圖右凸

非凸和凸集

二、基礎(chǔ)知識(shí)

無(wú)向權(quán)重圖

譜聚類的方法基于帶權(quán)重的無(wú)向圖,圖的每個(gè)節(jié)點(diǎn)是一個(gè)樣本點(diǎn),圖的邊有權(quán)重,權(quán)重代表兩個(gè)樣本點(diǎn)的相似度。

假設(shè)總共N個(gè)樣本點(diǎn),這些樣本點(diǎn)構(gòu)成的圖可以用G%3D(V%2CE)表示,其中V%3D%5C%7Bv_1%2C%20v_2%2C...v_N%5C%7D,圖中的每個(gè)點(diǎn)v_i也就代表了一個(gè)樣本x_iE是邊,用鄰接矩陣(相似度矩陣)W_%7BN%C3%97X%7D來(lái)表示,W%3D%5Bw_%7Bij%7D%5D%2Ci%E2%89%A51%2CN%E2%89%A5j,由于是無(wú)向圖,因此W_%7Bij%7D%20%3D%20W_%7Bji%7D。

另外還有度的概念,這里可以類比有向圖中的出度和入度的概念,不過(guò)圖中的點(diǎn)v_i的度d_i

并不是和該點(diǎn)相連的點(diǎn)的數(shù)量,而是和其相連的邊的權(quán)重之和,也就是鄰接矩陣的每一行的值加起來(lái),即:

d_%7Bi%7D%3D%5Csum_%7Bj%3D1%7D%5E%7BN%7D%20w_%7Bi%20j%7D

而圖的度矩陣(對(duì)角矩陣)D_%7BN%C3%97N%7D可以表示如下:

D%3D%5Cleft%5B%5Cbegin%7Barray%7D%7Bllll%7D%0Ad_%7B1%7D%20%26%20%26%20%5C%5C%0A%26%20d_%7B2%7D%20%26%20%5C%5C%0A%26%20%26%20%5C%5C%0A%26%20%26%20d_%7BN%7D%0A%5Cend%7Barray%7D%5Cright%5D

另外我們定義,對(duì)于點(diǎn)集V的一個(gè)子集A%E2%88%88V,我們定義%7CA%7C等于子集A中點(diǎn)的個(gè)數(shù)

%5Coperatorname%7Bvol%7D(A)%3A%3D%5Csum_%7Bi%20%5Cin%20A%7D%20d_%7Bi%7D

構(gòu)建鄰接矩陣

%5Cepsilon%20-近鄰法

首先需要設(shè)置一個(gè)閾值%5Cepsilon%20,比較任意兩點(diǎn)x_ix_j之間的距離s_%7Bij%7D%3D%7C%7Cx_i-x_j%7C%7C%5E2_%7B2%7D%5Cepsilon%20的大小,定義鄰接矩陣如下:

w_%7Bi%20j%7D%3D%5Cleft%5C%7B%5Cbegin%7Barray%7D%7Bl%7D%0A0%2C%20s_%7Bi%20j%7D%3E%5Cepsilon%20%5C%5C%0A%5Cepsilon%2C%20s_%7Bi%20j%7D%20%5Cleq%20%5Cepsilon%0A%5Cend%7Barray%7D%5Cright.

這種方法表示如果兩個(gè)樣本點(diǎn)之間的歐氏距離的平方小于閾值%5Cepsilon%20,則它們之間是有邊的。

因?yàn)椴恢С謒arkdown語(yǔ)法,關(guān)于其他構(gòu)建鄰接矩陣方法可以參考鏈接,下面只貼出代碼的運(yùn)行結(jié)果。


運(yùn)行結(jié)果

運(yùn)行結(jié)果對(duì)比


機(jī)器學(xué)習(xí)譜聚類詳解的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
镇沅| 赤城县| 东明县| 会昌县| 噶尔县| 云南省| 当阳市| 哈密市| 宜阳县| 金湖县| 收藏| 蒲城县| 东丽区| 延庆县| 哈巴河县| 南投市| 常熟市| 黔西县| 株洲县| 金堂县| 三门县| 正镶白旗| 太仆寺旗| 七台河市| 高尔夫| 固始县| 卢龙县| 勐海县| 兴安盟| 海门市| 永新县| 阆中市| 来安县| 开平市| 淳化县| 河北省| 松桃| 富锦市| 涪陵区| 巴林左旗| 临朐县|