拓端tecdat|Python實(shí)現(xiàn)譜聚類Spectral Clustering算法和改變簇?cái)?shù)結(jié)果可視化比較
原文鏈接:http://tecdat.cn/?p=24842?
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
譜聚類是一種將數(shù)據(jù)的相似矩陣的譜應(yīng)用于降維的技術(shù)。它是有用且易于實(shí)現(xiàn)的聚類方法。??
Scikit-learn?API 提供了 譜聚類來實(shí)現(xiàn) Python 中的譜聚類方法。譜聚類 將聚類應(yīng)用于歸一化拉普拉斯算子的投影。在本教程中,我們將簡要了解如何在 Python 中使用 譜聚類 對(duì)數(shù)據(jù)進(jìn)行聚類和可視化。教程涵蓋:
準(zhǔn)備數(shù)據(jù)
使用 譜聚類 和可視化進(jìn)行聚類
源代碼
我們將首先導(dǎo)入所需的庫和函數(shù)。
from numpy import random
準(zhǔn)備數(shù)據(jù)
我們將通過使用 make_blob() 函數(shù)生成一個(gè)簡單的數(shù)據(jù)集并在圖中將其可視化。
random.seed
make_blobs
plt
plt.show

這是一個(gè)易于理解的數(shù)據(jù),因此我們將使用譜聚類方法對(duì)其進(jìn)行聚類。
譜聚類和可視化
我們將使用 譜聚類定義模型,然后我們將它擬合到 x 數(shù)據(jù)上。譜聚類需要聚類的數(shù)量,因此將 4 設(shè)置為 n_cluster 參數(shù)。您可以檢查類的參數(shù)并根據(jù)您的分析和目標(biāo)數(shù)據(jù)更改它們。
SptlCltg.fit(x)
SelCg( n_clusters=4)?
接下來,我們將在圖中可視化聚類數(shù)據(jù)。為了按顏色區(qū)分聚類,我們將從擬合模型中提取標(biāo)簽數(shù)據(jù)。
labels = sc.labels_
plt.scatter(x[:,0], x[:,1], c=labels)
plt.show()??

我們還可以通過改變簇?cái)?shù)來檢查聚類結(jié)果。
plt
f.add_subplot
for i in range:
sc = Serurg.fit
f.add_subplot
plt.scatter
plt.legen
plt.show

在本教程中,我們簡要了解了如何使用 Python 中對(duì)數(shù)據(jù)進(jìn)行聚類和可視化。

最受歡迎的見解
1.R語言k-Shape算法股票價(jià)格時(shí)間序列聚類
2.R語言中不同類型的聚類方法比較
3.R語言對(duì)用電負(fù)荷時(shí)間序列數(shù)據(jù)進(jìn)行K-medoids聚類建模和GAM回歸
4.r語言鳶尾花iris數(shù)據(jù)集的層次聚類
5.Python Monte Carlo K-Means聚類實(shí)戰(zhàn)
6.用R進(jìn)行網(wǎng)站評(píng)論文本挖掘聚類
7.用于NLP的Python:使用Keras的多標(biāo)簽文本LSTM神經(jīng)網(wǎng)絡(luò)
8.R語言對(duì)MNIST數(shù)據(jù)集分析 探索手寫數(shù)字分類數(shù)據(jù)
9.R語言基于Keras的小數(shù)據(jù)集深度學(xué)習(xí)圖像分類