ApacheCN 機(jī)器學(xué)習(xí)實(shí)戰(zhàn)講義 十、K-Means
2018-05-02 07:03 作者:絕不原創(chuàng)的飛龍 | 我要投稿

K-Means 算法
聚類是一種無監(jiān)督的學(xué)習(xí), 它將相似的對(duì)象歸到一個(gè)簇中, 將不相似對(duì)象歸到不同簇中.
相似這一概念取決于所選擇的相似度計(jì)算方法.
K-Means 是發(fā)現(xiàn)給定數(shù)據(jù)集的 K 個(gè)簇的聚類算法, 之所以稱之為 K-均值
是因?yàn)樗梢园l(fā)現(xiàn) K 個(gè)不同的簇, 且每個(gè)簇的中心采用簇中所含值的均值計(jì)算而成.
簇個(gè)數(shù) K 是用戶指定的, 每一個(gè)簇通過其質(zhì)心(centroid), 即簇中所有點(diǎn)的中心來描述.
聚類與分類算法的最大區(qū)別在于, 分類的目標(biāo)類別已知, 而聚類的目標(biāo)類別是未知的.
優(yōu)點(diǎn): 容易實(shí)現(xiàn)
缺點(diǎn):可能收斂到局部最小值, 在大規(guī)模數(shù)據(jù)集上收斂較慢
使用數(shù)據(jù)類型 : 數(shù)值型數(shù)據(jù)
閱讀全文:http://ml.apachecn.org/mlia/kmeans/
標(biāo)簽: