【讀書筆記】算法漫步 第19章
2023-07-30 23:24 作者:圣斗士-DS-ALGO | 我要投稿
問題16聚類
?
聚類是要將若干對象劃分為幾組,稱每一組為一個類別。
也就是說,聚類本無類,只是根據(jù)對象之間的某種相似性,將它們分組。
?
聚類是一個無監(jiān)督的學(xué)習(xí)過程,其目的就是把相似的數(shù)據(jù)聚合(劃分)到一起。
?
設(shè)計(jì)分類算法的目的就是實(shí)現(xiàn)一個“分類器”。分類器的實(shí)現(xiàn)通常都是基于一批已知類別的數(shù)據(jù),形成某些規(guī)則,來做未知類別對象的類別判斷。
?
為了聚類,對象之間、類之間的相似性(或距離)含義和定義是基礎(chǔ)。
?
如果用計(jì)算機(jī)來做聚類,也涉及距離的定義和計(jì)算。
?
本章介紹了
層次聚類和K-means(K均值)算法
?
?
【作者感受】
計(jì)算機(jī)來做聚類,如何設(shè)定對象的特征標(biāo)準(zhǔn)化和維度,如何根據(jù)對象的特征屬性按照一定的規(guī)則計(jì)算相似性,都是很有挑戰(zhàn)的事情,決定了聚類算法的實(shí)現(xiàn)難度,和聚類結(jié)果有意義的程度。
標(biāo)簽: