[吃瓜筆記](méi)第9章
第9章 聚類(lèi)學(xué)習(xí)
聚類(lèi)是無(wú)監(jiān)督學(xué)習(xí)的代表。
9.1 聚類(lèi)任務(wù)
略。
9.2 性能度量
性能度量又稱(chēng)“有效性指標(biāo)”。
有效性指標(biāo)大致分為兩類(lèi):
外部指標(biāo):與參考模型進(jìn)行比較,常用的有Jaccard系數(shù)、FM指數(shù)、Rand指數(shù)。
內(nèi)部指標(biāo):直接考察聚類(lèi)結(jié)果,常用的有DB指數(shù)、Dunn指數(shù)
9.3 距離計(jì)算
距離度量函數(shù)需要滿足的基本性質(zhì):
非負(fù)性;
同一性;
對(duì)稱(chēng)性;
直遞性。
常用的度量距離有閔可夫斯基距離、歐式距離和曼哈頓距離。
上述的三個(gè)距離都屬于“有序距離”。對(duì)于無(wú)序距離,可以采用VDM。
9.4 原型聚類(lèi)
k均值算法:隨機(jī)選初始點(diǎn),然后看不同樣本點(diǎn)離哪個(gè)初始點(diǎn)最近,來(lái)劃分簇。不斷迭代??梢栽O(shè)置迭代次數(shù)或最小調(diào)整閾值。
9.5 密度聚類(lèi)
有以下幾個(gè)概念:
-鄰域
核心對(duì)象
密度直達(dá)
密度可達(dá)
密度相連

9.6 層次聚類(lèi)
層次聚類(lèi)是自底而上的。從多的往少的方向合并。
AGNES就是一種層次聚類(lèi)算法。