拓端tecdat|r語言有限正態(tài)混合模型EM算法的分層聚類、分類和密度估計及可視化
原文鏈接:http://tecdat.cn/?p=23825
原文出處:拓端數(shù)據(jù)部落公眾號?
簡介
本文介紹了基于有限正態(tài)混合模型在r軟件中的實現(xiàn),用于基于模型的聚類、分類和密度估計。提供了通過EM算法對具有各種協(xié)方差結(jié)構(gòu)的正態(tài)混合模型進行參數(shù)估計的函數(shù),以及根據(jù)這些模型進行模擬的函數(shù)。此外,還包括將基于模型的分層聚類、混合分布估計的EM和貝葉斯信息準則(BIC)結(jié)合在一起的功能,用于聚類、密度估計和判別分析的綜合策略。其他功能可用于顯示和可視化擬合模型以及聚類、分類和密度估計結(jié)果。
聚類
head(X)
pairs(X)

plot(BIC)

summary(BIC)

summary(mod1, parameters = TRUE)
?

?

plot(mod1)

table(class, classification)
plot(mod1, what = "uncertainty")

clustICL(X)
summary(ICL)

BootstrapLRT(X)
初始化
使用EM算法進行最大似然估計。EM的初始化是使用從聚類層次結(jié)構(gòu)聚類中獲得的分區(qū)來進行的。
hclust(X, use = "SVD"))

clustBIC(X, initialization )) # 默認
?


hc2

clustBIC(X, initialization )
?

hclust(X, model= "EEE"))
?

summary(BIC3)
?

通過合并最佳結(jié)果來更新BIC。
BIC(BIC1, BIC2, BIC3)


使用隨機起點進行單變量擬合,通過創(chuàng)建隨機集聚和合并最佳結(jié)果獲得。
for(j in 1:20)
{
rBIC <- mclustBIC(
initi ))
BIC <- update(BIC, rBIC)
}

clust(ga, BIC)

分類
EDDA
X <- iris[,1:4]
head(X)

clustDA(X, class, ?"EDDA")
plot(mod2)
MclustDA
table(class)
head(X)
clustDA(X, class)
plot(mod3, 2)
?
plot(mod3, 3)
交叉驗證誤差
cv(mod2, nfold = 10)
unlist(cv[3:4])
?
cv(mod3, nf = 10)
?
unlist(cv[3:4])
密度估計
單變量
clust(acid)
?

plot(mod4, "BIC")

plot(mod4, ?"density", acidity)

plot(mod4, "diagnostic", ?"cdf")


多變量
clu(faithful)
summary(mod5)

plot(mod5, "BIC")


plot(mod5, "density",faithful)

Bootstrap推理
summary(boot1, what = "se")
?

?

summary(boot1, what = "ci")
?

?


summary(boot4, what = "se")
plot(boot4)


降維
聚類
plot(mod1dr, ?"pairs")


plot(mod1dr)

plot(mod1dr, "scatterplot")

plot(mod1dr)
分類
summary(mod2dr)
plot(mod2d)
plot(mod2dr)
summary(mod3dr)
plot(mod3dr)
plot(mod3dr)
使用調(diào)色板
大多數(shù)圖形都使用默認的顏色。
調(diào)色板可以定義并分配給上述選項,具體如下。
options("Colors" = Palette )
Pairs(iris[,-5], Species)

如果需要,用戶可以很容易地定義自己的調(diào)色板。
參考文獻
Fraley C. and Raftery A. E. (2002) Model-based clustering, discriminant analysis and density estimation,?Journal of the American Statistical Association, 97/458, pp.?611-631.

最受歡迎的見解
1.R語言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語言泊松Poisson回歸模型分析案例
5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗
6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現(xiàn)
7.在R語言中實現(xiàn)Logistic邏輯回歸
8.python用線性回歸預(yù)測股票價格
9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標