最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網 會員登陸 & 注冊

R語言:EM算法和高斯混合模型的實現

2020-12-25 23:24 作者:拓端tecdat  | 我要投稿

原文 :http://tecdat.cn/?p=3433

?

本文我們討論期望最大化理論,應用和評估基于期望最大化的聚類。

軟件包

?

數據

我們將使用mclust軟件包附帶的“糖尿病”數據。

  1. data(diabetes)


  2. summary(diabetes)


  3. ## class glucose insulin sspg## Chemical:36 Min. : 70 Min. : 45.0 Min. : 10.0## Normal :76 1st Qu.: 90 1st Qu.: 352.0 1st Qu.:118.0## Overt :33 Median : 97 Median : 403.0 Median :156.0## Mean :122 Mean : 540.8 Mean :186.1## 3rd Qu.:112 3rd Qu.: 558.0 3rd Qu.:221.0## Max. :353 Max. :1568.0 Max. :748.0

?

?

期望最大化(EM)

期望最大化(EM)算法是用于找到最大似然的或在統(tǒng)計模型參數,其中該模型依賴于未觀察到的潛變量最大后驗(MAP)估計的迭代方法。期望最大化(EM)可能是無監(jiān)督學習最常用的算法。

似然函數

似然函數找到給定數據的最佳模型。

期望最大化(EM)算法

假設我們翻轉硬幣并得到以下內容 - 0,1,1,0,0,1,1,0,0,1。我們可以選擇伯努利分布

或者,如果我們有以厘米為單位的人的身高(男性和女性)的數據。高度遵循正常的分布,但男性(平均)比女性高,因此這表明兩個高斯分布的混合模型。

貝葉斯信息準則(BIC)

以糖尿病數據為例

  1. EM集群與糖尿病數據使用mclust。


  2. log.likelihood:這是BIC值的對數似然值


  3. n:這是X點的數量


  4. df:這是自由度


  5. BIC:這是貝葉斯信息標準; 低是好的


  6. ICL:綜合完整X可能性 - BIC的分類版本。


  7. clPairs(X,class.d)

?

EM的繪圖命令會生成以下四個繪圖:

BIC值用于選擇簇的數量

聚類圖

分類不確定性的圖表

簇的軌道圖

?

參考文獻

1.R語言k-Shape算法股票價格時間序列聚類

2.R語言中不同類型的聚類方法比較

3.R語言對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸

4.r語言鳶尾花iris數據集的層次聚類

5.Python Monte Carlo K-Means聚類實戰(zhàn)

6.用R進行網站評論文本挖掘聚類

7.用于NLP的Python:使用Keras的多標簽文本LSTM神經網絡

8.R語言對MNIST數據集分析 探索手寫數字分類數據

9.R語言基于Keras的小數據集深度學習圖像分類

?


R語言:EM算法和高斯混合模型的實現的評論 (共 條)

分享到微博請遵守國家法律
高淳县| 富源县| 绥阳县| 筠连县| 忻州市| 扶余县| 西平县| 恩施市| 花莲县| 镇巴县| 大丰市| 昆明市| 南溪县| 阿巴嘎旗| 策勒县| 永兴县| 彭阳县| 东乌| 宕昌县| 馆陶县| 锦州市| 沙河市| 福建省| 缙云县| 连南| 崇明县| 沭阳县| 武宣县| 三明市| 远安县| 广元市| 马关县| 桃园市| 长泰县| 海阳市| 东海县| 南昌市| 积石山| 中山市| 高阳县| 张北县|