即將發(fā)布的MATLAB聚類工具箱,支持自動尋找最優(yōu)簇數(shù)和可視化、還支持自動生成代碼
MATLAB的機(jī)器學(xué)習(xí)工具箱和深度學(xué)習(xí)工具箱都非常強(qiáng)大,然而官方對于無監(jiān)督學(xué)習(xí)中的聚類遲遲沒有一個很完善的工具箱,于是我開發(fā)了該工具箱,該工具箱不僅能得到聚類結(jié)果,還支持自動生成代碼幫助大家復(fù)現(xiàn)結(jié)果。
借助該工具箱,能夠很方便的使用k-means聚類,工具箱支持一鍵生成肘部圖幫助確定最佳聚類簇數(shù),也能使用使用輪廓系數(shù) 、間隔統(tǒng)計量 、Calinski-Harabasz指數(shù)、Davies-Bouldin指數(shù)這四種內(nèi)部評估方法幫助確定最佳聚類簇數(shù),這些方法的介紹可看這篇文章:MATLAB進(jìn)行聚類時確定簇數(shù)k的四種內(nèi)部評估方法。
MATLAB版本要求:2021a以及更高版本!且需要有統(tǒng)計與機(jī)器學(xué)習(xí)工具箱!Matlab中安裝工具箱的時候的選擇 : https://mp.weixin.qq.com/s/F8NLVMLjs6dbHirBlNeYRg
工具箱主界面如下:

聚類完畢后,工具箱提供了強(qiáng)大的可視化模塊對聚類結(jié)果進(jìn)行可視化,支持以下圖形:
(1)二維散點(diǎn)圖和三維散點(diǎn)圖


(2)聚類區(qū)域圖


(3)平行坐標(biāo)圖


(4)箱線圖


(5)主成分降維后主成分圖


(6)散點(diǎn)圖矩陣


如果你覺得圖形上的指標(biāo)名稱不是自己需要的,你可以一鍵對指標(biāo)名稱進(jìn)行修改:

除了可視化外,還能一鍵計算各個簇中各指標(biāo)的均值、最值、中位數(shù)等統(tǒng)計量:


最后還提供了一個假設(shè)檢驗?zāi)K,能檢驗各指標(biāo)在不同簇上的數(shù)值是否有顯著的差異:

你以為這就完了嗎?
工具箱中所有的操作都能自動在命令行窗口生成相應(yīng)的代碼,復(fù)制這個代碼運(yùn)行后你就能得到和工具箱相同的結(jié)果,聚類、可視化、計算統(tǒng)計量、假設(shè)檢驗都可以?。?!
例如下面就是點(diǎn)擊聚類后自動生成的代碼:

該工具箱目前大部分核心功能已經(jīng)開發(fā)完成了,?到時候會錄制視頻進(jìn)行講解,發(fā)布后第一時間也會放在評論區(qū),歡迎大家持續(xù)關(guān)注。