最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

Python用KShape對時間序列進行聚類和肘方法確定最優(yōu)聚類數(shù)k可視化

2022-07-03 10:31 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=27078?

原文出處:拓端數(shù)據(jù)部落公眾號

?【視頻】KMEANS均值聚類和層次聚類:R語言分析生活幸福質(zhì)量系數(shù)可視化實例

KMEANS均值聚類和層次聚類:R語言分析生活幸福質(zhì)量系數(shù)可視化實例

,時長06:05

時序數(shù)據(jù)的聚類方法

該算法按照以下流程執(zhí)行。

  1. 使用基于互相關(guān)測量的距離標度(基于形狀的距離:SBD)

  2. 根據(jù) 1 計算時間序列聚類的質(zhì)心。(一種新的基于質(zhì)心的聚類算法,可保留時間序列的形狀)

  3. 劃分成每個簇的方法和一般的kmeans一樣,但是在計算距離尺度和重心的時候使用上面的1和2。

import pandas as pd

  1. # 讀取數(shù)據(jù)幀,將其轉(zhuǎn)化為時間序列數(shù)組,并將其存儲在一個列表中

  2. tata = []

  3. for i, df in enmee(dfs):


  4. # 檢查每個時間序列數(shù)據(jù)的最大長度。

  5. for ts in tsda:

  6. if len(s) > ln_a:

  7. lenmx = len(ts)


  8. # 給出最后一個數(shù)據(jù),以調(diào)整時間序列數(shù)據(jù)的長度

  9. for i, ts in enumerate(tsdata):

  10. dta[i] = ts + [ts[-1]] * n_dd




  11. # 轉(zhuǎn)換為矢量

  12. stack_list = []

  13. for j in range(len(timeseries_dataset)):


  14. stack_list.append(data)


  15. # 轉(zhuǎn)換為一維數(shù)組

  16. trasfome_daa = np.stack(ack_ist, axis=0)

  17. return trafoed_data

數(shù)據(jù)集準備

  1. # 文件列表

  2. flnes= soted(go.ob('mpldat/smeda*.csv'))

  1. # 從文件中加載數(shù)據(jù)幀并將其存儲在一個列表中。

  2. for ienme in fiemes:

  3. df = pd.read_csv(filnme, indx_cl=one,hadr=0)

  4. flt.append(df)

聚類結(jié)果的可視化

  1. # 為了計算交叉關(guān)系,需要對它們進行歸一化處理。

  2. # TimeSeriesScalerMeanVariance將是對數(shù)據(jù)進行規(guī)范化的類。

  3. sac_da = TimeeiesalerMVarne(mu=0.0, std=1.0).fit_trnform(tranfome_data)


  4. # KShape類的實例化。

  5. ks = KShpe(_clusrs=2, n_nit=10, vrboe=True, rano_stte=sed)

  6. yprd = ks.ft_reitsak_ata)

  7. # 聚類和可視化


  8. plt.tight_layout()

  9. plt.show()

用肘法計算簇數(shù)

  • 什么是肘法...

    • 計算從每個點到簇中心的距離的平方和,指定為簇內(nèi)誤差平方和 (SSE)。

    • 它是一種更改簇數(shù),繪制每個 SSE 值,并將像“肘”一樣彎曲的點設(shè)置為最佳簇數(shù)的方法。


  1. #計算到1~10個群組

  2. for i ?in range(1,11):

  3. #進行聚類計算。

  4. ks.fit(sacdta)

  5. #KS.fit給出KS.inrta_

  6. disorons.append(ks.netia_)


  7. plt.plot(range(1,11), disorins, marker='o')

最受歡迎的見解

1.R語言k-Shape算法股票價格時間序列聚類

2.R語言中不同類型的聚類方法比較

3.R語言對用電負荷時間序列數(shù)據(jù)進行K-medoids聚類建模和GAM回歸

4.r語言鳶尾花iris數(shù)據(jù)集的層次聚類

5.Python Monte Carlo K-Means聚類實戰(zhàn)

6.用R進行網(wǎng)站評論文本挖掘聚類

7.用于NLP的Python:使用Keras的多標簽文本LSTM神經(jīng)網(wǎng)絡(luò)

8.R語言對MNIST數(shù)據(jù)集分析 探索手寫數(shù)字分類數(shù)據(jù)

9.R語言基于Keras的小數(shù)據(jù)集深度學習圖像分類


Python用KShape對時間序列進行聚類和肘方法確定最優(yōu)聚類數(shù)k可視化的評論 (共 條)

分享到微博請遵守國家法律
高碑店市| 溧水县| 梁山县| 托克托县| 积石山| 高平市| 五寨县| 平顺县| 维西| 永善县| 仪陇县| 湘乡市| 安福县| 定州市| 黄陵县| 醴陵市| 富锦市| 东乡族自治县| 平和县| 天祝| 无极县| 阳东县| 凤阳县| 岳池县| 定陶县| 于田县| 临高县| 阿尔山市| 张掖市| 绩溪县| 澄城县| 五常市| 安乡县| 靖州| 砀山县| 叙永县| 贡山| 乌拉特后旗| 新田县| 北川| 扎赉特旗|