最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

R語言k-Shape時間序列聚類方法對股票價格時間序列聚類

2020-11-27 10:23 作者:拓端tecdat  | 我要投稿

原文 :http://tecdat.cn/?p=3726

這次,我們將使用k-Shape時間序列聚類方法檢查與我們有業(yè)務(wù)關(guān)系的公司的股票收益率的時間序列。

?

企業(yè)對企業(yè)交易和股票價格

?
在本研究中,我們將研究具有交易關(guān)系的公司的價格變化率的時間序列的相似性。
由于特定客戶的銷售額與供應(yīng)商公司的銷售額之比較大,當(dāng)客戶公司的股票價格發(fā)生變化時,對供應(yīng)商公司股票價格的反應(yīng)被認(rèn)為更大。?

?k-Shape

k-Shape?[Paparrizos和Gravano,2015]是一種關(guān)注時間序列形狀的時間序列聚類方法。在我們進(jìn)入k-Shape之前,讓我們談?wù)剷r間序列的不變性和常用時間序列之間的距離測度。

?

時間序列距離測度

歐幾里德距離(ED)和動態(tài)時間扭曲(DTW)通常用作距離測量值,用于時間序列之間的比較。

兩個時間序列x =(x1,...,xm)和y =(y1,...,ym)的ED如下。

??

DTW是ED的擴(kuò)展,允許局部和非線性對齊。

??

k-Shape提出稱為基于形狀的距離(SBD)的距離。

k-Shape算法

k-Shape聚類側(cè)重于縮放和移位的不變性。k-Shape有兩個主要特征:基于形狀的距離(SBD)和時間序列形狀提取。

SBD

互相關(guān)是在信號處理領(lǐng)域中經(jīng)常使用的度量。使用FFT(+α)代替DFT來提高計(jì)算效率。

??

歸一化互相關(guān)(系數(shù)歸一化)NCCc是互相關(guān)系列除以單個系列自相關(guān)的幾何平均值。檢測NCCc最大的位置ω。

??

SBD取0到2之間的值,兩個時間序列越接近0就越相似。

形狀提取

通過SBD找到時間序列聚類的質(zhì)心向量 。

??

k-Shape的整個算法如下。

k-Shape通過像k-means這樣的迭代過程為每個時間序列分配簇。

  1. 將每個時間序列與每個聚類的質(zhì)心向量進(jìn)行比較,并將其分配給最近的質(zhì)心向量的聚類

  2. 更新群集質(zhì)心向量

重復(fù)上述步驟1和2,直到集群成員中沒有發(fā)生更改或迭代次數(shù)達(dá)到最大值。

?R 語言k-Shape

?

  1. > start <- "2014-01-01"

  2. > df_7974 %>%

  3. + ? ? filter(date > as.Date(start))

  4. # A tibble: 1,222 x 10

  5. date ? ? ? ?open ?high ? low close ? volume close_adj change rate_of_change ?code


  6. 1 2014-01-06 14000 14330 13920 14320 ?1013000 ? ? 14320 ? ?310 ? ? ? 0.0221 ? ?7974

  7. 2 2014-01-07 14200 14380 14060 14310 ? 887900 ? ? 14310 ? ?-10 ? ? ?-0.000698 ?7974

  8. 3 2014-01-08 14380 16050 14380 15850 ?3030500 ? ? 15850 ? 1540 ? ? ? 0.108 ? ? 7974

  9. 4 2014-01-09 15520 15530 15140 15420 ?1817400 ? ? 15420 ? -430 ? ? ?-0.0271 ? ?7974

  10. 5 2014-01-10 15310 16150 15230 16080 ?2124100 ? ? 16080 ? ?660 ? ? ? 0.0428 ? ?7974

  11. 6 2014-01-14 15410 15755 15370 15500 ?1462200 ? ? 15500 ? -580 ? ? ?-0.0361 ? ?7974

  12. 7 2014-01-15 15750 15880 15265 15360 ?1186800 ? ? 15360 ? -140 ? ? ?-0.00903 ? 7974

  13. 8 2014-01-16 15165 15410 14940 15060 ?1606600 ? ? 15060 ? -300 ? ? ?-0.0195 ? ?7974

  14. 9 2014-01-17 15100 15270 14575 14645 ?1612600 ? ? 14645 ? -415 ? ? ?-0.0276 ? ?7974

  15. 10 2014-01-20 11945 13800 11935 13745 10731500 ? ? 13745 ? -9

?缺失度量用前一個工作日的值補(bǔ)充。(K-Shape允許一些偏差,但以防萬一)

每種股票的股票價格和股票價格變化率。

將zscore作為“preproc”,“sbd”作為距離,以及centroid =“shape”,k-Shape聚類結(jié)果如下。

  1. > df_res %>%

  2. + ? ? arrange(cluster)

  3. cluster centroid_dist code ? ? ? ? ? name

  4. 1 ? ? ? 1 ? ? 0.1897561 1928 ? ? 積水ハウス

  5. 2 ? ? ? 1 ? ? 0.2196533 6479 ミネベアミツミ

  6. 3 ? ? ? 1 ? ? 0.1481051 8411 ? ? ? ? みずほ

  7. 4 ? ? ? 2 ? ? 0.3468301 6658 シライ電子工業(yè)

  8. 5 ? ? ? 2 ? ? 0.2158674 6804 ? ? ? ホシデン

  9. 6 ? ? ? 2 ? ? 0.2372485 7974 ? ? ? ? 任天堂

Nintendo,Hosiden和Siray Electronics Industries被分配到同一個集群。Hosiden在2016年對任天堂的銷售比例為50.5%,這表明公司之間的業(yè)務(wù)關(guān)系也會影響股價的變動。
另一方面,MinebeaMitsumi成為另一個集群,但是在2017年Mitsumi與2017年的Minebea合并, 沒有應(yīng)對2016年7月Pokemon Go發(fā)布時股價飆升的影響 。

?

?如果您有任何疑問,請?jiān)谙旅姘l(fā)表評論。?

最受歡迎的見解

1.R語言k-Shape算法股票價格時間序列聚類

2.R語言中不同類型的聚類方法比較

3.R語言對用電負(fù)荷時間序列數(shù)據(jù)進(jìn)行K-medoids聚類建模和GAM回歸

4.r語言鳶尾花iris數(shù)據(jù)集的層次聚類

5.Python Monte Carlo K-Means聚類實(shí)戰(zhàn)

6.用R進(jìn)行網(wǎng)站評論文本挖掘聚類

7.用于NLP的Python:使用Keras的多標(biāo)簽文本LSTM神經(jīng)網(wǎng)絡(luò)

8.R語言對MNIST數(shù)據(jù)集分析 探索手寫數(shù)字分類數(shù)據(jù)

9.R語言基于Keras的小數(shù)據(jù)集深度學(xué)習(xí)圖像分類


R語言k-Shape時間序列聚類方法對股票價格時間序列聚類的評論 (共 條)

分享到微博請遵守國家法律
东方市| 裕民县| 常宁市| 全州县| 永靖县| 嘉义市| 库尔勒市| 彩票| 江城| 蓝田县| 弥勒县| 师宗县| 县级市| 灯塔市| 山阴县| 天祝| 柳江县| 城口县| 彝良县| 平塘县| 简阳市| 浦县| 茶陵县| 丰原市| 临潭县| 丁青县| 昂仁县| 通河县| 海阳市| 阿拉善盟| 崇礼县| 哈巴河县| 永胜县| 保德县| 丁青县| 扎赉特旗| 陵川县| 沂南县| 行唐县| 达州市| 嘉荫县|