IBM SPSS Modeler通過數(shù)據(jù)挖掘我們能從股市數(shù)據(jù)得到什么
原文鏈接:http://tecdat.cn/?p=4838
眾所周知,在證券投資領(lǐng)域?qū)⑸婕昂芏鄶?shù)據(jù),因此,通過簡(jiǎn)單的處理難以有效地分析各種公司股票之間的關(guān)系,而關(guān)聯(lián)規(guī)則挖掘可以很好的解決這個(gè)問題,它允許投資在大量數(shù)據(jù)中,發(fā)現(xiàn)企業(yè)股票的相關(guān)性,以進(jìn)一步研究和分析。是股民的得力助手!
我們從2015年1月至2016年1月收集了香港部分上市公司的股票交易數(shù)據(jù),作為分析主體,探討其間的潛在影響。

?
現(xiàn)在通過關(guān)聯(lián)規(guī)則分析挖掘出,當(dāng)股價(jià)上漲的時(shí)候,另一股票的價(jià)格會(huì)隨著情況而上漲的情況。
首先,股票交易數(shù)據(jù)可視化,觀察股價(jià)之間的關(guān)系。 在IBM SPSS Modeler軟件中,我們使用網(wǎng)絡(luò)圖節(jié)點(diǎn)來分析上市公司股價(jià)上漲的潛在聯(lián)系,并找出其間的強(qiáng)關(guān)聯(lián)規(guī)則。

?
線段的粗細(xì)程度由線段兩端點(diǎn)的股票的價(jià)格同時(shí)上漲的天數(shù)決定,如果線段兩端的股票的價(jià)格同時(shí)上漲的實(shí)際情況的頻數(shù)越大,那么鏈接兩只股票間的線段就越粗。如果線段兩端的股票的價(jià)格同時(shí)上漲的實(shí)際情況的頻數(shù)越小,那么鏈接兩只股票間的線段就越細(xì)。從這一圖中很明顯的可以看出復(fù)興醫(yī)藥和白云山之間有著很強(qiáng)的關(guān)聯(lián)。
提高閾值的網(wǎng)絡(luò)圖

?
得到基于?Apriori?算法的關(guān)聯(lián)規(guī)則的結(jié)果?:
關(guān)聯(lián)規(guī)則結(jié)果

?
第一行規(guī)則表明,?當(dāng)該白云山價(jià)格出現(xiàn)上漲的趨勢(shì)時(shí),股票復(fù)星醫(yī)藥的股價(jià)很可能也會(huì)隨之上漲。原因是在股票的歷史交易數(shù)據(jù)中發(fā)現(xiàn)股票白云山和股票復(fù)星醫(yī)藥?同時(shí)上漲的情況發(fā)生了?130?次,占總事件的?35%,在這些時(shí)候有?100%的時(shí)候股票白云山的價(jià)格也發(fā)生了上漲。
但是預(yù)測(cè)對(duì)了就能掙錢嗎??這個(gè)就不一定。?建立的是一種數(shù)學(xué)或者統(tǒng)計(jì)模型,它能表現(xiàn)出已有數(shù)據(jù)的一些規(guī)律,但是未來的數(shù)據(jù)是否遵循這種規(guī)律,是不一定的。尤其是外在環(huán)境變量太多,甚至有人為因素。風(fēng)險(xiǎn)的控制,資金管理,自我情緒的管理這些都也很重要。技術(shù)大牛們都說系統(tǒng)交易到最后都是對(duì)人性的考驗(yàn)。