如何用Python對數(shù)據(jù)進行相關性分析

1. 簡介
????????數(shù)據(jù)相關性分析,有助于我們理解數(shù)據(jù)之間的關系。例如,我們在對股票漲跌進行預測時,就需要了解哪個參數(shù)和漲跌是關系密切的,以及哪些參數(shù)是無關緊要的。關系密切的參數(shù),我們要時刻關注,而無關緊要的參數(shù)我們要及時剔除,以免干擾我們的正常分析。
????????在本文中,我們將介紹使用 python 對數(shù)據(jù)進行相關性分析的方法,希望對大家有所幫助。歡迎在評論區(qū)討論和交流。
????????備注:這里默認大家都安裝好 Python 以及相關的工具包了。python 版本號:3.9.5 (tags/v3.9.5:0a7dcbd, May? 3 2021, 17:27:52)
2. 導入相關依賴包
3. 從 CSV 文件讀取數(shù)據(jù)
在對數(shù)據(jù)進行相關性分析之前,我們得先準備好待分析的數(shù)據(jù)。我已經事先將數(shù)據(jù)放到 CVS 文件中了,這里我們只需要將其讀取出來即可。大家根據(jù)自己的情況讀取數(shù)據(jù)。
從下圖代碼的運行結果可以看到,我這批數(shù)據(jù)總共有 20 個參數(shù)(其中 1 個表示股票的實際漲跌,另外19個是用于分析預測漲跌的相關參數(shù))和?6884 條數(shù)據(jù)樣本。

4. 獲取數(shù)據(jù)的相關系數(shù)
前面我們已經把數(shù)據(jù)從文件中讀取出來了,這里直接調用 corr 函數(shù)計算他們之間的相關系數(shù)即可。

5. 對數(shù)據(jù)的相關系數(shù)進行可視化輸出
前面我們獲取到的相關系數(shù),通過文本的形式打印輸出,看著不是很直觀。所以,這里我們可以通過圖像的方式將其進行可視化輸出,以方便我們觀察和分析。

上圖就是我們計算出來的,表示 19 個參數(shù)與股票漲跌之間的相互關系。結論就是:沒啥關系,哈哈。革命尚未成功,同志還需努力。路漫漫其修遠兮,吾將上下而求索。
6. 結語
以上就是使用 python 來對數(shù)據(jù)進行相關性分析的方法了,如果覺得還不錯的話,可以點個贊哦,感謝各位的支持。