學數(shù)據(jù)分析要懂哪些統(tǒng)計學知識?這份思維導圖請收好!
來? 源:數(shù)據(jù)分析不是個事兒
哈嘍,小伙伴們!
元旦小長假結(jié)束了,
我們收收心,開始學習啦!
努力實現(xiàn)2022年新立的flag
每次在寫數(shù)據(jù)分析必學知識時,我都會提到,對于數(shù)據(jù)分析師來說,我們是必須學習統(tǒng)計學知識的,畢竟天天跟數(shù)據(jù)打交道,總不能連最基礎(chǔ)的統(tǒng)計學知識都不會吧?
舉個例子,數(shù)據(jù)分析,你如果連最起碼的置信區(qū)間都不懂,你還怎么處理數(shù)據(jù)?如果統(tǒng)計學中最基本、核心的思想:用樣本估計總體,你都沒概念,就別說自己會數(shù)據(jù)分析了。

但多數(shù)人在學習統(tǒng)計學知識時會無比頭疼,因為統(tǒng)計學的書籍里幾乎都是復雜的推理公式,讓人難以理解。其實,對于大部分數(shù)據(jù)分析師來說,我們并不需要掌握的那么細。
因此,我整理了一些你需要掌握的統(tǒng)計學知識,把統(tǒng)計學知識展開了說,讓大家大致了解有哪幾個模塊知識,然后跟著這些模塊知識去學習。
一、概率與概率分布
先要明確,統(tǒng)計學不研究統(tǒng)計,它研究的是不確定性!而不確定性事件唯一的量化標準就是概率,獨立隨機事件沒法通過概率來預判何時發(fā)生,但卻可以用概率來描述事件發(fā)生的可能性。
這一模塊主要掌握:
隨機事件的概率
離散隨機變量
連續(xù)隨機變量的概率分布

二、數(shù)據(jù)的概括性度量
在數(shù)據(jù)人的實際工作中,你會經(jīng)常遇到這種情況:業(yè)務人員/老板拿到一坨數(shù)據(jù),丟在你面前,讓你分析。這時,大多數(shù)人會不知所措,不知道從哪一步開始整理這些數(shù)據(jù)。這個時候,就需要通過概括性的度量指標,來幫我們從宏觀上把握數(shù)據(jù)中的初步信息。
這一模塊主要掌握
集中趨勢的度量
離散程度的度量
分布形態(tài)的度量

三、回歸分析
回歸分析,因為它的易懂性,也因為它的實用性,但隨著自己數(shù)據(jù)分析經(jīng)驗的積累,對回歸分析的理解也越來越深,它不是簡單的回歸模型求解那么簡單,它更是一種日常工作中解決問題的思路和方法論。
這一模塊主要掌握
相關(guān)系數(shù)
回歸分析
最小二乘法
顯著性檢驗

四、統(tǒng)計量及其抽樣分布
抽樣,就是從研究的總體中抽取一部分個體作為我們真正的研究對象,稱為樣本,最后通過樣本的結(jié)果來推測總體情況。
這一模塊主要掌握
統(tǒng)計量的基本概念
常用統(tǒng)計量
正態(tài)分布

五、參數(shù)估計
參數(shù)估計,顧名思義就是對參數(shù)進行估計,那什么是參數(shù)呢?就是你假設(shè)分布的參數(shù),也就是說你知道某個隨機過程服從什么分布,但是不確定他的參數(shù)是什么,那怎么辦?你采樣,然后通過這些樣本的值,去估計分布的參數(shù)就是參數(shù)估計。
這一章節(jié),需要大家掌握幾個核心概念:
參數(shù)
點估計
區(qū)間估計

-END-
除了上文中的思維導圖
愛數(shù)據(jù)還準備了一份更加完整、全面的
統(tǒng)計學知識高清思維導圖(共17張)
掃描/識別下方二維碼
回復【統(tǒng)計17】即可領(lǐng)取~
(有關(guān)數(shù)據(jù)分析相關(guān)課程也可咨詢哦)
