拉勾數據分析私教班學習筆記
數理統(tǒng)計基礎:
抽樣估計基礎 ——?隨機事件
隨機現象:重復性、明確性、隨機性,需要大量的重復的隨機實驗。
樣本空間(Ω):隨機現象的一切可能的組合的集合。
隨機事件:樣本空間的一個子集,也就是在樣本空間里滿足一些前提的某些結果的集合。
隨機事件的概率
是隨機事件出現的可能性的度量。
事件A的概率是P(A),事件A與B同時發(fā)生的概率是P(AB)。
條件概率:在事件B已發(fā)生的條件下,事件A發(fā)生的概率P(A│B)=P(AB)/P(B)。
在條件概率中,隨著條件的增加,事件A的條件概率也在增加。
相互獨立事件:P(A)=P(A│B)即說明A關于B是獨立的。
概念延伸:有回放抽樣(獨立),無回放抽樣(非獨立)。
?隨機變量及其概率分布
隨機變量(大寫字母):表示隨機現象結果的變量。
常見的做法是把刻畫試驗結果的數值直接定義成隨機變量的取值,例如壽命、產量、次數等。
離散型隨機變量、連續(xù)型隨機變量
隨機變量的概率分布:知道了隨機變量所有值的可能性(分布),就找到了隨機試驗的規(guī)律性。
離散隨機變量的分布:每一個取值的概率在0與1之間,所有取值的概率之和是1。
連續(xù)隨機變量的分布:用概率密度函數來表示;可以從直方圖做出概率密度曲線(縱軸會由頻率變成概率)。
概率密度曲線與x軸所夾面積為1,求隨機事件的概率變成求某個區(qū)間關于概率密度曲線的積分。
隨機變量的數學特征
隨機變量的數學期望:變量值按概率的加權平均,也就是所有變量值乘以對應的概率再全部相加。
表示為E(X)
隨機變量的數學期望表征的是概率分布的中心位置。
方差Var(X)大,隨機變量的取值分布寬;方差小,取值分布窄。
方差的平方根是標準差STD。
對于相互獨立的隨機變量,方差可相加,標準差不能相加。
標簽: