1. 從頭開始,把概率論、統(tǒng)計、信息論中零散的知識統(tǒng)一起來

- 事件與概率
1.0
可能性描述

2.0


3.0





密度就是概率空間里面一個點的權(quán)重值,質(zhì)量就是一個線段或多個線段的權(quán)重值。密度與質(zhì)量與實數(shù)空間中距離相區(qū)分
概率空間就是帶權(quán)重的實數(shù)軸
邊緣概率


由于是壓縮,所以整體質(zhì)量歸一
條件概率


只是原來二維空間一部分,整體質(zhì)量不歸一,需要對權(quán)重進行等比放大

面對P的不同描述方式

概率論部分
博雷爾函數(shù)

用函數(shù)變換的方式可以發(fā)現(xiàn)不同隨機變量之間的關(guān)聯(lián),準確的說是兩個隨機變量代表的概率空間之間的關(guān)系
例如

我們通過X軸的權(quán)重分配情況,可以確定Y軸的權(quán)重分配情況。

所以當(dāng)我們知道了一個隨機變量的P的信息,還知道了一個隨機變量和另外一個隨機變量的變換關(guān)系,也就知道了另一個隨機變量對應(yīng)的P的全部信息了。
例子


換元的本質(zhì),就是坐標(biāo)變換,線性變換中,有旋轉(zhuǎn),圖像的拉伸和壓縮,拉伸和壓縮對密度有影響
雅可比矩陣行列式, 就是在積分換元時對ds和ds’進行拉伸的比例調(diào)整,也就是一個坐標(biāo)變換后面積的拉伸和壓縮的比例,行列式有正負號,也就是方向,我們這里不考慮方向,所以求行列式的絕對值。雅可比矩陣就可看成從XY坐標(biāo)系換成UV坐標(biāo)系的操作,

X,Y獨立,就得到了卷積公式,也就是X+Y=a的概率密度函數(shù)
數(shù)理統(tǒng)計部分

歸納分析包括兩個問題:
1.如何歸納分析出現(xiàn)實問題屬于哪個分布
2.如何歸納分析出具體的參數(shù)取值是多少

首先不是所有的隨機變量都是有期望的,先假設(shè)它是有的 。

通過抽樣樣本構(gòu)建出來,沒有包含任何未知參數(shù)的新隨機變量都稱為統(tǒng)計量,統(tǒng)計量也是隨機變量。統(tǒng)計學(xué)的一個重要工作就是通過統(tǒng)計量取評估樣本遵循的概率分布

最大似然


可以用多個我們熟悉的子概率分布去疊加而成復(fù)雜的概率分布。這里有個關(guān)鍵的概念是我們?nèi)藶閯?chuàng)造出來的隨機變量H是用來拆解原來的概率分布的,可以認為是輔助線,因此H被稱為隱變量。
信息論
離散情況下的熵稱為信息熵,連續(xù)情況下的熵稱為微分熵。
下面熵指信息熵

曲線的位置不同,E(X)的值也就不同。
H(X)中x被替換成log(x),那么就消除了x位置的影響。這樣計算出來的熵,僅僅表示它的形狀特征,而與位置特征沒關(guān)系

log運算把隨機變量之間通常的乘法運算轉(zhuǎn)換成了加法運算,log的底的選取任意。




通過熵,我們就能對一個或多個隨機變量的整體特征進行考慮和分析。