∑(xi-x平均)的平方/ σ2服從卡方分布的證明
我們先來(lái)談?wù)勈裁词强ǚ椒植?所謂卡方分布就是
本質(zhì)就是這n個(gè)自由的獨(dú)立變量都服從N(0 1)正態(tài)分布 那么他們平方和就服從自由度為n的卡方分布 要證明問(wèn)題介紹
我們本質(zhì)要證明兩個(gè)問(wèn)題 一,為什么自由度為n-1 也就是原式為何能寫成n-1個(gè)相互獨(dú)立變量的平方和 因?yàn)槎涡突癁闃?biāo)準(zhǔn)型要求矩陣p可逆所以保證p滿秩也就保證了標(biāo)準(zhǔn)型變量的獨(dú)立性 我們可以用二次型研究這個(gè)問(wèn)題 而實(shí)對(duì)稱矩陣非零特征值個(gè)數(shù)等于矩陣的秩 也就是變量數(shù)目 也就是自由度和維度 我們只需要證明非0特征值個(gè)數(shù)為n-1即可 二 ,為什么服從卡方分布,(為什么期望為0)(為什么方差為1) 期望為0通過(guò)簡(jiǎn)單的系數(shù)加減就能看出用到了公式E(ax+by)=aE(x)+bE(y)(x,y互相獨(dú)立)不過(guò)這里我們才用了化為z的方法z本身每一項(xiàng)期望都是0所以無(wú)論如何組合期望都是0更加簡(jiǎn)單 方差為1用到了D(aX+bY)=a方D(x)+b方D(y)(x,y互相獨(dú)立的前提) 也就只需要證明n-1個(gè)平方項(xiàng)每個(gè)內(nèi)部系數(shù)平方和為1即可 因?yàn)橐阎總€(gè)xi方差都為1 下面我們來(lái)看證明過(guò)程 先是預(yù)處理化為z z服從標(biāo)準(zhǔn)正態(tài)分布
證明思路就是把這個(gè)原式寫成n-1個(gè)自由獨(dú)立變量平方和 且每個(gè)平方內(nèi)部的數(shù)系數(shù)平方和為一(保證方差為一) 系數(shù)和為0(保證期望為0)(化z后已經(jīng)保證了期望為0所以不需要上述操作) N(0 1)正太分布本質(zhì)就是u=0西格瑪平方等于1 也就是期望為0 方差為1的分布 我們用二次型來(lái)研究這個(gè)問(wèn)題
發(fā)現(xiàn)非0特征值全部為1 且有n-1個(gè)1 故可以寫成n-1項(xiàng)平方和這就有力的證明了自由度為(n-1) 然后用施密特正交化和特征向量與特征空間關(guān)系可以證明存在單位正交基構(gòu)成的向量Q(其中Q=p的轉(zhuǎn)置) 用y=Qz可以把二次型z化為標(biāo)準(zhǔn)型(規(guī)范型)y也就是y的平方和 每個(gè)yi都是zi的線性組合且系數(shù)平方和為一(單位正交基的性質(zhì))這樣就完成了證明 我們來(lái)看n=2和n等于3情況下的證明加強(qiáng)這個(gè)原理的理解
最后看下證明過(guò)程中的補(bǔ)充與分析
實(shí)際上我們發(fā)現(xiàn)證明核心就是算出非0特征值有n-1個(gè)而且全為一 一但又一個(gè)不是1這個(gè)結(jié)論就無(wú)法成立了比如假設(shè)我們算的特征值都是2就不服從N(0 1)了而是服從N(0 2) 以下為超級(jí)核心 實(shí)際上本題的核心就是揭秘了二次型非0特征值與方差的關(guān)系 每個(gè)二次型的特征值實(shí)際上對(duì)應(yīng)了這一平方項(xiàng)內(nèi)部變量的方差(由施密特正交化導(dǎo)致單位正交基矩陣Q存在性決定) 本題非0特征值全部為1 所以每一項(xiàng)方差都是1 每一項(xiàng)都服從正太分布 所以總的就服從(n-1)項(xiàng)卡方分布