統(tǒng)計(jì):如何理解殘差與誤差?

????線性回歸因變量的觀測值是樣本真實(shí)數(shù)據(jù),估計(jì)值是回歸模型估計(jì)出來的預(yù)測值,二者的差別稱為殘差。誤差項(xiàng)表示對因變量而言,模型自變量無法解釋的部分,通常假定誤差服從均值為0的分布。???
????注意:殘差與誤差項(xiàng)不同,殘差是針對樣本真實(shí)數(shù)據(jù)而言,可以視為對總體模型中誤差項(xiàng)的估計(jì)。????
????殘差越小,說明擬合的回歸模型越好,模型的預(yù)測值更加貼近實(shí)際值。
????雖然我們可能會更關(guān)心回歸系數(shù)的大小,但實(shí)際上殘差能告訴我們這些系數(shù)的估計(jì)值是否可靠,而這一點(diǎn)更為重要,回歸系數(shù)無論表現(xiàn)多好,如果其不能穩(wěn)定可靠,我們的計(jì)算和預(yù)測是沒有意義的。
????因此,在數(shù)據(jù)分析中一定要學(xué)會觀察殘差圖,任何模型擬合的問題基本上都能在殘差圖中體現(xiàn)出來。
????一條對數(shù)據(jù)點(diǎn)擬合較好的回歸線必然穿過所有數(shù)據(jù)點(diǎn)的中央,所有的點(diǎn)圍繞這條線隨機(jī)波動,反映在殘差中就應(yīng)該是圍繞0隨機(jī)波動,不應(yīng)該有任何趨勢。如果殘差能看出趨勢,則說明模型擬合肯定有問題。

標(biāo)簽:衛(wèi)生統(tǒng)計(jì)學(xué)