精益六西格瑪--什么是向前選擇法?
如果說Minitab是武功,那統(tǒng)計學(xué)和數(shù)學(xué)基礎(chǔ)就是心法。
光練武功不行,就像PPT,EXCEL 各種制圖軟件每個選項的功能都知道了,但你作出漂亮的報表,作出優(yōu)美的作品嗎?
Minitab每個步驟都知道怎么操作了?
但分析出來結(jié)果了,你知道要看哪些信息嗎?這些信息含義是什么嗎?這些信息代表的含義是什么嗎?為什么要看這些信息嗎?
所以光學(xué)武功,或者光學(xué)心法都不行。

這就讓我想起當時大學(xué)學(xué)計算機各種課程,什么計算機結(jié)構(gòu),網(wǎng)絡(luò),算法與結(jié)構(gòu),數(shù)據(jù)庫,寫了幾年C語言。
最后還是啥都干不了,最后連一個網(wǎng)頁也做不了。
但最近幾年有學(xué)了很多編程語言,但又覺得這些基礎(chǔ)(心法反而更重要)!
所以內(nèi)外雙修,才可以稱霸天下。這和練武功真的是一模一樣的道理。

我們說回以上問題:
問:向前選擇是什么意思?
它是從模型中沒有自變量開始,然后按下面步驟選擇自變量來擬合模型。
第一步:對k個自變量(x1,x2,,,,,xk)分別擬合與因變量y的一元線性回歸模型,一共就有K個。
然后找出F統(tǒng)計量的值最大的模型和x, 將其引入模型。
第二步:在已經(jīng)引入模型的xi 基礎(chǔ)上,再分別擬合引入模型外的k-1個自變量(x1,,,,,xi-1,xi+1,,,,,xk)的線性回歸模型。
則自變量組合為xi+x1,,,,xi+xi-1,xi+xi+1,,,xi+xk 的k-1個線性回歸模型
然后分別考察這k-1個線性模型,挑選出F統(tǒng)計量的值最大的含有兩個自變量的模型,將F統(tǒng)計量的值最大的那個自變量xj引入模型。
如果除xi以外的K-1個自變量中沒有一個是統(tǒng)計上顯著的,則運算停止。

如此反復(fù),直到模型外的自變量均無統(tǒng)計顯著性為止。
向前選擇變量的方法是不停地向模型中增加自變量,直到增加自變量不能導(dǎo)致SSE顯著增加(這個過程通過F檢驗來完成)。