優(yōu)思學(xué)院|六西格瑪中的非正態(tài)的數(shù)據(jù)如何處理?教你這一招

正態(tài)分佈的假設(shè)
正態(tài)分布的假設(shè),經(jīng)常應(yīng)用于很多統(tǒng)計分析方法中,例如控制圖(Control Chart)、 制程能力分析(Cp/Cpk)、t-檢驗(yàn)、及變異數(shù)分析 (Analysis of variance, ANOVA)等等。
當(dāng)數(shù)據(jù)不是正態(tài)分布時,則此類資料非服從或接近正態(tài)分布,我們必須進(jìn)一步探討并采取補(bǔ)救措施,包括調(diào)查原因、或者進(jìn)行數(shù)據(jù)轉(zhuǎn)換、或使用其他類型的分布)。
實(shí)際上,不少制程與可靠度資料均非呈現(xiàn)正態(tài)分布, 而大部分六西格瑪與制程能力分析工具,均假設(shè)資料為正態(tài)分布 。所以,我們作為數(shù)據(jù)分析者、六西格瑪綠帶、黑帶、質(zhì)量工程師等都應(yīng)該了解一下轉(zhuǎn)換數(shù)據(jù)的方法。
統(tǒng)計學(xué)家George Box and David Cox發(fā)展出一套方法公式用以鑒別出一個適當(dāng)?shù)闹笖?shù)(Lambda=l) ,轉(zhuǎn)換數(shù)據(jù)成為正態(tài)分布樣態(tài)(形狀),這個Lambda值代表資料的次方數(shù)。 為了達(dá)到此目的,Box-Cox轉(zhuǎn)換方法自Lambda=-5到 Lambda=+5間找尋最佳的值 。
如果還未十分了解何謂正態(tài)分布(可先參考以下優(yōu)思學(xué)院的視頻),然后了解你目前要測量的數(shù)據(jù)的本質(zhì)是否為正態(tài)分布。
什么是正態(tài)分布(Normal Distribution)?

Box-Cox轉(zhuǎn)換方法
非正態(tài)的數(shù)據(jù)可以利用Box Cox Transformation 轉(zhuǎn)化為正態(tài)的數(shù)據(jù),這一個頗常用的方法。
例子:原始數(shù)據(jù):

第一步:進(jìn)行正態(tài)性檢驗(yàn),看數(shù)據(jù)是否遵循正態(tài)分布

從上圖中,P<0.005,因此數(shù)據(jù)不遵循正態(tài)分布,從直方圖中可以明顯看出數(shù)據(jù)偏向一邊。
第2步:使用Box Cox變換對數(shù)據(jù)進(jìn)行變換


變換后的數(shù)據(jù):

第3步:再次測試正態(tài)性

從上圖中,P值>0.05,因此很明顯,數(shù)據(jù)遵循正態(tài)分布,從直方圖中我們也可以看到數(shù)據(jù)也是均勻分布的。
如果想對六西格瑪?shù)慕y(tǒng)計分析有更系統(tǒng)性的了解,可以報讀六西格瑪黑帶課程,成為數(shù)據(jù)分析的專業(yè)人士。
