六西格瑪工具 | 為什么我們需要多重回歸?
考慮一種情況,其中許多不同的因素(稱為預(yù)測變量或自變量)相互作用以確定結(jié)果(稱為標準或因變量)。根據(jù)因素的不同,可能會取得不同的結(jié)果。例如,房屋銷售價格(標準)可能由許多因素(預(yù)測因素)決定,如房屋位置、建造年份、當?shù)刈》渴袌鰻顩r、房屋狀況等。
多重回歸用于建立一個模型,使我們能夠研究這種相互作用?;诙嘀鼗貧w的模型將使用數(shù)據(jù)構(gòu)建一個基于自變量預(yù)測結(jié)果的函數(shù)。例如,該模型是使用列出各種情況下結(jié)果的一組真實數(shù)據(jù)建立的。然后,該模型可用于預(yù)測給定一組自變量的結(jié)果,或找出現(xiàn)有數(shù)據(jù)與模型的擬合程度以及是否存在任何異常值。

為什么我們需要多重回歸?
多重回歸可用于多種領(lǐng)域。例如,人力資源專業(yè)人員可以根據(jù)員工的經(jīng)驗、工作領(lǐng)域、能力等各種因素收集員工的薪酬數(shù)據(jù)。然后,他們可以根據(jù)這些數(shù)據(jù)構(gòu)建一個模型,并在自己的公司中使用該模型來設(shè)定薪酬,以檢查自己的員工是否適合該模型。某些員工或團體的薪酬是否高于正常水平?比正常情況少?
類似地,不同的研究人員可能使用多重回歸來找出特定結(jié)果的最佳預(yù)測因素。例如,需要哪些自變量來最適合所看到的結(jié)果。一所學(xué)校的考試成績?nèi)绾危鞘裁匆蛩卦斐傻??影響供?yīng)鏈生產(chǎn)率的因素有哪些?

假設(shè)和限制
多重回歸僅在特定條件下才有效。該技術(shù)的基礎(chǔ)是以下假設(shè),這些假設(shè)必須正確才能使模型正常工作。
1.如果方程是線性的,變量之間的關(guān)系必須是線性的。非線性關(guān)系需要其他形式的回歸。
2.偏離線路的分布必須為“正態(tài)”分布。
3.一個好的模型預(yù)測是一種關(guān)系,而不是原因。一個好模型的存在并不意味著自變量導(dǎo)致結(jié)果,只是因為它們的存在表明結(jié)果可能是由于相關(guān)性造成的。
4.變量的“獨立性”。假設(shè)預(yù)測變量是獨立的。如果它們相互依賴性很強,模型就不會很好。

天行健六西格瑪顧問表示:在其局限性范圍內(nèi),多重回歸是一種適用于大量實際情況的良好技術(shù),并被廣泛用于構(gòu)建簡單易用的模型。這些可用于分析商業(yè)、醫(yī)學(xué)、工程等廣泛領(lǐng)域的數(shù)據(jù)。