數(shù)學(xué)建模算法培訓(xùn):偏最小二乘回歸分析
原理請參考:司守奎 《數(shù)學(xué)建模算法與應(yīng)用》,國防工業(yè)出版社,2015.9.
培訓(xùn)內(nèi)容:
MATLAB面向?qū)ο笤O(shè)計的思路
數(shù)據(jù)的存儲與提取
矩陣的運(yùn)算
原理到算法的設(shè)計思想
辯證看待,存在不足之處,多反思。打字和公式不易,此處多省略。
測試案例:
例1:假設(shè)隨機(jī)生成回歸方程系數(shù),根據(jù)自變量組數(shù)據(jù)X生成因變量組數(shù)據(jù)Y,并對Y添加噪聲。
由于隨機(jī)生成系數(shù)和多變量組擬合數(shù)據(jù),故存在一定的隨機(jī)性。結(jié)果:
從R2可知,自變量組對因變量組擬合效果非常好。如果不對Y添加噪聲,則R2均為1,求解的回歸系數(shù)original_coeff與隨機(jī)生成的初始系數(shù)c1是一致的。本例隨機(jī)化系數(shù)c1為
算法得到的回歸方程系數(shù)為
可視化,如圖1所示。在這個預(yù)測圖上,如果所有點(diǎn)都能在圖的對角線附近均勻分布,則方程的擬合值與原值差異很小,這個方程的擬合效果就是滿意的。圖1可見所有點(diǎn)基本上在一條線上,擬合效果非常好。

例2. Linnerud數(shù)據(jù),X為身體特征指標(biāo),Y為訓(xùn)練指標(biāo),數(shù)據(jù)如下表所示:

程序執(zhí)行及其結(jié)果如下
其中自變量對跳高y3擬合效果很差,彎曲y2擬合效果最好??梢暬Ч鐖D2所示:

例3.?下列數(shù)據(jù)是2個因變量和6個自變量。請用偏最小二乘回歸建立方程組,并預(yù)測最后四個數(shù)的因變量值。

結(jié)果如下:
可視化效果如圖3所示,自變量對y1的擬合效果要好于y2,其數(shù)值點(diǎn)基本在直線上下均勻分布。從R2也可以看出,其解釋度為90.75%。
