PLS-DA/OPLS-DA二維圖
不同于主成分分析(PCA)法,Partial Least Squares Discrimination Analysis(PLS-DA)或Orthogonal PLS-DA(OPLS-DA)是一種有監(jiān)督的判別分析統(tǒng)計(jì)方法。該方法運(yùn)用PLS-DA建立代謝物表達(dá)量與樣品類別之間的關(guān)系模型,來實(shí)現(xiàn)對(duì)樣品類別的預(yù)測(cè)。分別建立兩兩分組比較的PLS-DA模型(圖1)或OPLS-DA模型(圖2),模型得到的參數(shù)評(píng)價(jià)會(huì)以表格形式提供。其中R^2X和R^2Y分別表示所建模型對(duì)X和Y矩陣的解釋率,Q2標(biāo)示模型的預(yù)測(cè)能力,理論上R^2、Q^2數(shù)值越接近1說明模型越好,越低說明模型的擬合準(zhǔn)確性越差,通常情況下,R^2、Q^2高于0.5(50%)較好,高于0.4即可接受,且兩者差值不應(yīng)過大。臨床樣本由于個(gè)體差異大,不可控,尤其大樣本時(shí),R^2、Q^2大小為0.2左右亦可。圖3則是對(duì)PLS-DA模型(c)的檢驗(yàn),直線的斜率大,Q^2的截距為X,說明PLS-DA模型沒有過擬合。同時(shí)通過計(jì)算變量投影重要度(Variable Importance for the Projection, VIP)來衡量各代謝物的表達(dá)模式對(duì)各組樣本分類判別的影響強(qiáng)度和解釋能力,從而輔助標(biāo)志代謝物的篩選(通常以VIP值>1.0作為篩選標(biāo)準(zhǔn))(圖4)。




注:紅框所圈的點(diǎn)為VIP>1的代謝產(chǎn)物