R語言如何繪制PCA圖(3)
1.什么是PCA?
人眼一般能感知的空間為二維和三維。高維數(shù)據(jù)可視化的重要目標就是將高維數(shù)據(jù)呈現(xiàn)于二維或三維空間中。高維數(shù)據(jù)變換就是使用降維度的方法,使用線性或非線性變換把高維數(shù)據(jù)投影到低維空間,去掉冗余屬性,但同時盡可能地保留高維空間的重要信息和特征。
主成分分析法,也被稱為主分量分析法,是很常用的一種數(shù)據(jù)降維方法。主成分分析法采用一個線性變換將數(shù)據(jù)變換到一個新的坐標系統(tǒng),使得任何數(shù)據(jù)點投影到第一個坐標(第一主成分)的方差最大,在第二個坐標(第二主成分)的方差為第二大,以此類推。因此,主成分分析可以減少數(shù)據(jù)的維數(shù),并保留對方差貢獻最大的特征。
本文我們就來討論一下PCA圖是如何繪制的以及如何對其進行解讀。

2.繪圖前的數(shù)據(jù)準備
demo數(shù)據(jù)可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/PCA/PCA.rar下載。
2.1 PCA數(shù)據(jù)
數(shù)據(jù)來源一般是搜庫結果定量表。包含2個維度的數(shù)據(jù),一般情況下,每一行是一個基因,每一列是一個樣本。
2.2 分組數(shù)據(jù)(可選)
行名的名稱和個數(shù)要和之前的PCA數(shù)據(jù)保持一致,列名為分組名稱,可以包含不止一個分組。

3. R語言怎么畫PCA
4.BioLadder生信云平臺在線繪制PCA圖
不想寫代碼?可以用BioLadder生信云平臺在線繪制熱圖。
免費使用,注冊登錄后暢享40+模塊。
網址:https://www.bioladder.cn/web/#/chart/13
4.1 上傳文件
點擊“選擇”按鈕上傳自己的文件
備注:
第2文件為分組信息,非必選;
點擊查看按鈕可以查看自己的上傳的數(shù)據(jù);
點擊下載示例,可以下載demo數(shù)據(jù);
支持txt,csv,xlsx,xls四種格式;

4.2 調整參數(shù)
4.2.1 PCA特有參數(shù)
根據(jù)需求調整參數(shù)即可
按分組畫圖:勾選后按照樣本名稱進行繪制,否則按照基因進行繪制
是否畫橢圓:是否圍繞分組畫個橢圓(當分組內重復《=2時,不能畫橢圓)
label字體大?。赫{整標記文字的大小

4.2.2 ?通用參數(shù)
坐標軸選項卡:可以調整坐標軸名字,刻度大小,方向,圖例位置大小等

顏色選項卡:可以調整圖案顏色和透明度,以及可以選擇畫板背景主題。

4.3 提交查看
上傳完數(shù)據(jù),并調好參數(shù)后,點擊右上方“提交”按鈕,圖像會出現(xiàn)在左側。如果沒有上傳自己的數(shù)據(jù),會使用默認的demo數(shù)據(jù)繪圖。

4.4 下載
可以直接點擊下載按鈕,快捷下載當前所看到的圖形。也可以點擊更多選項,對圖片的寬高,格式等做調整。

更多選項里,可以手動拖拽調整圖片大小,也可以在下方的輸入框內直接輸入想要的大小,支持下載PNG,PDF,SVG,JPEG,BMP,EPS,TIFF等多種格式。

5.PCA結果解讀
是主成分分析的PC1和PC2的結果,橫縱坐標分別為前兩個主成分,括號內的百分比為該主成分能解釋的變量的百分比。PCA得分圖能將對照組和實驗組樣本區(qū)分開。在PCA圖中,如果樣本之間聚集在一起,說明這些樣本差異性??;反之樣本之間距離越遠,說明樣本之間差異性越大。不同顏色的散點表示不同實驗分組的樣本。
6.BioLadder生物信息在線分析可視化云平臺
網址:https://www.bioladder.cn/
BioLadder目前上線了生物學分析最常用50多個模塊,主要包括以下四類:
數(shù)據(jù)可視化:箱線圖,南丁格爾玫瑰圖,韋恩圖,UpSet圖,餅圖,詞云圖,核密度圖,小提琴圖,弦圖,柱形圖等
組學數(shù)據(jù)分析:序列的多重比對,表達數(shù)據(jù)的CV曲線圖,PCA,T-SNE,熱圖,相關性熱圖等,趨勢分析的mFuzz,差異分析的火山圖,富集分析的氣泡圖,修飾位點上下游模體分析的seqLogo,Motif熱圖等
功能分析:GO弦圖,相互作用網絡圖,富集分析
數(shù)據(jù)預處理:歸一化,補值,F(xiàn)DR校正,長寬表互換等