[BioLadder云平臺(tái)] 不編程怎么畫出最常用的PCA圖!
大家好!我是BioLadder生物信息在線可視化云平臺(tái)的工程師小宇,今天我來給大家分享怎樣用BioLadder畫出常用的PCA圖!
如果您反饋問題,報(bào)告Bug,提出新的需求,請(qǐng)直接在公眾號(hào)內(nèi)發(fā)留言給我哦!為感謝您對(duì)BioLadder的認(rèn)可我們還有星爸爸同款收納包相贈(zèng)哦!小宇先謝謝大家嘍!


人眼一般能感知的空間為二維和三維。高維數(shù)據(jù)可視化的重要目標(biāo)就是將高維數(shù)據(jù)呈現(xiàn)于二維或三維空間中。高維數(shù)據(jù)變換就是使用降維度的方法,使用線性或非線性變換把高維數(shù)據(jù)投影到低維空間,去掉冗余屬性,但同時(shí)盡可能地保留高維空間的重要信息和特征。主成分分析法,也被稱為主分量分析法,是很常用的一種數(shù)據(jù)降維方法。主成分分析法采用一個(gè)線性變換將數(shù)據(jù)變換到一個(gè)新的坐標(biāo)系統(tǒng),使得任何數(shù)據(jù)點(diǎn)投影到第一個(gè)坐標(biāo)(第一主成分)的方差最大,在第二個(gè)坐標(biāo)(第二主成分)的方差為第二大,以此類推。因此,主成分分析可以減少數(shù)據(jù)的維數(shù),并保留對(duì)方差貢獻(xiàn)最大的特征。本文我們就來討論一下PCA圖是如何繪制的以及如何對(duì)其進(jìn)行解讀。
2.繪圖前的數(shù)據(jù)準(zhǔn)備
demo數(shù)據(jù)可以在
https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/PCA/PCA.rar下載。
2.1?PCA數(shù)據(jù)?
數(shù)據(jù)來源一般是搜庫(kù)結(jié)果定量表。包含2個(gè)維度的數(shù)據(jù),一般情況下,每一行是一個(gè)基因,每一列是一個(gè)樣本。

2.2?分組數(shù)據(jù)(可選)
行名的名稱和個(gè)數(shù)要和之前的PCA數(shù)據(jù)保持一致,列名為分組名稱,可以包含不止一個(gè)分組。

3.BioLadder生信云平臺(tái)在線繪制PCA圖
不想寫代碼?可以用BioLadder生信云平臺(tái)在線繪制PCA圖。
免費(fèi)使用,登錄后暢享50+模塊
網(wǎng)址:https://www.bioladder.cn/web/#/chart/13

3.1?導(dǎo)入數(shù)據(jù)
3.1.1?上傳文件
點(diǎn)擊“選擇”按鈕上傳自己的文件
備注:
第2文件為分組信息,非必選;
點(diǎn)擊查看按鈕可以查看自己的上傳的數(shù)據(jù);
點(diǎn)擊下載示例,可以下載demo數(shù)據(jù);
支持txt,csv,xlsx,xls四種格式;

3.2?調(diào)整參數(shù)
PCA特有參數(shù)
根據(jù)需求調(diào)整參數(shù)即可
??按分組畫圖:勾選后按照樣本名稱進(jìn)行繪制,否則按照基因進(jìn)行繪制
??是否畫橢圓:是否圍繞分組畫個(gè)橢圓(當(dāng)分組內(nèi)重復(fù)《=2時(shí),不能畫橢圓)
??label字體大?。赫{(diào)整標(biāo)記文字的大小

通用參數(shù)
??坐標(biāo)軸選項(xiàng)卡:可以調(diào)整坐標(biāo)軸名字,刻度大小,方向,圖例位置大小等

??顏色選項(xiàng)卡:可以調(diào)整圖案顏色和透明度,以及可以選擇畫板背景主題。

3.3?提交查看
上傳完數(shù)據(jù),并調(diào)好參數(shù)后,點(diǎn)擊右上方“提交”按鈕,圖像會(huì)出現(xiàn)在左側(cè)。如果沒有上傳自己的數(shù)據(jù),會(huì)使用默認(rèn)的demo數(shù)據(jù)繪圖。

3.4?下載
首先,挑選自己想要的格式有png,jpg和pdf供選擇,接著調(diào)整圖片的寬,高和分辨率(注:這里的寬高比會(huì)反饋到左上的繪圖區(qū)),最后點(diǎn)擊“Download”下載按鈕。

更多選項(xiàng)里,可以手動(dòng)拖拽調(diào)整圖片大小,也可以在下方的輸入框內(nèi)直接輸入想要的大小,支持下載PNG,PDF,SVG,JPEG,BMP,EPS,TIFF等多種格式。

4. PCA結(jié)果解讀

PCA是主成分分析的PC1和PC2的結(jié)果,橫縱坐標(biāo)分別為前兩個(gè)主成分,括號(hào)內(nèi)的百分比為該主成分能解釋的變量的百分比。PCA得分圖能將對(duì)照組和實(shí)驗(yàn)組樣本區(qū)分開。在PCA圖中,如果樣本之間聚集在一起,說明這些樣本差異性??;反之樣本之間距離越遠(yuǎn),說明樣本之間差異性越大。不同顏色的散點(diǎn)表示不同實(shí)驗(yàn)分組的樣本。
5.BioLadder云平臺(tái)
網(wǎng)址:https://www.bioladder.cn/
BioLadder目前上線了生物學(xué)分析最常用的50多個(gè)模塊,主要包括以下四類:
數(shù)據(jù)可視化:箱線圖,南丁格爾玫瑰圖,韋恩圖,UpSet圖,餅圖,詞云圖,核密度圖,小提琴圖,弦圖,柱形圖等
組學(xué)數(shù)據(jù)分析:序列的多重比對(duì),表達(dá)數(shù)據(jù)的CV曲線圖,PCA,T-SNE,熱圖,相關(guān)性熱圖等,趨勢(shì)分析的mFuzz,差異分析的火山圖,富集分析的氣泡圖,修飾位點(diǎn)上下游模體分析的seqLogo,Motif熱圖等
功能分析:GO弦圖,相互作用網(wǎng)絡(luò)圖,富集分析
數(shù)據(jù)預(yù)處理:歸一化,補(bǔ)值,F(xiàn)DR校正,長(zhǎng)寬表互換等
好了PCA圖的繪制就到這里了,后續(xù)大家想要了解什么內(nèi)容可以給我們?cè)u(píng)論反饋,我們會(huì)根據(jù)大家的意見持續(xù)更新。我們歡迎您以任何方式提出您的優(yōu)化意見,使BioLadder平臺(tái)成為廣大科研工作者的生物信息分析首選平臺(tái)!

青蓮百奧可提供一站式蛋白質(zhì)組學(xué)、代謝組學(xué)、轉(zhuǎn)錄組學(xué)、多組學(xué)聯(lián)合分析等科研服務(wù)。青蓮百奧在整體實(shí)驗(yàn)設(shè)計(jì)方面經(jīng)驗(yàn)豐富,界內(nèi)最全的Bioactive Database、NeuroPedia Database,專業(yè)分析軟件Peaks,海歸坐鎮(zhèn)生信分析團(tuán)隊(duì),助您在科研道路上乘風(fēng)破浪,沖擊高水平文章。
更多技術(shù)服務(wù)敬請(qǐng)來電咨詢
010-5339583959