PCA:你的單細胞數(shù)據(jù)主成分分析大師
爾云間 一個專門做科研的團隊
歡迎點贊+收藏+關注

在處理單細胞測序數(shù)據(jù)的過程中,如何對數(shù)據(jù)矩陣進行降維是我們“必經(jīng)”的步驟之一,那么你知道最常用的數(shù)據(jù)降維方法有哪些嘛?接下來小果將教大家最常用的數(shù)據(jù)降維方法,一起來和小果看看吧!

1、數(shù)據(jù)集準備

還是老規(guī)矩,和小果簡單看一下我們生成的數(shù)據(jù)矩陣吧!
2、數(shù)據(jù)處理
因為本篇教程主要針對數(shù)據(jù)降維的方法,小果在這里就不細細闡述中間對數(shù)據(jù)處理的過程啦!小果把數(shù)據(jù)處理的代碼貼在下面供同鞋們參考,包括數(shù)據(jù)過濾、數(shù)據(jù)矯正。
3、數(shù)據(jù)降維處理
o 數(shù)據(jù)降維有哪些方法?
在進行具體操作之前,小果先向大家科普一些常用的數(shù)據(jù)降維方法吧!
1.PCA(主成分分析法)
2.MDS(多維縮放)
3.t-SNE
4.LLE(局部線嵌入)
o 什么是PCA主成分分析?
PCA(Principal Components Analysis)。其實就是找出處理數(shù)據(jù)中一個最主要的特征,然后進行深入分析。小果來給大家舉個簡單的例子理解一下:現(xiàn)在要考察公司中一個員工的整體能力水平,我們目前的參考因素有他的業(yè)績、出勤時間、高考成績、工資水平等等因素,那么我們?yōu)榱烁焖俚刈龀雠袛啵覀冎灰崛∷貥I(yè)績來分析即可。
o?R語言實現(xiàn)PCA主成分分析
現(xiàn)在展示的是按照Biological_Condition對數(shù)據(jù)矩陣分組后的統(tǒng)計信息哦!
PCA函數(shù)降維后,大家和小果先一起來看下每個細胞中前5個主成分的分值吧!
得到了以上的分析結(jié)果,我們?nèi)绾螌CA分析后的結(jié)果可視化展示呢,和小果一起來學一下吧!

???好啦,還有更多的數(shù)據(jù)降維方法等著大家去學習和使用,同學們可以根據(jù)自己的情況自行選擇去了解,在這里大家也可以移步我們的云生信平臺的畫圖專版去深入學習哦!

小果云生信平臺:云生信 ?- 學生物信息學 (biocloudservice.com)
小果云生信平臺畫圖專版:

云生信pca圖繪制小工具:www.biocloudservice.com/443/443.php
今天小果教你的降維方法學會了嗎!更多生信小技巧請繼續(xù)關注小果吧!~
生信人R語言學習必備
立刻擁有一個Rstudio賬號
開啟升級模式吧
(56線程,256G內(nèi)存,個人存儲1T)
往期代碼:
【1】lncRNA的拷貝數(shù)變異下游相關分析
【2】R可視化:ggstatsplot包—科研界的美圖秀秀
【3】隨機森林算法用于分類預測和篩選診斷標志物
【4】基于本地Java版GSEA的輸出結(jié)果整合多個通路到一張圖
【5】基于嶺回歸模型和基因表達矩陣估算樣本對藥物反應的敏感性
【6】基于R包NMF對樣本進行分型分析
【7】DALEX包用于探索、解釋和評估模型;分析不同特征變量對響應變量的影響
【8】根據(jù)腫瘤突變負荷TMB進行KM生存分析尋找最佳的cutoff
【9】基于單樣本富集分析算法評估組織中的免疫細胞浸潤水平
【10】代碼分享│什么?你還在用散點圖來可視化數(shù)據(jù)之間的相關性
【11】代碼分享│診斷列線圖、校準曲線、決策曲線和臨床影響曲線的構(gòu)建
【12】代碼分享│你了解基因的動態(tài)變化模式嗎
【13】代碼分享│生物信息分析之SCI熱門圖表-復雜熱圖
【14】代碼分享│生物信息分析之SCI熱門圖表-火山圖
【15】代碼分享│生物信息分析之SCI熱門圖表-箱型圖和小提琴圖
【16】代碼分享│深度學習-人工神經(jīng)網(wǎng)絡(ANN)的構(gòu)建
【17】代碼分享│R可視化:高分文章繪圖之基于RCircos包的多類型圈圖繪制
【18】代碼分享│R可視化:基因與功能之間的關系--GO功能富集網(wǎng)絡圖繪制
【19】代碼分享│生物信息分析之SCI熱門圖表—KM曲線和tROC曲線
【20】代碼分享│R可視化:腫瘤預后模型之Cox回歸分析后用R語言繪制森林圖
【21】代碼分享│生物信息分析之SCI熱門圖表—相關性熱圖和散點圖
【22】代碼分享│生信分析之R語言分析相關性及可視化的N種風格
【23】代碼分享│TCGA數(shù)據(jù)獲取有困難,不會預處理,學習起來
【24】代碼分享│機器學習-支持向量機遞歸特征消除(SVM-RFE)的構(gòu)建
【25】代碼分享│R可視化:對兩個矩陣進行相關性可視化分析
【26】GEO數(shù)據(jù)庫多數(shù)據(jù)集差異分析整合利器RRA,再也不用糾結(jié)去除批次效應
【27】你與生信大佬的距離,只差2分鐘搞定預后模型構(gòu)建和性能評估
【28】9+SCI純生信,模型構(gòu)建中的“流量明星”,你不得不知的LASSO
【29】手把手教你畫美觀大氣的lasso回歸模型圖,為你的SCI增磚添瓦
【30】R可視化:clusterProfiler包做組間比較GO富集圖
【31】代碼分享|R可視化:復雜熱圖繪制技巧之熱圖中添加柱狀圖
【32】代碼分享——基于基因突變信息分析腫瘤突變負荷
【33】代碼分享│富集不到想要的通路?別放棄呀,試試GSEA
【34】代碼分享│還在用PCA做降維聚類嗎?最強降維模型tSNE--你值得擁有
【35】代碼分享│GSVA:原來功能通路也能做差異分析!
【36】代碼分享│Slingshot:你不知道的單細胞擬時序分析還有它
【37】基于基因功能注釋信息挖掘關鍵作用基因
【38】基于癌癥分類預測的標志物特征提取的SVM-RFE分析代碼
【39】依據(jù)表型數(shù)據(jù)基于無監(jiān)督聚類算法對研究群體進行分層聚類分析
【40】基于穩(wěn)健排序整合算法對多數(shù)據(jù)集進行整合及可視化
【41】基于基因表達譜估算樣本免疫基質(zhì)評分和腫瘤純度
【42】自動化繪制LASSO算法回歸模型圖
【43】用于臨床診斷和臨床決策影響的DCA分析
【44】基于樣本預后生存信息和臨床因素用于評價不同模型的一致性指數(shù)軟件
【45】用于探索、解釋和評估模型的DALEX殘差分析軟件
【46】基于細菌群落功能豐度結(jié)果進行差異功能分析及可視化
【47】基于基因差異分析結(jié)果繪制其在染色體上的分布
【48】利用逐步回歸法篩選特征基因構(gòu)建Cox風險模型分析
【49】基于Immune Subtype Classifier進行腫瘤免疫亞型分類
【50】不同物種之間的同源基因名稱轉(zhuǎn)換分析
【51】基于逐步多因素cox回歸篩選預后標記基因并構(gòu)建風險評分模型
【52】基于表達信息挖掘與關注基因密切相關的基因
【53】基因組學基因名稱修正分析
【54】基于Spearman算法構(gòu)建關聯(lián)網(wǎng)絡
【55】基于線性建模方法對代謝組和轉(zhuǎn)錄組數(shù)據(jù)整合分析
【56】基于lasso回歸模型方法篩選特征基因
【57】基于線性建模方法對代謝組和轉(zhuǎn)錄組數(shù)據(jù)整合分析
【58】基于參數(shù)型經(jīng)驗貝葉斯算法和支持向量機(SVM)篩選疾病亞型特征基因
【59】基于LDA(線性判別分析)算法的微生物biomarker的篩選
【60】基于R包xCell計算64種免疫細胞相對含量及下游可視化
【61】基于甲基化數(shù)據(jù)評估腫瘤純度及下游可視化
【62】基于DiffCorr包識別不同表型下的差異共表達關系對
【63】基于逆累計分布函數(shù)識別顯著偏差通路
【64】基于差異基因?qū)ν返挠绊懲诰蜿P鍵通路
【65】基于高通量數(shù)據(jù)的樣本相似性分析
需要以上代碼,請私信小果哦!

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復現(xiàn)、生信硬核知識技能、服務器、生物信息學的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。