腫瘤生信文章必備分析內(nèi)容-亞型生存與臨床相關(guān)性分析
今天小果為小伙伴帶來(lái)的分享內(nèi)容為腫瘤亞型生存與臨床相關(guān)性分析,首先利用 survival包中的 Kaplan–Meier曲線方法評(píng)估不同亞型之間生存預(yù)后相關(guān)性,分析不同亞型之間的生存預(yù)后信息是具有顯著差別,之后對(duì)基因表達(dá)水平在亞型樣本中的分布進(jìn)行熱圖繪制,最后整理樣本臨床信息(年齡、性別等),對(duì)亞型與樣本的臨床因素進(jìn)行相關(guān)性分析;這就是小果今天帶來(lái)的內(nèi)容,在腫瘤生信文章中亞型相關(guān)分析出現(xiàn)的頻率非常高,灰常值得小伙伴學(xué)習(xí)哈,接下來(lái)跟著小果開始今天的學(xué)習(xí)吧!
1.?如何進(jìn)行亞型生存與臨床相關(guān)性分析?
如何進(jìn)行亞型生存與臨床相關(guān)性分析?小果來(lái)為小伙伴做一哈簡(jiǎn)單介紹,在進(jìn)行該分析之前,首先利用ConsensusClusterPlus對(duì)腫瘤樣本進(jìn)行無(wú)監(jiān)督聚類分析,獲得亞型分組信息,然后進(jìn)行不同亞型之間預(yù)后相關(guān)性分析,亞型與樣本的臨床因素相關(guān)性分析,這就是大概的分析步驟,其實(shí)很簡(jiǎn)單,非常適合小白,有需要的小伙伴馬上跟著小果開始今天的實(shí)操吧! 2.準(zhǔn)備需要的R包
#安裝需要的R包 install.packages("autoReg") install.packages("rrtable") install.packages("tidyverse") install.packages("pheatmap") install.packages("survival") install.packages("ggsci") install.packages("survminer") #加載需要的R包 library(rrtable) library(autoReg) library(tidyverse) library(pheatmap) library(survival) library(survminer) library(ggsci) 2.?讀取輸入數(shù)據(jù) #基因表達(dá)矩陣,行名為基因名,列名為樣本信息。 rt=read.table("熱圖1.txt",header=T,sep="\t",row.names=1,check.names=F)
#臨床信息和亞型分組信息文件,行名為樣本信息文件,第一列為亞型分組信息,其他列為臨床因子信息。 ann=read.table("熱圖2.txt",header=T,sep="\t",row.names=1,check.names=F)
3.?不同亞型之間生存預(yù)后相關(guān)性分析,以及繪制KM曲線
#行名為樣本名,列名為生存時(shí)間,生存狀態(tài)和亞型分組信息 tmp <- read.table(file = "km.txt",#工作目錄下的文件名 ??????????????????header = T,#設(shè)置列名 ??????????????????sep = "\t",#分隔符 ??????????????????row.names = 1)#設(shè)置行名Cluster
fit <- survfit(Surv(time,status) ~ Cluster,data = tmp) #設(shè)置主題 mytheme <- theme_survminer(font.legend = c(14,"plain", "black"), ???????????????????????????font.x = c(14,"plain", "black"), ???????????????????????????font.y = c(14,"plain", "black")) #繪制KM曲線 pdf("KM.pdf",height=7,width=7) ggsurvplot(fit, ???????????palette= c(pal_nejm()(2),'#F7A20B'),#pal_nejm()(2)數(shù)字是2代表3組 ???????????conf.int=FALSE,size=1.3, ???????????pval=T,pval.method = T, ???????????legend.labs=c("C1","C2","C3"), ???????????legend.title="Cluster", ???????????xlab="Time (years)", ???????????ylab='Survival probability', ???????????risk.table=TRUE, ???????????break.time.by = 2, ???????????risk.table.title="Number at risk", ???????????risk.table.height=.4, ???????????risk.table.y.text = FALSE, ???????????surv.median.line = "hv", ???????????ggtheme = mytheme) ? dev.off()
4.亞型與樣本的臨床因素進(jìn)行了相關(guān)性分析
#制作基線表,以Cluster亞型進(jìn)行分組 table1<-gaze(Cluster~.,ann)%>%myft() #導(dǎo)出word文件,在當(dāng)前目錄生成Report.doc table2docx(table1)
5.基因表達(dá)水平在亞型樣本中的分布進(jìn)行熱圖繪制
pdf(file="heatmap.pdf",width=8,height=7) pheatmap(rt, ?????????annotation=ann, ?????????cluster_cols = F, ?????????cluster_rows = T, ?????????color = colorRampPalette(c("CornflowerBlue", "white", "Salmon"))(50), ?????????#color = colorRampPalette(c("CornflowerBlue", "white", "Salmon"))(50), ?????????show_colnames = F, ?????????scale="row",?#矯正row ?????????#border_color ="NA", ?????????fontsize = 8, ?????????fontsize_row=7.5, ?????????fontsize_col=6) dev.off()
今天小果順利的完成了亞型的生存與臨床相關(guān)性分析,我們下期再見吧