最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

十分鐘實現(xiàn)KEGG富集分析多元可視化

2023-10-09 11:35 作者:爾云間  | 我要投稿

原理簡介

KEGG富集分析是一種生物信息學(xué)方法,用于解釋和理解基因或蛋白質(zhì)的功能和參與的代謝通路。該分析使用KEGG(Kyoto Encyclopedia of Genes and Genomes)數(shù)據(jù)庫中的注釋信息,將研究中發(fā)現(xiàn)的差異表達(dá)基因或蛋白質(zhì)與已知的代謝通路和功能進(jìn)行關(guān)聯(lián)。 KEGG富集分析通常包括以下步驟:1、將感興趣的基因或蛋白質(zhì)列表與KEGG數(shù)據(jù)庫中的基因ID或路徑way ID進(jìn)行比對。2、使用統(tǒng)計方法,如Fisher精確檢驗或超幾何分布法,計算在給定基因或蛋白質(zhì)列表現(xiàn)特定代謝通路或功能的顯著性。3、根據(jù)顯著性水平對結(jié)果進(jìn)行篩選,確定具有生物學(xué)意義的通路或功能。4、通過KEGG富集分析,研究人員可以識別與研究對象相關(guān)聯(lián)的代謝通路、信號通路和功能模塊,從而更好地理解基因或蛋白質(zhì)在生物體內(nèi)的作用和調(diào)控。 今天小云帶大家實現(xiàn)KEGG的富集分析~

代碼實現(xiàn)

讀入一個示例數(shù)據(jù)

data <- read.delim("Downloads/kegg_rich.txt",header = T,na.strings = T) #加載相應(yīng)的軟件包 library(tidyverse) colnames(data) data_1<-subset(data,p.adjust<0.05) colnames(data_1)

還記得小云在講R語言的顏色的時候給大家分享的paletteer包嘛,這里可以應(yīng)用一下啦~

添加自定義配色方案:

library(paletteer)#配色包 d_palettes <- palettes_d_names paletteer_d("ggthemes::wsj_dem_rep",n=3) col_bar1<-paletteer_d("ggthemes::wsj_dem_rep",n=3) col_bar1

畫圖

1、

排序柱狀圖

簡單繪制: ggplot(data_1)+ ??geom_col(aes(x=Count,y=reorder(Description,Count),fill=pvalue),color='black',width = 0.6)

添加count、顏色、和主題

ggplot(data_1)+ ??geom_col(aes(x=Count,y=reorder(Description,Count),fill=pvalue),color='black',width = 0.6)+ ??geom_text(aes(x=Count,y=reorder(Description,Count),label =Count),hjust=-0.5,vjust =0.5)+ ??scale_fill_gradientn(colours = c('#B1283AFF','#006A8EFF'))+ ??theme_minimal()+ ??scale_y_discrete(expand = c(0,0))+ ??geom_vline(xintercept = 0,lwd=0.1,color="black")+ ??theme(legend.position = 'right')+ylab(NULL)

2.富集氣泡圖

ggplot(data_1)+ ??geom_point(aes(x=Count,y=Description,color=pvalue,size=Count))+ ??scale_color_gradientn(colours = c('red','green'))+ ??theme_test()+ ??ylab(NULL)

3、帶有標(biāo)簽的氣泡圖

利用ggrepel中的geom_label_repel函數(shù) #取一個-log10變成一列 data_1$logP<- -log10(data_1$pvalue) library(ggrepel) col_bar2<-paletteer_d("ggsci::default_igv",n=50) #去另外一個色塊的顏色 col_bar2 ? colnames(data_1) ggplot(data_1)+ ??geom_point(aes(x=logP,y=Description,size=Count,color=Description))+ ??scale_color_manual(values = col_bar2)+ ??theme_test()+ ??guides(color=F)+ ??geom_label_repel(aes(x=logP,y=Description,label=Description), ???????????????????size=4,nudge_y = 0.1)+ ??theme(axis.text.y = element_blank(), ????????axis.ticks.y = element_blank())+ ??xlim(c(min(data_1$logP)-2,max(data_1$logP)+2))+ ??xlab(bquote(-Log[10] ~ italic('Pvalue')))+ylab(bquote(italic('KEGG Pathway')))

KEGG富集分析作用

功能注釋和解釋:KEGG數(shù)據(jù)庫提供了詳細(xì)的生物通路和功能注釋信息,通過KEGG富集分析可以確定基因集合與哪些生物學(xué)功能、信號通路或化學(xué)反應(yīng)相關(guān)聯(lián)。這有助于研究人員理解基因表達(dá)數(shù)據(jù)中的關(guān)鍵生物過程和調(diào)控機(jī)制。 1、生物標(biāo)志物鑒定:通過比較不同實驗組之間基因表達(dá)差異,在特定疾病狀態(tài)下對基因進(jìn)行KEGG富集分析,可以幫助鑒定與該疾病相關(guān)的生物標(biāo)志物。這有助于診斷和治療策略的開發(fā)。 2、數(shù)據(jù)可視化:KEGG富集分析結(jié)果可以通過生成圖形化展示來更好地呈現(xiàn)。例如,使用柱狀圖、散點圖或網(wǎng)絡(luò)圖等方式將富集通路/功能及其關(guān)聯(lián)基因可視化,有助于直觀地理解整體結(jié)構(gòu)和相互作用。 3、假設(shè)驗證和新假設(shè)生成:根據(jù)已知的KEGG富集分析結(jié)果,可以驗證預(yù)先設(shè)定的假設(shè)或生成新的生物學(xué)假設(shè)。例如,如果某個通路在疾病中顯著富集,則可能提示該通路在疾病發(fā)展過程中起重要作用。 4、數(shù)據(jù)挖掘和整合:通過將基因表達(dá)數(shù)據(jù)與KEGG數(shù)據(jù)庫進(jìn)行整合和分析,可以從大規(guī)?;虮磉_(dá)數(shù)據(jù)中提取有關(guān)特定通路、功能或代謝途徑的重要信息。這有助于揭示潛在的調(diào)節(jié)機(jī)制、相互作用網(wǎng)絡(luò)和生物學(xué)過程。 總之,KEGG富集分析是一種強(qiáng)大而廣泛應(yīng)用的工具,在基因組學(xué)、轉(zhuǎn)錄組學(xué)和代謝組學(xué)等領(lǐng)域中發(fā)揮著重要作用。它幫助解釋基因集合在生物學(xué)過程中所扮演的角色,并為進(jìn)一步研究提供了方向和洞見。

十分鐘實現(xiàn)KEGG富集分析多元可視化的評論 (共 條)

分享到微博請遵守國家法律
佛冈县| 封丘县| 三江| 宾川县| 巴东县| 舒兰市| 平和县| 东丽区| 东至县| 东山县| 县级市| 定远县| 新兴县| 新河县| 维西| 榆树市| 翼城县| 绥江县| 江津市| 武威市| 平乡县| 康保县| 虹口区| 彰化县| 九龙城区| 建湖县| 道真| 从化市| 遵义县| 绥德县| 惠水县| 锡林郭勒盟| 葫芦岛市| 武宁县| 柯坪县| 镇原县| 新丰县| 罗源县| 达拉特旗| 海宁市| 郧西县|