最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

爾云間生信代碼|基于逆累計(jì)分布函數(shù)識(shí)別顯著偏差通路

2022-11-01 13:52 作者:爾云間  | 我要投稿


通路富集分析方法已經(jīng)是生物學(xué)功能分析中非常有效的手段,通過利用富集算法如超幾何分布,fisher精確檢驗(yàn)等可以獲得與表型顯著相關(guān)的生物學(xué)通路。然而幾乎所有的富集工具所利用統(tǒng)計(jì)學(xué)方法都是從通路基因與表型相關(guān)基因之間的重合率或關(guān)聯(lián)度來評(píng)價(jià)通路的重要性的,通常我們通過顯著性P值來進(jìn)行評(píng)估。然而在生物學(xué)角度講,盡管一些基因富集到了通路中,但是這些基因本身有著不同程度的差異表達(dá),即有些基因異常變化程度很高,體現(xiàn)出與表型的高度關(guān)聯(lián)性,而有些基因盡管差異表達(dá),但是差異程度不明顯,很可能是受到關(guān)鍵基因誘導(dǎo)發(fā)生共表達(dá),或噪音干擾造成的。因此在評(píng)價(jià)一個(gè)通路與表型變化是否相關(guān)的過程中,除了基因數(shù)目的影響,我們也應(yīng)該考慮基因自身表達(dá)情況的差異。


本代碼充分考慮了基因本身的差異表達(dá)程度(pvalue值),利用逆累計(jì)分布函數(shù)將其轉(zhuǎn)化為Z值,通過算法得到通路在這些差異表達(dá)基因的差異表達(dá)下的偏差值,以挖掘顯著偏差的通路以及對(duì)通路的顯著偏差做出最大貢獻(xiàn)的差異表達(dá)基因集合。


只需要基因表達(dá)譜、樣本分組文件及通路富集結(jié)果,軟件將自行計(jì)算出差異表達(dá)基因及相應(yīng)的p.value值,同時(shí)挖掘出實(shí)驗(yàn)條件或疾病狀態(tài)下顯著偏差的通路以及對(duì)通路的顯著偏差做出最大貢獻(xiàn)的差異表達(dá)基因集合。


使用方法

Rscript ? pathway_score.r ?-exp= ?-group= ?-lfc= ?-KEGG_pathway=


參數(shù)說明:

USAGE:

USAGE:

pathway_score.r -exp=-group=-lfc=-KEGG_pathway=

PARAMETERS:

-exp ? ?the matrix of gene expression ,input csv format.

-group ?the group of sampple ,input txt format,"group" column must exsist.

-KEGG_pathway ? the KEGG pathway that DEGs were enriched,input txt format.

-lfc ? ?the cutoff of logFC.default:1


操作步驟:

1、打開命令行界面,輸入“Rscript pathway_score.r”調(diào)閱幫助文檔,確定該程序所需的輸入文件。


2、用戶根據(jù)幫助文檔中的參數(shù)說明內(nèi)容,對(duì)參數(shù)進(jìn)行設(shè)置。這里,必須輸入?yún)?shù)有3個(gè),分別是-exp,表示基因表達(dá)矩陣文件,這里必須保存為csv格式;-group表示樣本分組文件,輸入格式為txt文本文件,并且必須包含group列且順序一定要和基因表達(dá)矩陣列對(duì)應(yīng),相應(yīng)的分組這里必須設(shè)置為“Tumor”,“Normal”,如需修改,需進(jìn)入程序源代碼進(jìn)行相應(yīng)修改。-KEGG_pathway表示通路富集結(jié)果文件,這里默認(rèn)的是用clusterProfiler跑出來的結(jié)果,要用到p.adjust列。


可選參數(shù)有1個(gè),為-lfc,表示差異分析設(shè)置的logFC閾值,默認(rèn)為1,需要注意的是,一旦這里的值發(fā)生變化,相應(yīng)的-KEGG_pathway也需要重新輸入,因?yàn)槭遣町惢蚋患降耐贰?/p>


3、完成參數(shù)提交后,按下回車鍵,整個(gè)程序即正式開始進(jìn)入執(zhí)行。每步執(zhí)行內(nèi)容都會(huì)給出提示。程序執(zhí)行完畢后,界面會(huì)顯示”Program execution is completed"結(jié)束語。


結(jié)果展示:

diff.xls(所有基因差異分析結(jié)果)

logFC:差異表達(dá)倍數(shù)的log2值

AveExpr:基因在所有樣本表達(dá)均值

t:limma包采用t檢驗(yàn)的t統(tǒng)計(jì)值

p.value:顯著性p值

adj.P.Val:經(jīng)過BH校正后P值

B:該基因差異表達(dá)的概率,越大,差異表達(dá)概率越大


diff_exp.xls(按照所設(shè)閾值得到的差異基因表達(dá)矩陣文件)


result.txt(通路偏差得分結(jié)果)

第一列表示通路名稱,第二列表示校正后的通路偏差得分,越高表示該通路偏離正常水平越明顯,與表型越相關(guān),第三列表示原來富集分析的p.value值,第四列表示對(duì)該條通路貢獻(xiàn)最大的基因個(gè)數(shù),第五列表示最大貢獻(xiàn)的基因集合


PCA.pdf(基于表達(dá)譜矩陣?yán)L制的PCA圖)

不同形狀和顏色分別表示不同分組


pheatmap.pdf(差異基因雙向?qū)哟尉垲悷釄D)

頂部橫條不同樣色表示不同分組,縱向表示樣本,橫向表示基因,基因表達(dá)越高,顏色越紅


volcano.pdf(火山圖)

差異基因火山圖(藍(lán)色表示下調(diào)基因,紅色表示上調(diào)基因,灰色表示差異不顯著基因)

通路偏差得分富集結(jié)果圖,條形長(zhǎng)度表示最大貢獻(xiàn)基因個(gè)數(shù)多少,縱坐標(biāo)表示通路名稱,顏色越深,表示偏離正常水平越明顯


特別說明:本代碼經(jīng)申請(qǐng)軟件著作權(quán),僅轉(zhuǎn)讓使用權(quán),不轉(zhuǎn)讓所有權(quán)

如需代碼及示例數(shù)據(jù)等文件,請(qǐng)掃碼聊天框回復(fù) “代碼”領(lǐng)取!


寫在文末:

如果您近期想做生信方面的文章而苦于沒有思路,或者不知道如何來入手生信分析,或者兌具體的某一個(gè)圖有作圖需求,都可以掃碼咨詢小云,我們有專業(yè)的技術(shù)團(tuán)隊(duì),生信熱點(diǎn)思路設(shè)計(jì)、生信分析、熱點(diǎn)方向生信挖掘等,如有需要,可掃碼下方二維碼了解詳情 !?


爾云間生信代碼|基于逆累計(jì)分布函數(shù)識(shí)別顯著偏差通路的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
中西区| 偏关县| 当涂县| 桑日县| 茌平县| 垫江县| 茂名市| 龙州县| 海丰县| 巴塘县| 探索| 高碑店市| 吴旗县| 山阴县| 龙陵县| 罗平县| 铜梁县| 嘉鱼县| 镇远县| 交城县| 息烽县| 东平县| 含山县| 华安县| 织金县| 繁昌县| 汾西县| 泾源县| 太和县| 伊春市| 手机| 曲阳县| 湟中县| 上栗县| 大埔县| 翁牛特旗| 石河子市| 昭苏县| 张北县| 揭西县| 那曲县|