爾云間生信代碼|基于穩(wěn)健排序整合算法對(duì)多數(shù)據(jù)集進(jìn)行整合及可視化
科研有捷徑,輸入代碼,一鍵獲取科研成果!就是這么省事,來具體看下有多方便!
搜索http://985.so/a9kb查看全部代碼(目前共計(jì)50+持續(xù)新增中),也可以點(diǎn)擊右側(cè)【目錄】,可以看到更多有趣的代碼;真香提示:文末可以知道如何獲取代碼~??
?
不同芯片數(shù)據(jù)的差異基因整合,常規(guī)的思路是先進(jìn)行樣本整合,然后去除批次效應(yīng),最后進(jìn)行差異分析。閱讀相關(guān)文獻(xiàn)也有很多文章用了R包—RobustRankAggreg:對(duì)每個(gè)數(shù)據(jù)集進(jìn)行獨(dú)立分析,然后RRA整合DEG,拿到多個(gè)數(shù)據(jù)集共有的DEG。
穩(wěn)健排序整合(?Robust?rankaggregation,RRA)法是一種利用概率模型整合排序列表的方法,這個(gè)RobustRankAggreg包超級(jí)簡(jiǎn)單,RRA算法中最核心的為aggregateRanks函數(shù),aggregateRanks函數(shù)其實(shí)就是對(duì)多個(gè)排好序的基因集,進(jìn)行求交集的同時(shí)還考慮一下它們的排序情況。總體上來說,就是挑選那些在多個(gè)數(shù)據(jù)集都表現(xiàn)差異的基因,并且每次差異都排名靠前的那些。
結(jié)合R包RobustRankAggreg,將多個(gè)GSE數(shù)據(jù)集差異表達(dá)基因(按logFC值排序)并為一個(gè)list(正序倒序各一個(gè)list),然后獲得所有差異基因在多個(gè)GSE數(shù)據(jù)集中logFC矩陣,經(jīng)過預(yù)先設(shè)置的篩選閾值,篩選共同上調(diào)和下調(diào)基因,得到在多個(gè)數(shù)據(jù)集中共同的上下調(diào)基因,并利用熱圖可視化上下調(diào)top10共有差異基因。
使用方法:
Rscript??RRA.R??-files=??-padj=??-logfc=
參數(shù)說明:
USAGE:
RRA.R??-files=-padj=-logfc=
PARAMETERS:
-files\tThe?results?name?of?differentially?expressed?genes?were?obtained?by?limma.
-padj?the?DEG?Threshold?padj,Default?value?0.05,string.
-logfc?the?DEG?Threshold?logFC,Default?value?1,string.
操作步驟:
1、打開命令行界面,輸入“Rscript??RRA.R”調(diào)閱幫助文檔,確定該程序所需的輸入文件。
2、用戶根據(jù)幫助文檔中的參數(shù)說明內(nèi)容,對(duì)參數(shù)進(jìn)行設(shè)置。這里,必須輸入參數(shù)有3個(gè),是-?files,表示使用limma法獲得的各個(gè)GSE數(shù)據(jù)集差異基因結(jié)果名稱,例'GSE7476.txt,GSE13507.txt,GSE37815.txt,GSE65635.txt';-padj?共有差異基因篩選閾值,建議閾值為0.05,可根據(jù)需要調(diào)整;-logfc?共有差異基因篩選閾值,建議閾值為1,可根據(jù)需要調(diào)整。
3、完成參數(shù)提交后,按下回車鍵,整個(gè)程序即正式開始進(jìn)入執(zhí)行。每步執(zhí)行內(nèi)容都會(huì)給出提示。程序執(zhí)行完畢后,界面會(huì)顯示”Program?execution?is?completed<span data-raw-text="" "="" data-textnode-index-1661241119773="17" data-index-1661241119773="1118" class="character" style="margin: 0px; padding: 0px;">"結(jié)束語。
流程圖:

結(jié)果展示:

1.所有的共有上調(diào)基因結(jié)果Gene:基因名稱;logFC:差異倍數(shù),P.Value:為p值,adj.P.Val:矯正p值

2.共有上調(diào)基因根據(jù)軟件設(shè)置閾值篩選得到的共有上調(diào)顯著差異基因,Gene:基因名稱;logFC:差異倍數(shù),P.Value:為差異分析p值,adj.P.Val:差異分析矯正p值

3.所有的共有下調(diào)基因結(jié)果Gene:基因名稱;logFC:差異倍數(shù),P.Value:為p值,adj.P.Val:矯正p值

4.共有下調(diào)基因根據(jù)軟件設(shè)置閾值篩選得到的共有下調(diào)顯著差異基因,Gene:基因名稱;logFC:差異倍數(shù),P.Value:為差異分析p值,adj.P.Val:差異分析矯正p值

5.按照上調(diào)基因和下調(diào)基因的差異倍數(shù)排序,差異基因top10熱圖圖,依次代表輸入的GEO數(shù)據(jù)集
特別說明:本代碼經(jīng)申請(qǐng)軟件著作權(quán),僅轉(zhuǎn)讓使用權(quán),不轉(zhuǎn)讓所有權(quán)
如需代碼及示例數(shù)據(jù)等文件,請(qǐng)掃碼聊天框回復(fù) “B40”領(lǐng)?。?
寫在文末:
如果您近期想做生信方面的文章而苦于沒有思路,或者不知道如何來入手生信分析,或者兌具體的某一個(gè)圖有作圖需求,都可以掃碼咨詢小云,我們有專業(yè)的技術(shù)團(tuán)隊(duì),生信熱點(diǎn)思路設(shè)計(jì)、生信分析、熱點(diǎn)方向生信挖掘等,如有需要,可掃碼下方二維碼了解詳情:
