爾云間生信代碼|不同物種之間的同源基因名稱轉換分析

在基礎醫(yī)學研究中,很多實驗模型都是在動物上完成的,比如小鼠。假如我們研究某藥物的抗腫瘤效果,涉及到機制,最終都會往人上靠的,一般幾個基因,數(shù)據(jù)庫直接查一下就可以啦。但如果基因很多,人工查就不太現(xiàn)實。因此整理了可以批量尋找不同物種之間相近同源關系的基因的代碼。
本代碼利用Ensembl數(shù)據(jù)庫中的同源基因定位信息和不同物種基因序列上同源關系的相近程度,尋找不同物種之間相近同源關系的基因,基于物種間基因的同源性,對不同物種之間的同源基因名稱轉換。首先提供基因列表和源物種信息,根據(jù)輸入基因ID轉換為Ensembl?ENSG標識符,檢索目標物種的相應同源基因信息,在直系映射后能夠自動檢索與其輸入基因列表對應的同源基因。
使用方法:
Rscript?-Gorthgene.R?-querylist=querylist.txt?-source_organism=??-target_organism=?
參數(shù)說明:
USAGE:
Gorthgene.R??-querylist=<querylist>?-source_organism=<source_organism>?-target_organism=<target_organism>
PARAMETERS:
-querylist??the?query?genes?list?,input?txt?format?and?filenames.??????
-source_organism??the?name?of?the??source?organism?(default?set?at?hsapiens)?,string
-target_organism??the?name?of?the??target?organism?(default?set?at?mmusculus)?,string
操作步驟:
1、打開命令行界面,輸入“Rscript??Gorthgene.R”調閱幫助文檔,確定該程序所需的輸入文件。
2、用戶根據(jù)幫助文檔中的參數(shù)說明內容,對參數(shù)進行設置。這里,必須輸入?yún)?shù)有3個,分別是-querylist,用戶提供基因列表;-source_organism,源物種信息(默認設置為hsapiens);-target_organism,目標物種信息(默認設置為mmusculus)。
目前可以提供轉化的物種信息列表如下

??3、完成參數(shù)提交后,按下回車鍵,整個程序即正式開始進入執(zhí)行。每步執(zhí)行內容都會給出提示。程序執(zhí)行完畢后,界面會顯示"Program?execution?is?completed"結束語。
結果展示:
共輸出1個表格xls格式文件
1.?result.xls

注:檢索出來的同源基因信息:
input:輸入基因symbol;
input_ensg:輸入基因ensembl?ID;?
ortholog_name:轉化后的同源基因symbol;
ortholog_ensg:轉化后的同源基因ensembl?ID;
description:同源基因具體描述?
特別說明:本代碼經(jīng)申請軟件著作權,僅轉讓使用權,不轉讓所有權
如需代碼及示例數(shù)據(jù)等文件,請掃碼聊天框回復 “B50”領?。?/span>

寫在文末:
如果您近期想做生信方面的文章而苦于沒有思路,或者不知道如何來入手生信分析,或者兌具體的某一個圖有作圖需求,都可以掃碼咨詢小云,我們有專業(yè)的技術團隊,生信熱點思路設計、生信分析、熱點方向生信挖掘等,如有需要,可掃碼下方二維碼了解詳情:??
