GeneToList – 基因名轉(zhuǎn)換(ID convertion)網(wǎng)絡(luò)服務(wù)器
小編寫過有關(guān)基因名的坑的推文,總結(jié)了有關(guān)基因名的十大坑,見:。今天為大家推薦一款很不錯的基因名轉(zhuǎn)化在線服務(wù)器 – GeneToList
隨著高通量組學技術(shù)的日益流行,處理它們所產(chǎn)生的數(shù)據(jù)集變得越來越困難,因此需要借助于編程語言或者在線服務(wù)器,將一個數(shù)據(jù)庫中的基因名轉(zhuǎn)換成另一個數(shù)據(jù)庫中的基因名,例如:biomaRt,MyGene (http://mygene.info)和org.Hs.eg.db;DAVID在線服務(wù)器(https://david.ncifcrf.gov/conversion.jsp),g:Convert(https://biit.cs.ut.ee/gprofiler)以及bioDBnet(https://biodbnet-abcc.ncifcrf.gov/db/db2db.php)。
然而,遇見別名,或者是廢棄的IDs時就不行了。因此作者使用Python Plotly Dash包開發(fā)了一個ID轉(zhuǎn)換網(wǎng)絡(luò)服務(wù)器GeneToList
(https://www.genetolist.com/)。可以批量轉(zhuǎn)換,并且能夠處理別名,廢棄名字等情況。
GeneToList從NCBI中收集了超過3.4萬個物種的基因信息,支持的數(shù)據(jù)庫包括:NCBI Gene symbol,NCBI gene IDs(Entrez IDs),OMIM IDs,HGNC IDs,Ensembl IDs等。
1,基因別名
作者使用了10個基因名進行測試。
圖1. 建議功能
10個基因名中4個基因名完美匹配(綠色),5個是suggestion accepted,1個是自動接收建議,均可以匹配到響應(yīng)基因。
2,ID轉(zhuǎn)換
由于GeneToList具有suggestion功能,因此比其他轉(zhuǎn)換工具的轉(zhuǎn)換準確性更高。
圖2. 不同工具比較
3,測試
這里,我們以Ensembl數(shù)據(jù)庫ID為例。
1)打開GeneToList網(wǎng)站。
圖3. GeneToList網(wǎng)站
2)選擇物種
默認列了3個物種:人、小鼠、大鼠??筛鶕?jù)自己的物種情況點擊“Other (select from >34,000 taxa!”,然后在下面輸入框中鍵入物種名或者taxaid進行搜索(帶有提示)。
圖4. 選擇物種
4,粘貼待轉(zhuǎn)換IDs
將待轉(zhuǎn)換的基因IDs粘貼到
圖5. 粘貼待轉(zhuǎn)換基因id
5,提交并下載結(jié)果
點擊“Start New List”后會在右側(cè)出現(xiàn)轉(zhuǎn)換結(jié)果,點擊“Save as CSV”即可下載結(jié)果。與其他數(shù)據(jù)庫相比,轉(zhuǎn)換結(jié)果包括非常多的列(主要是來自NCBI geneinfo數(shù)據(jù)庫),例如常見的GeneID,Description,基因類型等均有列出,極大地方便了我們對基因的研究。
圖6. 轉(zhuǎn)換結(jié)果
優(yōu)點:
1,物種眾多,超過3.4w種
2,帶基因名建議功能,可手工確定
3,輸出信息列較多
4,轉(zhuǎn)換效率高,準確
缺點:
1,ID類型較少,例如不支持affy探針
2,沒有外部數(shù)據(jù)庫的信息,例如GO數(shù)據(jù)庫,KEGG數(shù)據(jù)庫等。
然而,該網(wǎng)站是目前發(fā)現(xiàn)的比較好的在線基因名轉(zhuǎn)換網(wǎng)站,微生信強烈推薦給大家使用!
地址:https://www.genetolist.com/