參考基因組&注釋文件下載鏈接大總結(jié)
參考基因組&注釋文件,這兩大文件是轉(zhuǎn)錄組分析的必備文件,可以說沒有它寸步難行。
需要者,可以直接從網(wǎng)站下載?
1.【小夢想在努力-2018-12-29】
http://www.360doc.com/content/18/1229/16/61186495_805301910.shtml
2.四種途徑下載參考基因組
http://www.360doc.com/content/20/0827/13/19913717_932471349.shtml
?
哪些網(wǎng)址可以下載GTF、Fa、GFF文件(參考基因組和注釋文件)?以小鼠為例。
?
一、Gencode 數(shù)據(jù)庫下載基因注釋文件; https://www.gencodegenes.org/mouse/
二、UCSC下載參考基因組http://hgdownload.soe.ucsc.edu
Sequence and Annotation Downloads??
????http://hgdownload.soe.ucsc.edu/downloads.html
三、NCBI下載參考基因組&注釋文件
https://www.ncbi.nlm.nih.gov/genome/52?genome_assembly_id=992563
四、ENSEMBL下載注釋文件
??http://ftp.ensembl.org/pub/release-103/gtf/mus_musculus/
【一】Gencode下載注釋文件https://www.gencodegenes.org/


https://www.gencodegenes.org/mouse/
在2021年3月23日星期二21:22下載了gencode數(shù)據(jù)庫中的GTF文件。第一個和第二個。
【二】UCSC下載參考基因組http://hgdownload.soe.ucsc.edu
?



Files included in this directory:
mm10.2bit - contains the complete mouse/mm10 genome sequence
????in the 2bit file format.??Repeats from RepeatMasker and Tandem Repeats
????Finder (with period of 12 or less) are shown in lower case; non-repeating
????sequence is shown in upper case. ?The utility program, twoBitToFa (available
????from the kent src tree), can be used to extract .fa file(s) from
this file.
??A pre-compiled version of the command line tool can be
????found at: http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/
?? ? See also:
????????http://genome.ucsc.edu/admin/git.html
? ? ? ? http://genome.ucsc.edu/admin/jk-install.html
包含完整的鼠標/mm10基因組序列的2bit文件格式。
重復掩蔽器和串聯(lián)重復發(fā)現(xiàn)者的重復(周期為12或更少)用小寫表示;
非重復序列以大寫字母表示。
實用程序twoBitToFa(可從kent src樹獲得)可用于從該文件提取.fa文件。
?ChromeFa.tar.gz -
每條染色體在一個文件中的裝配序列。
重復掩蔽器和串聯(lián)重復發(fā)現(xiàn)者的重復(周期為12或更少)用小寫表示;
非重復序列以大寫字母表示。
下載鏈接:http://hgdownload.soe.ucsc.edu/goldenPath/mm10/bigZips/
我下載的有:
chromFa.tar.gz???2012-02-09 13:54 ?830M
?mm10.2bit???????2012-02-07 10:52 ?682M ?
?????mm10.fa.gz??????2020-01-23 02:22 ?830M??
【補充1】在UCSC首頁Genomes欄中查看小鼠基因結(jié)構(gòu):
http://genome.ucsc.edu/index.html。


【補充2】UCSC可以鏈接到NCBI中的參考基因組&注釋文件
?

?

【三】NCBI下載參考基因組&注釋文件
https://www.ncbi.nlm.nih.gov/genome/52?genome_assembly_id=992563
?


下載的是download sequences in FASTA formot for genome.&download genome annotation in GFF.
【四】ensembl下載注釋文件
http://ftp.ensembl.org/pub/release-103/gtf/mus_musculus/
?



我下載的是第三個文件:Mus_musculus.GRCm39.103.gtf.gz??
【補充資料】
?

?
2021-03-24 周三
天馬行空的坦克兵