三代全長轉(zhuǎn)錄組數(shù)據(jù)可變剪切分析
爾云間? 一個專門做科研的團隊


1、所需軟件安裝?? 代碼如下
conda install -c bioconda histat2
conda install -c bioconda gamp
conda install -c bioconda gffread
conda install -c samtools
#sratoolkit手動安裝#
mkdir software
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.2/sratoolkit.3.0.2-ubuntu64.tar.gz
tar -zxvf sratoolkit.3.0.2-ubuntu64.tar.gz
#添加環(huán)境變量到.bashrc
export PATH=/media/desk16/wangd/softwore/sratoolkit.3.0.2-ubuntu64/bin:$PATH
source .bashrc
2、二代轉(zhuǎn)錄組原始數(shù)據(jù)下載和三代參考轉(zhuǎn)錄組和轉(zhuǎn)錄亞型下載(數(shù)據(jù)下載有點慢)? 代碼如下
mkdir rawdata
Prefetch? ERR706814 -O rawdata
fasterq-dump -3 -O raw-data raw-data/ ERR706814/ERR706814.sra


3、流程分析? 代碼如下
3.1 首先建立參考轉(zhuǎn)錄組索引
gmap_build -D index -d leaf leaf.UniTransModel.fa
3.2 將轉(zhuǎn)錄亞型回帖到參考轉(zhuǎn)錄組上,獲取GFF3文件
gmap -t 10 -D index -d leaf -f gff3_gene leaf.UniTransModel.isoforms.fa > leaf_gene.gff3
3.3 將GFF3轉(zhuǎn)成GTF格式
gffread leaf_gene.gff3 -T -o leaf_gene_tmp.gtf
sed -n '/exon/p' leaf_gene_tmp.gtf > leaf_gene.gtf
rm leaf_gene_tmp.gt
4、構(gòu)建bam? 代碼如下
4.1 構(gòu)建索引
hisat2-build -p 20 leaf.UniTransModel.fa index/leaf.UniTransModel
4.2 二代轉(zhuǎn)錄組數(shù)據(jù)進行比對,生成bam文件
hisat2 -x index/leaf.UniTransModel -1 raw-data/ERR706814.sra_1.fastq -2 raw-data/ERR706814.sra_2.fastq -p 100 | samtools sort -@ 50 > leaf_sort.bam &
4.3 去除低質(zhì)量比對reads
samtools view -@ 10 -b -q 30 leaf_sort.bam > leaf_flt.bam
5、結(jié)果文件? 代碼如下
最終生成可視化展示的sashimi_flt.bam
???????? sashimi.gtf

注:最后可變剪切分析展示可以利用IGV軟件進行可視化。
關(guān)注小果,小果將會持續(xù)為你帶來更多生信干貨哦。
推薦閱讀: