在做miRNA分析時,大家可能想知道m(xù)iRNA的質(zhì)控和mRNA是不是一樣呢,兩者有什么區(qū)別呢

小云在這里要告訴大家miRNA和Mrna的質(zhì)控是不同的哦!miRNA和mRNA是兩種不同的RNA類型,具有不同的功能和結(jié)構(gòu)。
miRNA是一種非編碼RNA,其長度通常在21-25個核苷酸之間。miRNA可以通過抑制mRNA的翻譯或降解mRNA來調(diào)節(jié)蛋白質(zhì)的表達水平。miRNA在生物體內(nèi)扮演著重要的調(diào)節(jié)基因表達的作用,參與了許多生物學過程,如細胞周期、細胞分化、細胞凋亡等。mRNA是一種編碼RNA,其長度通常在幾百到幾千個核苷酸之間。mRNA是從DNA轉(zhuǎn)錄而來的,它攜帶著編碼蛋白質(zhì)的信息,可以被翻譯成蛋白質(zhì)。由于兩者結(jié)構(gòu)(長度)的特異性,所以在質(zhì)控時具體參數(shù)要進行調(diào)整哦!
和小云一起來學習如何對miRNA進行質(zhì)控吧!
首先就是大家熟知的fastQC,對miRNA原始數(shù)據(jù)質(zhì)控得到結(jié)果:

由于小RNA測序建庫時會測到3'端的接頭序列,所以需要進行接頭的去除和質(zhì)量的過濾。使用cutadapt進行3'端接頭的去除以及長度控制。去除3'端接頭序列后,與mRNA的區(qū)別就是miRNA僅保留17-35nt的reads作為潛在的miRNA序列。
從上圖我們能看到,接頭類型是Illumina Universal Adapter,經(jīng)過小云的百度發(fā)現(xiàn)其接頭序列為AGATCGGAAGAG,所以我們在服務器使用腳本運行cutadapt:bash?腳本名
?
?
?
#!/bin/bash
all_fastq=$(ls *.fastq.gz) ?##修改為你的文件格式后綴
for each in ${all_fastq}; do
????cutadapt -a AGATCGGAAGAG --minimum-length=17
--maximum-length=35 \ ???##接頭序列以及最小最大長度設定
?????-o "${each%.*}_trimmed.fastq.gz" ?$each
done
經(jīng)過上面的操作,我們就得到了質(zhì)量較高的miRNA數(shù)據(jù),怎么樣是不是很簡單呢?歡迎和小果討論哦!

