FastQC——轉(zhuǎn)錄組數(shù)據(jù)質(zhì)控的得力助手
爾云間? 一個專門做科研的團隊
歡迎點贊+收藏+關(guān)注
生信人R語言學(xué)習(xí)必備
立刻擁有一個Rstudio賬號
開啟升級模式吧
(56線程,256G內(nèi)存,個人存儲1T)

在RNA-seq數(shù)據(jù)分析中,數(shù)據(jù)能否使用是最基本的問題,因此進行質(zhì)量控制(Quality Control, QC)是不可或缺的步驟
今天小果介紹了一個高效好用的軟件工具——fastqc,它可是轉(zhuǎn)錄組數(shù)據(jù)質(zhì)控的得力的助手。

FastQC是一個免費使用的質(zhì)量控制工具,能夠?qū)Ω咄繙y序數(shù)據(jù)進行快速、準確的評估。在這篇文章中,小果將以擬南芥轉(zhuǎn)錄組數(shù)據(jù)為例,詳細介紹FastQC在RNA-seq數(shù)據(jù)質(zhì)控方面的應(yīng)用。
安裝fastaqc
conda create –name?fastqc###創(chuàng)建環(huán)境
conda activate?fastqc###激活環(huán)境
conda install -c bioconda fastqc###安裝
fastqc?-version###驗證否安裝成功
數(shù)據(jù)準備
上一期我們對擬南芥的3組共9個轉(zhuǎn)錄組測序rawdata進行了過濾,這一期,小果繼續(xù)用上次的數(shù)據(jù)帶大家進行質(zhì)量控制,當然啦,正確的做法是先對數(shù)據(jù)進行質(zhì)量控制,然后根據(jù)結(jié)果報告來進行數(shù)據(jù)的過濾處理。小果先對數(shù)據(jù)進行了處理,然后進行了數(shù)據(jù)質(zhì)控。
質(zhì)量控制
這一步操作很簡單,進入文件所在目錄
fastqc -t 4 *_paired.fq.gz
或者
nohup fastqc -t 4 -o ~/my_folder/trimm/ninanjie_output/ninanjie_qc *_paired.fq.gz &
這一程序會在后臺運行,并對所有以?_paired.fq.gz 結(jié)尾的文件進行質(zhì)控,同時使用4個線程進行計算,結(jié)果輸出到給定目錄。
這一步可以根據(jù)自己的實際修改命令。

可以看到程序在后臺并給出了進程ID,可以進入輸出目錄查看結(jié)果,下面是部分,結(jié)果,慢慢等待即可。

查看結(jié)果
程序結(jié)束后我們會看到每個樣本都生成了read1和read2的.html報告和壓縮文件,我們可以打開.html查看報告。


今天的內(nèi)容就到這里了,你學(xué)會了嗎!
歡迎使用:云生信??-?學(xué)生物信息學(xué)?(biocloudservice.com)

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。