MultiQC:這個(gè)簡(jiǎn)單又實(shí)用的數(shù)據(jù)合并小工具一定要掌握
爾云間? 一個(gè)專門做科研的團(tuán)隊(duì)
歡迎點(diǎn)贊+收藏+關(guān)注
生信人R語言學(xué)習(xí)必備
立刻擁有一個(gè)Rstudio賬號(hào)
開啟升級(jí)模式吧
(56線程,256G內(nèi)存,個(gè)人存儲(chǔ)1T)

它通過掃描給定目錄中的可識(shí)別日志文件來生成一個(gè) HTML 報(bào)告來匯總統(tǒng)計(jì)數(shù)據(jù),比如說我們測(cè)序了很多個(gè)樣本并生成了很多qc質(zhì)量報(bào)告,這個(gè)時(shí)候,利用MultiQC將所有的報(bào)告合并能夠讓我們更輕松地查看結(jié)果。
這個(gè)小工具簡(jiǎn)單而實(shí)用,一定要掌握哦~下面和小果一起看看吧。
這里我們需要使用fastqc對(duì)cleandata進(jìn)行質(zhì)控,查看單個(gè)fastq的測(cè)序質(zhì)量,再使用multiqc合并多個(gè)fastqc的結(jié)果。
使用fastqc進(jìn)行質(zhì)控的代碼如下(小果分享過關(guān)于fastqc的具體使用方法哦,這里就直接放代碼了):
這里是對(duì)指定目錄的所有后綴名為.gz的文件進(jìn)行fastqc質(zhì)控分析,并指定輸出目錄,注意使用的時(shí)候修改為自己的目錄哦,結(jié)果是這樣的:

可以看到每條reads都生成了一個(gè)html格式的報(bào)告,這么多樣本和報(bào)告查看起來非常麻煩,這個(gè)時(shí)候就需要用multiqc來幫忙了。
沒有這軟件的話安裝一下:
然后我們可以合并一下報(bào)告,同樣注意修改代碼中的路徑哦:
##生成一個(gè)文件名稱的列表方便批量操作
不出意外的話我們會(huì)看到生成一個(gè)總的報(bào)告:

和小果一起看看這個(gè)總的報(bào)告長(zhǎng)什么樣子吧:

是不是看起來簡(jiǎn)潔多了呢!
好啦,今天的內(nèi)容暫時(shí)就到這里了,我們下期繼續(xù)!
歡迎使用:云生信??- 學(xué)生物信息學(xué)?(biocloudservice.com)
如果想用服務(wù)器可以私信小果哦

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長(zhǎng)。