之?dāng)?shù)據(jù)質(zhì)控,"> 之?dāng)?shù)據(jù)質(zhì)控。">

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

轉(zhuǎn)錄組分析<五>之?dāng)?shù)據(jù)質(zhì)控

2022-11-24 12:43 作者:生信小院  | 我要投稿


通過(guò)前四篇推文(詳細(xì)內(nèi)容可以點(diǎn)擊《轉(zhuǎn)錄組分析<一>之Hisat2不完全使用指南一》、《轉(zhuǎn)錄組分析<二>之Hisat2不完全使用指南二》、《轉(zhuǎn)錄組分析<三>之Stringtie不完全使用指南》和《轉(zhuǎn)錄組分析<四>之使用DEseq2/edgeR進(jìn)行差異分析》),讀者可以完成測(cè)序數(shù)據(jù)的比對(duì)、定量和差異表達(dá)基因。但是,我們有可能會(huì)發(fā)現(xiàn)分析的結(jié)果不夠理想,卻不知從何處找原因。這里就不得不提到轉(zhuǎn)錄組分析中最基礎(chǔ),也是最重要的環(huán)節(jié)之一,轉(zhuǎn)錄組數(shù)據(jù)的質(zhì)控。

一?質(zhì)控原因

現(xiàn)在常用的測(cè)序儀器如Illumina,其下機(jī)的數(shù)據(jù)常常是包含接頭的,低質(zhì)量的reads,含有大量N的read。因此,我們首先需要對(duì)這些數(shù)據(jù)進(jìn)行過(guò)濾,去掉這些可能會(huì)干擾結(jié)果的reads。之后,我們就會(huì)得到clean data。但是,對(duì)于這些clean data是否需要再評(píng)估一下呢。答案顯然是yes!

二?質(zhì)控流程

1 單個(gè)測(cè)序文件的質(zhì)控

那么,就需要使用到一個(gè)重要的分析工具:Fastqc。下面,我將通過(guò)四行代碼介紹如何使用fastqc去進(jìn)行質(zhì)量的評(píng)估(下載程序、解壓程序,進(jìn)入目錄,運(yùn)行程序)。

完成上述步驟后,每個(gè)測(cè)序文件都生成一個(gè)html文件和文件夾。使用瀏覽器打開(kāi)html文件夾,我們就可以查看各個(gè)測(cè)序文件的質(zhì)控結(jié)果。

2 多個(gè)測(cè)序文件的質(zhì)控結(jié)果整合

這里會(huì)有一個(gè)問(wèn)題,如果我們有幾十個(gè)測(cè)序文件,那我們?cè)撊绾握线@些測(cè)序文件的質(zhì)控結(jié)果到一個(gè)文件中呢?這里就得介紹一個(gè)軟件multiqc(網(wǎng)址為https://multiqc.info/)。使用這個(gè)軟件,我們就可以實(shí)現(xiàn)兩步完成對(duì)多個(gè)轉(zhuǎn)錄組數(shù)據(jù)的質(zhì)控結(jié)果的整合。

運(yùn)行完上述代碼之后,我們就會(huì)在當(dāng)前目錄下產(chǎn)生一個(gè)html文件和一個(gè)文件夾:multiqc_report.html和文件夾multiqc_data。此時(shí)html文件會(huì)將所有的結(jié)果整合。因?yàn)閳D1已經(jīng)展示了質(zhì)控的評(píng)價(jià)指標(biāo),而multiqc僅僅是對(duì)這些結(jié)果的整合,因此,下文僅以圖1中的‘2每個(gè)位置堿基質(zhì)量’整合結(jié)果進(jìn)行介紹,其余指標(biāo)也可參照相應(yīng)結(jié)果進(jìn)行解析。

圖2

如圖2所示,整合結(jié)果中一方面會(huì)顯示多少樣品達(dá)標(biāo),另一方面也會(huì)將所有樣品的質(zhì)控結(jié)果進(jìn)行統(tǒng)計(jì),并以圖的形式展出。

三 結(jié)果評(píng)估

實(shí)際上,質(zhì)控結(jié)果中我們首先需要重點(diǎn)關(guān)注的是‘2 每個(gè)位置堿基質(zhì)量’、‘4 每個(gè)序列質(zhì)量得分’和‘11 序列中接頭含量’。而其余指標(biāo)則需要依據(jù)最終結(jié)果進(jìn)行選擇,如果影響后續(xù)分析,則需要根據(jù)結(jié)果重新對(duì)測(cè)序數(shù)據(jù)進(jìn)行過(guò)濾。

本公眾號(hào)開(kāi)發(fā)的相關(guān)軟件,Multi-omics Hammer軟件和Multi-omics Visual軟件歡迎大家使用。文末是本公眾號(hào)在其他平臺(tái)的賬戶,也歡迎大家關(guān)注并多提意見(jiàn)。

簡(jiǎn)書(shū):WJ的生信小院

公眾號(hào):生信小院

博客園:生信小院

最后,也歡迎各位大佬能夠在本平臺(tái)上:1傳播和講解自己發(fā)表的論文;2:發(fā)表對(duì)某一科研領(lǐng)域的看法;3:想要達(dá)成的合作或者相應(yīng)的招聘信息;4:展示自己以尋找博后工作或者博士就讀的機(jī)會(huì);5:博導(dǎo)提供博后工作或者博士攻讀機(jī)會(huì),都可以后臺(tái)給筆者留言。希望本平臺(tái)在進(jìn)行生信知識(shí)分享的同時(shí),能夠成為生信分析者的交流平臺(tái),能夠?qū)崿F(xiàn)相應(yīng)的利益互補(bǔ)和雙贏(不一定能實(shí)現(xiàn),但是夢(mèng)想總得是有的吧)。

另外,怎么說(shuō)呢,投幣也可,不強(qiáng)求,但奢求。


轉(zhuǎn)錄組分析<五>之?dāng)?shù)據(jù)質(zhì)控的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
上饶市| 吉木萨尔县| 正镶白旗| 石渠县| 临清市| 乌鲁木齐县| 天祝| 荣昌县| 兖州市| 泾川县| 阳原县| 中阳县| 宁夏| 陆河县| 东台市| 榆社县| 泰和县| 视频| 兴国县| 巧家县| 泸溪县| 封丘县| 阿城市| 广安市| 孟连| 鹤峰县| 革吉县| 乾安县| 高要市| 灵武市| 隆化县| 招远市| 托里县| 陵水| 曲水县| 湘西| 蓝田县| 宜阳县| 普兰县| 日喀则市| 平乡县|