兩分鐘!教你畫出TSS富集熱圖!
小云最近沉迷ATAC-seq中無法自拔,這就帶大家來學(xué)習(xí)繪制ATAC-seq中的TSS富集熱圖。
首先,我們需要用到的軟件是deeptools。這里小云給大家簡(jiǎn)單介紹一下deeptools:deeptools 是一套基于 python 開發(fā)的工具,適用于有效處理分析高通量測(cè)序數(shù)據(jù),可用于 ChIP-seq, ATAC-seq 或 MNase-seq。deeptools 包含了多個(gè)有用的模塊,可以處理 BAM 文件或 bigWig 文件,進(jìn)行多種質(zhì)量檢查,創(chuàng)建標(biāo)準(zhǔn)的 bedGraph 和 bigWig 格式的歸一化覆蓋度文件,允許不同文件之間的比較(例如,處理組和對(duì)照組)。最后,使用這些歸一化和標(biāo)準(zhǔn)化的文件,deeptools 可以創(chuàng)建許多適合發(fā)表的可視化圖形,用于識(shí)別富集區(qū)域和進(jìn)行基因組的功能注釋。
簡(jiǎn)單來說,Deeptools的主要用途如下:
1.?處理 bam 文件 或者 bam 轉(zhuǎn)化的 bigwig 文件;
2.?數(shù)據(jù)質(zhì)量控制;
3.?作圖,比如熱圖、折線圖
deeptools的安裝十分簡(jiǎn)單,它的安裝方法有多種,最簡(jiǎn)單的一種是使用 conda 命令:
conda install -c bioconda deeptools
這樣可以自動(dòng)安裝 deeptools 及其所有的 python 依賴項(xiàng)
另一種方法是使用 pip 命令:
pip install deeptools
這樣也可以自動(dòng)安裝 deeptools 及其所有的 python 依賴項(xiàng)
這里小云考考小伙伴們,你們還記得TSS是什么嗎?如果你知道的話,那么小云覺得你真是泰酷辣!
揭曉答案咯:
TSS 是轉(zhuǎn)錄起始位點(diǎn)(transcription start site)的縮寫,是指一個(gè)基因的 5’ 端轉(zhuǎn)錄的第一個(gè)堿基,它是與新生 RNA 鏈第一個(gè)核苷酸相對(duì)應(yīng) DNA 鏈上的堿基,通常為一個(gè)嘌呤(A 或 G)。TSS 是基因轉(zhuǎn)錄的起點(diǎn),也是啟動(dòng)子的一部分。啟動(dòng)子是一段區(qū)域,與 RNA 聚合酶結(jié)合并能夠起始 mRNA 的合成。TSS 前即 5’ 末端的序列稱為上游,而把其后即 3’ 末端的序列稱為下游。
Deeptools下載完成之后,小云開始帶小伙伴們畫TSS富集圖咯
首先準(zhǔn)備bw文件,先建索引,然后轉(zhuǎn)bw,然后取注釋bed文件,接著形成矩陣文件,最后繪制TSS富集圖
下面是第一步:對(duì)bam文件建立索引,轉(zhuǎn)bw文件

下面是獲取注釋bed文件,這里需要用到選用物種的參考基因組注釋文件嗷

又用到了我們的老朋友a(bǔ)wk,不會(huì)的小伙伴們趕緊學(xué)起來呀
下面是形成矩陣文件,用 ComputeMatrix 計(jì)算全基因組范圍內(nèi) peaks 在基因特征的分布情況。
小云的代碼是這樣的:

下面是參數(shù)的解釋:

下面就是最后一步繪制富集圖啦,小云的代碼是這樣的:

下面就是小云畫出來的TSS富集圖啦,是不是很美觀呢?

今天的TSS富集熱圖學(xué)習(xí)就到這里啦,感興趣的小伙伴可以找小云討論哦,我們明天見咯~

