兩分鐘!教你畫出TSS富集熱圖!
爾云間? 一個專門做科研的團隊
歡迎點贊+收藏+關注
生信人R語言學習必備
立刻擁有一個Rstudio賬號
開啟升級模式吧
(56線程,256G內(nèi)存,個人存儲1T)

小果最近沉迷ATAC-seq中無法自拔,這就帶大家來學習繪制ATAC-seq中的TSS富集熱圖。
首先,我們需要用到的軟件是deeptools。這里小果給大家簡單介紹一下deeptools:deeptools 是一套基于 python 開發(fā)的工具,適用于有效處理分析高通量測序數(shù)據(jù),可用于 ChIP-seq, ATAC-seq 或 MNase-seq。deeptools 包含了多個有用的模塊,可以處理 BAM 文件或 bigWig 文件,進行多種質量檢查,創(chuàng)建標準的 bedGraph 和 bigWig 格式的歸一化覆蓋度文件,允許不同文件之間的比較(例如,處理組和對照組)。最后,使用這些歸一化和標準化的文件,deeptools 可以創(chuàng)建許多適合發(fā)表的可視化圖形,用于識別富集區(qū)域和進行基因組的功能注釋。
簡單來說,Deeptools的主要用途如下:
1. 處理 bam 文件 或者 bam 轉化的 bigwig 文件;
2. 數(shù)據(jù)質量控制;
3.?作圖,比如熱圖、折線圖
deeptools的安裝十分簡單,它的安裝方法有多種,最簡單的一種是使用 conda 命令:
這樣可以自動安裝 deeptools 及其所有的 python 依賴項
另一種方法是使用 pip 命令:
這樣也可以自動安裝 deeptools 及其所有的 python 依賴項
?這里小果考考小伙伴們,你們還記得TSS是什么嗎?如果你知道的話,那么小果覺得你真是泰酷辣!

揭曉答案咯:
TSS 是轉錄起始位點(transcription start site)的縮寫,是指一個基因的 5’ 端轉錄的第一個堿基,它是與新生 RNA 鏈第一個核苷酸相對應 DNA 鏈上的堿基,通常為一個嘌呤(A 或 G)。TSS 是基因轉錄的起點,也是啟動子的一部分。啟動子是一段區(qū)域,與 RNA 聚合酶結合并能夠起始 mRNA 的合成。TSS 前即 5’ 末端的序列稱為上游,而把其后即 3’ 末端的序列稱為下游。
Deeptools下載完成之后,小果開始帶小伙伴們畫TSS富集圖咯
首先準備bw文件,先建索引,然后轉bw,然后取注釋bed文件,接著形成矩陣文件,最后繪制TSS富集圖
?下面是第一步:對bam文件建立索引,轉bw文件
下面是獲取注釋bed文件,這里需要用到選用物種的參考基因組注釋文件嗷
又用到了我們的老朋友awk,不會的小伙伴們趕緊學起來呀
下面是形成矩陣文件,用 ComputeMatrix 計算全基因組范圍內(nèi) peaks 在基因特征的分布情況。
小果的代碼是這樣的:
下面是參數(shù)的解釋:
下面就是最后一步繪制富集圖啦,小果的代碼是這樣的:
下面就是小果畫出來的TSS富集圖啦,是不是很美觀呢?
?

今天的TSS富集熱圖學習就到這里啦,感興趣的小伙伴可以找小果討論哦,我們明天見咯~

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復現(xiàn)、生信硬核知識技能、服務器、生物信息學的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。