Peak注釋?HOMER來幫你!
爾云間一個(gè)專門做科研的團(tuán)隊(duì)
?小果?生信果
生信人R語言學(xué)習(xí)必備
立刻擁有一個(gè)Rstudio賬號(hào)
開啟升級(jí)模式吧
(56線程,256G內(nèi)存,個(gè)人存儲(chǔ)1T)

不知道小伙伴們是否理解Peak的含義呢?
今天小果就帶大家理解一下ATAC-seq中的peak。首先先介紹一下ATAC-seq:ATAC-seq是一種測量染色質(zhì)可及性的技術(shù),利用轉(zhuǎn)座酶Tn5在開放染色質(zhì)區(qū)域切割DNA并插入測序接頭,從而可以通過高通量測序檢測到哪些區(qū)域是染色質(zhì)開放的。那么ATAC-seq中的peak是指在某一位置或區(qū)域,測序信號(hào)達(dá)到最大值的現(xiàn)象,通常反映了某種基因調(diào)控元件(如啟動(dòng)子、增強(qiáng)子等)或轉(zhuǎn)錄因子結(jié)合位點(diǎn)的存在。ATAC-seq的peak分析可以幫助我們發(fā)現(xiàn)不同細(xì)胞類型或狀態(tài)下,染色質(zhì)可及性的變化,以及與之相關(guān)的轉(zhuǎn)錄調(diào)控機(jī)制。
例如下圖:

圖中的一個(gè)個(gè)突起的小山峰就是我們今天的主角peak了。那peak怎么得到呢?又為什么要去注釋呢?小伙伴們是不是有點(diǎn)暈?zāi)??哈哈哈不要著急,且聽小果?xì)細(xì)道來。

首先我們的ATAC-seq的測序數(shù)據(jù)row data經(jīng)過清理之后得到clean data,然后對(duì)clean data比對(duì)到基因組之后得到bam文件,經(jīng)過排序,標(biāo)記單端比對(duì)(雙端測序),去除PCR重復(fù)等過程就會(huì)得到最終的final bam文件,然后就可以采用MACS2 軟件來得到peak啦
那么為什么要對(duì)peak進(jìn)行注釋呢?Peak的注釋是將peak與基因組上的已知元件(如基因、轉(zhuǎn)錄起始位點(diǎn)、啟動(dòng)子、增強(qiáng)子等)進(jìn)行比較和對(duì)應(yīng),從而推斷peak的功能和作用對(duì)象123。Peak的注釋可以幫助我們理解peak在基因調(diào)控網(wǎng)絡(luò)中的角色,發(fā)現(xiàn)與peak相關(guān)的基因和轉(zhuǎn)錄因子,以及探索不同細(xì)胞類型或狀態(tài)下,peak的差異和變化。換句話說是因?yàn)閱渭兊膒eak只是一些冰冷的數(shù)據(jù),只有通過注釋,才能將peak匹配到一些基因元件上。

下面小果講一下怎么用HOMER軟件去注釋peak。
HOMER軟件是一種用于分析和注釋基因組上的peak的工具,主要用于ChIP-seq,ATAC-seq數(shù)據(jù)的處理。HOMER軟件可以提供以下功能:
1.?尋找和注釋與轉(zhuǎn)錄因子或組蛋白修飾相關(guān)的peak
2.?比較不同樣本或條件下的peak差異
3.?識(shí)別和分析轉(zhuǎn)錄因子結(jié)合位點(diǎn)的motif
4.?評(píng)估peak在基因表達(dá)調(diào)控中的作用
5.?可視化peak在基因組上的分布和特征
首先軟件的安裝:我們果斷選擇conda:
conda install -c bioconda homer
安裝完HOMER之后使用configureHomer.pl完成HOMER軟件的配置
如果是人類和小鼠等的數(shù)據(jù)就直接可以用configureHomer.pl來下載相應(yīng)的參考基因組
以人的參考基因組為例:
如果是自定義HOMER數(shù)據(jù)的話需要參考基因組的fasta文件和gtf文件,使用loadGenome.pl命令來自定義HOMER(需要HOMER版本4.4以上)
接下來就是peak的注釋啦,peak的注釋需要用到annotatePeaks.pl 命令,輸入文件可以是MACS2軟件callpeak的bed文件(可以直接使用)或者是HOMER軟件指定的peak文件格式。peak文件格式:使用Tab分隔,共五列,分別是 peak ID , chr , start , end ,strand
小果的代碼如下:
結(jié)果會(huì)生成一個(gè)xlsx文件,里面是注釋的結(jié)果信息
?

今天HOMER注釋peak的學(xué)習(xí)就到這里啦,感興趣的小伙伴可以找小果討論哦,我們明天見咯~

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。