HOMER安裝及Motif分析:差異基因共調(diào)節(jié)轉(zhuǎn)錄因子預(yù)測
筆記僅方便個人理解,具體內(nèi)容參考HOMER官網(wǎng):?http://homer.ucsd.edu/homer/
目錄:
????HOMER功能簡介
????HOMER軟件安裝(本文為Mac OS X安裝)
????Motif分析
????結(jié)果解讀

HOMER功能簡介
????HOMER (Hypergeometric Optimization of Motif EnRichment)基于Perl和C++編寫,主要用于Motif查找及ChIP-Seq分析。HOMER使用ZOOPS評分(0或1發(fā)生在每條序列上)與超幾何富集計算來確定motif富集,也包含發(fā)現(xiàn)de novo motif的算法。
????HOMER motif分析主要包括:
啟動子motif分析:需下載啟動子數(shù)據(jù)包
基因組motif分析:需下載基因組數(shù)據(jù)包
使用已知序列(fasta文件)進行motif分析
ChIP分析等
HOMER軟件安裝
? ? 個人感覺,建議以官方文檔為基礎(chǔ),勿過度依賴conda!?。?/strong>
????仔細閱讀報錯信息?+?善用百度/Google可以解決絕大部分問題。
????官網(wǎng)安裝指導(dǎo):http://homer.ucsd.edu/homer/introduction/install.html
電腦系統(tǒng)配置要求
? ? 硬件要求:Unix-style操作系統(tǒng)(UNIX/LINUX/Mac/Cygwin)
? ? 軟件要求:
? ? ? ? 1)HOMER運行所需要的UNIX工具(可使用軟件包管理工具安裝,我使用的是Homebrew):
? ? ? ? ? ? gcc
? ? ? ? ? ? g++
? ? ? ? ? ? make
? ? ? ? ? ? zip/unzip
? ? ? ? ? ? gzip/gunzip
? ? ? ? ? ? wget
? ? ? ? 2)NGS工具
? ? ? ? ? ? samtools
? ? ? ? ? ? R(同時還需要安裝兩個R包:DESeq2, edgeR)
? ? ? ? 注:R包安裝涉及太多版本問題及報錯情況,具體安裝參考其他R包安裝網(wǎng)絡(luò)教程。
安裝方法一:官網(wǎng)推薦的手動安裝方法
Step 1:下載 “configureHomer.pl” 配置文件:
? ??http://homer.ucsd.edu/homer/configureHomer.pl
并將?“configureHomer.pl”?文件放在想要安裝HOMER的目錄中
(如?/Users/af/HOMER/)
Step 2:運行該pl腳本,可在Mac終端運行:
? ? cd <path-to-HOMER>
? ? perl?configureHomer.pl -install
? ??如:cd?/Users/af/HOMER/
? ? ? ? ? ??perl?configureHomer.pl -install
? ? 安裝成功后會返回一個路徑,如:PATH=$PATH:/Users/af/HOMER/bin/ ,記住它。Step 3:修改 .bash_profile路徑,具體操作可百度,參考代碼:
? ? cd?
? ? vim .bash_profile
? ? 輸入?i?,回車進入編輯模式
? ? 將?PATH=$PATH:/Users/af/HOMER/bin/ 復(fù)制到文件中(新起一行即可)
? ??按esc退出編輯
? ? 輸入 :wq?返回
Step 4:source更新一下路徑,參考代碼:
? ? source .bash_profile
注:如果下一次操作有報錯提示找不到homer,重新運行一下該句source命令即可。
此時HOMER軟件已安裝完成,但還需要下載配置的HOMER數(shù)據(jù)包。?
安裝方法二:使用conda安裝
conda安裝只需一句命令:
? ?conda install -c bioconda homer
但安裝后使用which homer找到的路徑總是不對,運行也一直報錯。根據(jù)官方文檔重新手動安裝后無此問題。如使用conda安裝參考其他網(wǎng)絡(luò)教程。
下載HOMER包
? ??cd <path-to-HOMER>
? ? perl?configureHomer.pl -list ? ?# 查看可安裝的HOMER包
? ??perl?configureHomer.pl -install <package name>? ??#?安裝某個HOMER包
? ? 如:perl?configureHomer.pl -install hg38? ? # 安裝hg38版本的人類基因組包
? ? ? ? ? ??perl?configureHomer.pl -install human-p ? ?# 安裝人類promoter包
Motif分析
HOMER Motif Analysis官網(wǎng)介紹:?http://homer.ucsd.edu/homer/motif/index.html?
此處僅介紹?findMotifs.pl
準備輸入的文件:txt文件即可,第一列需為gene list,HOMER可接受Gene Symbols, Entrez Gene IDs, Unigene IDs, Ensembl Gene IDs等。

運行指令:
????findMotifs.pl <inputfile.txt> <promoter set> <output directory> [options]
如:findMotifs.pl DEGs.txt?human?/Users/af/homerresults/?-start -2000?-end 100 -len 8,10,12?-p 4
常用參數(shù):
? ? -start <#> 與?-end <#>? ? 自定義promoter region,默認-400~100;
????-len <#> ? 自定義motif長度,默認為8,10,12;
????-p?<#>? ?自定義CPUs占用數(shù),默認為1;
????-S <#> ? 自定義找到的motif數(shù)量,默認為25,一般只建議減少不建議增加;
????-bg <file>?? 可自定義背景序列信息,無定義時HOMER將自動選取。如進行基因組分析,將從整個基因組序列抓取GC含量一致的序列作為背景序列。若進行的是promoter分析,則將所有的promoter作為背景。
結(jié)果解讀
????findMotifs.pl /?findMotifsGenome.pl 運行后輸出結(jié)果文件,主要看:
homerResults.html : 重新預(yù)測的motif 的富集結(jié)果
homerResults/ directory: 對應(yīng)homerResults.html中結(jié)果
knownResults.html : 已知motif 的富集結(jié)果
knownResults/ directory: 對應(yīng)knownResults.html 中結(jié)果

????輸出結(jié)果按照p-value排序,最后一列是一個鏈接到motif文件的超鏈接,可以從這個文件中找到包含此motif的其他序列。倒數(shù)第二列Best Match/Details 為與de?novo motif最匹配的已知motif。Simiar motifs 可鏈接到與該motif相似的其他motif。
????找到的de novo?motif質(zhì)量可能較差的情況:
????????1)預(yù)測的motif在best match的已知motif中(可通過More Iinformation超鏈接查看)處于邊緣位置而非核心位置;
????????2)低復(fù)雜度的motifs和簡單重復(fù)的motifs。
