從一團(tuán)亂麻中梳理生命的樂章(使用TRANSFAC數(shù)據(jù)庫查找Composite Module)

遺傳密碼的概念表明密碼子在編碼蛋白質(zhì)時(shí)不會(huì)重疊,所以基因的編碼區(qū)域看起來像文本,單詞一個(gè)接一個(gè)地出現(xiàn),就像自然語言一樣。隨后,這個(gè)概念也在基因調(diào)控理論中占主導(dǎo)地位:轉(zhuǎn)錄起始位點(diǎn)(TSS)前面有“一些文本”,可以指導(dǎo)基因何時(shí)轉(zhuǎn)錄、何時(shí)不轉(zhuǎn)錄。然而實(shí)際情況卻與此不同,在一個(gè)基因的啟動(dòng)子區(qū)域中可以預(yù)測出數(shù)量龐大的基序。

在不同的細(xì)胞類型中,轉(zhuǎn)錄因子的同一個(gè)“停車位”可能被完全不同的因子占據(jù)。因此,調(diào)控代碼的“詞語”是重疊的,轉(zhuǎn)錄因子的相互作用就像一支管弦樂隊(duì)演奏著一首美麗的生命交響曲。每個(gè)轉(zhuǎn)錄因子都充當(dāng)一種獨(dú)立的樂器,真正的音樂是通過轉(zhuǎn)錄因子的協(xié)作和分組而形成的。

參與同一分子遺傳、生化或生理過程的功能相關(guān)基因,通常受到協(xié)調(diào)調(diào)節(jié)。這種調(diào)節(jié)依靠的是多種轉(zhuǎn)錄因子精確地結(jié)合到基因調(diào)控區(qū)域中的靶位點(diǎn)(順式元件)。順式元件組合為獨(dú)特的基因表達(dá)模式提供了結(jié)構(gòu)基礎(chǔ)。
Composite Module(復(fù)合模塊)是基因啟動(dòng)子和增強(qiáng)子中轉(zhuǎn)錄因子(TF)結(jié)合位點(diǎn)的集合,轉(zhuǎn)錄因子可以控制基因在不同條件下(例如不同組織、細(xì)胞類型、信號誘導(dǎo)、細(xì)胞周期階段)的表達(dá)。分析Composite Module對于解析生物學(xué)意義至關(guān)重要。
那么,基因的調(diào)控在表觀遺傳水平上到底是如何組織的呢?從ChlP-seq數(shù)據(jù)中觀察看到的表觀遺傳密碼的組織方式是什么?基因組中的這些基序如何控制基因的活性?
舉個(gè)例子,在啟動(dòng)子的某個(gè)區(qū)域內(nèi)結(jié)合了抑制子(repressor),因此基因被沉默。當(dāng)其他的因子出現(xiàn)并移除了抑制子后,基因就被激活。

利用多組分適應(yīng)度函數(shù)(Multicomponent Fitness Function),研究人員可以選擇最適合此基因表達(dá)譜的啟動(dòng)子模型,用于分析功能相關(guān)或共表達(dá)的基因。這種方法就是基于轉(zhuǎn)錄因子結(jié)合位點(diǎn)及其配對的組成來定義啟動(dòng)子模型的一種新方法。


通過geneXplain平臺(tái),用戶可以利用ChIP-seq工作流程查找轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBS)的組合?;蚴峭ㄟ^平臺(tái)研究全基因組組蛋白修飾譜,例如組蛋白甲基化和組蛋白乙酰化譜。


TRANSFAC是真核轉(zhuǎn)錄調(diào)控DNA序列元件和轉(zhuǎn)錄因子數(shù)據(jù)庫,已經(jīng)有30多年的歷史了,其數(shù)據(jù)量不僅穩(wěn)步增加,利用它開發(fā)的生物信息學(xué)工具也越來越多,例如PATCH可用于分析轉(zhuǎn)錄因子結(jié)合位點(diǎn)的序列相似性,MATCH可用于識別潛在的TFBS。

線上講座 | 探索TRANSFAC:解鎖轉(zhuǎn)錄因子的秘密,引領(lǐng)上游調(diào)控子的精準(zhǔn)發(fā)現(xiàn)
