【普鯨甲基化小講堂】第10講 - EPIC初探(1)
前面我們講過,Illumina最早是以制造基因芯片起家的,后來收購(gòu)了Solexa公司后才步入了NGS領(lǐng)域,直至今天成長(zhǎng)為一家綜合性的生物技術(shù)公司。
Illumina的基因芯片技術(shù)我們通常稱之為“微珠”芯片,因?yàn)樗脑硇蜗笠稽c(diǎn)說就是把芯片探針合成在一個(gè)個(gè)小的微珠上面,然后芯片本身就像一塊坑坑洼洼的平板,最后把一堆小小的微珠灑在平板上,就做成了一張張芯片了。當(dāng)然這是很不嚴(yán)謹(jǐn)?shù)谋扔?,但是能讓我們很好地了解Illumina芯片的特點(diǎn),因?yàn)檫@個(gè)特點(diǎn),它有一個(gè)獨(dú)特的名字叫做Infinium BeadChip。
而Illumina采用這款技術(shù)最早涉及到了使用芯片直接進(jìn)行甲基化檢測(cè)領(lǐng)域,它不依賴于ChIP等實(shí)驗(yàn),而是采用亞硫酸氫鹽轉(zhuǎn)化,最后轉(zhuǎn)化完成的DNA直接進(jìn)行芯片雜交,獲取探針信息。
最早推出的產(chǎn)品有27,000多個(gè)甲基化檢測(cè)位點(diǎn),所以芯片就被稱為27k芯片,后來升級(jí)到了450k,而現(xiàn)在我們今天要介紹的它的第三代也是最新一代的產(chǎn)品則可以檢測(cè)超過850,000個(gè)甲基化位點(diǎn),所以我們習(xí)慣性地稱呼它為“850k”芯片。而實(shí)際上它的官方名稱叫做Illumina Infinium MethylationEPIC BeadChip。

這款芯片于2015年年底推出,至今也已經(jīng)五歲多了,在甲基化芯片檢測(cè)領(lǐng)域是當(dāng)之無(wú)愧的No.1。它的設(shè)計(jì)主要是圍繞著CpG島來進(jìn)行的,但同時(shí)也兼顧了一些散在的CpG位點(diǎn)及CpG島周圍區(qū)域,Illumina根據(jù)“島”這個(gè)概念提出了幾個(gè)延伸出來的定義:Shore、Shelf和Open Sea。

所謂的Shore就是指CpG島周圍2,000bp的區(qū)域,而Shelf則是在Shore周圍2,000bp的區(qū)域,它們根據(jù)與CpG島的相對(duì)位置還可以進(jìn)一步有North和South的區(qū)分。除了CpG島及島周圍的Shore和Shelf以外的其它所有DNA序列都被稱為Open Sea。
我們很多小伙伴應(yīng)該做過Illumina家的甲基化芯片了吧?如果沒有做過,也可以從TCGA或者GEO等數(shù)據(jù)庫(kù)下載到它的數(shù)據(jù)。注意芯片掃描出來的原始數(shù)據(jù)圖像是以“.idat”為后綴的格式的哦。
拿到數(shù)據(jù)以后,我們喜歡動(dòng)手的同學(xué)們就可以自己去分析它了,在R語(yǔ)言的BioConductor包倉(cāng)庫(kù)中就有很多可以用來分析Illumina甲基化芯片數(shù)據(jù)的包,常見的有ChAMP、minfi等,它們的基本處理流程都遵循芯片的處理流程一般就是:數(shù)據(jù)讀入——數(shù)據(jù)過濾——數(shù)據(jù)校正——下游分析。

而有時(shí)我們處理數(shù)據(jù)或者查看已經(jīng)分析好的結(jié)果的時(shí)候,還會(huì)納悶怎么會(huì)顯示有兩類探針?這其實(shí)是Illumina針對(duì)甲基化檢測(cè)的一種獨(dú)特的技術(shù)。對(duì)于甲基化位點(diǎn),Illumina同時(shí)采用了兩組策略來集成在一張芯片上進(jìn)行檢測(cè)。

策略1:分別設(shè)計(jì)兩條探針來檢測(cè)同一位置的甲基化/非甲基化情況,每條探針釋放的熒光信號(hào)均不相同。
策略2:用一條探針在甲基化/非甲基化情況下釋放出不同的熒光信號(hào)。
這樣,結(jié)合兩種策略進(jìn)行互補(bǔ),我們就可以對(duì)甲基化譜進(jìn)行一個(gè)全面的檢測(cè)了,而不會(huì)發(fā)生大的疏漏。
