RNA測(cè)序技術(shù)簡(jiǎn)介
RNA測(cè)序(RNA-seq)是轉(zhuǎn)錄組學(xué)研究的重要工具,也是生命科學(xué)領(lǐng)域最常用的技術(shù)之一。相比于傳統(tǒng)通路研究低維度、低通量的局限性,轉(zhuǎn)錄組學(xué)有以下優(yōu)勢(shì):1)能夠動(dòng)態(tài)考察細(xì)胞基因組的表達(dá),多維度地反映差異變化;2)可用于研究占RNA絕大部分的非編碼RNA,研究其結(jié)構(gòu)以及在細(xì)胞生命活動(dòng)中的重要調(diào)控作用;3)與蛋白組學(xué)研究相互補(bǔ)充,更全面地呈現(xiàn)細(xì)胞水平的變化信息。作為轉(zhuǎn)錄組學(xué)研究的技術(shù)基礎(chǔ),RNA測(cè)序技術(shù)也在不斷地更新迭代。本文將對(duì)第一代至第三代測(cè)序技術(shù)的原理和特點(diǎn)進(jìn)行簡(jiǎn)要的介紹。注:除Direct-Seq外的測(cè)序技術(shù)都涉及到DNA鏈的合成,當(dāng)用于RNA測(cè)序時(shí),會(huì)先通過逆轉(zhuǎn)錄PCR(RT-PCR)合成cDNA文庫,再進(jìn)行測(cè)序。
第一代測(cè)序技術(shù)(Sanger Method)
第一代測(cè)序技術(shù)由Fred Sanger提出,被稱為Sanger Method,是分子測(cè)序領(lǐng)域“從無到有”的重大突破。此方法基于常規(guī)的PCR技術(shù)以及特殊的原料ddNTP(雙脫氧核苷三磷酸)。在PCR擴(kuò)增時(shí),四種ddNTP分別被加入體系中,由于ddNTP缺少3’-OH基團(tuán),不具備形成磷酸二酯鍵的能力,理論上可以終止在模板鏈上的任意位置。此外,這些ddNTP上連接有放射性同位素標(biāo)記,通過凝膠電泳分離后可被凝膠成像系統(tǒng)所檢測(cè)并分析(圖1)?;谶@一方法也開發(fā)出了能夠自動(dòng)化熒光測(cè)序的儀器(圖2)。由于一代測(cè)序技術(shù)步驟繁瑣耗時(shí),測(cè)序通量低,讀長(zhǎng)短且成本高昂,無法滿足目前組學(xué)研究的需求。

圖1 | Sanger Method的基本原理和流程圖

圖2 |?基于Sanger Method的自動(dòng)化熒光測(cè)序技術(shù)
第二代測(cè)序技術(shù)(Short Read RNA-seq)
第二代測(cè)序技術(shù)在測(cè)序方法上取得了重大突破,基于“邊合成邊測(cè)序”(sequencing by synthesis)和大規(guī)模平行測(cè)序技術(shù)(massive parallel analysis,MPS),使測(cè)序通量和讀取速度得到極大提升,其中最具代表性的是Illumina Solexa測(cè)序儀。Illumina的測(cè)序原理可以簡(jiǎn)化為四步:樣品文庫構(gòu)建、簇生成、測(cè)序和數(shù)據(jù)分析。由于讀長(zhǎng)限制,樣品DNA或由RNA逆轉(zhuǎn)錄得到的cDNA需要被打斷成300-500bp的片段,并在3'和5'端接上3種序列:1)Index,用于區(qū)分樣品來源;2)Adapter,用于結(jié)合測(cè)序通道上的位點(diǎn);3)Primer binding site,用于結(jié)合PCR引物啟動(dòng)擴(kuò)增反應(yīng)?;跇蚴絇CR技術(shù)的簇生成可以將模版鏈迅速擴(kuò)增成千上萬倍,保證過程中足夠的測(cè)序深度。測(cè)序時(shí)使用特殊標(biāo)記的dNTP:1)堿基上通過敏感鍵修飾上不同的熒光基團(tuán),用于區(qū)分ATCG;2)3'端使用疊氮基團(tuán)封閉,保證一次循環(huán)只上一個(gè)dNTP(圖3)。每一輪循環(huán)結(jié)束時(shí),會(huì)通過高速熒光顯微鏡記錄熒光圖像,再通入試劑除去熒光基團(tuán)和疊氮基團(tuán),開啟下一循環(huán)。通過分析讀取同一位點(diǎn)的熒光,實(shí)時(shí)獲取模版鏈的堿基序列。由于過程中使用的化學(xué)反應(yīng)并不可控,隨著循環(huán)數(shù)的增大會(huì)出現(xiàn)不同步的情況,因此Illumina的讀長(zhǎng)只能限制在200bp左右。但由于極高的測(cè)序通量和準(zhǔn)確率,Illumina仍占有目前最高的市場(chǎng)份額。

圖3?|?Illumina技術(shù)原理示意圖
第三代測(cè)序技術(shù)(Long Read RNA-seq)
由于Illumina測(cè)序前需要事先將樣本鏈打碎,測(cè)序后通過軟件去還原完整的序列,而且單次讀長(zhǎng)限制在200bp以內(nèi),在做全轉(zhuǎn)錄組分析時(shí)可能會(huì)丟失相當(dāng)一部分信息,而第三代測(cè)序技術(shù)恰恰彌補(bǔ)了這一短板。第三代技術(shù)有兩種:1)單分子實(shí)時(shí)測(cè)序技術(shù)(SingleMolecular Real-Time Sequencing,SMRT),仍需要RT-PCR構(gòu)建cDNA文庫,代表是Pracific Bioscience測(cè)序儀;2)直接測(cè)序技術(shù)(DirectRNA-seq),代表是OxfordNanopore測(cè)序儀。
1. SMRT:PracificBiosciences
SMRT技術(shù)無需打碎樣品,通過在模板兩端接上Adapter構(gòu)建成環(huán)形DNA分子。Pracific Biosciences測(cè)序儀的工作池中含有成千上萬個(gè)微孔,一個(gè)微孔只能裝載一個(gè)DNA-聚合酶復(fù)合物(圖4)。與二代技術(shù)不同,SMRT使用的dNTP的熒光基團(tuán)修飾在5’的三磷酸上,當(dāng)磷酸二酯鍵形成后,熒光基團(tuán)淬滅離去。將高速熒光顯微攝像機(jī)和低穿透性的激光相結(jié)合,dNTP通過堿基互補(bǔ)配對(duì)結(jié)合到模板鏈上的瞬間產(chǎn)生熒光信號(hào)被捕獲,合成后信號(hào)淬滅,保證一次僅讀取一個(gè)堿基。SMRT容易產(chǎn)生錯(cuò)讀,錯(cuò)誤率約為12.5%,但所幸誤差是隨機(jī)的,利用此平臺(tái)的Circular Consensus Sequencing模式對(duì)單個(gè)分子反復(fù)測(cè)序,即可得到高保真的序列信息(準(zhǔn)確率>99.9%),但此模式會(huì)進(jìn)一步消耗測(cè)序通量,使得測(cè)序深度過低。SMRT的另一個(gè)模式Continuous Long Read則是專門用于超長(zhǎng)序列(可至50k bp)的讀取。由于無需打碎,SMRT技術(shù)簡(jiǎn)化了樣品處理流程,且能夠?qū)崿F(xiàn)超長(zhǎng)序列的完整分析,方便用于全轉(zhuǎn)錄組學(xué)的分析研究。

圖4?|?Pacific Biosciences測(cè)序儀
2.?Direct RNA-seq:Oxford Nanopore
由于前幾代技術(shù)用于RNA測(cè)序都要通過RT-PCR構(gòu)建cDNA文庫,使樣品準(zhǔn)備流程繁瑣,且會(huì)引入一定的系統(tǒng)誤差。此外,前幾代技術(shù)都無法用于堿基修飾、mRNA的5’-甲基鳥苷帽以及3’-腺苷尾的研究。而Oxford Nanopore測(cè)序儀的問世完美解決了上述的問題。Nanopore的關(guān)鍵技術(shù)有三:1)納米孔:來源于天然的跨膜轉(zhuǎn)運(yùn)蛋白,并經(jīng)過人工改造,是核酸鏈的測(cè)序通道;2)高電阻聚合物膜:錨定納米孔蛋白,并保證測(cè)序時(shí)電流只能從納米孔通過;3)動(dòng)力蛋白:結(jié)合核酸并將其拖送至納米孔,用于DNA測(cè)序的動(dòng)力蛋白還兼具DNA解旋酶的功能(圖5)。當(dāng)動(dòng)力蛋白-核酸復(fù)合體結(jié)合到納米孔上時(shí),測(cè)序開始:核酸鏈逐個(gè)堿基地通過納米孔,由于四種堿基的電荷差異,會(huì)引起膜孔處不同的電流變化。電流信號(hào)經(jīng)放大后被系統(tǒng)收集,通過軟件算法實(shí)時(shí)翻譯為核苷酸序列。由于堿基修飾后(如甲基化、乙?;龋┩ㄟ^納米孔的速度以及產(chǎn)生的電流大小都會(huì)發(fā)生變化,因此Nanopore可被用于堿基修飾測(cè)序。此外,Nanopore可以直接讀取mRNA 3’-腺苷尾的長(zhǎng)度,這為信使RNA剪接成熟機(jī)制以及穩(wěn)定性的研究提供了有力工具。
Nanopore技術(shù)不僅大大簡(jiǎn)化了樣品的準(zhǔn)備流程,其最大的突破在于便攜性的提升和檢測(cè)成本的大幅優(yōu)化。一些系列的設(shè)備僅有USB驅(qū)動(dòng)器大小,2016年7月,一臺(tái)MiniON測(cè)序儀搭乘SpaceX 9號(hào)進(jìn)入到國(guó)際空間站,首次在太空微重力下完成了測(cè)序。此外,Nanopore大幅降低測(cè)序成本至僅萬元水平。核酸測(cè)序技術(shù),作為曾經(jīng)大型機(jī)構(gòu)的“堂前燕”,逐漸飛入了普通科研院所的“百姓家”。

圖5 | Oxford Nanopore測(cè)序技術(shù)
總結(jié)
至此,三代測(cè)序技術(shù)已介紹完畢。三代技術(shù)的優(yōu)缺點(diǎn)總結(jié)如圖(圖6)。我們傳統(tǒng)的實(shí)驗(yàn)方法多是熒光半定量、ELISA和WesternBlotting等,所能提供的信息有限且可能存在一定的偏向性。相比而言,RNA測(cè)序技術(shù)可以為我們的工作提供多維度的信息作為補(bǔ)充,也能夠給予研究更多的可靠性。隨著測(cè)序成本的不斷降低,RNA測(cè)序也將更加地普及,這對(duì)藥學(xué)工作者來說也將是一個(gè)“福音”。

圖6 |?幾代測(cè)序技術(shù)的優(yōu)缺點(diǎn)總結(jié)
本信息源自互聯(lián)網(wǎng)僅供學(xué)術(shù)交流 ,如有侵權(quán)請(qǐng)聯(lián)系我們立即刪除。


