最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

環(huán)狀RNA十周年 | 測序技術(shù)篇

2022-11-08 11:37 作者:circRNA官方號  | 我要投稿

金秋十月,又到了分享豐收的喜悅,科研界的大瓜也在十月成熟:今年最大的瓜當屬【諾貝爾經(jīng)濟學(xué)獎與西南財經(jīng)失之交臂】,而被稱為“酷姐”的諾貝爾化學(xué)獎獲得者Carolyn R. Bertozzi酷酷的人生也讓吃瓜群眾津津樂道。而另一位化學(xué)獎獲得者Karl Barry Sharpless“梅開二度”,成為第二位兩次獲得諾貝爾化學(xué)獎的得主。那么第一位是誰呢?那就是測序界鼎鼎有名的富二代Frederick Sanger,憑借1955年完成胰島素測序和1977年發(fā)明的“雙脫氧鏈終止法(Sanger 法)”兩次斬獲諾貝爾化學(xué)獎。


延伸閱讀:吳瑞在1970年首先發(fā)明了DNA測序方法以及其他一些DNA克隆技術(shù);1971年吳瑞將引物延伸用于DNA測序,該工作成為Sanger法測序最重要一步,引物延伸也用于其他兩項諾獎工作中:Kary Mullis的PCR,和Michael Smith的定點突變。


趁著秋風(fēng)正爽,現(xiàn)在就讓我們盤點一下環(huán)狀RNA領(lǐng)域用到的那些測序技術(shù)。


01一代測序

我們常用的sanger測序被稱為一代測序技術(shù),能夠幾乎100%準確地檢測大約1000nt的序列;雖然開發(fā)于1977年,但該技術(shù)仍然是目前檢測特定序列的金標準。

圖片

Sanger Method又稱為雙脫氧鏈終止法,其名字直觀地闡述了該測序方法的核心:根據(jù)模板在引物上逐個添加ddNTP。


在circRNA研究中,sanger測序主要搭配RT-PCR對目標circRNA進行驗證,主要包括以下幾種方式:

1-1Divergent Primer檢測BSJ??


圖片


1-2不同策略鑒定circRNA全長

①多引物驗證多外顯子circRNA isoform

圖片

②拼接多組primers?

圖片


③一步到位的滾環(huán)PCR

圖片


在我們對環(huán)狀RNA驗證時,一般只對“環(huán)狀RNA特定標識BSJ”進行驗證;然而大量證據(jù)已表明環(huán)狀RNA BSJ內(nèi)部存在著復(fù)雜的剪切結(jié)構(gòu),因此,雖然有相同BSJ,但具體是哪一個isoform發(fā)揮功能,仍需要對isoform的全長進行驗證。


02二代測序

歷史回顧

剛開始sanger測序是作為人類基因組計劃的“御用”技術(shù),但由于效率太低且昂貴(8年僅完成 3%,且當時每個堿基預(yù)估 1 美金);當用上二代測序技術(shù)后,簡直是“鳥槍換炮”(最初二代測序技術(shù)被稱為“鳥槍法〔shot gun〕測序”),不到3年就完成了90%的基因組鑒定。

隨著人類基因組計劃的完成,二代測序技術(shù)也迎來了它的輝煌時代:2005年Roche 454測序系統(tǒng)發(fā)布標志著測序技術(shù)正式跨入高通量測序時代。早期二代測序技術(shù)手段可謂百花齊放,但被大家熟知的測序儀包括Roche 454、Illumina Solexa以及ABI SOLID;然而短短幾年,二代測序市場就基本被Illumina測序儀一家獨大,國內(nèi)市場早已被Illumina測序產(chǎn)品主導(dǎo);直到2015年,我國終于迎來自主研發(fā)的首款測序儀BGISEQ-500,實現(xiàn)了國產(chǎn)測序“從0到1”的突破。


圖片
Roche 454乳液PCR技術(shù)、Illumina Solid橋式 PCR、ABI SOLID雙堿基四色熒光以及華大BGI的DNB技術(shù)


二代測序技術(shù)很快就從基因組層面拓展到了轉(zhuǎn)錄組水平。最開始使用轉(zhuǎn)錄組測序可能完全是奔著編碼蛋白的mRNA去的,通過poly(A) selection的策略進行 mRNA 的文庫構(gòu)建(即mRNA-seq);漸漸地,人們發(fā)現(xiàn)除了mRNA,轉(zhuǎn)錄組中還存在許多“暗物質(zhì)”通過mRNA-seq難以檢測到,因此,rRNA-deleted建庫方式的全轉(zhuǎn)錄組測序登上了舞臺,非編碼長鏈RNA被大量發(fā)現(xiàn);通過RNA-seq結(jié)果能觀察到環(huán)狀RNA完全是必然中的偶然,由于環(huán)狀RNA分子序列與線性分子基本一致,唯一的標識BSJ一般作為“scrambled products”或“chimeric reads”被丟棄,直到2012年被有心人Salzman等研究者堅持研究才讓環(huán)狀RNA開云見日,從此一路生花!


圖片
mRNA-seq、全轉(zhuǎn)錄組RNA-seq以及circRNA-seq的不同建庫方式


2-1環(huán)狀RNA的檢測

如上圖所示,目前常用于檢測環(huán)狀RNA的二代測序建庫方法主要包含兩種:

??rRNA-deleted library

能夠同時檢測mRNA,lncRNA等線性RNA以及circRNA。

??rRNA-deleted, RNase R + library

雖然只能檢測circRNAs,但通常能夠檢測到更多circRNA,特別是一些表達豐度較低的circRNA。如果想同時研究circRNA與mRNA的關(guān)聯(lián),可以對同一批起始RNA進行mRNA-seq。


為了使circRNA更富集,我們也可以先通過加A的方式讓線性RNA的3' 末端更突出(RNase R只能結(jié)合到3'單鏈末端至少包含7個堿基的分子),從而讓線性RNA被RNase R消化得更充分。


測序后我們可以開展一系列與circRNA相關(guān)的生物信息學(xué)分析,而這一切都要源于對back-spliced junction(BSJ)——RNA是否是環(huán)狀的唯一標識——的理解和識別。


圖片
forward splicing(即Linear splicing) 與 back splicing(即circularization)


這張經(jīng)典的圖非常清楚地指明了什么是forward splicing,什么是back-splicing。back-splicing現(xiàn)象是通過生信比對過程中發(fā)現(xiàn)的:不同于能夠用hisat2/bwa/STAR等比對到參考基因組上的reads(圖中右上部分),back-spliced reads是無法正常比對到參考基因組的,通常被歸納到unmapped reads或chimeric reads,比對順序是前后相反的(圖中右下部分)。


識別BSJ是生信軟件鑒定環(huán)狀RNA的核心,然后不同軟件會包含一些其他的設(shè)置來保證環(huán)狀RNA的真實性,例如reads在back-spliced site前后最小長度、BSJ側(cè)翼序列是否存在剪切位點、BSJ內(nèi)部序列長度是否超過某個閾值等。


從2012年到現(xiàn)在,已經(jīng)有許多經(jīng)典的鑒定與定量軟件被我們熟知,例如find_circ、CIRI、DCC、CIRCexplorer等,這些軟件各有各的優(yōu)點但也有不足(主要是假陽性與敏感性的權(quán)衡),因此研究者往往通過聯(lián)合多款軟件對環(huán)狀RNA進行識別與表達定量。現(xiàn)在雖然已經(jīng)過了環(huán)狀RNA鑒定方法開發(fā)的噴涌期,但由于不同的實驗和技術(shù)存在偏倚性,直到現(xiàn)在仍有一些新的軟件涌現(xiàn),例如CARP(Li et.al, 2022)、CiLiQuant(Celine et.al, 2022)。


2-2環(huán)狀RNA的多組學(xué)研究

過去十年,二代測序技術(shù)幫助研究者對環(huán)狀 RNA 有了深刻的認識,涉及從合成到降解的整個生命周期。

圖片

下面簡單闡述了不同的組學(xué)技術(shù)對環(huán)狀 RNA 的研究。

??在基因組層面,通過ATAC-seq和ChIP-seq我們不僅能夠探索環(huán)狀RNA的轉(zhuǎn)錄活性被哪些轉(zhuǎn)錄因子、表觀修飾因子等調(diào)控子的影響,還能觀察宿主線性RNA與環(huán)狀RNA是否受到相同的轉(zhuǎn)錄調(diào)控。不過這方面的內(nèi)容鮮有人涉足。

??環(huán)狀RNA轉(zhuǎn)錄組研究量在組學(xué)中是最多的。轉(zhuǎn)錄組測序除了檢測到全轉(zhuǎn)錄水平的環(huán)狀RNA表達,不同的建庫方式所研究的內(nèi)容也有差異:通過全轉(zhuǎn)錄組RNA-seq,我們不僅能夠?qū)€性RNA(例如mRNA與lncRNA)與環(huán)狀RNA進行全面刻畫,還能了解同一個基因轉(zhuǎn)錄剪切的多樣性;而circRNA-seq則為我們提供了更全面更豐富的circRNA圖譜,能夠描述一些低表達的circRNA,并且能捕獲到一些非經(jīng)典的環(huán)狀RNA(例如ciRNA)。

??環(huán)狀RNA的翻譯是當下研究的熱點,而我們需要首先知道哪些環(huán)狀RNA能夠被翻譯。除了用生信方法來預(yù)測翻譯潛能(例如ORF、IRES以及m6A位點),一些數(shù)據(jù)庫(例如circBank/transCirc等)也對circBase中的~10萬個人類circRNAs提供了翻譯的線索。當然,相比間接的方法,我們更希望能夠直接檢測到正在翻譯的環(huán)狀RNA。本來這個活Ribo-seq是最得心應(yīng)手的,但核糖體印記長度~30nt,想要BSJ恰好被核糖體包裹,概率委實有點低(大家可以查看riboCirc數(shù)據(jù)庫)。而另一種測序策略RNC-seq彌補了Ribo-seq敏感性低的缺陷,它捕獲的是新生態(tài)鏈復(fù)合物,所以檢測到的是RNA全長,從而提高了對環(huán)狀RNA檢測的敏感性。


雖說翻譯調(diào)控(translation regulation)所包含的程序超過了其他調(diào)控的總和(Schwanhausser et al., 2011),但我們?nèi)岳г谀男┉h(huán)狀RNA能夠翻譯,環(huán)狀RNA翻譯的研究真的是“路漫漫其修遠兮”。

??環(huán)狀RNA的修飾在生命活動中發(fā)揮著重要的功能,例如單個m6A位點就能誘導(dǎo)翻譯(Yang et.al, 2017)、m6A水平影響circRNA表達(Tang et.al, 2020),一般我們可以通過meRIP-seq方法來檢測全轉(zhuǎn)錄組的circRNA修飾。

??環(huán)狀RNA的生命活動離不開蛋白質(zhì)的參與,我們可以通過RIP-seq研究某個RBP所結(jié)合的環(huán)狀RNA分子,而有些研究者也能通過CLIP-seq觀察到少量環(huán)狀RNA分子(例如starbase與circInteractome)。

??單細胞以及空間轉(zhuǎn)錄組測序讓我們能夠更精準的了解細胞分子活動的時空性,能夠解析bulk RNA-seq無法觸及的領(lǐng)域。雖然研究者已經(jīng)對幾乎所有能測的組織和細胞株進行了單細胞測序,然而環(huán)狀RNA的單細胞研究卻極少。其中一個主要原因是主流的單細胞測序技術(shù)只能通過poly(A) 的建庫方式對RNA進行捕獲,例如10X Genomics;而環(huán)狀RNA的檢測則需要full-length的建庫方式,雖然也存在一些技術(shù)能夠采用了這種建庫方式(例如SMART-seq2),但每次檢測的細胞數(shù)量較少(<1000 cells)且價格并不便宜,因此這類full-length的單細胞策略并沒有普及起來(circSC數(shù)據(jù)庫僅收集到171套數(shù)據(jù))。


除了這些常見的二代測序技術(shù)能夠為我們解答許多關(guān)于環(huán)狀RNA身世之謎,還有許多其他較小眾的策略也常常用于環(huán)狀RNA的研究,例如DRIP-seq檢測R-loop研究環(huán)狀RNA的調(diào)控。


當然,現(xiàn)在的項目研究所用到的技術(shù)都不是孤立的,我們往往需要整合多組學(xué)的技術(shù)聯(lián)合對所觀察到的現(xiàn)象進行剖析,例如circRNA m6A研究往往都需要結(jié)合RNA-seq,scRNA-seq往往需bulk RNA-seq。只有掌握了這些測序技術(shù)的基本原理,我們才能在研究中更游刃有余。


2-3二代測序的痛點

由于環(huán)狀RNA除了BSJ與其他線性RNA別無二致,因此通過二代測序手段檢測以及定量circRNA實際上一件比較困難的事。

雖然聽起來讓人詫異——不是已經(jīng)有這么多軟件能夠分析circRNA了嗎——這些環(huán)狀RNA識別與定量也僅僅是通過算法推測,假陽性率甚至達到了45%(Dodbele et.al, 2021)。


為什么這么說呢?主要原因有兩點:

??二代測序固有的缺陷

二代測序由于DNA聚合酶活性等問題,只能檢測較短的片段(例如最常用的PE150),因此需要事先對RNA分子進行片段化處理,這一措施很可能導(dǎo)致“circRNA唯一標識BSJ”丟失。

??環(huán)狀RNA自身的特征

絕大部分環(huán)狀RNA表達豐度是極低,因此,在碎片化的RNA文庫中circRNA的信號很容易就被掩蓋了。


因此,二代測序?qū)Νh(huán)狀RNA進行檢測一般都需要比mRNA更高的RNA建庫起始量,從而保證BSJ分子能夠被保留;同時,生信算法也需要足夠敏感,但同時又要盡可能地排除假陽性。


二代測序研究環(huán)狀RNA另一個缺陷是難以檢測到環(huán)狀RNA的中間序列,而大量研究都表明環(huán)狀RNA存在著復(fù)雜的中間結(jié)構(gòu)。為了緩解這一狀況,許多根據(jù)RNA-seq數(shù)據(jù)預(yù)測環(huán)狀RNA中間結(jié)構(gòu)的算法被提出,例如CIRCexplorer2、CIRI-full、CircAST等等。


然而,盡管研究人員通過計算方法一定程度提高了二代測序檢測環(huán)狀RNA的準確性,但二代測序固有的局限性以及環(huán)狀RNA結(jié)構(gòu)的復(fù)雜性讓我們需要更適合的技術(shù)對環(huán)狀RNA更進一步的刻畫。


03三代測序

歷史回顧

雖然二代測序極大地開拓了我們對RNA世界的認知,但二代測序?qū)⑿蛄兴槠@得的信息存在許多噪音也丟失了許多重要信息(例如RNA復(fù)雜的可變剪切)。我們對測序最初的希望是直接得到全轉(zhuǎn)錄組RNA分子的完整序列并對其無偏定量,三代測序策略的讓我們離這個愿望更接近了。


在2011年和2014年P(guān)acBio以及Oxford Nanopore分別發(fā)布了基于聚合酶和基于電信號的商用測序儀。隨著技術(shù)的成熟和測序價格的下降,在2015年的時候You等研究者就開始使用PacBio檢測環(huán)狀RNA,雖然當時僅僅是12個二代測序來源的環(huán)狀RNA進行了驗證;在2017年Hirsch等人通過Nanopore對circNPM1的剪接異構(gòu)體的序列組成進行解析;直到2019年,Rahimi等人才通過Nanopore對環(huán)狀RNA進行了大規(guī)模的測序(發(fā)表在bioRxiv預(yù)印本),不過它采用片段化試劑盒“破環(huán)”的方式仍然可能導(dǎo)致環(huán)狀RNA序列的不完整。


去年應(yīng)該能算作circRNA三代高通量測序研究的元年,總共有四篇文章介紹了用Nanopore測序技術(shù)檢測全長circRNA的不同策略,分別是:


isoCirc(2021年1月Nature Communicate)

賓夕法尼亞大學(xué)費城兒童醫(yī)院的刑毅博士團隊開發(fā)了納米孔滾環(huán)擴展的環(huán)狀RNA isoform全長測序策略(rolling circle amplification followed by nanopore long-read sequencing),對 12 個人類組織和一個人類細胞系開展了測序并收集于isoCirc。

圖片

isoCirc通過rRNA-deleted、RNase R對circRNA進行富集,隨后用隨機引物對circRNA進行反轉(zhuǎn)錄,如果反轉(zhuǎn)錄后的產(chǎn)物超出了環(huán)的長度就用酶進行消化,隨后反轉(zhuǎn)錄產(chǎn)物被連接成環(huán),最后進行滾環(huán)擴增(RCA)。


隨后將RCA產(chǎn)物進行Nanopore測序。生信分析鑒別circRNA主要包括滾環(huán)一致序列(rolling consesus sequence)以及BSJ識別兩個步驟。

CIRI-long(2021年3 月Nature Biotechnology)

中科院北京生命科學(xué)研究院的趙方慶教授團隊對多種Nanopore環(huán)狀RNA建庫進行了測試,力求尋找目前對circRNA Nanopore測序的最優(yōu)組合,并試圖為Nanopore檢測環(huán)狀RNA提供best practices。

圖片

CIRI-long通過rRNA-deleted、poly(A) tailing和RNase R充分去除線性分子從而富集circRNA,隨后用隨機引物進行滾環(huán)反轉(zhuǎn)錄,再合成2nd鏈cDNA后進行了最優(yōu)測序片段的篩選。


Nanopore測序后,用CIRI-long分析策略進行數(shù)據(jù)分析,分析的關(guān)鍵步驟包括滾環(huán)一致序列(cyclic consesus sequence)以及BSJ識別兩個步驟。

circNick-LRS(2021年8月,Nature Communications)

丹麥奧胡斯大學(xué)的Rahimi等研究者在2019年已將circNick-LRS分享到了bioRxiv,他們沒有像isoCirc和CIRI-long那樣進行滾環(huán)擴增,而是采用“破環(huán)”的方式(作者描述為nick gently)使環(huán)狀RNA線性化后測序。除此之外,他們還提供了針對circRNA panel三代測序circPanel-LRS。

圖片

circNick-LRS通過rRNA-deleted、poly(A) tailing和RNase R充分富集環(huán)狀分子,隨后通過“破環(huán)”將環(huán)狀RNA線性化并添加 poly(A) 尾。


Nanopore 測序后通過pblat查看測得的序列是否包含BSJ位點。

circFL-seq(2021年10月,eLife)

北大醫(yī)學(xué)部基礎(chǔ)醫(yī)學(xué)院的楊恩策研究員領(lǐng)導(dǎo)團隊開發(fā)了自己的全長環(huán)狀RNA測序,同樣采取的是滾環(huán)的建庫方式;另外,circFL-seq也配套了自己的生信分析工具包,除了對環(huán)狀RNA進行檢測還能識別融合circRNA(f-circRNA)。


圖片

circFL-seq采用的仍然是rRNA-deleted、poly(A) tailing和RNase R富集環(huán)狀分子的方法,隨后用滾環(huán)反轉(zhuǎn)錄將環(huán)狀RNA線性化建庫。


測序后生信分析方面,circFL-seq提供了包括序列直接進行參考基因組比對(RG)以及通過CCS進行參考基因組比對(cRG)兩種方式尋找潛在circRNA。


三代測序技術(shù)能夠輕松檢測到二代測序難以捕獲到的信息,不僅進一步支持了環(huán)狀RNA種類的多樣性(包括 ecircRNA/EIciRNA/ciRNA等),同時還揭露了BSJ內(nèi)部序列的復(fù)雜性,并能夠直接獲取到融合環(huán)狀RNA(f-circRNA)的信息。


近期資訊

去年國內(nèi)首款自主研發(fā)實現(xiàn)量產(chǎn)的納米孔基因測序儀QNome-3841發(fā)布,并于今年6月進行了升級發(fā)布QNome-3841hex。


Illumina在二代測序市場雖然占有絕對的統(tǒng)治地位,但面對測序市場向長讀長測序的急速轉(zhuǎn)變,它急需在該領(lǐng)域做出突破。另一方面,Illumina的一些核心專利(例如“修飾核苷酸”和“改良核苷酸”)到期或即將到期,早已被虎視眈眈的二代測序市場將被瓜分(例如華大制造已經(jīng)發(fā)布了多款DNBSEQ產(chǎn)品在美上市的計劃),這也迫使Illumina需要在新的領(lǐng)域有所作為。


因此,Illumina在2018年收購三代測序界的翹楚PacBio無果后,在今年1月推出了長讀長技術(shù)Infinity。9月29日,首屆Illumina基因組學(xué)論壇宣稱Illumina三代測序產(chǎn)品Complete Long-Reads(曾用名Infinity)目前正處于搶先體驗階段,將于2023年正式推出。


最后

Illumina公司推出長讀長產(chǎn)品意味著DNA測序市場已經(jīng)開始轉(zhuǎn)變。特別地,二代測序的市場幾乎完全被國外技術(shù)鉗制,三代測序技術(shù)應(yīng)用場景非常廣闊且市場仍有大片空白,這也給了中國企業(yè)“彎道超車”的機會。


當然,“尺有所短,寸有所長”,無論是一代、二代還是三代,它們都有著各自的優(yōu)勢領(lǐng)域,不同的科研問題用不同的技術(shù),而我們只需要按需所取就可以了!


環(huán)狀RNA十周年 | 測序技術(shù)篇的評論 (共 條)

分享到微博請遵守國家法律
东丽区| 平舆县| 八宿县| 登封市| 武定县| 申扎县| 贵定县| 那坡县| 秦安县| 清涧县| 琼海市| 镇巴县| 广东省| 阆中市| 山东省| 武山县| 宜宾县| 桓台县| 大名县| 白银市| 开化县| 博乐市| 蕉岭县| 永善县| 河间市| 象州县| 浠水县| 临沭县| 东山县| 工布江达县| 揭阳市| 邹城市| 甘南县| 大渡口区| 东莞市| 淮滨县| 木兰县| 南充市| 揭东县| 璧山县| 玛多县|