湖南大學(xué)友松教授團(tuán)隊(duì)發(fā)布病毒circRNA數(shù)據(jù)庫(kù) VirusCircBase 2.0
本期特邀湖南大學(xué)彭友松教授團(tuán)隊(duì)分享解讀,感謝對(duì)circRNA平臺(tái)的關(guān)注!
病毒是一類(lèi)微小而具有傳染性的病原體,其基因組相對(duì)于真核生物的基因組來(lái)說(shuō)異常微小。正是這種微小的基因組使得病毒circRNA長(zhǎng)期以來(lái)鮮為人知。與線性RNA不同,circRNA具備獨(dú)特的封閉環(huán)結(jié)構(gòu),這一特性使其極其穩(wěn)定,能夠抵抗核酸外切酶的降解作用。同時(shí),circRNA廣泛分布于各類(lèi)生物體中,包括植物、動(dòng)物和病毒。近年來(lái),高通量測(cè)序技術(shù)和生物信息學(xué)工具的發(fā)展,使得研究人員能夠更全面地識(shí)別和分析circRNA。
有研究表明,病毒circRNA在宿主的多種關(guān)鍵生命活動(dòng)中發(fā)揮重要作用,包括調(diào)節(jié)宿主基因表達(dá)、與細(xì)胞成分相互作用以及影響宿主免疫反應(yīng)等方面的影響。比如Sekiba等人發(fā)現(xiàn)乙型肝炎病毒(HBV)產(chǎn)生的circRNA與人類(lèi)DExH-Box螺旋酶9(DHX9)相互作用,參與針對(duì)DNA病毒的先天性免疫反應(yīng);Liu等人發(fā)現(xiàn),人類(lèi)γ皰疹病毒4(HHV4)編碼的名為circRPMS1的環(huán)狀RNA可作為miRNA海綿,促進(jìn)HHV4相關(guān)上皮腫瘤的發(fā)展。然而,這些病毒環(huán)狀RNA研究比較零散,且只揭示了少數(shù)的病毒環(huán)狀RNA分子。為了系統(tǒng)地研究病毒circRNA分子,我們之前的工作中建立了首個(gè)病毒circRNA數(shù)據(jù)庫(kù)VirusCircBase(http://www.computationalbiology.cn/ViruscircBase/home.html)。該數(shù)據(jù)庫(kù)近三年來(lái)已經(jīng)被來(lái)自全球60個(gè)主要國(guó)家和地區(qū)的用戶(hù)使用,促進(jìn)了病毒環(huán)狀RNA分子的研究。
2023年9月19日,湖南大學(xué)彭友松教授研究團(tuán)隊(duì)在Emerging Microbes & Infections(IF=13.2)在線發(fā)表了的最新研究成果,題為“An updated database of virus circular RNAs provides new insights into the biogenesis mechanism of the molecule”。在先前的研究中,我們建立了首個(gè)病毒circRNA數(shù)據(jù)庫(kù)VirusCircBase,并在該領(lǐng)域得到了廣泛應(yīng)用。在更新版本的數(shù)據(jù)庫(kù)--VirusCircBase 2.0(http://computationalbiology.cn/VirusCircBase2/#/home)中,我們不僅顯著增加了數(shù)據(jù)庫(kù)中的數(shù)據(jù)量和功能,還為病毒circRNA的生成機(jī)制提供了新的見(jiàn)解。

亮點(diǎn)
1. VirusCircBase 2.0在數(shù)據(jù)量和功能上都有了顯著的提升,包含來(lái)自43個(gè)病毒物種的60,859個(gè)circRNA,為研究人員提供了全面的資源。
2. 病毒circRNA表現(xiàn)出普遍的低表達(dá)和較強(qiáng)的組織異質(zhì)性。
3. 病毒circRNA展示了與動(dòng)植物不同的獨(dú)特剪接信號(hào)特征。
4. 揭示了與病毒circRNA形成相關(guān)的人類(lèi)基因,為病毒circRNA的生物合成機(jī)制提供了啟示。
研究結(jié)果
01?數(shù)據(jù)庫(kù)更新情況:
與前一版本相比,VirusCircBase 2.0在數(shù)據(jù)量和數(shù)據(jù)庫(kù)功能方面都有所更新(表1)。
在數(shù)據(jù)方面,VirucCircBase 2.0中病毒circRNA的數(shù)量從 46440 個(gè)增加到 60859 個(gè)。具體來(lái)說(shuō),病毒種、宿主、組織或細(xì)胞類(lèi)型、樣本量、病毒circRNAs與宿主miRNAs之間相互作用的數(shù)量分別從23、9、46、337、30818增加到43、22、83、566、72157。此外,新增了1902個(gè)全長(zhǎng)病毒circRNA。
在數(shù)據(jù)庫(kù)功能方面,VirusCircBase 2.0提供了三個(gè)新功能:i)以熱圖形式顯示病毒circRNA在樣本中的表達(dá)水平;ii)以基因組瀏覽器形式顯示病毒circRNA在病毒基因組上的表達(dá)情況;iii)按宿主瀏覽病毒circRNA(圖1)。


該數(shù)據(jù)庫(kù)的網(wǎng)址為:
http://computationalbiology.cn/VirusCircBase2/#/home
02?VirusCircBase 2.0包含的數(shù)據(jù)情況:
我們?cè)?個(gè)巴爾的摩分類(lèi)、25個(gè)病毒科和43種病毒中鑒定到了病毒circRNA(如圖2所示)。大多數(shù)病毒circRNA來(lái)自正義單鏈RNA(ssRNA(+))病毒(占67.3%)和雙鏈DNA(dsDNA)病毒(占30.6%)。另外,在VirusCircBase 2.0中新增了35種病毒的circRNA,其中20種是之前沒(méi)有的病毒。其中SARS-CoV和HHV1的circRNA數(shù)量增加最為顯著,分別從4157個(gè)增至9324個(gè)和從379個(gè)增至2721個(gè)。有趣的是,Mammalian orthoreovirus(MRV1)編碼了125個(gè)circRNA,是目前為止是唯一已知具備編碼circRNA能力的dsRNA病毒。此外,我們還發(fā)現(xiàn)了兩種噬菌體,即假單胞菌病毒PhiKZ(PhiKZ)和埃希氏菌病毒P1(PhageP1),它們分別編碼了249個(gè)和178個(gè)circRNA。

03?病毒circRNA在不同細(xì)胞或組織中的表達(dá)量情況:
由于數(shù)據(jù)有限,大多數(shù)病毒只在少數(shù)細(xì)胞或組織中表達(dá)circRNA。此外,它們?cè)谶@些細(xì)胞或組織中的表達(dá)量也很低。病毒circRNA在不同細(xì)胞或組織中的表達(dá)量差異很大,例如,HHV8在大多數(shù)細(xì)胞中的豐度較低(lg RPM:2.16-3.79),但在TREx-BCBL1RTA和iSLK-BAC16細(xì)胞中的豐度較高(lg RPM分別為4.59和4.97)。有趣的是,一些病毒,如鼠乳頭瘤病毒1型(MmuPV1)只有尾部組織中才有高表達(dá)的circRNA(lg RPM:6.0),這表明病毒circRNA在MmuPV1尾部組織的慢性感染中起著重要作用。

04?病毒circRNA的形成機(jī)制分析:
如圖4A所示,70%的病毒circRNA使用GT/AG剪接信號(hào),這也是動(dòng)物和植物中使用的主要信號(hào)。然而,與非規(guī)范剪接信號(hào)所占比例低于1%的動(dòng)物和植物相比,病毒circRNA表現(xiàn)出更高的非規(guī)范剪接信號(hào)比例。例如,GC/AG信號(hào)是病毒circRNA中最豐富的非規(guī)范信號(hào),占總數(shù)的7.1%,遠(yuǎn)高于哺乳動(dòng)物(0.7%)。
對(duì)病毒circRNA的剪接類(lèi)型的分析發(fā)現(xiàn),病毒circRNA中最常見(jiàn)的是A5SS類(lèi)型(55.9%),其次是ES(22.0%)和A3SS(15.7%)(圖4B)。而在人類(lèi)中,ES是最常見(jiàn)的剪接類(lèi)型,其次是A3SS和A5SS。
對(duì)病毒circRNA的異構(gòu)體數(shù)量的分析發(fā)現(xiàn),大多數(shù)病毒circRNA只有一種或兩種異構(gòu)體(69.9%)(圖4C)。只有很小一部分病毒circRNA有五個(gè)及以上異構(gòu)體。而在哺乳動(dòng)物和植物中,circRNA通常有兩種或兩種以上的異構(gòu)體。

圖4. 病毒環(huán)狀RNA形成機(jī)制分析
05?影響病毒circRNA產(chǎn)生的宿主基因
我們通過(guò)計(jì)算病毒circRNA的豐度與人類(lèi)基因表達(dá)水平之間的相關(guān)性,發(fā)現(xiàn)分別有411和755個(gè)人類(lèi)基因與病毒circRNA的產(chǎn)生呈中度正相關(guān)或負(fù)相關(guān)(定義為SCC的絕對(duì)值大于或等于0.3)。先前的研究表明,RBPs經(jīng)常參與circRNA的產(chǎn)生。它們既能促進(jìn)也能抑制病毒circRNA的生物生成。有趣的是,43個(gè)RBP編碼基因與病毒circRNA的產(chǎn)生呈中度相關(guān),其中大部分(42/43)呈顯著負(fù)相關(guān)。
功能分析顯示,正相關(guān)基因富集于有限的功能中,如腺體發(fā)育和傷口愈合的生物過(guò)程、受體活性和細(xì)胞外基質(zhì)的分子功能。因此,我們重點(diǎn)研究了與病毒circRNA生成負(fù)相關(guān)的755個(gè)基因的功能。這些基因中分別富集了細(xì)胞組分(CC)、生物過(guò)程(BP)和分子功能(MF)的85、264和26個(gè)GO術(shù)語(yǔ),以及14個(gè)KEGG通路。CC主要與紡錘體、染色體區(qū)、剪接體復(fù)合物和核糖體有關(guān)(圖5A);BP主要與細(xì)胞周期和RNA處理有關(guān)(圖5B);MF主要與催化活性、核酸酶活性、微管蛋白和微管結(jié)合有關(guān)(圖5C);富集的KEGG通路主要與細(xì)胞周期、核糖體、COVID-19、剪接體、卵母細(xì)胞減數(shù)分裂、RNA降解等有關(guān)(圖5D)。

結(jié)論
本研究顯著提高了數(shù)據(jù)庫(kù)的數(shù)據(jù)量和功能,從而將數(shù)據(jù)庫(kù)重建為VirusCircBase 2.0(http://computationalbiology.cn/VirusCircBase2/#/home)。病毒circRNA的表達(dá)分析顯示,它們?cè)诖蠖鄶?shù)細(xì)胞或組織中的表達(dá)水平較低,表現(xiàn)出較強(qiáng)的表達(dá)異質(zhì)性。病毒circRNA的剪接分析顯示,它們與動(dòng)植物相比,使用了更高比例的非經(jīng)典反向剪接信號(hào),并主要使用了A5SS。大多數(shù)病毒circRNA沒(méi)有超過(guò)兩個(gè)異構(gòu)體。最后,對(duì)與病毒circRNA產(chǎn)生相關(guān)的人類(lèi)基因進(jìn)行研究發(fā)現(xiàn)超過(guò)1000個(gè)人類(lèi)基因與病毒circRNA的表達(dá)呈中等相關(guān)性。其中大多數(shù)顯示出負(fù)相關(guān)性,包括42個(gè)編碼RNA結(jié)合蛋白的基因。它們?cè)谂c細(xì)胞周期和RNA加工相關(guān)的生物過(guò)程中顯著富集??偟膩?lái)說(shuō),該研究為進(jìn)一步研究病毒circRNA提供了有價(jià)值的資源,也為病毒circRNA的生物合成機(jī)制提供了新的見(jiàn)解。
原文鏈接:
https://doi.org/10.1080/22221751.2023.2261558
