最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

高質(zhì)量的肩突硬蜱基因組促進了蜱類科學的發(fā)展

2023-01-28 20:12 作者:笨笨熊愛吃肉  | 我要投稿

新年伊始,Nature Genetics公布了由美國Maryland大學科研人員對肩突硬蜱基因組進行測序組裝的最新研究結(jié)果,這是第三版的肩突硬蜱基因組了,而上一次是2015年發(fā)表在Nature Communication上,我之前也對文章進行了解讀萊姆病的傳播媒介生物-肩突硬蜱(Ixodes scapularis)基因組測序,時隔8年科研人員接著對肩突硬蜱的基因組工作進一步完善,發(fā)表在了更高水平的雜志上,學習一下。

圖片

研究背景:

蜱蟲大約起源于~225百萬年前,大多數(shù)蜱蟲在地理上受到特定宿主-寄生蟲關(guān)系的限制,而硬蜱是一種高度進化的蜱蟲種類,寄生在不同的寄主范圍內(nèi),傳播一系列流行病原體,并具有廣泛的地理分布。與其密切相關(guān)的蜱蟲種類,比如肩突硬蜱(黑腳蜱),篦子硬蜱和全溝硬蜱,廣泛分布于北美、歐洲、北非和亞洲。肩突硬蜱或相關(guān)蜱類是許多影響人類的病毒、細菌和真核病原體的有效載體,包括萊姆病。盡管越來越多的人認識到硬蜱是多種嚴重疾病的傳播媒介,但它們的分子生物學和攜帶病原體的載體能力許多方面仍然未知,缺乏高質(zhì)量的參考基因組進一步阻礙了其研究。


肩突硬蜱基因組攜帶有13對常染色體加上性染色體XX或者XY,大小約~2.26Gb(雌蜱),X染色體最大,Y染色體最小[1,2]。之前公布了兩個版本的肩突硬蜱基因組。其中一個(Wikel strain)來自三個地區(qū)種群的肩突硬蜱經(jīng)過雜交和近親繁殖12代后,通過ABI平臺進行的Sanger測序,平均深度為3.8X。另一個版本通過對肩突硬蜱細胞系ISE6進行測序,采用了三代的PacBio測序平臺的CLR模式,產(chǎn)生了一個更為完整的基因組,減少了88倍的的contigs數(shù)目,contig的N50長度增加了278倍。研究人員對肩突硬蜱的基因組進一步進行了提高,并發(fā)現(xiàn)了成千的新的蛋白編碼基因和不同的RNA類型。


主要結(jié)果


肩突硬蜱基因組高精度測序


為了進一步提高基因組的連續(xù)性、準確性和完整性,研究人員從單一雌蜱中分離高分子量(high-molecular weight,HMW) DNA,并結(jié)合PacBio的low input (LI)和ultra-low input (ULI) DNA文庫(Fig.1a)通過SMRT平臺測序。從單一雌蜱中提取出3096 ng的HMW DNA, 研究人員構(gòu)建了四個HMW DNA文庫(Sup Fig.1b,c),最終產(chǎn)生了~41-fold的PacBio的HiFi數(shù)據(jù),包括40.2Gb的LI 數(shù)據(jù)(n=4.6 × 106 reads, median read length 8.2 kb) 和 56.0 Gb of ULI 數(shù)據(jù) (n = 5.3 × 106 reads, median read length 10.1 kb)(Sup Fig.1d和Sup Table1)。LI文庫使用native DNA模板進行測序,在讀取長度和產(chǎn)量有限的情況下,顯示了在整個基因組中均勻的覆蓋率,而通過PCR擴增的ULI文庫具有更好的產(chǎn)量和更長的讀取長度,但在具有高AT或GC偏倚的基因組區(qū)域覆蓋率較低(Sup Fig.1d)。通過結(jié)合這兩種類型文庫,我們能夠在一個個體中對兩種單倍型進行測序,而不是像為了獲得足夠的基因組所必需的那樣,從多個個體中提取DNA構(gòu)建文庫。此外,使用Illumina平臺從SMRT-seq測序的同一蜱蟲中進行150bp短讀長測序,產(chǎn)生112 Gb的數(shù)據(jù),基因組覆蓋率約為49倍。

圖片
Fig.1肩突硬蜱基因組組裝。

a ,單只蜱蟲基因組組裝和測序計劃流程圖。左邊,gDNA質(zhì)檢的“膠圖”和FEMTOpluse系統(tǒng)的質(zhì)檢圖。中間,總RNA的“膠圖”和Tape station系統(tǒng)的質(zhì)檢圖。右邊,Hi-C文庫及測序(4只雌蜱)。b,不同版本基因組質(zhì)量評估關(guān)鍵參數(shù)比較。c, Assembly tree maps with contigs scaled by length and scaffolds color coded。d. Hi-C組裝得到的14條染色體的scaffolds。c, Assembly tree maps with contigs scaled by length and scaffolds color coded。e, 12個Illumina 的RNAseq 數(shù)據(jù)集比對到 VB49 Wikel, NCBI ISE6 和當前基因組。


質(zhì)量提高的基因組


研究人員分別通過比較三款HiFi基因組組裝工具(hifiasm,?hicanu v.2.0 和 IPA v.1.3.1)結(jié)果,hifiasm組裝結(jié)果基因組連續(xù)性、完整性最好(Sup Table2)。

圖片

研究人員為了獲得染色體水平的高質(zhì)量的單倍型基因組,使用purge dups去除了重復的單倍型,最終獲得的contig set比之前組裝的兩個版本基因組具有更高的完整性(Table1),去重后的contig序列大小為2.23Gb(accession no. GCA_016920785.2),BUSCO完整性值C值為96.3%。使用Proximo Hi-C,將>50kb的Contig連接成scaffold,得到了14個染色體的scaffolds序列,接近總長度2.23Gb的90%序列,scaffold N50 為132 Mb,BUSCO completeness of 98.8% (Fig. 1b-d,Sup Fig. 1e)。從公共數(shù)據(jù)庫下載了12個高質(zhì)量的Illumina的RNA-seq數(shù)據(jù)集比對到VB49 Wikel, NCBI ISE6和新組裝基因組上。除了4個來自細胞的轉(zhuǎn)錄組數(shù)據(jù)集外,8個來自蜱組織的數(shù)據(jù)集在新組裝的基因上比對結(jié)果做好(Fig. 1e)。

圖片
Table 1 | 肩突硬蜱基因組特征總結(jié)

通過結(jié)合RNA-seq提高基因組注釋質(zhì)量


為進一步提高基因組注釋質(zhì)量,對單一蜱蟲進行了Isoform sequencing(Iso-Seq),從Iso-Seq數(shù)據(jù)確定了142057個高質(zhì)量異構(gòu)體和假定的蛋白質(zhì)編碼序列,主要是完整的開放閱讀框(ORFs) (Fig.2a)。基因組注釋使用了NCBI的RefSeq注釋流程,共釋放了三個版本: 101(發(fā)布日期2021年3月22日;HiFi contig assembly),102(4月1日2021; HiFi contig assembly + Iso-Seq data)和103(2021年7月7日; HiFi contig + Iso-Seq data, supported by Hi-C scaffold assembly),三個版本的基因組注釋質(zhì)量逐漸提高(Fig.2b),最終基因組注釋文件為NCBI 103。

研究人員對轉(zhuǎn)座元件(TEs)進一步分析,基因組約69%的區(qū)域被RepeatModeler鑒定為重復序列,產(chǎn)生了4,527個假定一致的序列。Dfam和RepBase搜索產(chǎn)生了81個已知元件,合并不同結(jié)果并去重后最終產(chǎn)生3,921個轉(zhuǎn)座元件(Sup Table3)。Overall, ~46%的散在重復序列被標記為unknown, 其中可能的長散在核元件(LINES),長末端重復序列(LTRs),DNA轉(zhuǎn)座子和短散在元件序列分別占~12%,~9.6%,~8.8%和~1.3% (Fig. 2c),并在不同染色體上占比接近(Fig. 2d)。

研究人員比較了當前基因組(NCBI 103)和之前兩個版本基因組VB49 Wikel和NCBI ISE6注釋特征及基因數(shù)目(Table 1),當前版本基因組注釋質(zhì)量在多個方面得到了提升(Fig. 2e),得到了更多的基因數(shù)目,NCBI 103 (32,419), NCBI ISE6 (30,436) ,VB49 Wikel (23,342)。更多新的mRNA類型,更多非編碼RNA數(shù)目。(t)RNA 和 long noncoding (lnc)RNA 數(shù)目比NCBI ISE6少了約14%,small nuclear (sn)RNA比VB49 Wikel少了約20%。Iso-Seq分析能夠在注釋時提供轉(zhuǎn)錄起始位點,轉(zhuǎn)錄結(jié)束位點,5’-UTRs, 3’-UTRs和 splicing patterns (Fig. 2f 和 Sup Fig. 2a,b), 提高了gene models (Fig. 2g 和 SupFig. 2c)。


圖片
Fig. 2 | Annotation and analyses of I. scapularis genome

?a, ORFs in the Iso-Seq data。b, 100 (ISE6), 101, 102 and 103注釋結(jié)果中基因比較。c,DNA重復序列和轉(zhuǎn)座元件分析. d, 14條染色體scaffolds序列組成比較。e, I. scapularis gene基因注釋在VB49 Wikel、ISE6和 current 103 release)中結(jié)果,箭頭和三角分別表示不同注釋類別的增加或減少。f, Example of a gene (LOC8023763) with alternative transcription start sites。g, Example of a gene (LOC8026453) that is split or merged in different genome annotations with alternative transcription start sites。h. NCBI ISE6及 VB49 Wikel和當前版本基因組都注釋到的免疫基因在不同染色體上的分布。


代表性基因的注釋和結(jié)構(gòu)變化?


研究人員發(fā)現(xiàn)了多個well-known基因家族發(fā)生了擴張,比如一些免疫通路基因和化學感受受體基因,并對免疫基因數(shù)目和之前NCBI ISE6及 VB49 Wikel基因組進行了比較,并借助HiC數(shù)據(jù),將這些免疫基因定位到不同染色體上(Fig. 2h)。

研究人員進一步對腸道和唾液腺特異性基因和之前的注釋結(jié)果進行比較,也發(fā)現(xiàn)了較多的變化(Sup Table 6、7),并且許多先前確定為疫苗候選的蜱抗原,或涉及蜱-宿主-病原體相互作用的蜱抗原注釋結(jié)果發(fā)生了較多變化(Sup Table8)。

通過Hi-C數(shù)據(jù)獲得了14條染色體的scaffolds序列(Fig.3a),其中13條為常染色體,一條為X染色體。Hox聚集到CS1上(Sup Fig. 1e),其中包括大多數(shù)蒼蠅的Hox基因的同源物;在果蠅(Drosophila spp)中,這些在3R染色體中分裂為兩個簇(antp和bithorax) (觸角基因和雙胸基因),間隔約9.6 Mb(Fig. 3b)。新組裝結(jié)果還發(fā)現(xiàn)了防御素和防御素樣基因產(chǎn)物的顯著擴展,包括27個注釋的防御素,它們分布在兩個基因簇中,在CS5相距約7.6 Mb (Sup Table 10 和 Fig. 3c, upper panel)。

同樣,谷胱甘肽s -轉(zhuǎn)移酶(GST)家族在CS1中也有大量擴增(Fig. 3c, lower panel, and Sup Table 11)。此外,由于表觀遺傳調(diào)控因子對蜱蟲的生活方式可能至關(guān)重要,研究人員研究了蜱蟲基因組中一組具有代表性的表觀遺傳基因簇,如the trithorax group (TrxG) and polycomb group (PcG)蛋白,并將主要的TrxG和PcG基因比對回不同版本的基因組上(Fig. 3d)。


圖片
Fig. 3 | 組裝到染色體水平的scaffolds和基因分析

代表性TrxG 基因分析及其功能


為了評估改進的基因組如何促進對硬蜱屬成員生物學特征理解,特別是在發(fā)育、嗜血和持續(xù)攜帶病原體的特征,研究人員分析了在果蠅中研究較多的三個主要的TrxG基因(ash2,Set1和NSD2)。TrxG基因中只有ash2在吸血階段表達升高(Fig.4a),然后使用RNAi技術(shù)敲低ash2基因或者其它TrxG基因(Fig.4b, Extended Data Fig. 1d)能夠影響蜱蟲飽血的時間但不影響飽血后重量(Fig. 4c,Extended Data Fig. 1e-g),進一步影響了蜱蟲的蛻皮能力(Fig. 4d, Extended Data Fig.1h)。

研究人員確定了Ash2的兩種isoforms(Fig.4e, Extended Data Fig.2b),使用抗重組Ash2抗體的Western blotting分析在整個蜱蟲裂解液中識別出約55 kDa的天然蛋白(Fig. 4f)。共聚焦免疫熒光顯示,該蛋白可在蜱的腸道和唾液腺中檢測到,定位在細胞核內(nèi)(Fig. 4g)。對ash2沉默蜱的組織學分析顯示腸道組織的改變(Fig. 4h)。喂食8小時后檢測ash2缺陷蜱的腸道細胞增殖活性也受到損害(Fig. 4i),包括腸道中組蛋白修飾事件減少。


圖片
Fig. 4 |蜱蟲吸血階段早期腸道中的development需要Ash2基因


提高的立克次體基因組


研究人員從HiFi序列中重新組裝了Rickettsia sp的基因組,長度為1.78Mb, 平均 coverage 為 77× (Fig. 5a),并使用NCBI Prokaryotic Genome Annotation流程進行注釋,得到了2,055個基因和472個假基因(Fig.5b)。研究人員使用蛋白編碼基因和16S 構(gòu)建系統(tǒng)發(fā)育樹(Fig.5c)證明其組裝的基因組質(zhì)量可靠并和其它基因組進行了比較(Fig. 5d);)。結(jié)合HiC數(shù)據(jù)研究人員試著對 Rickettsia sp染色體序列進行劃分(Fig. 5e, left), 盡管分辨率較低,但還是發(fā)現(xiàn)Rickettsia sp基因組中存在多個互作關(guān)聯(lián)區(qū)域(Fig. 5e, right)。


圖片
Fig. 5 | 立克次體基因組組裝和注釋


肩突硬蜱遺傳差異


為了評估當前基因組作為基因分型和評估遺傳變異的有效性,研究人員接下來對從不同流行地區(qū)收集的野生肩突硬蜱進行了限制性內(nèi)切位點相關(guān)測序(RAD-seq)分析。通過主成分判別分析(DAPC)對種群結(jié)構(gòu)的分析表明,不同地區(qū)肩突硬蜱在遺傳上是多樣化的,而俄克拉荷馬州立大學實驗室飼養(yǎng)的種群與來自同一地區(qū)的野生捕獲種群聚集在一起(Fig. 6a,b 和 Sup Table 15)。然后構(gòu)建了野生蜱蟲的snp圖譜并估算了不同地區(qū)的肩突硬蜱遺傳聚類(Fig. 6c-d)。


圖片
Fig. 6 | Variations in tick population genetic structures as assessed by RADseq。


高分辨率蛋白質(zhì)組圖譜


研究人員通過納米液相色譜-串聯(lián)質(zhì)譜分析法(nano-LC–MS/MS)對肩突硬蜱進行了蛋白組測序,確定了4,927個蛋白質(zhì)種類,許多基因在不同喂養(yǎng)狀態(tài)和生命階段中存在差異表達(Fig. 7a-c)。

圖片
Fig. 7 | Whole-body proteome analysis of I. scapularis over the course of feeding and adult development.

總結(jié):

研究人員從肩突硬蜱的單一雌蜱中提取高分子量的DNA并通過pacBio的SMRT平臺進行了HiFi測序,進而對肩突硬蜱基因組進行了重新組裝,該種測序策略避免了多只蜱蟲混樣帶來的DNA異質(zhì)性對組裝的影響,盡管在組裝的完整性、準確性上相比之前有了大幅度的提高,但相比于現(xiàn)在的HiFi序列組裝的基因組,N50值太低了(連續(xù)性不夠),但絲毫不影響作者在NG上發(fā)表文章。

在基因組后續(xù)的分析中,作者沒有在重復之前的也常見的比較基因組學工作,而是專注于和之前的肩突硬蜱基因組組裝和注釋質(zhì)量進行比較,證實自己的基因組在組裝和注釋質(zhì)量是可靠的。并選取了幾個關(guān)鍵基因進行了定位及RNAi實驗證實其可靠性及基因功能。


肩突硬蜱遺傳異質(zhì)性分析中,研究人員選擇了RAD-seq測序分析并比較了不同染色體上SNP分布特征及不同地區(qū)的遺傳關(guān)系,我比較疑惑的是為什么沒有選擇重測序,推斷可能是為了節(jié)約成本。最后,研究人員進行蛋白質(zhì)組測序并結(jié)合轉(zhuǎn)錄組數(shù)據(jù)觀察不同階段肩突硬蜱的一些基因表達變化。



補充學習:

low input (LI)和ultra-low input (ULI) DNA文庫:低起始量文庫和超低起始量文庫,其中ULI要經(jīng)過PCR擴張,用以增加DNA量。


FEMTO Pluse系統(tǒng)可以分離 165 kb 以內(nèi)的高分子量 DNA,還可以檢測起始量濃度低至 50 fg/μL 的核酸,是低濃度樣品中長讀長 NGS 文庫 QC、gDNA、小 RNA 或 cfDNA 分析的理想選擇。


TapeStation 系統(tǒng)是用于 DNA 和RNA 樣品質(zhì)量控制 (QC) 的自動化電泳解決方案。TapeStation系統(tǒng)是一個一體化平臺,包括用于分析樣品分子大小、數(shù)量和完整性的儀器、數(shù)據(jù)處理軟件、試劑以及 Screen Tape 膠條。該系統(tǒng)提供高精準度的分析評估,非常適合于新一代測序(NGS) 或生物樣本庫工作流程,可實現(xiàn)從低到高的各種樣品通量。


Hox基因(英語:Hox genes)全名同源基因(英語:homeotic genes)或同源異型基因。是生物體中一類專門調(diào)控生物形體的基因,一旦這些基因發(fā)生突變,就會使身體的一部分變形。其作用機制,主要是調(diào)控其他有關(guān)于細胞分裂、紡錘體方向,以及硬毛、附肢等部位發(fā)育的基因。Hox基因?qū)儆谕串愋秃校╤omeobox)家族的其中一員,在大多數(shù)Hox基因中,會含有一段約180個核苷酸的同源異型盒,可以轉(zhuǎn)錄出含有約60個氨基酸序列,稱為同源蛋白質(zhì)區(qū)段(homeodomain)


RAD(Restriction-site-associated DNA sequencing)即與限制性核酸內(nèi)切酶識別位點相關(guān)的DNA序列。RAD-seq技術(shù)于2008年由Baird提出。傳統(tǒng)RAD方法是對基因組DNA進行單酶切,加接頭后對酶切片段超聲波隨機打斷后建庫測序,因此單酶切RAD測序得到的帶酶切位點的read1是對齊的,而read2是參差不齊的。



參考學習文章:

1.Geraci, N. S., Spencer Johnston, J., Paul Robinson, J., Wikel, S. K.

& Hill, C. A. Variation in genome size of argasid and ixodid ticks.

Insect Biochem. Mol. Biol. 37, 399–408 (2007)

2.Gulia-Nuss, M. et al. Genomic insights into the Ixodes scapularis

tick vector of Lyme disease. Nat. Commun. 7, 10507 (2016).





本文使用 文章同步助手 同步


高質(zhì)量的肩突硬蜱基因組促進了蜱類科學的發(fā)展的評論 (共 條)

分享到微博請遵守國家法律
鹤山市| 阳东县| 华安县| 安宁市| 延吉市| 沙河市| 垣曲县| 赣榆县| 顺昌县| 赞皇县| 东阿县| 清苑县| 铁岭县| 长丰县| 娄底市| 珲春市| 波密县| 晋宁县| 进贤县| 金平| 同仁县| 昭通市| 高唐县| 曲沃县| 清河县| 西平县| 澎湖县| 盐源县| 城固县| 常山县| 绥棱县| 玉田县| 长寿区| 县级市| 蒲城县| 西峡县| 深泽县| 信阳市| 东光县| 长岭县| 湖南省|