凌恩生物文獻分享|大熱門--HiFi宏基因組有效提升真核生物群落檢出效果

binning和HiFi宏基因組測序優(yōu)勢:
? ? ? 不依賴于微生物的分離培養(yǎng),環(huán)境微生物單菌基因組(框架圖)研究的一種新的途徑和高性價比策略;
? ? ? 可以得到環(huán)境中豐度較低的宏基因組,為研究低豐度微生物提供了途徑;
? ? ? 引入了宏觀生態(tài)的研究理念,對環(huán)境中微生物菌群的多樣性、功能活性等宏觀特征進行研究,可以更準確地反應出微生物生存的真實狀態(tài)。

美國國家海洋和大氣管理局近期在《mSystems》期刊上(IF=7.324)發(fā)表的“Long-Read Sequencing Improves Recovery of Picoeukaryotic Genomes and Zooplankton Marker Genes from Marine Metagenomes”研究論文中,驗證了HiFi宏基因組binning的結果可以改善海洋群落組成分析,并為真核生物植物和浮游動物的遺傳學提供重要的見解。

期刊:mSystems????
影響因子:7.324 ????????
發(fā)表時間:2022
樣本類型:水樣
一、實驗背景
三代宏基因組測序具有改善宏基因組組裝的潛力,并提供了比二代測序更穩(wěn)健的微生物群落組成和功能的評估。高通量測序可對無法培養(yǎng)分類群為主的生態(tài)重要生境進行群落調查,通過組裝基因組 (MAG) 對原核生物多樣性和生態(tài)學提供了重要的見解。與原核生物相比,真核生物基因組的binning相關計算更大,更大的基因組、內含子的存在和染色體間的組成差異,是真核 MAGs 準確矯正的重要障礙。
二、實驗設計
將PacBio CCS HiFi 測序應用于14個海洋水柱樣本,并將結果與相應環(huán)境 DNA 樣本的二代宏基因組的結果進行比較。
三、實驗結果
1、二代和三代測序結果與組裝
每個樣本的PacBio CCS 測定reads 的數量為6,807~1,907,840個,相應的 Illumina reads數量為2,879,847~264,220,592。
文章對相應eDNA樣品的不同組裝方式進行了比較,Illumina組裝、PacBio(HiFiasm meta和metaFlye)以及Illumina和PacBio的混合組裝(hybridSPAdes)。經比較,相比于二代或混合組裝中的contigs,僅三代產生的組裝中的最長contigs更長。最長contigs(> 800 kb,來自Las19c139_27m-3)上的ORF注釋為Verrucomicrobiaceae?細菌TMED86(圖1)。
其他組裝方式顯示contigs之間的差異很大;混合組裝和二代比三代可以組裝更多的 > 1kb的contigs, 另外metaFlye 組裝出來contigs數量 (> 5kb)是最多的。
2、二代和三代測序注釋比較
使用隱馬爾可夫模型 (HMMs) 比較了從Illumina、PacBio和混合組裝中提取的小亞基 SSU rRNA基因,混合和二代組裝之間 SSU rRNA 序列的平均數量相當?;?K-mer ,三代和二代樣本之間的物種注釋組成比較差異很大。三代和二代宏基因組的基因組的多樣性差異很大(圖1)。
α多樣性分析顯示 Illumina 和混合組裝的宏基因組的數值范圍比 PacBio 宏基因組要小很多,Shannon 多樣性值和基于組裝分析差異很大(圖2)?;趓eads以及組裝的注釋分類學比較,β多樣性顯示三代和二代樣本之間差異有統(tǒng)計學意義,混合組裝與 Illumina metaSPAdes 組裝緊密聚集。


三代測序的主要潛在優(yōu)勢之一是矯正完整的蛋白編碼基因和重建完整的生化基因通路。因此文章比較了所有組裝類型中 ORF 的總數、具有 KEGG 注釋的 ORF 的分數和每個contigs注釋 ORF 的平均數量(圖3)以及比較了完整(> 80%)KEGG模塊的數量(表1),發(fā)現二代的平均模塊完整性最高為42%,而三代的平均值不到該值的一半。二代和混合組裝體的總 ORF 數量最高(圖3A),但三代組裝得到的MAG具有更高比例的注釋ORF(圖3B),從而導致所有組裝類型中總注釋 ORF 的數量相當(圖3C)。


3、二代和三代測序binning比較
使用兩種不同的binning程序比較了二代、三代和混合組裝生成的 MAGs 的數量和質量評分??傮w而言,使用 Vamb binning的混合組裝產生了最多的MAG(平均值為18)以及40.3的高質量評分(表2)。

在所有三代和混合組裝產生的15個高質量的 MAGs 中,從相應二代宏基因組中匹配到的MAG缺少(在屬水平上定義)5個(表3)。這些獨特的 MAGs 中包括疣微菌門SW10、酸桿菌門TK06 和黃桿菌科微生物。其中兩個 MAGs 可能受益于 PacBio 組裝產生的較長contigs,最長的 MAG contigs在290,000和320,000 bp之間(表3)。同樣從二代宏基因組中復原的MAG中,10個中有9個來自混合組裝,其中8個來自Vamb binning程序。

此外,從混合組裝中產生了兩個真核MAGs。經過人工優(yōu)化(圖4)的單拷貝基因的分類和DNA依賴性的rRNA聚合酶基因的系統(tǒng)發(fā)育定位,它們被鑒定為微真核生物類群——Ostreococcus lucimarinus?和Bathycoccus prasinos。

來自5個不同 metaFlye 三代組裝的9個 > 10000 bp的contigs包含全長 18S rRNA 和完整或部分 28S rRNA 基因序列。根據位于contigs上的 18S 和 28S rRNA 基因序列,進行浮游動物物種注釋。在9個 18S rRNA 基因中,2個對磷蝦種?Euphausia pacifica?,3個對橈足類種?Calanus pacificus?或?Metridia sp. 的 BLAST 相似度最高。。

四、研究結論
與單獨的擴增子測序或二代宏基因組測序相比,二代+三代宏基因組的組合可以得到更完整的浮游群落組成結構,包括磷蝦和橈足類。這項研究為理解物種間遺傳變異性和利用 eDNA 序列數據補充海洋生態(tài)系統(tǒng)中物種調查結果提供了基礎。
凌恩生物優(yōu)推PacBio HiFi三代擴增子、宏基因組測序項目,為您提供專業(yè)優(yōu)質的三代全長16S、ITS測序,各類環(huán)境、醫(yī)學樣本宏基因組測序及專業(yè)可靠的分析服務。測序找凌恩,組學科研好伙伴~
參考文獻
Patin NV,Goodwin KD. Long-Read Sequencing Improves Recovery of Picoeukaryotic Genomes and Zooplankton Marker Genes from Marine Metagenomes. mSystems. 2022;7 (6):e0059522. doi:10.1128/msystems.00595-22