最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

獲得全基因測(cè)序的最優(yōu)方案—低深度重測(cè)序(LcWGS)有奇招!

2022-06-14 08:23 作者:上海歐易生物  | 我要投稿

全基因組關(guān)聯(lián)研究(GWAS)已經(jīng)確定了數(shù)千種與人類和農(nóng)業(yè)物種復(fù)雜性狀相關(guān)的遺傳變異。盡管測(cè)序成本不斷下降,大規(guī)模的全基因組測(cè)序(幾千個(gè)樣本)的成本仍然很高。在許多情況下,基于參考面板填充的策略將低密度數(shù)據(jù)填充為高密度數(shù)據(jù),為全基因組關(guān)聯(lián)分析提供了一種經(jīng)濟(jì)有效的方法。

在過去十年中,產(chǎn)生了越來越多樣本的參考面板(such as 1000 Genomes (1000G),Haplotype Reference Consortium (HRC),and the TransOmics for Precision Medicine (TOPMed) Program)。參考面板樣本量的連續(xù)增加促使我們捕獲了更多罕見的變異,并在關(guān)聯(lián)研究中提供了更高分辨率的圖譜。但是隨著面板的增加,如何選擇最佳參考面板也是一個(gè)挑戰(zhàn)。例如,當(dāng)在特定研究群體中(如撒丁島、芬蘭、挪威、和冰島等地進(jìn)行的研究),較小的定制參考面板可能要比使用廣泛使用的公共參考面板有更好的填充效果。但是定制的參考面板會(huì)可能會(huì)遺漏一些罕見的突變和單倍型,而這些突變和單倍型同樣也可能會(huì)被較大的面板所覆蓋,并且可能對(duì)具有獨(dú)特祖先的個(gè)體表現(xiàn)不佳。理想的解決方案是構(gòu)建一個(gè)組合參考面板。


2022年5月3日,密歇根大學(xué)生物統(tǒng)計(jì)學(xué)系Gon?alo Abecasis研究員與他的研究團(tuán)隊(duì)在AIHG發(fā)表"Meta-imputation: An efficient method to combine genotype data after imputation with multiple reference panels"文章中提出了一種Meta-imputation方法,該方法允許將使用不同參考面板生成的多個(gè)填充結(jié)果合并到一起,生成一致填充數(shù)據(jù)集。


Meta-imputation包括兩個(gè)單獨(dú)的步驟(minimac4+MetaMinimac2),即填充和整合,如下圖:


meta-imputation分析流程圖


首先,根據(jù)兩個(gè)或多個(gè)不同的參考面板估算目標(biāo)樣本。文章中創(chuàng)新的地方是使用每個(gè)基因組中的基因型標(biāo)記來估計(jì)每個(gè)個(gè)體的局部權(quán)重。然后通過依次掩蔽每個(gè)觀察到的基因型,試圖根據(jù)側(cè)翼標(biāo)記的信息對(duì)其進(jìn)行填充,文章中稱此程序的估算結(jié)果為leave-one-out (LOO) dosages。


通過比較LOO dosages和掩蔽位點(diǎn)的原始基因型來評(píng)估每個(gè)參考面板的局部填充性能,并相應(yīng)地分配局部權(quán)重。如下圖中展示了使用兩個(gè)參考面板的LOO填充算法的簡化版本。


leave-one-out填充示例圖


為了評(píng)估Meta-imputation對(duì)于填充混合個(gè)體基因組的能力,文章中選擇了一組1000G具有混合祖先的樣本,并創(chuàng)建了兩個(gè)填充面板——一個(gè)具有大部分歐洲血統(tǒng)的個(gè)體(EUR,503名歐洲人),另一個(gè)具有大部分非洲血統(tǒng)的個(gè)體(AFR,600名非洲人)。將美國西南部(ASW)的61名非裔美國人(采用Illumina Human1M-Duo BeadChip (19,883 out of 1,803,869 variants on chromosome 20)獲取基因型),使用歐洲面板和非洲面板進(jìn)行了Meta-imputation,并通過計(jì)算 imputed results和masked genotype data之間的aggregated r2來評(píng)估填充準(zhǔn)確性,如下圖:


非裔美國人樣本填充精度比較圖


從結(jié)果來看,Meta-imputation的準(zhǔn)確度大大高于使用單一參考面板進(jìn)行填充的準(zhǔn)確度。對(duì)于MAF為0.05%~0.1%,與單獨(dú)使用AFR面板(r=0.313)或單獨(dú)使用EUR面板(r=0.009)的填充相比,Meta-imputation實(shí)現(xiàn)了更高的精確度(填充劑量和實(shí)際基因型之間的r=0.427),并且Meta-imputation的精確度與使用AFR+EUR面板(r=0.425)的精確度相當(dāng)??偟膩碚f,與使用一個(gè)較小的面板相比,對(duì)于罕見變異,Meta-imputation具有最大的優(yōu)勢(shì)。


文章中還使用大小差異很大的參考面板,在南亞血統(tǒng)樣本中評(píng)估Meta-imputation方法,如下圖,采用TOPMed release 2 面板(包括97256個(gè)個(gè)體)和1000G phase 3(GRCh38)面板(包括2504個(gè)個(gè)體)對(duì)762個(gè)南亞樣本進(jìn)行填充。采用UK Biobank發(fā)布了約50000名個(gè)體的完整外顯子組測(cè)序數(shù)據(jù)集作為真值集,以評(píng)估填充的準(zhǔn)確性。從結(jié)果來看,Meta-imputation的準(zhǔn)確度同樣高于2個(gè)參考面板單獨(dú)進(jìn)行填充的準(zhǔn)確度。


南亞樣本填充精度比較圖


文章中還展示了Meta-imputation填充性能的優(yōu)勢(shì),如下表,分別統(tǒng)計(jì)了1000、2000、5000和10000個(gè)目標(biāo)樣本的Meta-imputation單核計(jì)算時(shí)間。?


結(jié) 論


Meta-imputation程序包括兩個(gè)單獨(dú)的步驟,即填充和整合,允許研究人員逐步考慮新的參考面板,而無需使用之前的面板重復(fù)填充步驟。隨著每個(gè)面板的添加,研究人員只需針對(duì)新面板填充目標(biāo)樣本,然后即可將結(jié)果與之前計(jì)算的填充結(jié)果數(shù)據(jù)集相結(jié)合,實(shí)現(xiàn)面板共享,擴(kuò)大了對(duì)越來越罕見變異的填充范圍。除此之外,作者也指出了該方法的一些局限性,例如Meta-imputation是基于每個(gè)單倍型進(jìn)行的,因此其性能取決于pre-phasing的質(zhì)量。phasing中的switch errors可能導(dǎo)致填充精度降低和權(quán)重誤導(dǎo),因此Meta-imputation應(yīng)直接受益于不斷發(fā)展的phasing算法。


原創(chuàng)聲明:本文由歐易生物旗下子公司青島歐易報(bào)道,本文著作權(quán)歸文章作者所有。歡迎個(gè)人轉(zhuǎn)發(fā)及分享,未經(jīng)作者的允許禁止轉(zhuǎn)載。

獲得全基因測(cè)序的最優(yōu)方案—低深度重測(cè)序(LcWGS)有奇招!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
小金县| 宁海县| 工布江达县| 武陟县| 青岛市| 黄梅县| 碌曲县| 睢宁县| 滨海县| 高淳县| 长海县| 松阳县| 招远市| 汪清县| 高平市| 通榆县| 余姚市| 陆川县| 乐至县| 石屏县| 葵青区| 赞皇县| 石家庄市| 苏尼特左旗| 万安县| 博爱县| 延长县| 喀什市| 富平县| 巫山县| 汨罗市| 日照市| 邳州市| 缙云县| 贡嘎县| 武胜县| 东明县| 正镶白旗| 汽车| 海丰县| 林甸县|