Nat子刊: 如何提高基于生物樣本庫的抑郁癥遺傳研究的準確性?
近日,Andrew Dahl和Na Cai等人探討了如何改進生物信息庫中與重度抑郁癥(MDD)相關的遺傳研究。他們提出,結合不同類型的表型—既有大樣本但低特異性的淺層表型,也有小樣本但高特異性的深層表型—能顯著提升研究的效果。
通過整合多種MDD相關表型,作者能更準確地進行全基因組關聯(lián)研究(GWAS)和多基因風險評分(PRS)。此外,他們提出了一種新型的基于PRS的多效性指標,證實了這種估算方法在保持遺傳結構特殊性的同時,增強了GWAS的力量和PRS的預測準確性。
他們的成果發(fā)表在最新一期的Nature Genetics雜志上,名為 “Phenotype integration improves power and preserves specificity in biobank-based genetic studies of major depressive disorder”
雖然MDD是全球最普遍的精神難題,其成因大多仍是謎團。最新研究通過GWAS開始揭示風險因素,發(fā)現(xiàn)增加樣本量和深入分析表型是關鍵。這不僅提高了對遺傳影響的準確估計,還增強了研究的力度和準確性。盡管研究者面臨預算限制,必須在樣本量和表型深度間權衡,但如何選擇仍存爭議。
本研究提出一種新策略(圖1),整合UKB中與MDD相關的表型數據,以增強研究的綜合性。作者通過表型估算顯著提升了對MDD表型的分析力度和精確度。此外,他們還開發(fā)了新技術,對非特異性信號進行校正,并通過多特征分析來研究表型的綜合效應。
圖1.研究概述
1. 表型估算增加了有效的樣本量
在UKB里,作者深入探討了MDD的細致標準。通過結合在線心理健康問卷(MHQ)的數據,識別了16297例MDD病例和50867例對照組。此外,他們還研究了MDD的基本特征,包括217種與抑郁癥相關的表現(xiàn)。利用SoftImpute技術數據和深度學習算法AutoComplete,提高了對抑郁癥現(xiàn)象的估算數據和其準確度。
2. 表型估算提高了GWAS力量
在這項研究中,作者通過GWAS分析了實際觀察到的及估算的LifetimeMDD(一生中至少一次抑郁癥)案例。結果顯示,估算數據揭示了更多遺傳位點(圖2)。分析表明,估算方法能捕捉到與實際觀察到的LifetimeMDD相似的遺傳信號。此外,作者還發(fā)現(xiàn)這些遺傳位點在不同抑郁癥隊列中具有一致的效果。他們還探討了LifetimeMDD的多基因結構,顯示估算值雖然遺傳性略低,但與觀察值在遺傳相關性上非常接近。
圖2.觀察到和估算的LifetimeMDD的遺傳結構
3. 全表型因素指數抑郁癥風險的基因多效性
在SoftImpute中,作者分析了關鍵因素,以識別影響表型相關性的主導因素。通過兩個統(tǒng)計指標,他們突出了最重要的因素(圖3)。作者探究了這些因素的遺傳基礎,發(fā)現(xiàn)它們在遺傳層面的影響差異顯著。例如,某些因素與年齡緊密相關,而另一些因素則與社會經濟地位和教育程度相關。最后,他們分析了這些因素與抑郁癥表型的遺傳相關性,發(fā)現(xiàn)遺傳相關性與因素負荷緊密相關。
圖3. 描述驅動 SoftImpute 的主要潛在因素
4. MTAG提高了GWAS力量,但對輸入很敏感
在尋找更佳的遺傳性疾病預測方法中,作者嘗試:利用METAG技術對多個GWAS的數據進行整合分析。通過對六組不同的GWAS數據使用METAG,他們發(fā)現(xiàn)這種方法能有效增加我們對終身抑郁癥遺傳標記的識別(圖4)。尤其是當我們將抑郁癥家族史和環(huán)境因素納入分析時,GWAS的命中率顯著提高。此外,隨著輸入表型的增多,GWAS命中數也相應增加,這可能是由于METAG在提高力量的同時也增加了假陽性的風險。
圖4.不同輸入表型選擇的METAG結果
5. 表型估算和MTAG提高了PRS的準確性
作者深入探索了PRS在預測MDD方面的準確性。通過對UKB的數據進行分析,作者使用十倍交叉驗證的方法來測試這些PRS的效果。他們的比較涵蓋了從不同數據來源構建的PRS,包括UKB、GPpsy數據庫以及PGC和iPSYCH。
他們發(fā)現(xiàn),使用特定的方法(如SoftImpute和AutoComplete)構建的PRS在預測MDD方面的效果比其他方法更佳,甚至比基于更大樣本量的23andMe數據更準確(圖5)。此外,還發(fā)現(xiàn)MTAG技術在PRS的構建中顯示出獨特的優(yōu)勢,尤其是在處理多個不同的輸入數據時。
圖5.使用觀察、估算和/或元分析的MDD的PRS性能
6. PRS特異性的新指標
在探索UKB數據時,作者發(fā)現(xiàn)結合不同的表型可以提高MDD的PRS準確性,但這可能降低MDD的特異性。為了評估這種效果,他們比較了MDD與其他表型的PRS預測準確性,并引入“PRS多效性”指標來衡量其通用性。分析顯示,與MDD緊密相關但稍有差異的表型,如普通心理問題(GPpsy),通常具有較高的PRS多效性。此外,他們發(fā)現(xiàn)不同的PRS整合策略,如MTAG方法,其特異性和靈敏度表現(xiàn)各異。
圖6.表型范圍的 PRS 多效性量化了非特異性
總結
作者探討了如何通過結合多種MDD表型,提高GWAS和PRS的效力和準確性。他們發(fā)現(xiàn),混合表型提升了GWAS的功效,同時保持了MDD的遺傳結構。此外,他們討論了表型整合在基于生物庫的遺傳研究中的廣泛適用性,以及其對遺傳研究公平性的復雜影響。