Nature | 細(xì)胞遺傳畸變或源自BRCA1/2缺乏(含免費(fèi)質(zhì)粒超值優(yōu)惠)
癌癥基因組記錄了正常細(xì)胞發(fā)育和癌變過(guò)程中 DNA 損傷和 DNA 修復(fù)缺陷引起的基因改變。BRCA1缺陷型(BRCA1d)和BRCA2缺陷型(BRCA2d)癌癥的全基因組體細(xì)胞改變模式歸因于HR的缺陷,HR是人類(lèi)細(xì)胞修復(fù)雙鏈斷裂(DSB)的主要途徑。其中一些突變模式可能反映了細(xì)胞在缺乏 HR 的情況下使用的特定易出錯(cuò)的 DSB 修復(fù)機(jī)制。這種突變模式可作為 HR 缺乏的生物標(biāo)志物,并有助于識(shí)別臨床相關(guān)的治療缺陷。
2023年8月16日,發(fā)表在《Nature》雜志上的一篇題為“Long-molecule scars of backup DNA repair in BRCA1- and BRCA2-deficient cancers”的文章,揭示了BRCA1或BRCA2缺陷所特有的重排類(lèi)別可能是HR缺陷細(xì)胞中細(xì)胞遺傳畸變的來(lái)源。
現(xiàn)漢恒有BRCA1相關(guān)基因產(chǎn)品,超值限量活動(dòng)!
典型的互變重排(即平衡易位或倒位)不會(huì)導(dǎo)致遺傳物質(zhì)的丟失或增殖。許多重排,包括易位和倒位,斷裂末端在基因組上靠近但不相鄰。TICs和chromoplexies(平衡重排鏈)是近乎對(duì)等的復(fù)雜 SVs (structural variants,結(jié)構(gòu)變異)的例子。近對(duì)等 SV 包含中間基因組區(qū)域的拷貝缺失或增益,被稱(chēng)之為空白區(qū)段。根據(jù)質(zhì)量守恒,當(dāng)斷裂末端連接到間隙區(qū)段(+極性)時(shí),拷貝數(shù)會(huì)增加;當(dāng)斷裂末端連接到側(cè)翼區(qū)段(-極性)時(shí),拷貝數(shù)會(huì)減少。對(duì)于(+)間隙區(qū)段,相同的基因座拓?fù)浣Y(jié)構(gòu)和拷貝數(shù)特征可能與易位或簡(jiǎn)單的模板插入同樣一致,在易位或模板插入中,間隙區(qū)段被拷貝到遠(yuǎn)處的基因座上,而源基因座則未被拷貝。對(duì)相互對(duì)(reciprocal pairs)的間隙段長(zhǎng)度和極性進(jìn)行可視化后,發(fā)現(xiàn)了三種不同的亞模式,它們是 BRCA1 缺乏癥和/或 BRCA2 缺乏癥所特有的。首先,在 BRCA1d 腫瘤中,具有兩個(gè) 100-bp-100-kbp (+) 極性間隙片段的互變對(duì)富集,被稱(chēng)之為互變重復(fù)(rDups)。其次,在 BRCA2d 腫瘤中,具有兩個(gè) 1-bp-10-kbp (-) 缺口片段的互變對(duì)富集,被稱(chēng)之為互變?nèi)笔В╮Dels)。第三種情況是,在 BRCA1d 和 BRCA2d 病例中,由 1-bp-100-kbp 的極性相反(+)和(-)的間隙片段組成的互補(bǔ)對(duì)富集,被稱(chēng)之為互補(bǔ)缺失重復(fù)(rDelDups)。對(duì)單個(gè)互變配對(duì)位點(diǎn)的檢測(cè)證實(shí),這些相互對(duì)發(fā)生在基因組區(qū)域,而這些區(qū)域在 1-Mbp 范圍內(nèi)并不包含其他重排。在驗(yàn)證數(shù)據(jù)集中分析這些模式證實(shí),rDups、rDels 和 rDelDups 分別在 BRCA1、BRCA2 和 HR 缺陷中富集。
圖1. 在 BRCA1d 和 BRCA2d 腫瘤中富集了相互對(duì)(reciprocal pairs)
接下來(lái),為了評(píng)估相互對(duì)是否可能導(dǎo)致 HRD 癌癥中的大規(guī)模重排,作者推斷了它們的衍生染色體結(jié)構(gòu),即相位。這些分析的具體目標(biāo)是根據(jù) LR WGS 配對(duì)模式區(qū)分順式(復(fù)制粘貼、模板插入)結(jié)果和反式(平衡易位或倒位)結(jié)果。在對(duì)基因定相進(jìn)行基準(zhǔn)測(cè)試后,作者分析了 LR WGS 數(shù)據(jù)中的相互對(duì)。對(duì) BRCA1d 樣本中的 94 個(gè) rDups 進(jìn)行相位分析后發(fā)現(xiàn),順式相位占絕大多數(shù)(67/94;71%),每一個(gè)結(jié)果都是在遠(yuǎn)處基因座的串聯(lián)重復(fù)間隙片段之間復(fù)制和粘貼一個(gè)間隙片段。例如,給定 ABC 和 DEF 這兩個(gè)基因座,就會(huì)產(chǎn)生一個(gè) ABEBC 單倍型,其中包含串聯(lián)的變異 BE 和 EB 連接,而另一個(gè) DEF 單倍型則未進(jìn)行排列。其余 29% 的基因座包含反式結(jié)構(gòu),其中 BE 和 EB 連接點(diǎn)位于不相連(染色體間 rDups)或相距較遠(yuǎn)(染色體內(nèi) rDups)的重排等位基因上。在這些結(jié)果中,兩個(gè)不同的衍生等位基因 ABEF 和 DEBC 共享重復(fù)的 B 和 E 段。這包括平衡易位,在交界處有多達(dá)約 20 kbp 的重復(fù)序列。同樣,使用 LR WGS 對(duì) 37 例 HRD(22 例 BRCA1d,14 例 BRCA2d,1 例 BRCA1d 和 BRCA2d)中的 46 個(gè) rDelDups 進(jìn)行了分期。與 rDups 一樣,在不同的基因位點(diǎn)上發(fā)現(xiàn)了順式和反式相位,盡管在 BRCA1d 腫瘤中反式相位占優(yōu)勢(shì),比例約為 2:1,而在 BRCA2d 腫瘤中順式相位占優(yōu)勢(shì),比例約為 4:1。就 ABC 和 DEF 基因座而言,順式 rDelDups 包括 "剪切、復(fù)制和粘貼 "的結(jié)果,即在一個(gè)衍生的 AEC 等位基因上用一個(gè)額外的 E 拷貝取代了 B 拷貝,而一個(gè)未排列的 DEF 基因座包含了另一個(gè) E 拷貝;相比之下,反式基因座顯示相同(1-241 kbp)的 E 片段在兩個(gè)不同的 DEC 和 AEF 衍生基因座上重復(fù)。最后,短讀數(shù)預(yù)測(cè) BRCA2d 腫瘤特異性 rDels 會(huì)產(chǎn)生嚴(yán)格的反式結(jié)果,LR WGS 證實(shí)了這一點(diǎn)。這些結(jié)果表明,反式相互對(duì)在 rDups、rDels 和 rDelDups 中很常見(jiàn),是 BRCA1d 和 BRCA2d 腫瘤中大規(guī)模重排的來(lái)源。
圖2. LR WGS 揭示了類(lèi)似相互對(duì)拓?fù)涞捻樖胶头词较辔?/p>
鑒于順式和反式相互對(duì)的染色體結(jié)果不同,作者尋找能在短讀 WGS 中區(qū)分這些位點(diǎn)的特征,從而能在更大的數(shù)據(jù)集中研究相互對(duì)的相位。對(duì)順式 rDups 的相位結(jié)構(gòu)進(jìn)行深入分析和可視化后發(fā)現(xiàn),短(50 bp-1 kbp)E 段主要以 ABEBC 結(jié)構(gòu)交錯(cuò)于長(zhǎng)(1-300 kbp)B 段的兩個(gè)拷貝之間。然而,在 ABEF 和 DEBC 單倍型中,反式 rDups 由一對(duì)較長(zhǎng)(1 kbp-300 kbp)的 B 和 E 片段組成。將這些 LR WGS 相位順式和反式位點(diǎn)與來(lái)自短讀數(shù) WGS BOPP 數(shù)據(jù)集的非相位數(shù)據(jù)繪制成圖,以每對(duì)中較長(zhǎng)的間隙段長(zhǎng)度為方向(y 軸),發(fā)現(xiàn)了兩個(gè)不同的 rDup 群。第一個(gè) "長(zhǎng)-短 "rDup 群涉及較長(zhǎng)(1-100 kbp)和較短(10 bp-1 kbp)間隙片段的連接,完全由順式事件組成。相比之下,反式 rDups 完全包含在第二個(gè) "長(zhǎng)-長(zhǎng) "群中。發(fā)現(xiàn)類(lèi)似的長(zhǎng)度差異可以區(qū)分順式和反式 rDelDups。這些長(zhǎng)度差異使得在短讀數(shù) WGS 中以合理的精度推算相互對(duì)相位成為可能。由于反式相互對(duì)可能產(chǎn)生長(zhǎng)程 SV(例如平衡易位和倒位),預(yù)測(cè)反式事件(而非順式事件)的染色體方向會(huì)受到限制。具體來(lái)說(shuō),反式相互對(duì)可能出現(xiàn)在兩種中心粒定向之一:第一種(I 型)定向只產(chǎn)生單中心染色體,而第二種(II 型)定向產(chǎn)生一個(gè)或多個(gè)異中心衍生物。由于無(wú)著絲粒 DNA 片段容易在隨后的細(xì)胞分裂中丟失,因此無(wú)著絲粒片段上的連接點(diǎn)會(huì)優(yōu)先丟失,而剩余的連接點(diǎn)不會(huì)被檢測(cè)為相互對(duì)。這將導(dǎo)致反式相互對(duì)的 I 型偏倚。相反,由于模板插入不會(huì)改變?nèi)旧w中心粒的劑量,因此順式基因座應(yīng)該與 I 型和 II 型取向無(wú)關(guān)。事實(shí)上,當(dāng)分析 LR WGS 的分期數(shù)據(jù)時(shí),發(fā)現(xiàn)反式基因座對(duì) I 型和 II 型的偏倚超過(guò) 9:1,而順式基因座同樣有可能處于 I 型或 II 型方向(P = 3.9 × 10-6,幾率比(OR)= 8.57,費(fèi)雪精確檢驗(yàn))。接下來(lái),作者分析了短讀數(shù) WGS BOPP 數(shù)據(jù)集中的無(wú)相位相互對(duì),根據(jù)大小和方向推算順式和反式相位。結(jié)果發(fā)現(xiàn)這些數(shù)據(jù)具有相同的偏倚方向(P = 1.4 × 10-4,OR = 1.96),盡管這些數(shù)據(jù)僅有歸因相位。特別是,這些分析表明,染色體內(nèi)反式相互對(duì)產(chǎn)生的巨堿基規(guī)模倒位同樣受到中心粒劑量的限制。反式相互對(duì)預(yù)測(cè)會(huì)出現(xiàn)的間期和端粒缺失的大小分布反映了在HRD癌癥中發(fā)現(xiàn)的間期和端粒LOH的分布。這些結(jié)果共同表明,反式相互對(duì)具有大規(guī)模染色體后果,因此可能與細(xì)胞遺傳學(xué)上可見(jiàn)的畸變有關(guān),而這些畸變通常與 BRCA1 和 BRCA2 失活有關(guān)。
圖3. 異常復(fù)制-重啟模型將反式相互對(duì)與巨堿基規(guī)模的染色體改變聯(lián)系起來(lái)
鑒于LR WGS 數(shù)據(jù),作者認(rèn)為可以利用長(zhǎng)分子圖譜檢測(cè) HR 缺失特異性修復(fù)途徑的其他疤痕。單鏈退火(SSA)是一種DSB修復(fù)途徑,涉及DSB側(cè)翼近似同源(同源)重復(fù)序列的雜交。HR 缺乏的實(shí)驗(yàn)?zāi)P拖到y(tǒng)顯示,SSA 在 BRCA2d 癌癥中是活躍的,但在 BRCA1d 癌癥中并不活躍。在切除斷裂末端深處退火相似序列時(shí),SSA 能允許低至 80% 的序列同一性;然而,以前對(duì) HR 缺乏癥的基因組研究只分析了精確的微同源性,而沒(méi)有檢查不精確的序列同一性。為了更好地評(píng)估 LR WGS 圖譜中的 SSA ,作者開(kāi)發(fā)并驗(yàn)證了一種算法,用于檢測(cè)體細(xì)胞斷裂末端附近的同源運(yùn)行或 80% 或更高的序列同一性。該算法確定了 50 bp 左右的同源峰值,在 46 個(gè) LR WGS 樣本中發(fā)現(xiàn)了 138 個(gè)同源度大于 10 bp 的連接點(diǎn)。值得注意的是,這些同源連接大多也能在短讀程 WGS 中高效檢測(cè)到,這表明同源分析可應(yīng)用于完整的短讀程 WGS BOPP 數(shù)據(jù)集。對(duì) 583 對(duì)腫瘤-正常人配對(duì)(BRCA1d、BRCA2d 或 HRP)的分析表明,49,561 個(gè)連接點(diǎn)中有 1,248 個(gè)(2.5%)是同源的,其分布情況與 LR WGS 相似。雖然這些連接的同源長(zhǎng)度中位數(shù)為 40 bp,但觀察到的連接束長(zhǎng)達(dá) 128 bp。接下來(lái),作者研究了哪些類(lèi)別的簡(jiǎn)單或復(fù)雜變異包含同源連接。比較不同基因型的分布發(fā)現(xiàn),相對(duì)于 BRCA1d(RR = 3.93,P = 4.2 × 10-4,伽馬-泊松回歸的 Wald 檢驗(yàn))和 HRP 癌癥(RR = 3.28,P = 8.37 × 10-6,伽馬-泊松回歸的 Wald 檢驗(yàn)),BRCA2d 癌癥中較大(超過(guò) 1 kbp)同源缺失的負(fù)擔(dān)和比例明顯更高。盡管在其他 SV 類(lèi)中也觀察到了同源斷裂末端,但這些事件的負(fù)擔(dān)與 HR 缺陷狀態(tài)無(wú)關(guān)。值得注意的是,同源缺失的中位大小與已知發(fā)生在 BRCA2d 細(xì)胞中的末端切除長(zhǎng)度一致31,32,支持 SSA 在人類(lèi) BRCA2d 腫瘤中作為后備修復(fù)途徑的作用。
圖4. LR WGS 在 BRCA2d 基因組中發(fā)現(xiàn)了 SSA 的足跡
最后,作者思考了僅根據(jù)斷點(diǎn)級(jí)結(jié)構(gòu)基因組特征預(yù)測(cè)HR缺陷的效果如何?為了評(píng)估這一點(diǎn),作者比較了僅使用 HRDetect 中 SV 特征(RS3 和 RS5 標(biāo)志)訓(xùn)練的隨機(jī)森林分類(lèi)器和使用 B1+2 特有的附加 SV 特征(同源缺失、互對(duì)和 1-100-kbp 簡(jiǎn)單重復(fù))訓(xùn)練的隨機(jī)森林分類(lèi)器的性能。結(jié)果發(fā)現(xiàn)與基于 HRDetect 的 SV 分類(lèi)器(AUROC = 0.73,AUPRC = 0.57)相比,基于 B1+2 的 SV 分類(lèi)器(AUROC = 0.93,AUPRC = 0.57,泛癌 HMF)的性能要好得多(P < 2.2 × 10-16,DeLong 檢驗(yàn))。雖然某些 B1+2 分類(lèi)器特有的 SV 特征單獨(dú)使用時(shí)具有相關(guān)性,但當(dāng)這些特征結(jié)合使用時(shí),觀察到的性能最高。接下來(lái)作者研究了 B1+2 是否能區(qū)分 BRCA1 和 BRCA2 缺乏癥,這兩種疾病是不同的生物狀態(tài),各自可能有不同的治療缺點(diǎn)。由于 HRDetect 并非為解決這一任務(wù)而開(kāi)發(fā),將 B1+2 與根據(jù) HRDetect 的六個(gè)特征訓(xùn)練的隨機(jī)森林分類(lèi)器進(jìn)行了比較。結(jié)果發(fā)現(xiàn) B1+2 在區(qū)分 BRCA1d 和 BRCA2d 腫瘤方面的表現(xiàn)(AUROC = 0.90,AUPRC = 0.91)大大優(yōu)于這種類(lèi)似 HRDetect 的分類(lèi)器(AUROC = 0.80,AUPRC = 0.83)(P = 0.005,DeLong 檢驗(yàn))。B1+2 分類(lèi)器特異性 SV 特征對(duì)于區(qū)分非 BOPP 癌癥尤為重要。由于 B1+2 可分別輸出 BRCA1d(B1 得分)和 BRCA2d(B2 得分)的概率,因此可以分析分類(lèi)器稱(chēng)為 HR 缺乏的腫瘤(B1+2 陽(yáng)性,B1 + B2 得分 > 0.5)中 BRCA1d 或 BRCA2d 的概率。這項(xiàng)分析證實(shí),相對(duì)于乳腺癌和卵巢癌,前列腺癌和胰腺癌的 HR 缺失明顯富集于 BRCA2d 表型,而在乳腺癌和卵巢癌中,BRCA1 和 BRCA2 缺失的可能性相同。HR缺陷基因組特征的一個(gè)主要用途是發(fā)現(xiàn)HR通路失活的替代機(jī)制,并評(píng)估意義不確定變體(VUS)的致病性。對(duì)訓(xùn)練和測(cè)試數(shù)據(jù)中排除的病例的 B1+2 評(píng)分分布進(jìn)行了調(diào)查,結(jié)果發(fā)現(xiàn)在各層次的單拷貝和/或 VUS 病例中,B1+2 陽(yáng)性率明顯較高。盡管這一比例大大低于 BRCA1 或 BRCA2 雙倍性致病性改變的病例(95%)。這包括對(duì) BRCA1d(BARD1 和 EME1)和 BRCA2d(PALB2 和 RAD51C)具有不同偏倚的基因,這與它們?cè)?HR 通路中的已知作用一致。這些結(jié)果表明,B1+2 分類(lèi)器有助于發(fā)現(xiàn)和亞分類(lèi)導(dǎo)致 HR 缺乏的致病等位基因。
圖5. 區(qū)別 BRCA1 和 BRCA2 缺乏癥的 SV 特征
總之,本研究通過(guò)對(duì)數(shù)千例腫瘤的短線程全基因組測(cè)序(WGS)圖譜的基因組圖譜分析與對(duì) 46 例 BRCA1 或 BRCA2 突變?nèi)橄侔┑纳疃孺溩x測(cè)序 WGS 分析相結(jié)合,發(fā)現(xiàn)了一類(lèi)不同的HR缺陷富集重排,稱(chēng)為相互對(duì),其是HR缺陷中的疤痕類(lèi)型,而這些疤痕來(lái)自于兩種備用的修復(fù)機(jī)制,可能促使HR缺陷的癌細(xì)胞存活,而阻斷這一機(jī)制或許是治療這些癌癥的一種新方法。