癌癥跟基因有關嗎
癌癥是一種基因組疾?。喝绻覀儗┘毎幕蚪M與標準人類參考基因組進行比較,我們會發(fā)現(xiàn)它經(jīng)常在多個位點發(fā)生改變。幸運的是,并非所有這些基因改變都是危險的或致病的。自出生以來,其中許多也存在于我們身體的所有其他細胞中:這些被稱為種系突變,是從我們的父母那里遺傳的,是使每個人獨一無二的原因。但是在特定組織中還有其他改變,通常是DNA復制錯誤或暴露于誘變因素的結果,這些被稱為體細胞突變。
在大多數(shù)情況下,這些突變并不危險。盡管如此,在某些情況下,它們可能會導致細胞表型的改變,例如細胞以異常方式生長,如良性息肉的情況。積累基因組改變的細胞,通常是由于暴露于環(huán)境影響(例如過度曬黑)或由于不良生活習慣(如肥胖或吸煙)的影響,會增加其發(fā)展異常表型的可能性,從而導致致癌。與良性息肉不同,癌細胞可以侵入周圍組織,甚至遷移到身體的其他部位。平均而言,一個腫瘤細胞在其DNA上積累了1000到10,000個體細胞突變,但其中只有一部分是導致癌變表型發(fā)展的真正“驅動因素”。
一些體細胞突變的存在只是因為腫瘤細胞的基因組不是很穩(wěn)定:在某些情況下,每個腫瘤細胞都可以產(chǎn)生一些特定的突變并將它們傳遞給它們的后代,從而產(chǎn)生遺傳異質的腫瘤塊。在其他情況下,腫瘤的所有細胞共享大致相同的突變,如克隆腫瘤的情況。有時,獲得性突變使腫瘤具有侵入其他組織的能力,進入血液或淋巴系統(tǒng)并侵入遠處的組織,這就是我們所說的轉移。
癌癥基因組學研究腫瘤細胞和正常細胞之間DNA序列的差異:通過基因組測序,我們可以識別這些基因組改變,從而表征腫瘤以了解它們對治療的敏感性并預測它們的預后。癌癥基因組學代表了腫瘤學的強大工具,但我們必須了解一些技術參數(shù),才能正確設計和執(zhí)行癌癥基因組測序。在正確準備好生物標本之后,下一代測序儀可以生成我們稱之為“測序讀數(shù)”的DNA序列片段。在一組測序讀數(shù)中表示基因組參考堿基的次數(shù)稱為測序覆蓋率。為了正確識別腫瘤細胞DNA中發(fā)生了哪些基因組變化,我們需要具有良好的測序覆蓋率,以便能夠區(qū)分真正的基因組變化和測序錯誤,并識別低頻突變。因此,一般來說,如果你想對更大的基因組部分進行測序,你將獲得更多的數(shù)據(jù),分析的復雜性和成本也會更高。
根據(jù)我們的需要,為了測量基因組改變,我們可以在不同的測序目標之間進行選擇。我們可以選擇靶向測序,別名基因組,這使我們能夠自信地檢測特定基因數(shù)量的改變。全外顯子組測序——用于篩選編碼區(qū)域,約占基因組的1-2%?;蛘?,如果我們想要完整的圖片,我們可以選擇全基因組測序來訪問整個基因組,包括非編碼區(qū)域,如調控區(qū)域、假基因和單倍型?;蚪M可以對選定的疾病特異性基因進行非常高的覆蓋,因此廣泛用于診斷環(huán)境,因為它們能夠很好地發(fā)現(xiàn)特定基因上深度已知的熱點突變,同時減少時間、成本和數(shù)據(jù)負擔。
全外顯子組和全基因組測序等綜合方法的好處是可以同時識別多個可能未知的突變,從而實現(xiàn)探索性研究和新發(fā)現(xiàn),盡管成本和數(shù)據(jù)量會增加,分析時間和復雜性也會增加。它們越來越多地用于初級研究和早期臨床試驗,以探索各種癌癥類型的基因組景觀和分子機制,以及表征驅動癌癥進展的突變。不同的測序目標需要不同數(shù)量和質量的輸入DNA樣本來執(zhí)行文庫準備步驟。一般來說,最好的基因組測序質量來自大量細胞和新鮮冷凍或新鮮組織樣本,而不是福爾馬林固定石蠟包埋樣本。通常,基因組不需要大量的gDNA。根據(jù)我們設施的經(jīng)驗,大約10-100ng,具體取決于試劑盒類型,通常與低質量樣品兼容,例如從福爾馬林固定石蠟包埋組織中提取的DNA。另一方面,對于全外顯子組測序和全基因組測序,通常建議最少使用50nggDNA。有針對從福爾馬林固定石蠟包埋樣本中提取的DNA而優(yōu)化的全外顯子組測序和全基因組測序文庫制備方案。盡管如此,由于福爾馬林固定引起的測序偽影,這些工作流程仍然具有挑戰(zhàn)性,主要是在回顧性系列中從儲存的標本中提取DNA時。
設計實驗時要考慮的另一個關鍵點是需要對照樣本:當您對癌癥樣本進行分析時,至關重要的是要有一個匹配的正常樣本,以確定與腫瘤細胞相關的真實基因組變異,排除遺傳性種系改變.通常用作正常DNA來源的對照樣本是血液、口腔拭子或腫瘤周圍的正常組織,在最后一種情況下,我們必須確保組織的微環(huán)境沒有改變?,F(xiàn)在讓我們談談與腫瘤樣本分析相關的一些潛在問題:腫瘤純度和瘤內異質性。
一般來說,從臨床實踐中獲得的實體瘤組織具有高度異質性。它們可以是癌癥亞克隆、周圍正常組織、基質和浸潤性免疫細胞的混合物。估計腫瘤純度,即這些異質樣本中癌細胞的比例,是至關重要的,因為腫瘤組織中正常細胞的污染會在基因組分析中引入噪聲,從而減少變得更難以檢測的腫瘤改變信號。此外,通常在同一腫瘤塊內,可能存在不止一個腫瘤細胞群。
即使突變只出現(xiàn)在一小部分細胞中,如果它賦予腫瘤選擇性優(yōu)勢,也可能導致耐藥或復發(fā)。由于對大量DNA中低代表DNA物種進行測序的實際概率與測序深度成正比,因此檢測小亞克隆中存在的突變所需的平均覆蓋率需要更高??朔@些挑戰(zhàn)的一種有效方法是在單細胞水平上研究實體瘤樣本,以識別和表征細胞亞群。
測序后,過濾掉低質量的讀數(shù),并將剩余的讀數(shù)映射到參考基因組。在此階段,必須確定測序的效率。這可以通過檢查測序覆蓋率來完成。質量指標通常如下所示第一個數(shù)字表示平均覆蓋率,表明在這種情況下,每個堿基平均被測序100次。作為所有已測序基因組的平均值,該數(shù)字并未提供有關測序效率較低區(qū)域的任何信息。因此,提供有關目標基因組覆蓋率的均勻程度或有多少堿基具有零覆蓋率或低覆蓋率的衡量標準很有用。在這種情況下,質量度量告訴我們90%的區(qū)域的覆蓋率至少為20倍。
一旦我們確保達到了所需的覆蓋率,我們就可以檢測到幾種不同類型的基因組變化,這些變化可以分為小變化和大變化。需要高測序覆蓋率才能可靠地檢測到的小改變包括:單核苷酸變異,這是一個堿基對變化的點突變,例如,如果A被C替換?;騃ndels,這是小插入和缺失,由兩個堿基組成,最多可達幾十個。通過將收集樣本的基因組與匹配的正常組織或血液DNA進行比較以排除種系突變,可以檢測到微小的變化。每對樣本的基因組學變異都記錄在一個帶有VCF擴展名的文本文件中。在幾個顯示文件生成方式的元數(shù)據(jù)行之后,每個變體由VCF文件中的一行表示,報告幾條信息,例如基因組上變異的位置。替代等位基因和該位置的參考基因組質量分數(shù)以及變異是否通過了質量過濾器。以及其他信息,例如具有這種變異的樣本數(shù)量和樣本的組合深度。
檢測改變非常簡單,但由于癌細胞攜帶大量突變,數(shù)據(jù)的管理和解釋可能非常具有挑戰(zhàn)性,尤其是在對整個基因組進行測序時,在這種情況下,vcf文件將包含數(shù)萬行。生物信息學工具可用于將每個改變的功能信息添加到vcf文件中,例如受影響的基因和突變的潛在功能影響,例如它是否會導致移碼或沉默突變。此外,為了識別致病突變并確定潛在藥物靶標的優(yōu)先級,可以篩選由國際腫瘤委員會更新的臨床精選數(shù)據(jù)庫。然而,必須牢記,過濾和注釋突變是分析的關鍵但具有挑戰(zhàn)性的步驟,通常需要手動策劃以說明腫瘤的特異性。我們也可以進行大的改動。
事實上,腫瘤細胞的基因組不穩(wěn)定性也會導致結構性染色體畸變的積累,這也可以在較低的測序覆蓋率下檢測到。這些大的改變包括拷貝數(shù)改變,當基因組的一部分以異常數(shù)量的拷貝(而不是兩個)存在時,就會發(fā)生這種情況。這些被識別為經(jīng)歷一段DNA的增加或丟失的基因組部分,并且可檢測為相對于正常對照的測序深度的局部變化。我們還可以進行結構重排,即基因組的一部分位于不同的位置。
我們可以在沒有正常樣本的情況下進行類似的分析嗎?如果沒有匹配的正常樣本來過濾掉種系突變,每個人參考基因組的變異數(shù)量可能會非常高,大約有70-10萬個變異。在這種情況下,我們可以使用來自大量健康個體的信息過濾至少一部分,丟棄最具多態(tài)性的位點。然而,應謹慎使用這種方法,因為在人群中經(jīng)常發(fā)生突變的基因中發(fā)現(xiàn)了眾所周知的癌癥驅動基因改變,并且會被這種方法丟棄。由于癌癥基因組學計劃的努力,例如癌癥基因組圖譜(TCGA),其中包括33種癌癥類型的10,000多名患者的臨床、基因組和轉錄組學信息,許多先前發(fā)布的關于癌癥基因組學的數(shù)據(jù)可以被使用和查詢。這些數(shù)據(jù)集經(jīng)過協(xié)調和整理,因此非常適合與您的數(shù)據(jù)進行比較。
讓我們通過與Ospedale SanRaffaele組學科學中心的AnnaSofia交談來總結我們所學到的知識。癌癥基因組學研究腫瘤細胞和正常細胞之間的DNA差異,這些差異可以通過基因組測序檢測到。根據(jù)我們的問題,我們可以選擇不同的測序目標:疾病特異性基因、所有編碼區(qū)或所有基因組。
我們已經(jīng)看到,不同的測序目標需要不同數(shù)量和質量的輸入DNA,并且具有不同的時間、成本和數(shù)據(jù)負擔。癌癥基因組學分析的關鍵方面是:需要對照樣本,以區(qū)分體細胞改變和種系改變。良好的覆蓋范圍,自信地檢測罕見的變化估計樣品的純度,以濾除因非癌性細胞類型的存在而引入的噪音。我們可以通過生物信息學分析檢測到的DNA差異是小的改變,如SNP和插入缺失,或大的改變,如CNV和結構重排。請記住,檢測變化非常簡單,但對結果的解釋仍然非常具有挑戰(zhàn)性,并且需要對不同腫瘤類型有深入的了解。