文獻學習-放療等待時間(WT)和放療結果關系的系統(tǒng)綜述及meta分析
摘要
目的
綜合與放療等待時間(WT)和放療結果相關的直接臨床證據(jù)。
方法及資料
我們對1975年至2005年間的文獻進行了系統(tǒng)綜述,以確定描述 WT 與 RT 結果之間關系的臨床研究。只有高質(zhì)量(HQ)的研究,已充分控制混雜因素被納入主要分析。最初被報道為分類變量的 WT 被轉換為基于每個類別中 WT 分布的連續(xù)變量。薈萃分析采用固定效應模型進行。
結果
系統(tǒng)綜述確定了44項相關研究。對20項局部對照研究的薈萃分析顯示,隨著 WT,RRlocal 復發(fā)/月 = 1.14,95% 置信區(qū)間(CI) : 1.09-1.21,局部失敗風險顯著增加。對于乳腺癌術后放療,RRlocal 復發(fā)/月 = 1.11,95% CI: 1.04-1.19。對于頭頸部癌術后放療,RRlocal 復發(fā)/月 = 1.28,95% CI: 1.08-1.52。對于頭頸部癌癥的確定性放療,RR-local 復發(fā)/月 = 1.15,95% CI: 1.02-1.29。
幾乎沒有證據(jù)表明 WTs 與遠處轉移的風險之間存在任何聯(lián)系。對6項 HQ 乳腺癌研究的薈萃分析顯示,RR 轉移/月 = 1.04,95% CI: 0.98-1.09。對4項乳腺癌 HQ 研究的薈萃分析顯示,隨著 WT 的增加,生存率沒有顯著下降,RRdeath/月 = 1.06,95% CI: 0.97-1.16,但在頭頸部癌癥的4項 HQ 研究中生存率略有下降,RRdeath/月 = 1.16,95% CI: 1.02-1.32。
結論
局部復發(fā)的風險隨著放療時間的增加而增加。在某些臨床情況下,局部復發(fā)率的增加可能導致生存率的降低。RT 的 WT 應該盡可能短。
引言
以前對該領域的幾個系統(tǒng)評價,包括我們自己的一個評價,根據(jù)現(xiàn)有信息[32] ,[33] ,[34] ,[35] ,[36]得出了一些不同的結論。大多數(shù)專注于 WT 與局部控制之間的關系[32] ,[33] ,[35] ,[37] ,其中三個專門處理乳腺癌[33] ,[35] ,[37]。在本綜述中,我們采取了更全面的方法; 我們包括了所有類型的癌癥,并且我們描述和綜合了關于 RT 的 WT 與遠處轉移和生存概率以及局部控制概率之間的關系的已知信息。本綜述還試圖糾正方法部分詳細討論的以前研究中的方法學弱點,并包括自我們上次綜述以來的四年中發(fā)表的一些重要的新研究的結果。
方法和材料
搜索策略
我們首先搜索了1975年至2005年7月期間的索引數(shù)據(jù)庫,包括 PubMed,HealthstAR,CancerLit,使用限于人類的關鍵詞或 Cochrane圖書館(meSH) : “等待名單”,“等待時間”,“延遲”,“間隔”,“時間”,“放療”,“輻射”,“照射”,“結果”,“局部復發(fā)”,“轉移”,“生存”在所有語言中。對這些報告的摘要進行了掃描,以排除那些明顯無關的內(nèi)容。接下來,我們對關鍵文章的參考文獻列表進行了手動搜索,以確定在初步搜索中可能遺漏的相關研究。我們還回顧了美國放射治療與腫瘤學會(ASTRO)和加拿大放射腫瘤學協(xié)會(CARO)年會的摘要。如果在不同的報告中研究了相同的患者群體,則使用最近的一個。如果報告提供的信息不完整或描述含糊不清,我們試圖與作者聯(lián)系以獲得更多信息。
納入準則
只有符合以下標準的臨床研究被確定為與我們的分析相關: (a)所有患者接受 RT 治療; (b) WT 用于 RT 的定義,測量和報告; (c)測量和報告以下一個或多個結果: 局部控制/失敗,轉移,生存,生活質(zhì)量。在等待放療期間測量腫瘤生長,但沒有測量結果的研究不包括在內(nèi)?;谟^察到的或預期的腫瘤生長率模擬 WT 對結果的影響,但沒有直接測量結果的研究不包括在內(nèi)。
質(zhì)量標準
我們沒有發(fā)現(xiàn)相關的隨機試驗。所有的相關研究都是觀察性的。觀察性研究的基本問題是,對照組可能與患者相關、疾病相關或治療相關因素不平衡,這可能影響感興趣的結果。因此,我們先驗地決定將我們的主要分析局限于比較組(即等待更長或更短時間的那些)與與感興趣的結果相關的其他預后因素相似的研究,或者在適當調(diào)整相關預后因素的差異后報告了 WT 與結果之間的關聯(lián)。我們使用術語“高質(zhì)量”(HQ)來描述符合這些標準的研究。我們通過解決以下問題來操作這種方法: (a)在比較的患者組中是否充分描述了相關預后因素的分布?如果否,則將研究分類為不高質(zhì)量(NHQ) ; 如果是,進入問題(b) ,比較組在相關預后因素方面是否平衡?如果是,將研究分類為 HQ; 如果否,進入問題(c) ,報告的結果是否適當?shù)卣{(diào)整了相關預后因素的差異?如果是,則歸類為HQ; 如果否,則歸類為 NHQ。在所有研究中,分期、分級、 RT 劑量/分次、體積和技術以及全身治療類型被認為是相關的。切緣的狀態(tài)被認為與所有術后放療研究相關。在我們以前的綜述[32]中,我們使用了九分制來分類研究的質(zhì)量,但是我們在這里放棄了這種方法,支持二元 HQ/NHQ 方法,因為我們認為研究設計的某些方面的高分不應該被允許補償其他設計領域的低分,這可能會獨立偏倚結果[38]。
相關研究由四位獨立評審員進行評審。最初,四位評審員一致同意44篇論文的質(zhì)量。最初對其余七份文件的狀況存在分歧,通常是由于一名或多名審評員漏掉了案文、表格或圖表中的一些關鍵信息點。所有的分歧都以協(xié)商一致的方式解決了。
延遲的定義
WT 被定義為從診斷日期到初次放療開始放療的時間間隔,或者從手術日期到術后放療開始放療的時間間隔。
在許多原始報告中,沒有報告?zhèn)€別患者的 WTs。相反,患者被分為兩個或三個組,等待更長或更短的時間,并比較這些組之間的結果。不同研究組之間的分界點各不相同。在最近的一些研究中,研究人員描述了個體 WT,并探討了其與結果的關系,多變量分析包括個體 WT 作為一個獨立的連續(xù)變量。
結合這些不同的研究結果提出了挑戰(zhàn)。在我們以前的薈萃分析中,我們只能綜合研究結果,比較等待時間較長和較短的組的結果,當他們使用一個共同的截止點來分離較長和較短的 WT。沒有使用共識截止點的研究不得不被排除在薈萃分析之外。更重要的是,這種方法只允許我們比較經(jīng)歷“更長”和“更短”WT 的患者的結果,并且不允許我們量化每單位時間延遲的影響,這是從臨床和政策角度的興趣量。
數(shù)據(jù)提取
為了本研究的目的,風險比(HR)和相對風險(RR)被視為效應大小的等效估計值[38]。為了綜合不同 WT 變量(例如連續(xù)和各種分類表示)的研究結果,我們將每個研究中報告的 WT 效應大小轉換為對應于每個月 WT 的連續(xù)表示的回歸系數(shù)(β)和標準誤差(SE)。對于具有分類 WT 表示的研究,中位數(shù)被分配來反映每個類別的 WT 的中心值。如果原始研究沒有提供每個類別的中位 WT,則從類別的邊界估計,假設 WT 分布的形狀與在安大略省觀察到的形狀相似,其中完整的數(shù)據(jù)可用于我們。
(a)對于連續(xù)測量 WT 的研究,β 計算為 log (HR) ,相應的 SE 計算為(log (上 CI)-log (下 CI))/3.92。人力資源單位在計算前轉換為月。
(b)對于只有兩個 WT 組的研究,只提供粗略的結果率,RR 和 CI 從2乘2列聯(lián)表計算。Β 計算為 log (RR)/((xn-x0) × 3.92) ,相應的 SE 計算為(log (高 CI)-log (低 CI))/((xn-x0) × 3.92) ,其中 xn 表示 n 組水平的暴露量,x0表示參考組的暴露量。如果只提供 p 值,則將 SE 計算為“基于測試的”方法,SE = (logRR)/Zp,其中 Zp 是單位正態(tài)檢驗的值(例如,如果 p = 0.05,則 Zp = 1.96,雙尾檢驗)。
(c)對于兩組以上的研究,使用加權回歸來估計 β [38]。然后,采用格陵蘭和洛格內(nèi)克描述的方法計算 SE [39]。
meta分析
個體研究的調(diào)整回歸系數(shù)采用固定效應模型進行組合。使用反方差(1/SE2)來衡量個體研究。初步分析僅限于總部研究。進行了包括所有相關研究在內(nèi)的二次分析,以探討排除不符合我們充分控制潛在混雜因素的標準的研究的影響。在我們以前的綜述中,我們對分析中延遲對局部控制的影響進行了原發(fā)癌部位的先驗分層。經(jīng)過反思,我們認為這是不恰當?shù)?,因為延遲可能影響局部控制的基本機制在所有類型的癌癥中都是常見的。因此,我們一起分析了所有局部控制研究的結果,盡管我們也對特定類型的癌癥進行了分層分析。在檢查 WT 與總生存率之間的關系時,我們沒有結合不同類型癌癥的研究結果,因為不言而喻,局部失敗對生存的影響主要取決于依賴于主要部位的手術挽救的潛力。
薈萃分析中的同質(zhì)性假設首先通過卡方統(tǒng)計來評估: Xh = Σw (b-E [ b ])2(Xh 也稱為 Cochran’s χ2)[38]。這一統(tǒng)計被認為具有高特異性,但是靈敏度較低[38]。然后用數(shù)量 I2來評估異質(zhì)性的程度。自2003年以來,這一統(tǒng)計數(shù)據(jù)一直在《 Cochrane 評論》中定期報道,以幫助評估薈萃分析的一致性[40]。I2計算為

其中 Q 是 Cochran 的 χ2[40]。I2可以解釋為由于異質(zhì)性引起的總變異的比例[41]。值大于50% 表明可能存在顯著的異質(zhì)性[42]。使用元回歸方法進一步探討異質(zhì)性的來源[38]。
為了檢測發(fā)表偏倚,我們使用 Egger 等人提出的線性回歸方法檢驗了標準漏斗圖的不對稱性。簡要地說,標準法向偏差(SND)與其精度進行了回歸。SND 定義為效應大小除以標準誤差,精度定義為標準誤差的倒數(shù)(回歸方程: SND = α + β * 精度)。截距 α 提供數(shù)量測試是否存在統(tǒng)計上顯著的不對稱性。如果 α 與0不同,則存在統(tǒng)計上的顯著不對稱,否則沒有不對稱的證據(jù)。此外,“修剪和填充”的方法被用來調(diào)整整體效果大小,以考慮到發(fā)表偏倚[44] ,[45]。簡而言之,通過假設漏斗圖中研究圍繞整體效應的對稱分布,L + 統(tǒng)計量表示的不對稱研究被“削減”了。在剩余研究的基礎上重新估計總體效應,然后使用不對稱的“修剪”研究圍繞修正的總體效應產(chǎn)生鏡像研究,以使漏斗圖對稱。通過對所有觀察和人工研究的綜合考慮,最終確定了總體效果。
結果
我們確定了72個可能相關的原始報告,所有這些報告都經(jīng)過了詳細審查。共有26,231名患者參與了44項研究,報告了放療的 WTs 與一項或多項感興趣的結果之間的關系。涉及12,463名患者的 HQ 研究被確定為初步分析的基礎[46] ,[47] ,[48] ,[49] ,[50],[51] ,[52] ,[53] ,[54] ,[55] ,[56] ,[57] ,[58],[59] ,[60] ,[61] ,[62] ,[63] ,[64] ,[65] ,[66],[67] ,[68] ,[69] ,[70] ,[71] ,[72] ,[73] ,[74],[75] ,[76] ,[77] ,[78] ,[79] ,[80] ,[81] ,[82],[83] ,[84] ,[85] ,[86] ,[87] ,[88].表1顯示,這些研究大多數(shù)是在北美或歐洲進行的,大多數(shù)是在1995年以后發(fā)表的。大多數(shù)病例集中在乳腺癌或頭頸部癌癥。有三份報告僅以摘要形式提供。其他的都是全文手稿。大多數(shù)研究報告局部控制率,許多也報告生存率和一些也報告轉移率。

?Characteristics of 44 relevantstudies
表2描述了38項研究,這些研究檢查了 WT 與局部復發(fā)風險之間的關系。我們能夠在36個研究中計算 RR-local 復發(fā)。這是不可能的其余兩個研究,因為沒有發(fā)現(xiàn)局部失敗的任何一個或其他分支的這些研究。圖1、圖2說明了原始研究的原始數(shù)據(jù)是如何轉換成每個月的延遲 RR 的。圖1顯示了在8個 HQ 乳腺癌研究中 WT 與局部復發(fā)率之間的關系,其中 WT 定義的患者亞組的結果已被描述。這種類型的圖形首先被 Heinmüller 用于這個目的[36]。這些點顯示了在等待更長或更短時間的患者亞組中觀察到的局部復發(fā)率。這條線的斜率說明了 WT 與局部復發(fā)風險之間關聯(lián)的強度。在僅報告兩組病例局部復發(fā)率的研究中,WT 與局部復發(fā)風險之間的關系用直線表示。在兩組以上的研究中,如果隨著時間的推移,風險趨勢不是恒定的,那么斜率可以自由變化。大多數(shù)研究顯示一個上升的趨勢,表明復發(fā)的風險隨著 WT 的增加而增加。等待時間最短的病例組的基線 WT 因研究而異。表明 WT 與復發(fā)風險之間關系的強度的線的斜率也不同,但沒有證據(jù)表明基線 WT 與 WT 之間關聯(lián)的強度和復發(fā)風險之間存在任何系統(tǒng)關系。因此,這些研究的集體結果并不表明存在一個閾值,低于這個閾值,延遲對局部復發(fā)風險的影響較小,盡管一項研究顯示最初呈下降趨勢,隨后呈上升趨勢。這個問題在meta回歸中得到了更多的定量研究(見下文)。



為了進行meta分析,假設 WTs 與局部復發(fā)風險之間的關系隨著時間的推移是恒定的。對于 > 2個亞組的研究,總體 RR 由每個連續(xù)觀察對的加權平均 RR/月估計。圖2說明了從圖1中描述的原始乳腺癌研究中以這種方式得出的 RR。在圖2中,我們還顯示了另外三個乳腺癌研究的結果,其中 WTs 被視為一個連續(xù)變量,RR 是由回歸分析推導出來的。圖2中線條的斜率代表了被納入下面描述的薈萃分析的 RR。該圖還顯示了11項乳腺癌研究結果的加權平均數(shù),以及薈萃分析得出的這一估計值的95% 置信限。
圖3顯示了來自所有20個 HQ 初步研究(所有癌癥部位)的局部復發(fā)和95% CI 的 RR,以常規(guī)森林圖的形式顯示。總體 RRlocal 復發(fā) = 1.14(CI: 1.09-1.21)/月。Cochran χ2檢驗顯示出顯著的異質(zhì)性(χ2 = 34.6,p = 0.016)。我們計算了 I2作為這20項研究中異質(zhì)性的量度,發(fā)現(xiàn)與 Cochrane 系統(tǒng)評價數(shù)據(jù)庫中的509項其他薈萃分析相比,中度異質(zhì)性(I2 = 45%)[40]。Meta 回歸顯示原發(fā)癌部位(p = 0.44)或基線 WT (p = 0.32)與 WT 與局部復發(fā)風險之間的關聯(lián)強度之間沒有顯著相關性。

圖3還顯示了分層薈萃分析的結果,其中研究根據(jù)癌癥的主要部位和使用 RT 的背景進行分組(術后與確定性 RT)。乳腺癌術后放療后局部復發(fā)的延遲時間為每月1.11次(95% CI: 1.04-1.19)。僅包括未接受化療的患者(1.11,95% CI: 0.94-1.33)的研究估計的 RRlocal 復發(fā)值與包括接受化療的患者的研究得出的值相同(1.11,95% CI: 1.03-1.19)。頭頸部腫瘤術后放療后局部復發(fā)的延遲時間為每月1.28次(95% CI: 1.08-1.52)。頭頸部癌確定性放療后 RRlocal 復發(fā)的延遲時間為每月1.15次(95% CI: 1.02-1.29)。
圖4顯示了一個漏斗圖,說明了個體研究的不對稱程度,匯總對數(shù)(RR)為0.13,所有20個 HQ 研究合并。似乎有些不對稱。Egger 方法的不對稱程度無統(tǒng)計學意義[43](p = 0.12) ,但這種方法已知是相當不敏感的[44] ,[45]。因此,我們使用“修剪和填充”的方法來調(diào)整我們對觀察到的不對稱效應大小的估計,假設它反映了發(fā)表偏倚。圖表右側的四項研究沒有與左側的類似研究相匹配,這些研究首先被 Duval 和 Tweedie 所描述[44] ,[45]。然后,這些研究被“削減”,即被排除在外,而 RR 則根據(jù)剩余研究重新計算。在最后一個步驟中,這四項研究與四項“鏡像”研究一起被取代,以彌補未報道的研究。重復薈萃分析得出調(diào)整后 RR 的置信限,RRlocal 復發(fā)的校正估計值為1.12,95% CI: 1.06-1.18,表明 WT 與局部復發(fā)風險之間的正相關不太可能由發(fā)表偏倚解釋。

圖5顯示了二次分析的結果,其中我們納入了16項額外的研究,這些研究被排除在主要分析之外,因為它們不符合我們的 HQ 標準,不能充分控制可能的混雜因素。所有36項研究的薈萃分析結果與20項總部研究的主要分析結果相似。對于所有36項研究,RRlocal 復發(fā)率為1.13(95% CI: 1.08-1.18) ,而20項 HQ 研究為1.14(95% CI: 1.09-1.21)。因此,沒有跡象表明我們的主要分析結果受到排除低質(zhì)量研究的影響。

等待時間與遠處轉移風險的關系
表3描述了10個個體研究,探討了 WT 與遠處轉移風險之間的關系。圖6顯示了八項 HQ 研究中 RT 延遲每月的 RR,這些研究符合我們對森林地塊形式的潛在混雜因素進行充分控制的標準。只有在乳腺癌中有足夠的研究來證明薈萃分析的合理性。乳腺癌術后放療的 RR 轉移/月 = 1.04,95% CI: 0.98-1.09。


等待時間與總體生存的關系
表4描述了18項研究,探討了放療與總生存率之間的關系。圖7顯示了14個 HQ 研究中符合我們對潛在混雜因素進行充分控制標準的 RRdeath/Month。在乳腺癌的4項 HQ 研究中,放療的 WT 與生存率之間沒有顯著相關性,RRdeath/month = 1.06,95% CI: 0.97-1.16。在頭頸部癌癥 RRdeath/month = 1.16,95% CI: 1.02-1.32的5項 HQ 研究中,隨著 WT 的增加,生存率略有下降。研究宮頸癌延遲和生存之間關系的單項研究顯示,隨著 WTs 的延長,生存率有下降的趨勢,但沒有統(tǒng)計學意義。


討論
我們考慮了觀察到的 WT 與局部復發(fā)風險之間的關聯(lián)可能是由于選擇偏倚的可能性。盡管沒有一項原始研究比較了隨機分配到較長或較短延遲的患者組的結果,但我們確實采取了措施來確保比較組在相關預后因素方面保持良好的平衡,或者這些因素在分析中得到了充分的控制。此外,幾乎沒有理由懷疑兩組之間的不平衡會使結果偏向于那些得到更及時治療的患者。一般而言,醫(yī)生會選擇較差而較好的病例,以便盡早接受治療,這會導致醫(yī)生低估而非高估延誤與局部復發(fā)之間的關系。延遲與乳腺癌轉移風險之間沒有任何顯著關聯(lián),這使得延遲與局部控制之間觀察到的關聯(lián)特別不可能是由于更具侵襲性或晚期癌癥患者的治療延遲。由于傷口愈合延遲,對更晚期癌癥進行了更廣泛手術的頭頸部癌癥患者可能不得不等待更長時間的放療,這可能確實在延遲和局部控制之間創(chuàng)造了人為的關聯(lián)。當然,這種效應不能解釋在接受頭頸部腫瘤明確放療的患者中,WT 與局部復發(fā)風險之間的顯著相關性。
還考慮了發(fā)表偏倚的可能性。調(diào)查人員似乎更有可能致力于發(fā)表積極的調(diào)查結果,編輯也更有可能考慮報告積極結果的論文。然而,漏斗圖分析顯示,只有一個適度的不對稱程度提供很少的證據(jù)發(fā)表偏倚。此外,調(diào)整觀察到的不對稱性對觀察到的 WT 和局部控制之間的聯(lián)系的強度只有很小的影響。
盡管我們試圖盡量減少偏倚對結果的影響,但我們承認,包括在我們的薈萃分析中的所有觀察性研究將被歸類為不優(yōu)于 Sackett 證據(jù)水平類型學中的3或4級證據(jù)[90]。因此,如果從“循證醫(yī)學”的角度來看,我們的結果可能看起來并不確定。然而,我們認為,這是錯誤的范例適用于這種情況[91]。Sackett 的證據(jù)規(guī)則旨在用于評估治療干預的益處。它們不是為了評估暴露于可能避免的危害的風險。事實上,Sackett 建議采用一種不同的方法來評估治療的潛在危害,這種方法更接近于評估環(huán)境危害的一般方法[90]。認識到單純進行隨機臨床試驗來評估對患者的潛在危害通常是不可能的,他建議在評估這方面的證據(jù)時,我們首先要問這樣一個問題: “在這種情況下進行的研究類型是否是最強的?”然后他建議我們將希爾的因果關系標準應用于這個問題的整個證據(jù)體系[92]。由于導言中概述的原因,不能進行隨機試驗來評估治療延遲的不良影響,觀察性隊列研究是延遲有害的直接證據(jù)的最佳來源。然而,它們并不是相關證據(jù)的唯一來源。也有強有力的間接證據(jù)表明,延遲增加了局部失敗的風險,基于良好的臨床證據(jù): (a)腫瘤進展,而患者正在等待放療; (b)通過放療控制局部腫瘤的可能性取決于疾病的程度[91]。此外,腫瘤體積與局部控制之間的關系可以通過強大的放射生物學理論得到很好的解釋,該理論已經(jīng)得到實驗驗證[23]。當 Hill 的標準被應用于將 RT 延遲與局部復發(fā)率增加聯(lián)系起來的整個文獻時,延遲導致局部復發(fā)風險增加的證據(jù)似乎基本上是無懈可擊的,至少在乳腺癌和頭頸部癌癥的情況下[91]。還需要進一步的研究來更徹底地量化延遲的風險,并確定不同癌癥部位之間風險的潛在差異。
參考
Chen Z, King W, Pearcey R, Kerba M, Mackillop WJ. The relationship between waiting time for radiotherapy and clinical outcomes: a systematic review of the literature. Radiother Oncol. 2008 Apr;87(1):3-16. doi: 10.1016/j.radonc.2007.11.016. Epub 2007 Dec 21. PMID: 18160158.