【佳學(xué)基因檢測】如何科學(xué)地進行乳腺癌腫瘤基因檢測數(shù)據(jù)分析與解讀?
腫瘤基因檢測準確性分析所采用的樣本
根據(jù)《乳腺癌精準治療基因檢測分析方法》,乳腺癌腫瘤基因檢測數(shù)據(jù)分析解讀本研究選取了來自乳腺癌協(xié)會聯(lián)盟(BCAC)參與研究的亞血統(tǒng)女性乳腺癌患者。這些患者均有關(guān)于生存狀態(tài)和診斷至最后隨訪的年份等信息,并且均被診斷為任何階段的原發(fā)性浸潤性乳腺癌,且在診斷時年齡至少為18歲。最終的研究樣本包含了來自70個BCAC研究的91,686名乳腺癌患者。
乳腺癌患者的組織病理學(xué)、存活率和治療信息由各個參與的合作醫(yī)院和醫(yī)生收集,并在佳學(xué)基因進行匯總和協(xié)調(diào),然后參照BCAC數(shù)據(jù)庫。所有研究均獲得了相關(guān)倫理委員會的批準,并且所有患者均簽署了知情同意書。
基因檢測結(jié)果如何將患者分為不同的類型
患者亞組的劃分依據(jù)主要基于診斷時的年齡、雌激素受體(ER)狀態(tài)、孕激素受體(PR)狀態(tài)、人類表皮生長因子受體2(HER2)狀態(tài)、腫瘤分級及系統(tǒng)治療類型(基于BCAC數(shù)據(jù)庫可獲取的相關(guān)信息)。對于診斷年齡和腫瘤分級,特別關(guān)注預(yù)后較差的亞組。因此,我們定義了15個亞組:
- 診斷時年齡小于40歲的患者;
- 腫瘤分級為3級的患者;
- ER陽性(ER+)腫瘤并接受內(nèi)分泌治療的患者;
- ER陰性(ER−)腫瘤并接受化療的患者;
- 激素受體(HR)陽性(ER+或PR+)且HER2陰性的患者;
- HR陽性(ER+或PR+)且HER2陰性腫瘤,接受化療的患者;
- HR陽性且HER2陰性腫瘤,未接受化療的患者;
- HR陽性且HER2陽性(HER2+)腫瘤的患者;
- HR陰性且HER2陽性(HER2+)腫瘤的患者;
- HR陰性且HER2陰性(HR−,HER2−)腫瘤的患者;
- 接受他莫昔芬治療的患者;
- 接受芳香化酶抑制劑治療的患者;
- 接受環(huán)磷酰胺-甲氨蝶呤-氟尿嘧啶(CMF)類化療方案的患者;
- 接受紫杉醇類藥物治療的患者;
- 接受蒽環(huán)類藥物治療的患者。
每個亞組的選擇依據(jù)與文獻支持的理由請咨詢佳學(xué)基因檢測。需要注意的是,由于患者數(shù)量較少,HER2陽性腫瘤接受曲妥珠單抗治療的亞組未被納入分析,因為該亞組的事件率較低,導(dǎo)致分析的統(tǒng)計功效較低。
此外,研究還排除了診斷時即為轉(zhuǎn)移性乳腺癌的患者(占所有患者的1.1%),因為這類患者通常接受姑息治療,不適合基于系統(tǒng)治療類型的亞組分析。
除了亞組分析,佳學(xué)基因檢測還對所有乳腺癌患者進行了全基因組分析,評估常見遺傳變異與乳腺癌特定生存期(15年生存期)之間的關(guān)系。這項分析旨在評估是否可以在整個患者數(shù)據(jù)集中檢測到亞組分析中的遺傳變異關(guān)聯(lián)。以往也進行過類似的全基因組分析。然而,之前的分析數(shù)據(jù)來自12個GWAS數(shù)據(jù)集,其中包括來自iCOGS和OncoArray的數(shù)據(jù)(患者數(shù)為84,757人,隨訪時間較短),而當前數(shù)據(jù)集的樣本量和隨訪時間更為充足。
由于部分變量存在缺失數(shù)據(jù),并非所有患者都能被劃分到每個亞組,因此在亞組劃分時會根據(jù)缺失值進行適當處理。每個亞組的患者數(shù)量、乳腺癌特定死亡的數(shù)量、患者/腫瘤特征、治療信息及隨訪數(shù)據(jù)請咨詢佳學(xué)基因檢測靶向藥物基因檢測合作醫(yī)院機構(gòu)。
臨床與病理變量缺失值的填補
為了進行二次調(diào)整分析,我們使用R軟件的鏈式方程多重填補(MICE)包(v. 3.2.0)填補了臨床和病理變量中的缺失值。具體的填補方法和變量列表及缺失值百分比,詳見佳學(xué)基因解碼說明文檔。
基因分型和基因型填補、族群分析與質(zhì)量控制
關(guān)于基因分型和基因型填補的方法,佳學(xué)基因在基因解碼專題中進行詳細介紹。簡而言之,患者使用了兩種不同的基因分型芯片:iCOGS和OncoArray。只有通過基因型數(shù)據(jù)推斷為亞州血統(tǒng)的樣本才被納入分析。對于未進行分型的變異,最初是使用1000基因組計劃第3階段(2014年10月發(fā)布)的參考面板進行填補。最近,我們使用了Haplotype Reference Consortium(HRC)參考面板重新進行填補,以提高稀有變異的填補質(zhì)量。所有的分析都基于基因型變異或填補后的變異,且要求次要等位基因頻率(MAF)>0.01。僅當填補后的變異的填補r²值大于0.7時,這些變異才被納入分析。最終,共分析了大約1000萬個變異。
統(tǒng)計分析
佳學(xué)基因乳腺癌腫瘤精準用藥基因檢測的主要分析結(jié)果是乳腺癌特定生存期(因乳腺癌死亡的時間)。我們采用延遲進入的Cox回歸模型估算風(fēng)險比(HR)和95%置信區(qū)間(CI)。風(fēng)險時間是從研究入組時開始的,如果入組時間晚于診斷時間(22.9%的患者在診斷1年后入組,27.3%的患者在1年后入組),則時間從研究入組開始。如果入組時間缺失(24.5%的患者),則時間從診斷開始;如果入組時間在診斷之前(8.4%的患者),則時間從診斷開始。事件的發(fā)生時間右刪失,截止時間為最后隨訪或診斷后15年,以先發(fā)生者為準。如果患者死于乳腺癌以外的原因或死因不明,則在15年內(nèi)或15年后進行刪失。
在分析中,我們還參考了早期乳腺癌臨床試驗者合作組(EBCTCG)的結(jié)果。特別是,對于基于系統(tǒng)治療類型的亞組分析,我們將最大隨訪時間限制在診斷后5年內(nèi)。這些分析的目的是探討常見遺傳變異在接受特定系統(tǒng)治療的患者中的短期效應(yīng),因為這些效應(yīng)可能隨時間變化,并且治療方案通常集中在診斷后前5年。
Cox回歸分析分別在每個亞組內(nèi)進行,并按國家進行分層。所有分析都分別按基因分型平臺(iCOGS與OncoArray)進行,結(jié)果通過固定效應(yīng)的Meta分析進行合并。HR估算值的標準誤差根據(jù)似然比檢驗統(tǒng)計量重新計算,如前所述。對于僅在一個基因分型平臺上符合納入標準(MAF>0.01且r²>0.7)的變異,我們僅使用該平臺的結(jié)果。對于P值<5E−08的變異,我們還在另一平臺上重新計算HR和95%置信區(qū)間,以驗證關(guān)聯(lián)的方向是否一致。
(責(zé)任編輯:佳學(xué)基因)