全基因組cfDNA甲基化分析在提高早期乳腺癌無創(chuàng)診斷成像準(zhǔn)確性的應(yīng)用
瀏覽次數(shù):488 發(fā)布日期:2023-3-28
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
乳腺癌早期發(fā)現(xiàn)是提高患者預(yù)后和生存率的關(guān)鍵;谌榉縓線片和超聲技術(shù)的乳腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(BI-RADS)被廣泛用于乳腺癌的早期診斷,但這種方法的假陽(yáng)性率較高,會(huì)導(dǎo)致不必要的活檢,尤其是對(duì)于BI-RADS-4類的患者來說。而攜帶DNA甲基化信息的游離DNA(cfDNA)已經(jīng)成為一種非侵入性的癌癥檢測(cè)方法。在本文中,作者進(jìn)行了一項(xiàng)前瞻性多中心研究,利用全基因組重亞硫酸鹽測(cè)序數(shù)據(jù)來研究203名疑似惡性乳腺病變的女性患者cfDNA甲基化標(biāo)志物的臨床應(yīng)用。cfDNA主要富集在低甲基化的基因組區(qū)域。作者設(shè)計(jì)了一套方法來挖掘最佳的DNA甲基化標(biāo)記物,顯著提高了BI-RADS 4類患者的早期診斷率(AUC從0.78-0.79到0.93-0.94)。作者通過開展基于血液的全基因組DNA甲基化研究,以單堿基分辨率從良性腫瘤中檢測(cè)早期乳腺癌,結(jié)果表明結(jié)合液體活檢和傳統(tǒng)的成像診斷可以通過降低假陽(yáng)性率和避免不必要的損害來改進(jìn)當(dāng)前乳腺癌早期診斷的臨床實(shí)踐。
方案設(shè)計(jì)
本研究收集了接受乳腺X線片和超聲檢查后活檢的210例BI-RADS 4類乳腺病變女性患者。從CHCAMS的活檢患者中收集了20個(gè)腫瘤樣本(10個(gè)惡性和10個(gè)良性),用于全基因組亞硫酸氫鹽測(cè)序(WGBS)。后續(xù)具體的研究方案如圖1所示。
圖1
主要結(jié)果
作者利用WGBS檢測(cè)了每個(gè)受試者的cfDNA甲基化組。由于ctDNA在總cfDNA中的含量較低,作者設(shè)計(jì)了一個(gè)計(jì)算框架來提高cfDNA甲基化標(biāo)志物的檢測(cè)(圖2),該框架包括基于腫瘤樣本的差異甲基化區(qū)域的識(shí)別、cfDNA富集分析、片段大小選擇、基于片段的cfDNA惡性比率的統(tǒng)計(jì)推斷以及早期乳腺癌預(yù)測(cè)模型的建立。
圖2
在文庫(kù)制備和測(cè)序后,作者通過分析WGBS數(shù)據(jù)(n=101例惡性和102例良性)預(yù)測(cè)了cfDNA長(zhǎng)度的分布情況,結(jié)果顯示cfDNA長(zhǎng)度分布呈現(xiàn)典型模式,在167bp處有顯著富集。cfDNA與19個(gè)組織樣本一起產(chǎn)生了總計(jì)4.0TB的WGBS數(shù)據(jù),平均覆蓋參考基因組的88%,平均深度為11.2 x。
cfDNA甲基化標(biāo)記的鑒定。研究發(fā)現(xiàn)WGBS的cfDNA片段在編碼區(qū)和基因間隔區(qū)富集,而在基因啟動(dòng)子區(qū)域缺失(圖3A)。不同基因組區(qū)域的相應(yīng)cfDNA數(shù)量與CpG密度和GC含量呈負(fù)相關(guān)(圖3B)。在9個(gè)惡性腫瘤和10個(gè)良性腫瘤樣本之間共鑒定出57,575個(gè)DMR(51,962個(gè)低DMR和5613個(gè)高DMR)。正如預(yù)期的那樣,高DMR患者的CpG密度顯著高于低DMR患者(p<0.0001;圖3C)。因此,在所有惡性和良性樣本中,低DMR中cfDNA片段的平均數(shù)量顯著高于高DMR中的cfDNA片段平均數(shù)量(p<0.0001;圖3D)。CpG富集的高DMRs中cfDNA片段的缺失可能是由于cfDNA中開放的染色質(zhì)區(qū)域優(yōu)先被消化。這些發(fā)現(xiàn)有助于作者優(yōu)化低甲基化區(qū)域的cfDNA甲基化標(biāo)記。異常低甲基化,一般在cfDNA豐富的基因體或基因間區(qū)的封閉染色質(zhì)中,是各種惡性腫瘤的共同特征。為了保證高質(zhì)量的cfDNA定量,本文選擇了低DMRs作為候選的DNA甲基化標(biāo)記。
計(jì)算每個(gè)患者樣本的cfDNA惡性比率。利用發(fā)現(xiàn)隊(duì)列數(shù)據(jù),篩選出10個(gè)區(qū)分惡性和良性血漿樣本的DMR。它們大多位于基因間區(qū),其中惡性腫瘤患者的惡性比例明顯高于良性病變患者( p < 0.05 ;圖 3E)。但在10個(gè)甲基化標(biāo)記中,有4個(gè)功能基因( RYR2、 RYR3、 GABRB3和 DCDC2C )和2個(gè)lncRNA ( AC096570.1和LINC00923 )。
基于cfDNA甲基化的早期乳腺癌預(yù)測(cè)模型。利用cfDNA分子標(biāo)記物的惡性比率,使用隨機(jī)森林分類器(Random Forest)計(jì)算發(fā)現(xiàn)隊(duì)列中每個(gè)血漿樣本的cfDNA甲基化預(yù)測(cè)評(píng)分( cfMeth評(píng)分)。發(fā)現(xiàn)組和驗(yàn)證組模型的曲線下面積( AUC )分別為0.89 (95 % CI , 0.84 ~ 0.94 ;圖 3F)和0.81 ( 95 % CI , 0.69 - 0.93 ;圖 3G ),優(yōu)于BI-RADS結(jié)果(AUC = 0.78 - 0.79 )或相關(guān)腫瘤標(biāo)志物檢測(cè)結(jié)果( CA15 - 3和CEA AUC = 0.57 - 0.70)。
cf Meth評(píng)分與影像診斷的組合模型。采用嶺回歸(ridge regression)方法在發(fā)現(xiàn)隊(duì)列中建立cf Meth評(píng)分與乳腺X光、超聲檢查的組合診斷模型。聯(lián)合模型的表現(xiàn)優(yōu)于任何一種單獨(dú)的方法( AUC = 0.94,95 % CI,0.90-0.97 ;圖3H )。惡性組和良性組在發(fā)現(xiàn)隊(duì)列和驗(yàn)證隊(duì)列中的組合評(píng)分分布均有統(tǒng)計(jì)學(xué)差異。聯(lián)合模型的截?cái)帱c(diǎn)被選為在發(fā)現(xiàn)隊(duì)列中假陰性率小于2 %,其敏感性為98.7 %,特異性為68.8 %,準(zhǔn)確性為83.8 %。在驗(yàn)證隊(duì)列中,性能相似( AUC = 0.93 [ 95 % CI , 0.84-1.00 ] );圖3I ),其敏感性為91.7 %,特異性為88.0 %,準(zhǔn)確性為89.8 %,沒有過度擬合的證據(jù)?傮w而言,聯(lián)合模型的檢出率分別為93.3 % ( 42 / 45 )、100 % ( 34 / 34 )、100 % ( 22 / 22 ),腫瘤Ⅰ、Ⅱ、Ⅲ期診斷的特異性為73.5 %。
圖3
結(jié)論
在單堿基分辨率下,作者進(jìn)行了基于血液的全基因組DNA甲基化檢測(cè)早期乳腺癌的研究,結(jié)果顯示液體活檢與傳統(tǒng)的診斷顯像相結(jié)合可以提高早期乳腺癌診斷的準(zhǔn)確性。