Fig 5.單細胞全基因組擴增和測序技術的發(fā)展概況。圖表的上半部分顯示了標記的主要事件scWGA和低通率scWGS技術的發(fā)展,以及吞吐量的發(fā)展
ScWGA方法
由于單個細胞中的DNA含量有限(約6pg/細胞),沒有達到測序儀的檢測要求,因此必須在測序前放大單個細胞中微量的全基因組DNA。該擴增過程的目的是生成高覆蓋率的全基因組,確保后續(xù)高通量測序中準確和全面的測序結果。隨著時間的推移,WGA技術發(fā)生了重大變化,以滿足這些需求。值得注意的方法包括簡并寡核苷酸引物聚合酶鏈反應(DOP-PCR)(Telenius,1992),多重置換擴增(MDA)(Dean,2001),以及多重退火和基于循環(huán)的擴增循環(huán)(MALBAC)(Zong,2012)。隨后的創(chuàng)新,如通過轉座子插入的線性擴增(LIANTI)(Chen,2017),單鏈測序利用微流控反應器(SISSOR),初級模板定向擴增(PTA)(Gonzales -Pena,2021)和互補鏈的多重末端標記擴增(META-CS)(Xing,2021)進一步擴展了WGA工具包。表1給出了這些方法的一般特征的概述。在下面的章節(jié)中,將回顧幾種主要的WGA方法,重點關注它們的覆蓋范圍、均勻性和準確性。簡而言之,放大性能沒有明顯的贏家,每種策略根據(jù)重要的參數(shù)都有優(yōu)勢。
表1:CGH,比較基因組雜交;LOH,雜合性缺失;STR,短序列重復;FISH,熒光原位雜交;SNP,單核苷酸多態(tài)性;SSCP,單鏈構象多態(tài)性;NGS,第二代測序;CNV,拷貝數(shù)變異;SNV,單核苷酸變異
PCR擴增
基于PCR的WGA方法有多種形式,包括引物延伸預擴增PCR(PEP-PCR)(Zhang,1992)、DOP-PCR(Teleneius,1992)、標記隨機引物PCR(T-PCR)(Grothues,1993)和連接介導PCR(LM-PCR)(Klein,1999)。這些技術對于從單個細胞中獲得基因組DNA的擴增、滿足特定的研究目標以及作為scWGA技術的模型至關重要。最早使用的scWGA技術之一是PEP-PCR,它后來被更流行的DOPPCR所取代。這些技術導致了商業(yè)試劑盒的發(fā)展,如PicoPLEX WGA試劑盒(Rubicon Genomics,美國)和GenomePlex單細胞全基因組擴增試劑盒(Sigma-Aldrich,美國)。
DOP-PCR的原理是利用部分隨機引物對模板基因組DNA進行兩步PCR擴增(Telenius et al.,1992)。簡并引物由中間隨機的6個堿基序列組成,兩側各有固定序列。引物3’端較短的ATGTGG序列在基因組DNA中具有極高的分布頻率,指導了初始低溫退火步驟,并確定了偏向于特定序列的擴增起始位點。中間的6個簡并堿基產(chǎn)生了46個不同的序列,在退火過程中,其中一個或多個簡并堿基與3’端特異性堿基同時與模板DNA結合,提高了引物的結合效率。PCR擴增分為兩個步驟:前幾個周期(3-5個)涉及低溫退火(例如,30°C),然后在高溫下進行鏈延伸。在第二步中,在更高的退火溫度(62°C)下,使用針對5’固定序列的引物進行進一步的擴增。
DOP-PCR擴增的效率取決于引物濃度和聚合酶活性。在低退火溫度下,引物可以結合多個基因組位點,產(chǎn)生擴增產(chǎn)物幾乎覆蓋整個基因組。DOP-PCR是基于PCR的WGA中最突出的一種代表性方法,可擴增單細胞的人類基因組DNA,用于腫瘤異質性分析、拷貝數(shù)變異評估和非整倍體檢測(Knouse,2014;McConnell,2013;Navin,2011)。然而,DOP-PCR通常產(chǎn)生較低的基因組覆蓋率(通常低于10%)(Navin,2011),這是一個與PCR擴增的指數(shù)性質相關的特征。此外,PCR擴增反應具有較高的堿基錯配率,由于假陽性率升高,不太適合檢測單核苷酸變異。
恒溫擴增
MDA是等溫scWGA方法中最具代表性的方法,最初由Dean等人(2001)開發(fā)。MDA在等溫條件下運行,采用了一個6-堿基對的隨機引物,隨機退火到基因組上,啟動了一個由phi29 DNA聚合酶催化的鏈置換擴增反應。通過置換產(chǎn)生的單鏈序列可以通過隨機引物退火進行隨機擴展,從而形成多分支擴增結構。由于phi29 DNA聚合酶具有強大的DNA合成能力,合成的DNA片段長度通常為50-100kb。此外,phi29 DNA聚合酶的高復制保真度,由于其3’→5’外切酶和校對活性,其錯誤率約為每108個1個核苷酸,使得MDA適用于精確的單核苷酸變異(SNV)。這一特性導致了其在單細胞基因組譜系追蹤中的應用(Lodato,2015)。此外,與最初的基于PCR的方法相比,MDA提供了顯著更高的基因組覆蓋率。然而,MDA的一個缺點是其指數(shù)擴增過程,類似于DOP-PCR,它引入了序列依賴的偏倚,阻礙了覆蓋的均勻性。值得注意的是,MDA的序列依賴偏倚在從一個細胞到另一個細胞的基因組中不能一致地重復,這使得拷貝數(shù)變異(CNV)測量的噪聲和歸一化效率較低。
為了解決放大偏差和增強均勻性和覆蓋率,各種改進的等溫放大技術,包括乳劑MDA(eMDA)(Fu,2015),數(shù)字液滴MDA(ddMDA)((Sidore,2016),TruePrime等,2016)、SISSOR(Chu,2017)和PTA(Gonzalez-Pena,2021)已經(jīng)基于MDA技術開發(fā)。eMDA和ddMDA都涉及到將擴增過程分散到數(shù)百萬個小液滴中,旨在提高擴增的均勻性和糾正偏置。TruePrime技術用一種名為TthPrimPol的獨特DNA引物替代MDA方法中的N6引物,以增強擴增均勻性。SISSOR通過將同源染色體對中的百萬堿基大小的單鏈DNA片段隨機分布到許多納升的隔間中,在微流控裝置中進行酶擴增,從而提高了測序的準確性。通過在反應中添加抗外切酶終止子,PTA技術產(chǎn)生更小的雙鏈擴增產(chǎn)物,從而進行有限的后續(xù)擴增。這導致反應從指數(shù)過程轉變?yōu)闇示性過程,增加了來自主模板的擴增量,并增強了基因組擴增的覆蓋率和均勻性。目前,基于MDA的產(chǎn)品已經(jīng)成熟,如Qiagen公司的REPLI-g單細胞試劑盒。
MALBAC
Zong等人(2012)于2012年報道,MALBAC(多重退火和基于循環(huán)的放大周期)是一種scWGA方法,旨在減輕與非線性放大相關的偏差。MALBAC引物的5’端共有27個核苷酸序列,3’端有8個隨機核苷酸序列。擴增過程始于這8個隨機核苷酸與0°C下的基因組DNA模板雜交。然后,當溫度升高到65°C時,我們使用具有鏈置換活性的DNA聚合酶來創(chuàng)建半擴增子不同的長度(0.5-1.5kb)。在94°C時,然后將半擴增子從模板中變性。半擴增子被進一步擴增,產(chǎn)生具有互補末端的完整擴增子,當溫度降低(至58°C)時形成發(fā)夾。全擴增子形成環(huán),可能會阻礙進一步的擴增和交叉雜交。經(jīng)過5輪預擴增后,將含有常見的27個核苷酸序列的寡核苷酸作為PCR的引物,對整個擴增子進行指數(shù)擴增。這一過程產(chǎn)生了下一代測序所需的微克DNA。此外,基于MALBAC方法的商業(yè)試劑盒已經(jīng)被創(chuàng)建,如MALBAC單細胞WGA測試(Qiagen)。
MALBAC不僅僅是DOP-PCR和MDA的組合;由于它的準線性放大,它具有根本的不同,它繞過了與指數(shù)放大相關的序列依賴性偏倚,從而增強了放大的均勻性。在MALBAC技術的初始階段,采用多重置換反應,使擴增產(chǎn)物的全基因組覆蓋率達到93%。MALBAC具有廣泛的覆蓋范圍和均勻的擴增,使其適用于單個細胞中SNPs和CNVs的全基因組檢測(Hou,2013;Zong,2012)。該技術的實施促進了臨床輔助生殖技術的發(fā)展(Yao,2018)。此外,MALBAC在SNV檢測中的假陰性率較低。然而,與MDA技術相比,MALBAC在SNV檢測中確實表現(xiàn)出更高的假陽性率,因為目前使用的DNA聚合酶的假陽性率較低。
LIANTI
與以前的WGA方法,如指數(shù)PCR反應退化PCR((Telenius,1992),鏈取代DNA聚合酶驅動指數(shù)放大MDA單鏈DNA(Dean,2001),和準線性放大MALBAC(Zong,2012)通過循環(huán)擴增子保護和PCR都涉及非特異性引物和指數(shù)擴增導致偏差和錯誤,一種新的scWGA方法由Chen等的團隊(Chen,2017),稱為線性擴增通過轉座子插入(LIANTI)。LIANTI利用Tn5轉座酶技術在全基因組擴增過程中維持線性擴增。該方法將基因組DNA隨機切片,然后用預先確定的序列填充切割位置通過利用Tn5轉座酶的特性,LIANTI將T7啟動子插入到基因組DNA中。然后,將標記有T7啟動子的基因組DNA片段用T7 RNA聚合酶進行IVT,線性擴增成數(shù)千個RNA拷貝。接下來是RT和第二鏈合成,產(chǎn)生為DNA文庫構建準備的雙鏈LIANTI擴增子。與早期的技術(DOP-PCR、MDA和MALBAC)相比,LIANTI在識別CNVs和SNV方面分別表現(xiàn)出優(yōu)越的靈敏度和準確性。此外,LIANTI優(yōu)于其他WGA技術(DOP-PCR、MDA和MALBAC),其基因組覆蓋率為97%,等位基因退出率為17%的WGA技術。
META-CS
真正的SNV必須位于兩條DNA鏈上的相同位置,而聚合酶錯誤和DNA損傷通常隨機發(fā)生在兩條鏈中的一條上。因此,對雙鏈DNA(dsDNA)的兩個互補鏈進行測序,對于減少單鏈的假陽性和提高準確性至關重要;パa鏈的多重末端標記擴增(META-CS)是一種革命性的scWGA技術,由Xie及其同事于2021年提出(Xing,2021)。由于DNA的互補性,META-CS可以在單管反應中清晰地識別和擴增這兩條DNA鏈,減少了幾乎所有的假陽性。使用這種方法可以從單個細胞中可靠地識別從頭SNV。
META-CS是建立在以前報道的多路復用的由本研究團隊開發(fā)的末端標記放大方法。最初,將16個獨特的轉座子序列的組合與Tn5轉座子酶以等摩爾比混合,形成轉座子復合物。這些復合物從單個細胞中隨機切割基因組DNA。隨后,由兩個隨機轉座子序列標記的基因組DNA片段通過加熱進行變性,釋放出兩條單鏈。為了獲得鏈特異性標記,這些鏈隨后使用兩個連續(xù)的聚合酶延伸過程進行預擴增。每次聚合酶延伸反應后,使用外切酶I來消除多余的引物。這些產(chǎn)物,從原始DNA的義鏈和反義鏈中分別擴增出來,可以通過將它們映射到參考基因組來區(qū)分。因此,SNV是由來自兩條鏈的信息確定的,顯著提高了準確性。
高通量scWGS方法
自從第一個用于分析人體組織拷貝數(shù)的scWGS方法的引入以來(Navin,2011),單細胞基因組學領域在過去的十年中取得了快速的進展。早期的技術僅限于一次分析少量細胞,并基于WGA化學物質(Chen,2017;Dean,2001;Telenius,1992)。然而,對腫瘤細胞基因組進化和重建的研究往往需要同時分析大量單細胞腫瘤基因組的突變特征。低通量的scWGS方法由于其勞動密集型、昂貴、耗時的性質和有限的效率而帶來了挑戰(zhàn)。組合索引、納米管和微滴技術的最新發(fā)展極大地提高了細胞吞吐量并降低了成本(Laks,2019;Minussi,2021;Vitak,2017;Yin,2019)。在下面的章節(jié)中,我們將詳細地討論和比較基于不同策略的高通量scWGS方法。支持信息中的表S5總結了幾個關鍵的高通量scWGS方法的特點。
基于微流控的高通量scWGS方法
(1) 直接庫制備方法(DLP)
Zahn等人(2017)提出了一種直接DNA轉位單細胞文庫生產(chǎn)(DLP)方法。該方法直接從單個單元格中創(chuàng)建索引庫。DLP方法利用一種特殊設計的微流控裝置來捕獲和溶解單個細胞。Tn5轉座體復合物隨機分割單個細胞的基因組DNA片段,在5‘端標記一個不同的適配器序列。然后,使用11個PCR周期,將索引條形碼和測序適配器添加到標記的DNA插入物的兩端。在索引之后,這些庫被組合用于多路測序。
在建立文庫之前,早期的單細胞技術使用WGA來捕獲整個基因組(Gawad,2014;Navin,2011;Wang,2014)。然而,預擴增引入了擴增偏差,降低了覆蓋一致性,阻礙了CNVs的檢測(Macaulay和Voet,2014;Wang,2012;Zong,2012)。DLP是第一個直接生產(chǎn)而不使用標記進行預擴增的單細胞文庫的一個例子。該方法產(chǎn)生高均勻覆蓋的基因組,使許多細胞多路復用,使其適合高通量和價格合理的CNV檢測。與DOP-PCR相比,DLP更具成本效益(每個細胞約0.50美元,而每個細胞15美元)和時間效率(2.5h vs 3d)。然而,微流控裝置的使用限制了細胞的吞吐量,并需要一定大小的細胞,因為非常小的細胞可能會滑過陷阱,除非該設備是專門為這種類型的細胞制造的。大細胞也可能堵塞通道。因此,仍然需要額外的優(yōu)化。
(2) 微流控液滴法
由于單細胞分配方法的局限性、從單細胞擴增基因組DNA的困難以及文庫制備的酶學步驟的復雜性,提高細胞測序的吞吐量面臨著挑戰(zhàn)(Lan,2017;Vitak,2017)。為了應對這些挑戰(zhàn),Andor等人(2020年)提出了一種實現(xiàn)大規(guī)模scWGS的解決方案。他們的方法利用基于兩階段微流控液滴技術自動生成高細胞數(shù)的scWGS庫。與之前的單細胞轉錄組研究類似,微流控液滴上裝載了一個可以標記DNA的條形碼水凝膠珠。為了制造細胞珠(CBs),單個細胞首先被包裹在水凝膠基質中。然后將用于細胞裂解和蛋白質消化的試劑添加到這些CBs中,以裂解和解開DNA。為了制造細胞珠-凝膠珠(CBGB)乳液,我們使用了第二個微流控芯片,其中凝膠珠(GB)被數(shù)百萬個不同的液滴識別條形碼副本功能化,并與水凝膠CB和酶反應混合物共封裝。CBGB在封裝后進行溶解,釋放內容。用測序適配器和條形碼序列標記的基因組DNA片段通過兩步等溫孵育過程獲得。在破碎和純化乳劑后,文庫已經(jīng)準備好進行Illumina測序。這種基于微流控液滴的細胞分離技術可以在一次實驗中分離出數(shù)萬個細胞,其吞吐量超過了傳統(tǒng)的DLP技術。
基于納米細胞的高通量scWGS方法
(1) 高通量直接換位scWGS方法(DLP+)
與基于預擴增的技術相比,早期使用微流控裝置的DLP方法有效地減少了偏差(Zahn,2017)。盡管基于微流控的DLP分析性能良好,但定制的微流控設備的使用限制了細胞的大小,并對其普遍采用和可擴展性提出了障礙。此外,一些基于液滴的方法對細胞大小也面臨著類似的限制(Andor,2020)。為了應對這些問題,Emma Laks(Laks,2019)開發(fā)了DLP+平臺,這是一種高通量直接換位scWGS系統(tǒng),建立在“現(xiàn)成的”皮升體積壓電分配技術和商品高密度納米管陣列上。在DLP+方法中,通過限制稀釋分離單細胞,并分配到納米細胞陣列中。為了達到幾乎完美的單細胞分離率,所選擇的細胞使用定位軟件選擇性地沉積到反應室中,該軟件將它們定位在分配噴嘴內。一個10倍的倒置熒光顯微鏡掃描每個納米細胞芯片,以驗證單細胞的占用率,并收集有關細胞狀態(tài)的數(shù)據(jù)。在發(fā)現(xiàn)文庫制備試劑之前,要進行成像,使其能夠在成像過程中排除雙孔、空孔或受污染的細胞。添加試劑,旋轉,密封,和加熱芯片是程序參與從未擴增的單細胞中創(chuàng)建DLP+文庫。使用標準的Illumina程序和HiSeq設備,得到的文庫在恢復過程中被匯集,并在所需的覆蓋深度進行測序。
通過其透明的分配噴嘴和內置相機,DLP+提供了一個獨特的優(yōu)勢,使在分配前拍攝物體的高分辨率顯微鏡圖像成為可能。通過積極選擇單個細胞,這一功能有助于防止碎屑或雙鏈細胞的測序。此外,通過有系統(tǒng)地修改一些變量,包括細胞裂解體積和緩沖類型、轉座酶(Tn5)濃度、索引后PCR周期和細胞裂解/DNA溶解時間,DLP+改進了物理反應決定因素,以生產(chǎn)高質量的文庫。DLP方法是這些優(yōu)化的基礎(Zahn,2017)。此外,DLP+顯示出基于微流控與DLP方法相當?shù)幕蚪M覆蓋一致性,但吞吐量明顯更高,在一系列組織類型中,每次實驗從數(shù)百到數(shù)萬個細胞。
(2) 檔案納米細胞測序方法(Arc-well)
先前開發(fā)的高通量scWGS方法,包括DLP(Laks,2019)、SCI-seq(Vitak,2017)和ACT(Minussi,2021),有一個共同的限制——它們需要新鮮或快速冷凍的組織樣本,使它們不適合分析檔案福爾馬林固定石蠟包埋(FFPE)組織樣本。為了解決這一挑戰(zhàn),Wang等人(2023)引入了一種名為Arc-well(檔案納米細胞測序)的新方法。為了進行Arc-well,對FFPE塊進行切片和脫親和,產(chǎn)生單核懸液,隨后用于FACS分類。將分類后的細胞核分布到5184孔的納米孔芯片中,可以對納米孔進行成像,以選擇單細胞,防止雙態(tài)、細胞核惡化和空孔。然后,使用ICELL8 cx系統(tǒng)(TaKaRa Bio)進行五步等量分配步驟,該系統(tǒng)用于將下游試劑分配到納米細胞芯片中。首先,分配裂解試劑來裂解選定的細胞核并釋放基因組DNA。接下來,分配用于標記反應(Tn5轉座體)和Tn5失活。此外,通過沉積雙指標(72個×72個組合)和擴增PCR結果,每個納米孔都得到一個不同的條形碼組合。然后將條形碼庫匯集在Illumina平臺上進行排序。
聲細胞標記(ACT)技術于2021年首次提出。該技術利用聲學液體轉移(ALT)技術、基因組DNA直接標記和單核流式細胞儀,可以實現(xiàn)單分子分辨率的高通量單細胞DNA測序(Minussi,2021)。將ACT方法與Arc-well進行比較,發(fā)現(xiàn)Arc-well具有更高的吞吐量(每次實驗1900-2600個細胞),更低的試劑成本和更低的技術可變性。重要的是,Arc-well證明了擴增FFPE檔案組織中常見的降解DNA片段的能力,使其與此類組織樣本兼容。
基于組合索引的高吞吐量scWGS方法
(1) SCI-seq
FACS在SCI-seq方法中用于將單個細胞分類為96孔板(Vita,2017)。隨后,來自單個細胞的基因組DNA被Tn5轉座酶隨機片段,每個產(chǎn)生的片段都用索引1和一個適配器標記。指數(shù)2的引入是通過PCR反應來實現(xiàn)的。最終,這些不同的文庫被組合起來進行測序。核小體缺失被SCI-seq用于組合索引程序,這使得同時產(chǎn)生數(shù)千個單細胞基因組測序文庫成為可能。這種方法除了具有高通量外,還具有不需要專門的微流體設備或液滴乳化程序的優(yōu)點。然而,值得注意的是,SCI-seq技術在PCR擴增過程中引入了一定的偏倚。
(2) SCI-L3-WGS
為了解決放大偏差問題,Yin等人(2019)引入了sciL3,這是一種將組合索引與線性放大相結合的方法。在3級索引技術的幫助下,sciL3-WGS顯著提高了LIANTI的吞吐量,允許它在每次實驗中至少測序數(shù)千甚至數(shù)百萬個細胞,同時最大限度地減少擴增偏差。sci-L3- WGS過程分為三個關鍵步驟:(i) Tn5轉座酶從單個細胞中隨機切割基因組DNA,并將條形碼1連接到每個片段上。(ii)第二組條形碼被連接到DNA片段的末端,以及一個位于兩個條形碼外的T7啟動子。(iii)引入的T7啟動子啟動IVT,然后是RT和第二鏈合成。在第二鏈合成過程中引入了第三組條形碼和UMIs。雙鏈DNA分子可以按照傳統(tǒng)的文庫制備程序進行制備。每個分子包含三個識別細胞來源的條形碼。與目前的方法和任何直接的SCI-seq(Vitak,2017)和LIANTI(Yin,2019)的組合相比,sci-L3策略有許多好處首先,使用IVT,它實現(xiàn)了與LIANTI相同的線性放大。其次,由于它使用了三輪條形碼,其理論吞吐量超過100萬個細胞,而文庫制備成本低廉(Cao,2019)。第三,sci-L3是一種靈活的線性擴增結合高通量細胞索引的策略;除單測序外,還可用于其他單細胞測序分析,如單細胞RNA/ DNA共分析。
scWGS在生物醫(yī)學中的應用
scWGS技術能夠揭示單細胞基因組結構的差異,是一個強大的工具,被用于許多不同的領域,包括腫瘤生物學、體細胞突變和鑲嵌現(xiàn)象、生物體發(fā)育、生殖細胞突變和發(fā)育、生育能力和微生物研究。它已成為生命科學的一個主要研究領域。該技術在生育和腫瘤生物學領域的應用將是接下來討論的重點。
(1) 腫瘤生物學
腫瘤是一種多方面的和多樣化的疾病,其特征是基因組不穩(wěn)定和體細胞突變的積累,其瘤內異質性對個體化癌癥醫(yī)學提出了重大挑戰(zhàn)。傳統(tǒng)的大規(guī)模測序方法為癌癥的基因組組成提供了有價值的見解;然而,他們往往忽視了腫瘤內部固有的異質性,導致了對疾病的不完整的描述。scWGS的出現(xiàn)已經(jīng)被證明有助于克服這一限制。通過支持對個人的分析在單分子水平上,scWGS在癌癥研究的各個方面都顯示出了顯著的潛力,如闡明腫瘤內的異質性、解釋克隆過程的進化、理解侵襲和轉移、研究循環(huán)腫瘤細胞(CTCs)和評估治療結果。
一項針對乳腺惡性腫瘤的研究揭示了首次利用基于DOP-PCR的scWGS研究腫瘤內異質性。該研究利用拷貝數(shù)變化確定了乳腺腫瘤內的亞克隆譜系(Navin et al.,2011)。后續(xù)scWGS研究,利用多種癌癥類型,如卵巢(McPherson,2016)、膀胱(Li,2012)、大腦(Francis,2014)、腎(Xu,2012)、結直腸(Leung,2017)、肝癌(Hou,2016)、肺(Ferronika,2017)和血液學(Gawad,2014;Hughes,2014)癌癥擴大了我們對CNVs和SNV水平的瘤內異質性的理解。這些研究揭示了特定病例中腫瘤亞型和亞克隆多樣性之間的相關性。例如,Baslan等人(2020年)使用基于DOP-PCR的測序方法,對16個乳腺癌樣本中的2086個乳腺細胞基因組進行了全面分析。他們觀察到,與雌激素受體陽性乳腺癌相比,雌激素受體陰性乳腺癌表現(xiàn)出更高的亞克隆多樣性。
通過單細胞DNA測序(scDNA-seq)獲得的基于腫瘤內異質性譜的系統(tǒng)發(fā)育分析,為識別在癌癥發(fā)展和進展中發(fā)揮重要作用的驅動突變和基因改變提供了有價值的見解。通過分析單個癌細胞的基因組,研究人員能夠確定驅動腫瘤生長的特定突變,為開發(fā)解決這些驅動突變的靶向治療提供關鍵信息。在Wang等人(2014)的一項工作中,使用靶向雙單分子測序和scWGS的組合對數(shù)百個乳腺細胞進行了分析。在兩名乳腺癌患者中,研究人員研究了突變進化和克隆多樣性。他們的研究表明,SNV逐漸進化,導致了高度的克隆多樣性。另一方面,非整倍體重排發(fā)生在腫瘤發(fā)生的早期,并在克隆生長過程中保持非常穩(wěn)定。該研究在雌激素受體陽性的浸潤性導管癌樣本中發(fā)現(xiàn)了許多與癌癥相關的非同義突變,如PIK3CA、CASP3、FBN2和PPP2R5E。有趣的是,在腔內A乳腺腫瘤中最常見的驅動突變是PIK3CA(Ellis,2012;Network,2012)。
CTC起源于原發(fā)腫瘤并進入外周血,有可能促進轉移。CTC的ScWGS為腫瘤的無創(chuàng)取樣提供了一種很有前途的方法,為無創(chuàng)預后甚至診斷提供了見解。在Riebensahm等人(2019)的一項研究中,我們采用scWGS分析了乳腺癌腦轉移患者CTC的基因突變特征。該研究確定了突變基因,如TP53、ARID1A、CDH1和TTN,與ARID1A一起參與染色質重構,被強調為一個潛在的藥物靶點。Ni等人(2013年)采用了MALBAC方法,檢測了從肺癌患者中獲得的單個CTC的基因組。分析顯示,在CTC外顯子組中存在與癌癥相關的插入/缺失(indels)和SNV。這一突變信息為個性化治療提供了潛在的臨床指導。此外,CTC已被用于治療反應的無創(chuàng)監(jiān)測(Dago,2014)。
總之,scWGS是癌癥研究中的一項開創(chuàng)性技術,提供了對單個癌細胞基因組景觀的全面理解。通過發(fā)現(xiàn)克隆進化、識別驅動基因突變、跟蹤染色體異常、研究腫瘤微環(huán)境和檢測微小殘留疾病,scWGS為癌癥診斷、預后和靶向治療提供了有價值的見解。隨著scWGS技術的不斷發(fā)展,它為推進個性化癌癥醫(yī)學帶來了巨大的前景。
(2) 生育能力
通過體外受精(IVF)產(chǎn)生的胚胎的植入前遺傳學診斷(PGD)和植入前基因組篩選(PGS)是scWGS的兩種臨床用途。這有助于防止有害突變和染色體異常的遺傳,使染色體的徹底研究。為此,使用了多種基因組分析系統(tǒng),包括多重定量PCR、比較基因組雜交(CGH)陣列和SNP陣列(Rubio,2013;Tobler,2014;Treff,2012)。scWGS技術改進了分析胚胎活檢的傳統(tǒng)方法,能夠同時識別整個基因組的非整倍體和突變(Kumar,2015;Treff,2013;Wells,2014)。高通量測序方法的快速發(fā)展進一步降低了費用,提高了PGD/PGS在染色體水平上的準確性和分辨率。這種方法有望提高在體外受精過程中選擇健康胚胎的準確性,提高輔助生殖的成功率,并降低新生兒發(fā)生遺傳疾病的風險。下面,作者將描述PGD/PGS中scWGS的幾個應用程序示例。
在PGS和PGD中scWGS的應用已經(jīng)在許多研究中得到證實:Wells等人(2002)利用基于pcr的WGA在第一極體上進行scWGA,使用CGH技術成功檢測胚胎的染色體異常。Daina等人(2013)對一個Lynch綜合征家族的14個胚胎進行了單基因分析,采用MDA方法成功實現(xiàn)了雙因素PGD,并導致了2名健康兒童的出生。Hou等人(2013)采用基于MALBAC的測序技術,分析了來自8個健康供體的單個人類卵母細胞的基因組。他們展示了如何在體外受精過程中通過MALBAC PGS選擇正常受精卵進行胚胎移植。Huang等人(2014)收集了3名孕婦供體的23個冷凍切割胚胎,并進行了單細胞CGH、SNP和MALBAC測序,并進行了24條染色體的非整倍體分析。MALBAC測序結果與CGH和SNP的一致性較高,表明其在PGD/PGS中具有應用價值。Shang等人(2018)將MALBAC-scWGS擴展到應用于線粒體疾病的PGD/PGS檢測,證明了該技術在解決各種遺傳條件方面的多功能性。
ScWGS通過分析胚胎內的單個細胞,使PGD/PGS檢測發(fā)生了革命性的變化。這種強大的技術提供了關于染色體異常、結構變異和突變景觀的詳細信息。檢測胚胎內單個細胞的基因組含量的能力提高了遺傳分析的精度,為選擇具有最高水平的胚胎提供了有價值的見解在體外受精期間成功的可能性。因此,scWGS有助于提高體外受精程序的成功率。
總結
單細胞基因組學技術的進展并沒有跟上轉錄組學的步伐,這主要是由于在DNA捕獲過程中實現(xiàn)甚至是基因組覆蓋的挑戰(zhàn)。盡管如此,單細胞基因組測序已經(jīng)為各種以前無法觸及的生物學問題帶來了重要的見解。該技術在不同的研究領域都有應用,包括體細胞突變、了解基因組功能、研究生物體發(fā)育和探索微生物學。單細胞基因組測序在臨床和翻譯研究和實際應用方面顯示出巨大的潛力,特別是在腫瘤學和輔助生殖領域。
參考文獻:
Sun F, Li H, Sun D, et al. Single-cell omics: experimental workflow, data analyses and applications. Sci China Life Sci. 2025;68(1):5-102. doi:10.1007/s11427-023-2561-0