期刊:Science China-Life Sciences
影響因子:8.0
單細(xì)胞測(cè)序概述
單細(xì)胞測(cè)序(Single-cell RNA sequencing; scRNA-seq)是一種開(kāi)創(chuàng)性的單細(xì)胞測(cè)序技術(shù),現(xiàn)在已得到廣泛普及,并涵蓋了多種方法。盡管方法多種多樣,但它們都遵循類似的一般過(guò)程,包括四個(gè)主要步驟:(i)單細(xì)胞分離、(ii)逆轉(zhuǎn)錄(RT)、(iii)cDNA 擴(kuò)增和(iv)測(cè)序文庫(kù)構(gòu)建和測(cè)序(Hedlund and Deng,2018)。scRNA-seq工作流程的主要步驟如圖 3所示。本節(jié)概述了與單細(xì)胞分離和測(cè)序文庫(kù)構(gòu)建相關(guān)的一些技術(shù)和解決方案。
(1)單細(xì)胞分離
在scRNA-seq中,第一步也是關(guān)鍵的一步是單細(xì)胞分離,其中組織解離和單細(xì)胞分離被認(rèn)為是造成污染、批次效應(yīng)和程序差異的重要因素(Tung等,2017)。因此,要進(jìn)行高通量和無(wú)偏差的單細(xì)胞測(cè)序,高效、可靠、準(zhǔn)確捕獲單細(xì)胞是關(guān)鍵決定因素。早期的單細(xì)胞分離方法包括有限連續(xù)稀釋 ( Gross等,2015 )、手動(dòng)顯微操作 ( Hu等,2016a )和激光捕獲顯微切割 (LCM)( Emmert-Buck等,1996 ),這些方法通量低、耗時(shí)、效率低、技術(shù)難度大,但仍用于分析少量細(xì)胞(例如稀有細(xì)胞)( Dal Molin and Di Camillo, 2019 )。
流式細(xì)胞熒光分選 (FACS)是一種常用的高通量技術(shù),可特異性地自動(dòng)分離數(shù)千個(gè)單個(gè)細(xì)胞,但對(duì)細(xì)胞數(shù)量的需求很大(需要分離的細(xì)胞數(shù)量 >10,000)( Hu等,2016a )。此外,由于熒光信號(hào)微弱,該技術(shù)不適用于某些標(biāo)志物表達(dá)較低的細(xì)胞,因此很難區(qū)分具有相似標(biāo)志物表達(dá)的亞群 ( Yasen等,2020 )。磁激活細(xì)胞分選 (MACS)是另一種高通量分離技術(shù),旨在通過(guò)與磁珠結(jié)合的酶、凝集素、抗體或鏈霉親和素分離各種細(xì)胞類型,從而促進(jìn)特定蛋白質(zhì)與靶細(xì)胞的結(jié)合 ( Hu等,2016a )。MACS 系統(tǒng)具有顯著的優(yōu)勢(shì),可在特定細(xì)胞群中實(shí)現(xiàn) 90% 以上的純度 ( Miltenyi等,1990 )。然而,與 FACS 相比,MACS 具有固有的局限性,因?yàn)槊庖叽偶夹g(shù)只能將細(xì)胞分離為陰性和陽(yáng)性細(xì)胞群。此外,它不能根據(jù)分子的低表達(dá)或高表達(dá)來(lái)分離細(xì)胞,而 FACS 可以做到這一點(diǎn) ( Hu等,2016a )。在當(dāng)前的高通量測(cè)序平臺(tái)中,基于微流體的單細(xì)胞操作方法已成為轉(zhuǎn)錄組研究中單細(xì)胞分離的主要技術(shù),這種技術(shù)顯著提高了分離過(guò)程的規(guī)模、效率和準(zhǔn)確性。微流體裝置使用反應(yīng)室或液滴捕獲細(xì)胞,然后分別進(jìn)行單獨(dú)的納升水平的反應(yīng)步驟,提供了更經(jīng)濟(jì)且樣品效率更高的分析方法。這些裝置主要分為基于微孔的方法、基于液滴的方法和集成流體回路 (IFC)。微流控系統(tǒng)在 scRNA 測(cè)序中的集成顯著提高了測(cè)序通量,能夠同時(shí)處理和分析數(shù)以萬(wàn)計(jì)的單細(xì)胞。表S2 全面概述了當(dāng)前的單細(xì)胞分離技術(shù),包括其優(yōu)點(diǎn)和局限性。
(2)逆轉(zhuǎn)錄和 cDNA 擴(kuò)增
單個(gè)哺乳動(dòng)物細(xì)胞含有的 RNA總量約 10 pg,其中主要部分由核糖體RNA (rRNA)和轉(zhuǎn)運(yùn)RNA (tRNA)組成,而信使RNA (mRNA)僅占總量的1%–5%(Liu等,2014 ; Wang等,2023c)。由于單細(xì)胞中mRNA含量極低,因此必須在逆轉(zhuǎn)錄后對(duì)cDNA進(jìn)行擴(kuò)增,以獲得大量用于測(cè)序文庫(kù)制備的樣本。cDNA擴(kuò)增可以通過(guò)使用聚合酶鏈?zhǔn)椒磻?yīng) (PCR)的指數(shù)擴(kuò)增或基于體外轉(zhuǎn)錄 (IVT)的線性擴(kuò)增來(lái)實(shí)現(xiàn)。
目前,文庫(kù)構(gòu)建的主要方法是基于 PCR 的 cDNA 擴(kuò)增,包括 poly(A)加尾和模板轉(zhuǎn)換 (TS)方法(Kolodziejczyk等,2015)。poly(A)加尾法使用 oligo-dT 引物與 mRNA 3′-poly(A)尾結(jié)合,將mRNA 逆轉(zhuǎn)錄為 cDNA。poly(A)加尾法速度快但不能捕獲非多聚腺苷酸化(Poly(A)−)RNA(Hebenstreit,2012),且捕獲效率低,文獻(xiàn)報(bào)道現(xiàn)行捕獲方法的捕獲效率約為10%–15%(Islam等,2014)。此外,逆轉(zhuǎn)錄酶反應(yīng)的終止還可能導(dǎo)致轉(zhuǎn)錄中 mRNA 5′端的覆蓋率降低。TS 技術(shù)利用莫洛尼鼠白血病病毒 (MMLV)逆轉(zhuǎn)錄酶進(jìn)行 TS 過(guò)程。MMLV 逆轉(zhuǎn)錄酶可以在新合成的單鏈尾端附加一個(gè) poly(C)尾。poly(C)尾可以與模板轉(zhuǎn)換寡核苷酸 (TSO)接頭序列的 5′端 poly(G)尾結(jié)合。在這一互作之后會(huì)發(fā)生一個(gè)“切換”:逆轉(zhuǎn)錄酶以TSO為模板合成cDNA,完成銜接子的轉(zhuǎn)換(Picelli,2017)。TS法相對(duì)來(lái)說(shuō)不易發(fā)生核酸丟失,但與poly(A)加尾法相比靈敏度較低。基于PCR的擴(kuò)增雖然能夠在短時(shí)間內(nèi)快速有效地?cái)U(kuò)增大量cDNA,但受到指數(shù)擴(kuò)增過(guò)程固有特性的制約。PCR傾向于擴(kuò)增較短和GC含量較低的擴(kuò)增子,從而導(dǎo)致定量偏差和非特異性轉(zhuǎn)錄本的積累,從而導(dǎo)致原始轉(zhuǎn)錄本信息的丟失(Aird等,2011)。此外,PCR會(huì)導(dǎo)致最終文庫(kù)中高表達(dá)的轉(zhuǎn)錄本過(guò)多(Aird等,2011)。
IVT代表了另一種cDNA合成和擴(kuò)增的方法。IVT 的主要優(yōu)勢(shì)在于其線性擴(kuò)增,這一特性可減輕人們通常所說(shuō)的擴(kuò)增偏好,使其比 PCR 更精確、重復(fù)性更好 ( Chen等,2017a ; Grün and van Oudenaarden, 2015 )。在該策略中,一條oligo-dT 引物最初與 mRNA 的 3′-poly(A)尾結(jié)合,合成兩條 cDNA 鏈,該引物包含(i)唯一分子標(biāo)識(shí)符 (UMI,具有標(biāo)記單個(gè) mRNA分子的隨機(jī)核苷酸序列,用于量化唯一轉(zhuǎn)錄本和糾正擴(kuò)增偏好性);(ii)唯一的細(xì)胞條形碼(barcode);(iii)Illumina 接頭;和(iv)T7 啟動(dòng)子。將擴(kuò)增的 RNA 分子重新轉(zhuǎn)換為 cDNA需要另一輪逆轉(zhuǎn)錄,以便構(gòu)建測(cè)序文庫(kù)。因此,得到的 cDNA 在 3′端的覆蓋度上存在明顯的偏差。此外,這種方法耗時(shí)耗力,使之與 PCR 相比,沒(méi)有得到廣泛的應(yīng)用(Hashimshony 等人,2012)。
作為 scRNA-seq的一個(gè)獨(dú)特步驟,所有來(lái)自單個(gè)細(xì)胞的轉(zhuǎn)錄本都會(huì)獲得一個(gè)獨(dú)特的barcode-在逆轉(zhuǎn)錄期間引入 cDNA 的短寡核苷酸序列,用于區(qū)分單個(gè)細(xì)胞的轉(zhuǎn)錄組。利用獨(dú)特的barcode信息,這些轉(zhuǎn)錄本就可以被很容易地對(duì)應(yīng)到各自歸屬的細(xì)胞中去。因此,在每個(gè)細(xì)胞都用唯一的barcode標(biāo)記后,大量單細(xì)胞轉(zhuǎn)錄組才能被合并在一起,用于構(gòu)建文庫(kù),然后在一次運(yùn)行中完成后續(xù)測(cè)序。這種方法顯著降低了成本并提高了測(cè)序通量。細(xì)胞barcode是一種非常有效的并行處理策略,2011首次用于 STRT-seq方法(Islam等,2011)。隨后,2014, Islam 等人進(jìn)一步創(chuàng)新,引入了 UMI 來(lái)識(shí)別細(xì)胞內(nèi)的每個(gè) cDNA 分子。與細(xì)胞barcode一樣,UMI 也是一個(gè)由 6–8 個(gè)堿基對(duì)組成的隨機(jī)寡核苷酸序列,可以在逆轉(zhuǎn)錄過(guò)程中整合到細(xì)胞內(nèi)的每一個(gè)轉(zhuǎn)錄本中。大量的UMI序列可以讓每個(gè)轉(zhuǎn)錄本都帶上不同的標(biāo)記,從而確保通過(guò) PCR 擴(kuò)增產(chǎn)生的所有重復(fù)分子都保留原始轉(zhuǎn)錄本的UMI。通過(guò)計(jì)算UMI,就可以對(duì)轉(zhuǎn)錄本的原始拷貝數(shù)進(jìn)行精準(zhǔn)的定量,從而消除 PCR 擴(kuò)增的偏好性。
針對(duì)單細(xì)胞 RNA 測(cè)序的三個(gè)關(guān)鍵問(wèn)題:(i)單細(xì)胞分離;(ii)最大限度地減少逆轉(zhuǎn)錄期間的RNA損失;以及 (iii)產(chǎn)生足夠的DNA進(jìn)行測(cè)序,研究人員近年來(lái)進(jìn)行了許多技術(shù)方面的探索,導(dǎo)致了各種 scRNA-seq方法的提出,專門用于單細(xì)胞轉(zhuǎn)錄組學(xué)的全面研究。
不同的 scRNA-seq技術(shù)都基于共同的基本原理,但它們?cè)谝韵轮辽僖粋(gè)方面有所不同:(i)單細(xì)胞分離;(ii)逆轉(zhuǎn)錄;(iii)cDNA 擴(kuò)增;(iv)轉(zhuǎn)錄本覆蓋;(v)UMI;(vi)鏈特異性。每種方法都有其獨(dú)特的優(yōu)勢(shì)和局限性。這些不同的 scRNA-seq技術(shù)的主要特征合并整理在表S1 中。因此,研究人員可以根據(jù)技術(shù)特點(diǎn)、優(yōu)勢(shì)、成本因素和通量需求靈活地選擇合適的 scRNA-seq方法。
圖3. 單細(xì)胞測(cè)序工作流程的主要步驟
當(dāng)前可用的 scRNA-seq 技術(shù)
低通量 scRNA-seq 技術(shù)
如表S1 中所述,scRNA-seq已經(jīng)開(kāi)發(fā)出了60多種不同的方法?傮w來(lái)說(shuō),這些方法可以分為兩大類:低通量方法和高通量方法。低通量方法發(fā)展出的基本化學(xué)方法旨在提高測(cè)序的靈敏度和準(zhǔn)確性,同時(shí)降低成本和技術(shù)噪音。其中,靈敏度是最為重要的關(guān)鍵特性,也是評(píng)估方法性能的基本指標(biāo)。高通量方法的基本化學(xué)原理也是從幾種經(jīng)典低通量方法中發(fā)展而來(lái)的。我們將在下面詳細(xì)討論這些技術(shù)。
(1)Tang's protocol
Tang's protocol于2009年由Surani課題組開(kāi)發(fā),是一種具有開(kāi)創(chuàng)性的scRNA-seq方法。在該技術(shù)中,單個(gè)小鼠胚泡是利用一臺(tái)顯微鏡來(lái)手動(dòng)進(jìn)行選擇的。隨后解列細(xì)胞,用帶有錨定序列(UP1)的 poly(T)引物將 mRNA 逆轉(zhuǎn)錄為 cDNA,并在末端轉(zhuǎn)移酶的幫助下將 poly(A)尾添加到第一鏈末端的尾端。此后,使用帶有另一個(gè)錨定序列(UP2)的第二條 poly(T)引物合成第二鏈 cDNA。在此之后,使用 UP1 和 UP2 引物通過(guò)PCR對(duì)cDNA進(jìn)行高效擴(kuò)增,構(gòu)建文庫(kù),最后在SOLiD系統(tǒng)上進(jìn)行測(cè)序。該方法可以生成幾乎全長(zhǎng)的轉(zhuǎn)錄本 cDNA 并檢測(cè)約 13,000 個(gè)基因(Tang等,2009)。該技術(shù)的主要用途是幫助揭示新的轉(zhuǎn)錄本和可變剪接異構(gòu)體。
盡管該技術(shù)代表了當(dāng)時(shí)新興的scRNA-seq領(lǐng)域的重大進(jìn)步,但它也有很多局限性。首先,該方法只能識(shí)別具有poly(A)尾的 mRNA;它不能捕獲沒(méi)有poly(A)尾的 mRNA,例如組蛋白 mRNA、miRNA、環(huán)狀 RNA(circRNA)和新生 RNA。這是因?yàn)樵摲椒ㄐ枰蕾囉趐oly(T)引物通過(guò)poly(A)尾來(lái)捕獲mRNA,進(jìn)而起始逆轉(zhuǎn)錄反應(yīng)。其次,酶反應(yīng)效率低下導(dǎo)致測(cè)序靈敏度降低,從而導(dǎo)致低表達(dá)轉(zhuǎn)錄本的丟失。第三,這種方法不是鏈特異性的,不能區(qū)分正義和反義轉(zhuǎn)錄本。因此,它沒(méi)有被廣泛使用。
(2)STRT-seq
2011年,Islam 等人(2011)開(kāi)發(fā)了一種單細(xì)胞標(biāo)記逆轉(zhuǎn)錄測(cè)序 (single-cell tagged reverse transcription sequencing,STRT-seq)方法,這是一種基于Illumina 平臺(tái)多重測(cè)序的scRNA-seq方法。該方法在逆轉(zhuǎn)錄過(guò)程中通過(guò)模板切換機(jī)制引入barcode和上游引物結(jié)合序列,促進(jìn) 3′端鏈特異性擴(kuò)增以及高通量96細(xì)胞多重測(cè)序。STRT-seq在基于陣列的測(cè)序策略基礎(chǔ)上,支持處理多達(dá) 800 個(gè)單個(gè)細(xì)胞。該方法的一個(gè)關(guān)鍵優(yōu)勢(shì)是它可以在逆轉(zhuǎn)錄過(guò)程中為每個(gè)細(xì)胞添加獨(dú)特的barcode序列,從而能夠大規(guī)模檢測(cè)各種混合細(xì)胞樣本,例如高度異質(zhì)性的腫瘤細(xì)胞樣本。與Tang’s protocol相比,STRT-seq通過(guò)提前加入barcode的策略顯著降低了成本和處理時(shí)間。然而,該方法中包含了多個(gè)PCR循環(huán),可能會(huì)引入PCR偏差。該方法在生物醫(yī)學(xué)領(lǐng)域有許多應(yīng)用,包括探究腫瘤異質(zhì)性、識(shí)別潛在的用于疾病的診斷和治療的新型生物標(biāo)志物或者藥物靶點(diǎn)(Cui等,2021 ;Song等,2022a ;Tian等,2022)。(3)Smart-seq
2012, Ramsköld 等人開(kāi)發(fā)了一種可靠、穩(wěn)定的 scRNA-seq方法 Smart-seq,該方法最顯著的進(jìn)步是通過(guò)轉(zhuǎn)錄本前端的切換機(jī)制,在轉(zhuǎn)錄本全長(zhǎng) cDNA 合成中達(dá)到超過(guò)40%的效率。該技術(shù)的發(fā)表是 scRNA-seq研究領(lǐng)域的一個(gè)里程碑。Smart-seq的核心原理是利用 poly(T)引物和 SMART-TS 技術(shù)將多聚腺苷酸化(poly(A)+)RNA 轉(zhuǎn)換為全長(zhǎng) cDNA。得到的cDNA分子經(jīng)PCR擴(kuò)增后,通過(guò)Nextera Tn5轉(zhuǎn)座子技術(shù)構(gòu)建Illumina測(cè)序文庫(kù),該方法顯著提高了檢測(cè)可變剪接外顯子和低豐度表達(dá)轉(zhuǎn)錄本的能力。smart-seq方法在醫(yī)學(xué)領(lǐng)域有著廣泛的應(yīng)用,如分析膽道閉鎖小鼠模型肝臟中CD177+細(xì)胞的基因表達(dá)譜(Zhang等,2022d);分析骨骼肌干細(xì)胞、不同生態(tài)位的細(xì)胞和單根肌纖維的全基因組表達(dá)(Blackburn等,2019 ;Blackburn等,2021);研究急性皮膚紅斑狼瘡患者與正常對(duì)照組真皮CD4 + Trm細(xì)胞的差異(Zhao等,2022c)。
Smart-seq2被開(kāi)發(fā)出來(lái)是為了克服 Smart-seq中存在的覆蓋范圍有限、cDNA擴(kuò)增產(chǎn)量較低和靈敏度不夠等問(wèn)題(Picelli 等人,2013)。為了增加 cDNA 文庫(kù)的產(chǎn)量和長(zhǎng)度,Smart-seq2進(jìn)行了幾項(xiàng)改進(jìn),包括增強(qiáng)逆轉(zhuǎn)錄、TSO 和PCR重新擴(kuò)增。與 Smart-seq相反,Smart-seq2是通過(guò)在 TSO 的 3 '端加入鎖核酸 (LNA)鳥(niǎo)苷酸,使得cDNA 產(chǎn)量顯著提高至大約兩倍。這種改善與LNA-DNA堿基對(duì)的熱穩(wěn)定性增強(qiáng)有關(guān)。此外,該技術(shù)通過(guò)添加甲基供體甜菜堿以及更高濃度的 MgCl2,使得cDNA 產(chǎn)量大幅增加。另一方面,不直接將脫氧核糖核苷三磷酸 (dNTP)加入RT主混合物中,而是在RNA 變性之前才加入反應(yīng)體系,這樣可以增加預(yù)擴(kuò)增cDNA的平均長(zhǎng)度。上述改進(jìn)可能是由RNA 與oligo-dT 引物雜交穩(wěn)定性提高所導(dǎo)致的。KAPA HiFi Hot Start DNA 聚合酶的應(yīng)用改善了cDNA的生成并增加了cDNA的長(zhǎng)度。Smart-seq2 轉(zhuǎn)錄組文庫(kù)在檢測(cè)強(qiáng)度、覆蓋率、偏差和準(zhǔn)確性方面均優(yōu)于 Smart-seq。Smart-seq2 轉(zhuǎn)錄組文庫(kù)的建立可以使用成本更低的現(xiàn)成試劑,使得深入分析每個(gè)轉(zhuǎn)錄本的全外顯子和檢測(cè)不同的剪接變體成為可能。該方法還有助于徹底分析單核苷酸多態(tài)性 (SNP)和突變。然而,該方法也存在局限性,例如缺乏鏈特異性和無(wú)法檢測(cè) poly(A)− RNA(Picelli等,2014)。此外,使用微量移液器的細(xì)胞分離過(guò)程較為耗時(shí)且通量低。
(3)Smart-seq3
通過(guò)優(yōu)化逆轉(zhuǎn)錄和模板轉(zhuǎn)換的條件,提高了靈敏度(HagemannJensen等,2020)。優(yōu)化的參數(shù)包括使用Maxima H-minus逆轉(zhuǎn)錄酶、將逆轉(zhuǎn)錄鹽從KCl轉(zhuǎn)換為NaCl或CsCl、在體系中存在5% 聚乙二醇 (PEG)的條件下進(jìn)行逆轉(zhuǎn)錄,以及加入GTP或dCTP來(lái)增強(qiáng)和穩(wěn)定模板轉(zhuǎn)換反應(yīng)等。Smart-seq3 的一個(gè)顯著特點(diǎn)是它將全長(zhǎng)轉(zhuǎn)錄組覆蓋與 5′UMI RNA計(jì)數(shù)策略相結(jié)合,從而無(wú)需犧牲整體覆蓋率即可提高轉(zhuǎn)錄本計(jì)數(shù)的精度。這種方法構(gòu)建了一個(gè)TSO引物,包含Tn5基序的一部分、11 個(gè)堿基對(duì)的標(biāo)簽序列、8 個(gè)堿基對(duì)的 UMI 序列和三個(gè)核糖鳥(niǎo)苷。測(cè)序后,利用上述11 個(gè)堿基對(duì)的標(biāo)簽就可以明確區(qū)分 5′UMI 標(biāo)記的reads和內(nèi)部reads,在單次測(cè)序反應(yīng)中就可以收集5′UMI標(biāo)記的reads和不帶 UMI 的整個(gè)轉(zhuǎn)錄本的內(nèi)部reads。這種方法允許利用UMIreads對(duì)原始轉(zhuǎn)錄本進(jìn)行準(zhǔn)確量化,從而校正非線性PCR擴(kuò)增偏差,通過(guò)使用內(nèi)部reads就可以重建全長(zhǎng)轉(zhuǎn)錄本。當(dāng)前的很多測(cè)序文庫(kù)構(gòu)建方法結(jié)合了細(xì)胞barcode和 UMI 標(biāo)簽策略。然而,由于這些標(biāo)簽只能引入到cDNA的末端,因此得到的用于測(cè)序的cDNA序列僅限于轉(zhuǎn)錄本的一端,導(dǎo)致轉(zhuǎn)錄本中間的重要序列信息丟失。因此,基于標(biāo)簽的方法主要用于基因表達(dá)的量化,不適用于異構(gòu)體識(shí)別或剪接的研究。盡管 Smart-seq和 Smart-seq2 能夠捕獲全長(zhǎng)轉(zhuǎn)錄本,但它們無(wú)法利用barcode或 UMI 來(lái)對(duì)轉(zhuǎn)錄本進(jìn)行標(biāo)記,這就使得它們與高通量并行的單細(xì)胞測(cè)序不兼容。此外,如果沒(méi)有 UMI 標(biāo)簽,這些方法也就無(wú)法解決PCR帶來(lái)的擴(kuò)增偏好性問(wèn)題。然而,Smart-seq3 通過(guò)使用一種特殊的TSO引物克服了全長(zhǎng)轉(zhuǎn)錄本覆蓋和UMI不兼容的限制。
Smart-seq-total被設(shè)計(jì)出來(lái)是為了針對(duì)之前的 Smart-seq技術(shù)只能捕獲 poly(A)+ RNA 分子的限制 ( Isakova等,2021 )。這種方法的主要進(jìn)步在于利用大腸桿菌 poly(A)聚合酶在 RNA 分子的 3′端添加腺嘌呤尾巴。因此,所有 poly(A)+ RNA在進(jìn)行逆轉(zhuǎn)錄時(shí)使用的poly(T)引物都包含UMI和TSO。這種修改使 Smart-seq-total 能夠同時(shí)捕獲多種形式的RNA,包括單個(gè)細(xì)胞內(nèi)的蛋白質(zhì)編碼RNA、長(zhǎng)非編碼RNA、microRNA 和其他非編碼RNA轉(zhuǎn)錄本。這種方法有助于探索細(xì)胞內(nèi)編碼和非編碼轉(zhuǎn)錄本之間的調(diào)控聯(lián)系,從而深入了解復(fù)雜的調(diào)控景觀。但值得注意的是,Smart-seq-total確實(shí)也存在一些局限性。首先,它不能評(píng)估環(huán)狀RNA。其次,它會(huì)導(dǎo)致轉(zhuǎn)錄本內(nèi)源性多聚腺苷酸化狀態(tài)的喪失。盡管存在這些缺點(diǎn),Smart-seq-total 仍然表現(xiàn)出巨大的潛力,可以揭示控制細(xì)胞功能的非編碼調(diào)控模式,并有助于確定細(xì)胞身份。
(4)CEL-seq
CEL-seq(Cell expression by linear amplification and sequencing)是把IVT 中的線性的鏈特異性用于擴(kuò)增單細(xì)胞中的 RNA 的開(kāi)創(chuàng)性方法 ( Hashimshony 等,2012 )。該過(guò)程的起始包括使用具有錨定 poly(T)、特定barcode、5′Illumina 測(cè)序接頭和 T7 啟動(dòng)子的引物合成cDNA的第一鏈。隨后生成第二條鏈,產(chǎn)生含有 T7 啟動(dòng)子的雙鏈cDNA。來(lái)自多個(gè)細(xì)胞的混合cDNA樣本由T7啟動(dòng)子起始IVT,從而實(shí)現(xiàn) cDNA 的線性擴(kuò)增,得到擴(kuò)增后的RNA隨后轉(zhuǎn)化為cDNA 進(jìn)行測(cè)序。通過(guò)線性擴(kuò)增,CEL-seq最大限度地減少了擴(kuò)增偏差,與Smart-seq等全長(zhǎng) cDNA 覆蓋技術(shù)相比,可提供更靈敏、更可重復(fù)的結(jié)果。然而,CEL-seq也有局限性,例如無(wú)法檢測(cè) miRNA 和其他 poly(A)−轉(zhuǎn)錄本,并且由于其強(qiáng)烈的 3′偏差而難以區(qū)分不同的可變剪接形式。
CEL-seq2 是 CEL-seq的改進(jìn)版本,它提高了靈敏度、降低了成本并減少了動(dòng)手時(shí)間(Hashimshony 等人,2016)。為了減輕mRNA分子計(jì)數(shù)的偏差,CEL-seq2 在barcode上游引入了 5 個(gè)堿基對(duì)的 UMI。使用 SuperScript II 雙鏈 cDNA 合成試劑盒并改變CEL-seq引物長(zhǎng)度,逆轉(zhuǎn)錄反應(yīng)效率顯著提高。CEL-seq2優(yōu)于原始 CEL-seq方法,每個(gè)細(xì)胞可檢測(cè)到兩倍多的轉(zhuǎn)錄本,檢測(cè)到的基因數(shù)增加30%。但值得注意的是,盡管 CEL-seq2 具有明顯的3′偏向性,但是大多數(shù)剪接事件的信息它都不能提供。盡管如此,其更高的靈敏度和單個(gè)轉(zhuǎn)錄本計(jì)數(shù)能力使其再轉(zhuǎn)錄組學(xué)中的各種應(yīng)用具有更多的優(yōu)勢(shì)。
(5)SUPeR-seq
SUPeR-seq(single-cell universal poly(A)-independent RNA sequencing)使用具有固定錨序列的隨機(jī)引物代替 cDNA 合成中常用的 oligo-dT 引物,這使得檢測(cè)單個(gè)細(xì)胞內(nèi)的poly(A)+ 和 poly(A)− RNA成為了可能(Fan等,2015b)。該過(guò)程涉及利用具有固定錨定序列的隨機(jī)引物(AnchorX-T15N6)將總 RNA 逆轉(zhuǎn)錄為cDNA第一條鏈。在合成初始的cDNA鏈后,用ExoSAP-IT 消化多余的引物,防止形成引物二聚體復(fù)合物。使用末端脫氧核苷酸轉(zhuǎn)移酶和含有1% ddATP 的 dATP將 poly(A)尾巴附加到初始 cDNA 鏈的 3′端,隨后,使用具有可變錨定序列的 poly(T)引物(AnchorY-T24)生成cDNA的第二條鏈。上述兩條鏈?zhǔn)褂?AnchorY-T24 和 AnchorX-T15 引物通過(guò) PCR 擴(kuò)增并進(jìn)行測(cè)序。SUPeR-seq已被用于研究哺乳動(dòng)物早期胚胎發(fā)育過(guò)程中 circRNA 的調(diào)控機(jī)制。然而,由于缺乏UMI和細(xì)胞barcode,它給高通量測(cè)序和分子計(jì)數(shù)帶來(lái)了挑戰(zhàn)。
(6)MATQ-seq
2017年,Sheng 等人(2017)介紹了基于多重退火和加dC尾的定量單細(xì)胞 RNA 測(cè)序(MATQ-seq)方法。有別于SUPeR-seq,該技術(shù)結(jié)合barcode和UMI對(duì)polyA+和polyA − RNA進(jìn)行測(cè)序。該過(guò)程包括使用為多重退火和基于環(huán)狀的擴(kuò)增循環(huán)(MALBAC)設(shè)計(jì)的引物將總RNA轉(zhuǎn)化cDNA第一條鏈。這些引物主要包含G、A和T堿基,以及MALBAC-dT引物。逆轉(zhuǎn)錄后,cDNA一鏈進(jìn)行dC加尾,然后使用G富集的MALBAC引物合成cDNA二鏈。UMI在第二鏈合成過(guò)程中添加。與 Smart-seq2和SUPeR-seq不同的是,MATQ-seq利用UMI 顯著減少了HEK293T 轉(zhuǎn)錄本中的前導(dǎo)端或尾端偏差。此外,MATQ-seq在捕獲 polyA − RNA 方面表現(xiàn)出比 Smart-seq2 和 SUPeR-seq更高的靈敏度,捕獲效率為 89.2%±13.2%。這一改進(jìn)提高了檢測(cè)低豐度基因的效率。MATQ-seq的高準(zhǔn)確度和靈敏度可以檢測(cè)到同一類細(xì)胞中各個(gè)細(xì)胞之間基因表達(dá)的細(xì)微差異。然而,與 SUPeR-seq類似,MATQ依靠口吸管進(jìn)行單細(xì)胞分離的方法十分耗時(shí),限制了 MATQ-seq的通量。
(7)FLASH-seq
FLASH-seq是一種快速且透徹的全長(zhǎng) scRNA 測(cè)序方法,由Hahaut 等人(2022)開(kāi)發(fā)。為了提高 Smart-seq2方法的效率,該技術(shù)進(jìn)行了幾個(gè)關(guān)鍵的修改:(i)將逆轉(zhuǎn)錄和 cDNA 預(yù)擴(kuò)增結(jié)合起來(lái),簡(jiǎn)化了流程;(ii)用更高效的逆轉(zhuǎn)錄酶 Superscript IV取代了Superscript II,縮短了逆轉(zhuǎn)錄反應(yīng)時(shí)間;(iii)增加了dCTP的量,有利于Superscript IV 的 C 尾活性并增強(qiáng)模板轉(zhuǎn)換反應(yīng);(iv)將模板轉(zhuǎn)換寡核苷酸中的 3′-末端鎖核酸鳥(niǎo)嘌呤替換為核糖鳥(niǎo)苷;(v)將反應(yīng)體積減少到 5 μL ( Hahaut等,2022 )。這些改動(dòng)共同導(dǎo)致時(shí)間和成本大幅降低。FLASH-seq可以在大約 4.5 小時(shí)內(nèi)完成,比 Smartseq2 等其他方法快2–3.5 小時(shí)。與 Smart-seq3 相比,它的單個(gè)細(xì)胞成本低于其他商業(yè)化和非商業(yè)化的方法,不到 1 美元。此外,F(xiàn)LASH-seq可以檢測(cè)到大量的 SNP。該方法適合于尋求經(jīng)濟(jì)實(shí)惠、自動(dòng)化友好、穩(wěn)定且高效的單細(xì)胞轉(zhuǎn)錄分析方法的研究人員。
高通量scRNA-seq技術(shù)
(1) 開(kāi)發(fā)高通量 scRNA-seq的策略
ScRNA-seq的早期階段使用顯微操作器或 LCM 分離單個(gè)細(xì)胞,進(jìn)行單獨(dú)的轉(zhuǎn)錄組擴(kuò)增和文庫(kù)構(gòu)建。然而,這些方法有局限性,因?yàn)樗鼈冊(cè)谝淮螌?shí)驗(yàn)中只能分析幾個(gè)細(xì)胞。細(xì)胞特異性barcode的引入徹底改變了該領(lǐng)域,允許將數(shù)千個(gè)單細(xì)胞轉(zhuǎn)錄組混合在一起,在單次運(yùn)行中進(jìn)行文庫(kù)構(gòu)建和測(cè)序,從而實(shí)現(xiàn)高通量并行測(cè)序。該方向上的一個(gè)顯著進(jìn)步是 MARS-seq方法的開(kāi)發(fā),該方法將 FACS 與自動(dòng)液體處理相結(jié)合,在一次實(shí)驗(yàn)中成功測(cè)序數(shù)千個(gè)細(xì)胞(Jaitin 等人,2014)。該方法采用三種不同水平上的標(biāo)識(shí)用于標(biāo)記細(xì)胞、培養(yǎng)板和mRNA,便于混合所有材料進(jìn)行后續(xù)自動(dòng)化處理。與 MARS-seq類似,STRT-Seq-2i 旨在通過(guò)實(shí)施專門的 FACS 和barcode流程來(lái)提高測(cè)序通量(Hochgerner 等人,2017)。該方法使用定制的鋁板,該鋁板上有 9,600 個(gè)孔,排列成 96 個(gè)子陣列,每個(gè)子陣列有 100 個(gè)孔,一次運(yùn)行即可同時(shí)對(duì) 9,600 個(gè)細(xì)胞進(jìn)行測(cè)序。然而,盡管這些基于培養(yǎng)板的方法提高了通量,但可分析的細(xì)胞數(shù)量仍然有限。微流控技術(shù)的引入從根本上解決了高通量單細(xì)胞操作帶來(lái)的挑戰(zhàn)。2012,F(xiàn)luidigm C1 系統(tǒng)成為首個(gè)商用自動(dòng)化微流控平臺(tái),可同時(shí)對(duì) 96 個(gè)單細(xì)胞進(jìn)行自動(dòng)細(xì)胞分離、細(xì)胞裂解、cDNA 合成、擴(kuò)增和文庫(kù)制備。但該系統(tǒng)的處理能力有限,無(wú)法滿足高通量并行測(cè)序的需求。2015年,基于液滴的微流控 scRNA-seq技術(shù)的出現(xiàn)帶來(lái)了革命性的突破。以Klein 等人和Macosko 等人開(kāi)發(fā)的方法為例,這類方法能夠同時(shí)處理數(shù)千個(gè)細(xì)胞(Klein等,2015 ; Macosko等,2015)。這項(xiàng)重大進(jìn)步使單細(xì)胞基因組學(xué)領(lǐng)域真正大規(guī)模并行測(cè)序成為可能。隨后,其他高通量并行測(cè)序策略也被開(kāi)發(fā)出來(lái),包括 sci-RNA-seq(Cao等,2017)和 SPLiT-seq(Rosenberg等,2018)。這些方法采用組合式索引方法來(lái)標(biāo)記細(xì)胞,而無(wú)需對(duì)單個(gè)細(xì)胞進(jìn)行物理分隔。這些技術(shù)具有很高的細(xì)胞標(biāo)記效率,操作簡(jiǎn)單,并可大幅降低測(cè)序成本。我們將在下文詳細(xì)討論這些創(chuàng)新技術(shù)。
(2)基于微孔板的高通量 scRNA-seq方法
基于微孔板的高通量 scRNA-seq方法包括通過(guò) FACS 將細(xì)胞分選到微孔板上,并標(biāo)記細(xì)胞轉(zhuǎn)錄本以進(jìn)行后續(xù)高通量測(cè)序。這些方法的優(yōu)勢(shì)在于可以處理任意數(shù)量的單個(gè)細(xì)胞,而不會(huì)顯著影響每個(gè)細(xì)胞的成本。另一方面,其他高通量方法,例如基于液滴的技術(shù),如 Drop-seq(Macosko等,2015)、InDrop(Klein等,2015)和 10x Chromium(Zheng等,2017),在同時(shí)分析大量細(xì)胞時(shí)能夠分?jǐn)偝杀,使成本的效益更高;诳装宓姆椒ǖ臏y(cè)序通量受所用微孔板數(shù)量的限制。接下來(lái)將詳細(xì)討論這些技術(shù)。
1)Quartz-seq。為了揭示非遺傳細(xì)胞異質(zhì)性的生物學(xué)功能和根本原因,Sasagawa 等人開(kāi)發(fā)了簡(jiǎn)單但定量水平很高的Quartz-seq技術(shù)。Quartz-seq通過(guò)解決三個(gè)關(guān)鍵方面提高了全轉(zhuǎn)錄本擴(kuò)增的簡(jiǎn)單性和定量性能。首先,為了克服以往基于 poly(A)尾反應(yīng)的全轉(zhuǎn)錄本擴(kuò)增技術(shù)中副產(chǎn)物過(guò)多的問(wèn)題,Quartz-seq結(jié)合了外切酶 I 處理、調(diào)控 poly(A)尾以及優(yōu)化的阻抑PCR。這種策略方法完全消除了副產(chǎn)物的合成,簡(jiǎn)化了后續(xù)的 scRNA-seq分析。其次,該技術(shù)采用了針對(duì)單管反應(yīng)優(yōu)化的強(qiáng)效 DNA 聚合酶 (MightyAmp DNA Polymerase)。這種 PCR 酶的選擇提高了 cDNA 產(chǎn)量,提高了全轉(zhuǎn)錄本擴(kuò)增復(fù)制的可重復(fù)性,并減少了所需的 PCR 循環(huán)次數(shù)。最后,Quartz-seq通過(guò)調(diào)節(jié)退火溫度來(lái)優(yōu)化 RT 和第二鏈合成的效率。值得注意的是,該方法的所有步驟都合并到一個(gè) PCR 管中,無(wú)需純化,每個(gè)單細(xì)胞僅涉及六個(gè)反應(yīng)步驟。這種精簡(jiǎn)大大簡(jiǎn)化了 Quartzseq方法,有助于其高通量實(shí)施。除了簡(jiǎn)單之外,Quartz-seq還表現(xiàn)出很高的定量準(zhǔn)確性、可重復(fù)性和靈敏度。因此,它可以辨別各種類型的非遺傳細(xì)胞異質(zhì)性,并區(qū)分不同細(xì)胞類型和同一細(xì)胞類型內(nèi)的細(xì)胞周期階段。
Quartz-seq2 ( Sasagawa等,2018 )是一種創(chuàng)新的高通量 scRNA-seq方法,是作為 Quartz-seq的擴(kuò)展而開(kāi)發(fā)的。該方法包括使用 FACS 將單個(gè)細(xì)胞分選到 384 孔板中,然后使用結(jié)合了 oligo-dT 序列、細(xì)胞barcode序列和 UMI 序列的引物進(jìn)行 RT。通過(guò)應(yīng)用多個(gè)分子生物學(xué)階段的進(jìn)步,包括對(duì) poly(A)標(biāo)記的重大升級(jí),Quartz-seq2 實(shí)現(xiàn)了出色的 UMI 轉(zhuǎn)換效率。值得注意的是,Quartz-seq2采用了基于T55緩沖液和遞增溫度條件組合的poly(A)標(biāo)記策略,使cDNA的數(shù)量增加了約3.6倍。
Quartz-seq2的UMI轉(zhuǎn)換效率非常高,從32%到35%不等,超過(guò)了CEL-seq2、SCRB-seq和MARS-seq(7%-22%)等其他方法。由于效率的提高, Quartz -seq2可以從更少的序列讀取中以更低的成本識(shí)別出更多的轉(zhuǎn)錄本。與MARSseq類似,Quartz-seq2使用FACS進(jìn)行細(xì)胞分選,這一過(guò)程需要熟練的工人。盡管有這個(gè)要求,但該技術(shù)更高的UMI轉(zhuǎn)換效率和成本效益使其成為scRNA-seq應(yīng)用的一種有價(jià)值方法。
2)MARS-seq。MARS-seq是一種自動(dòng)化、高度并行的RNA單細(xì)胞測(cè)序技術(shù),開(kāi)發(fā)于 2014(Jaitin等,2014),通過(guò)在 oligo-dT 引物中引入U(xiǎn)MI實(shí)現(xiàn)對(duì)唯一RNA分子的計(jì)數(shù),從而徹底改變了這一領(lǐng)域。MARS-seq流程使用 FACS 將單細(xì)胞分選到384 孔板中。逆轉(zhuǎn)錄和文庫(kù)構(gòu)建過(guò)程遵循 CEL-seq流程,確保方法具有系統(tǒng)性和可重復(fù)性。MARS-seq的關(guān)鍵創(chuàng)新之一在于其自動(dòng)化,該方法的每一步都由液體處理機(jī)器人執(zhí)行。這種自動(dòng)化提高了該技術(shù)的可重復(fù)性,并顯著提高了通量。MARS-seq的高通量和自動(dòng)化特性使其適用于正常和疾病狀態(tài)下的各種組織和器官。通過(guò)描述組織的細(xì)胞類型和細(xì)胞狀態(tài)組成,MARS-seq有助于全面了解這些生物實(shí)體,并將這些信息與詳細(xì)的全基因組轉(zhuǎn)錄譜聯(lián)系起來(lái)。
2019,研究團(tuán)隊(duì)在 MARS-seq方法的基礎(chǔ)上,開(kāi)發(fā)了用于索引排序和大規(guī)模并行單細(xì)胞 RNA 測(cè)序的集成流程 (MARS-seq2.0)(Keren-Shaul等,2019)。MARS-seq2.0 能夠在一次運(yùn)行中高效測(cè)序 8,000–10,000 個(gè)細(xì)胞,顯著提高了通量。值得注意的是,該方法將逆轉(zhuǎn)錄反應(yīng)的體積減少了八倍,從 4 μ L 減少到 500 nL。由于體積減少,制備單細(xì)胞文庫(kù)的成本將下降六倍。MARS-seq2.0 是一種基于 3′的 scRNA-seq技術(shù),這限制了它在確定基因 5′端的可變剪接異構(gòu)體或特定序列方面的應(yīng)用。這是需要記住的關(guān)鍵一點(diǎn)。盡管存在這一限制,MARS-seq2.0 中索引式 FACS 分類與 scRNAseq的整合已被證明有利于識(shí)別稀有亞群和處理人類臨床樣本中的稀有細(xì)胞。此外,MARS-seq2.0 提供了一個(gè)靈活的平臺(tái),通過(guò)將無(wú)偏轉(zhuǎn)錄圖譜與大量熒光標(biāo)記相結(jié)合,能夠同時(shí)獲得同一單細(xì)胞的多層信息,涵蓋遺傳學(xué)、信號(hào)傳導(dǎo)、表觀遺傳學(xué)和空間定位。這種多方面的方法有助于更深入地從分子層面理解生理過(guò)程和疾病。
3)SCRB-seq。為了降低探究異質(zhì)性細(xì)胞群中基因表達(dá)變異的主要模式的成本, Soumillon 等人基于 Smart-seq方案開(kāi)發(fā)了SCRB-seq(single-cell RNA barcoding and sequencing),使用最少的試劑和最少的單個(gè)細(xì)胞測(cè)序讀數(shù)來(lái)分析大量細(xì)胞中的mRNA。SCRB-seq利用FACS將單個(gè)細(xì)胞分選到 384 孔板中。Poly(A)+ mRNA 通過(guò) RT 轉(zhuǎn)化為 cDNA,逆轉(zhuǎn)錄使用模板轉(zhuǎn)換逆轉(zhuǎn)錄酶和由barcode、UMI 和 poly(T)引物組成的逆轉(zhuǎn)錄引物。此后,鏈信息被保留下來(lái),來(lái)自多個(gè)細(xì)胞的被修飾過(guò)的cDNA混合在一起進(jìn)行擴(kuò)增,用改進(jìn)的基于轉(zhuǎn)座子的片段化技術(shù)進(jìn)行測(cè)序,該技術(shù)富集 3′端。SCRB-seq技術(shù)能夠測(cè)序大約 12,000 個(gè)單細(xì)胞,提供深度和全長(zhǎng)轉(zhuǎn)錄組覆蓋測(cè)序。此外,它所需的酶反應(yīng)、純化和液體轉(zhuǎn)移步驟比 MARSseq方法少大約兩倍 ( Jaitin等,2014 )。與 Smartseq相比,SCRB-seq在逆轉(zhuǎn)錄期間添加了獨(dú)特的細(xì)胞barcode,從而更容易識(shí)別來(lái)自同一細(xì)胞的讀取并提高測(cè)序通量。盡管如此,對(duì)大量單細(xì)胞進(jìn)行測(cè)序仍然面臨挑戰(zhàn)。
4)STRT-seq-2i。STRT -seq-2i 是一種雙索引 5′單細(xì)胞和細(xì)胞核 RNA 測(cè)序方法,旨在顯著提高通量 ( Hochgerner等,2017 )。它使用專門設(shè)計(jì)的 9,600 微孔板,有助于提高效率。微孔陣列可以對(duì)單細(xì)胞孔進(jìn)行成像驗(yàn)證,減少單孔中雙聯(lián)體的出現(xiàn)。除了保留了一些優(yōu)點(diǎn),例如可顯示轉(zhuǎn)錄起始位點(diǎn)的 5′端reads、添加 UMI 進(jìn)行絕對(duì)定量,以及使用單端測(cè)序而非雙端測(cè)序以最大限度提高成本效率之外,STRT-seq-2i 仍然與之前描述的 STRT-seq方法兼容。該技術(shù)已證明其可適應(yīng)各種實(shí)驗(yàn)環(huán)境,因?yàn)樗捎糜跈z查新鮮單個(gè)小鼠皮質(zhì)細(xì)胞和冷凍的死后人類皮質(zhì)細(xì)胞核的轉(zhuǎn)錄譜。
(3)基于微流體的高通量 scRNA-seq方法
基于液滴和微孔的平臺(tái)是高通量 scRNA-seq的主要技術(shù)能夠在一次實(shí)驗(yàn)中分析大約 10,000 個(gè)單細(xì)胞的轉(zhuǎn)錄組。這兩種方法基本上都涉及將單個(gè)細(xì)胞分離到許多納升大小的容器(例如微孔或油包水液滴)中,其中包含逆轉(zhuǎn)錄所需的化學(xué)物質(zhì)。與非微流體方法和帶有閥門的微流體方法相比,將細(xì)胞barcode集成到這些微流體平臺(tái)中的策略可顯著提高通量,同時(shí)降低成本。這一進(jìn)步對(duì)于需要對(duì)大量細(xì)胞進(jìn)行全面轉(zhuǎn)錄組分析的生物醫(yī)學(xué)研究應(yīng)用尤其有利。
1)基于液滴的 scRNA-seq技術(shù)。(i)InDrop。inDrop 的基本技術(shù)(Klein 等人,2015)是將單個(gè)細(xì)胞包裹在含有裂解緩沖液、逆轉(zhuǎn)錄試劑和barcode水凝膠微球 (BHM)的液滴中。每個(gè) BHM 包含 ~109個(gè)可以光解的標(biāo)簽引物(147,456 個(gè)不同的標(biāo)簽)。該技術(shù)中采用的微流體裝置包含用于載體油、細(xì)胞、裂解/逆轉(zhuǎn)錄試劑和 BHM 的入口,以及用于液滴收集的出口。每個(gè) BHM 都通過(guò)光釋放鍵共價(jià)連接到標(biāo)簽引物,這些引物具有 T7 RNA 聚合酶啟動(dòng)子、Illumina 測(cè)序接頭、獨(dú)特細(xì)胞barcode、UMI 和 poly(T)尾。樣本中的所有 BHM 共享相同的細(xì)胞barcode以區(qū)分樣本,但擁有不同的 UMI 以進(jìn)行精確的轉(zhuǎn)錄計(jì)數(shù)。封裝后,紫外線 (UV)暴露使引物釋放并結(jié)合mRNA ,在 cDNA 合成過(guò)程中進(jìn)行barcode編碼,同時(shí)使反應(yīng)仍限制在同一液滴中。隨后,按照 CEL-seq方案(Hashimshony 等,2012),在液滴破裂后匯集所有細(xì)胞的 cDNA 以進(jìn)行文庫(kù)構(gòu)建和測(cè)序。與傳統(tǒng)方法不同,InDrop固有的可擴(kuò)展性不受反應(yīng)室數(shù)量的限制。此外,通過(guò)在液滴內(nèi)進(jìn)行裂解和逆轉(zhuǎn)錄簡(jiǎn)化了操作過(guò)程。然而,inDrop 的一個(gè)顯著缺點(diǎn)是其相對(duì)較低的 mRNA 捕獲效率(~7%),這使得轉(zhuǎn)錄本豐度低于 20–50 個(gè)轉(zhuǎn)錄本的基因在單細(xì)胞中難以可靠地檢測(cè)到。
(ii)Drop-seq。與inDrop 類似,Drop-seq旨在對(duì)數(shù)千個(gè)單細(xì)胞中的 mRNA 表達(dá)進(jìn)行高通量分析。它通過(guò)將每個(gè)細(xì)胞與帶有唯一標(biāo)記的珠子共同封裝在納升級(jí)的油包水液滴中以同時(shí)處理來(lái)實(shí)現(xiàn)這一點(diǎn)(Macosko等,2015)。與使用標(biāo)記水凝膠微球的 inDrop 不同,Drop-seq使用由不變的硬樹(shù)脂制成的珠子。這些樹(shù)脂珠直接用標(biāo)記引物合成,其中包括用于捕獲 mRNA 的 poly(T)序列、細(xì)胞barcode、UMI 和用于擴(kuò)增的通用PCR序列。每個(gè)珠子含有超過(guò) 108種不同的引物。細(xì)胞在液滴中裂解后,釋放的 mRNA 與伴隨珠子上引物的poly(T)尾巴雜交,生成固定在微粒上的單細(xì)胞轉(zhuǎn)錄組 (STAMP)。液滴破裂后,數(shù)千個(gè) STAMP 匯集在一起,在一次反應(yīng)中進(jìn)行逆轉(zhuǎn)錄、PCR 擴(kuò)增和測(cè)序。與 inDrop (147,456)相比,Drop-seq方法擁有更多獨(dú)特的barcode (16,777,216),從而能夠?qū)崿F(xiàn)經(jīng)濟(jì)高效且快速的高通量分析。
(iii)10x Genomics。10x Genomics 系統(tǒng) ( Zheng等,2017 )是一個(gè)完全商業(yè)化的平臺(tái),與 inDrop 和 Drop-seq有相似之處。反應(yīng)體系中的凝膠珠 (GEM)是該方法的基本組成部分。創(chuàng)建 GEM需要使用 8 通道微流體裝置,該芯片在6分鐘內(nèi)可以生成 100,000 個(gè) GEM,每個(gè) GEM 可容納數(shù)千個(gè)細(xì)胞。GEM 中的每個(gè)凝膠珠都含有標(biāo)簽寡核苷酸,包括 Illumina 接頭、10x barcode、UMI 和 poly(T)尾巴,使得poly(A)+ RNA能夠逆轉(zhuǎn)錄。細(xì)胞與凝膠珠共封裝成液滴后,細(xì)胞立即裂解,釋放出mRNA。隨后,凝膠珠溶解并釋放帶標(biāo)簽的寡核苷酸,從而實(shí)現(xiàn)poly(A)+RNA的RT。RT反應(yīng)在每個(gè)液滴內(nèi)進(jìn)行,產(chǎn)生的cDNA分子具有每個(gè)GEM共享的barcode、唯一的UMI,并在3′端以TSO結(jié)尾。去除油相后,帶標(biāo)簽的cDNA混合起來(lái),遵循Smart-seq流程進(jìn)行PCR擴(kuò)增。
InDrop、Drop-seq和Chromium是三個(gè)類似的平臺(tái),它們采用液滴微流控方法分離單細(xì)胞以進(jìn)行高通量測(cè)序。這三種方法每天都可以快速處理數(shù)萬(wàn)個(gè)細(xì)胞。這三種技術(shù)在以下四個(gè)方面有所不同:
首先,inDrop和10x Genomics使用的是水凝膠微球,而Drop-seq中使用的珠子是硬樹(shù)脂。inDrop 和 10x Genomics 使用的水凝膠珠子較柔軟,封裝在微流控通道中時(shí)可以同步產(chǎn)生超泊松分布。對(duì)于單個(gè)細(xì)胞和珠子在同一個(gè)液滴中的封裝,雙泊松分布控制著微小硬珠子的封裝。因此,inDrop 和 10x Genomics 可以獲得比 Drop-seq更高得多的細(xì)胞捕獲效率。據(jù)報(bào)道,10x Genomics 的細(xì)胞捕獲率約為 50%(Zheng等,2017)。
其次,inDrop 和 10x Genomics 使用水凝膠珠子,可以將引物固定在珠子內(nèi)部,而 Drop-seq的引物只能固定在更小的硬珠表面。封裝后,inDrop 利用紫外線誘導(dǎo)的裂解來(lái)釋放引物。10x Genomics通過(guò)直接溶解珠子將引物全部釋放到溶液中,提高了mRNA的捕獲效率,而Drop-seq的引物不能從珠子中釋放出來(lái),mRNA分子會(huì)與珠子上的poly(T)尾雜交形成STAMP進(jìn)行RT,這是Drop-seq相較于inDrop和10x Genomics的一個(gè)缺點(diǎn)。再次,Drop-seq在mRNA與引物雜交后立即分裂液滴,將所有STAMP混合在一起進(jìn)行RT,而inDrop和10x Genomics方法將RT試劑共封裝在液滴中,每個(gè)液滴內(nèi)獨(dú)立進(jìn)行RT反應(yīng),有利于提高cDNA轉(zhuǎn)化的特異性,提高相對(duì)產(chǎn)量,減少試劑消耗(Streets等,2014)。
最后,三個(gè)平臺(tái)采用了不同的建庫(kù)策略。Drop-seq和 10x Genomics 使用類似于眾所周知的 Smart-seq化學(xué)的模板切換程序,而 inDrop 使用 CEL-seq方法。因此,它們分別繼承了 Smart-seq和 CEL-seq的優(yōu)點(diǎn)和缺點(diǎn)。
(iv)MULTI-seq。為了在逆轉(zhuǎn)錄期間傳遞細(xì)胞特異性barcode,之前討論的所有基于液滴的技術(shù)通常都使用共封裝策略,這需要同時(shí)封裝細(xì)胞和barcode珠子。MULTI-seq方法(使用脂質(zhì)標(biāo)記進(jìn)行單細(xì)胞和單核 RNA的樣本多重測(cè)序)最近由McGinnis 等人 (2019b)引入,作為一種以獨(dú)特方式使用細(xì)胞barcode的替代策略。在這項(xiàng)技術(shù)中,DNA barcode通過(guò)與“錨”脂質(zhì)修飾寡核苷酸 (LMO)雜交而被標(biāo)記到單細(xì)胞的質(zhì)膜上。“錨定” LMO 的疏水性 5 '二十六酸酰胺與膜結(jié)合;與帶有 3 '棕櫚酸酰胺的“共錨定” LMO 雜交可增強(qiáng)復(fù)合物的疏水性,延長(zhǎng)膜保留時(shí)間。3'poly(A)捕獲序列、8 bp 樣本barcode和 5'PCR 手柄組成 LMO。LMO 攜帶的每個(gè)單細(xì)胞或細(xì)胞核與 mRNA 捕獲珠共同封裝到由 10x Genomics 系統(tǒng)生成的乳液液滴中。樣本解復(fù)用是通過(guò)在液滴內(nèi)細(xì)胞裂解時(shí)釋放內(nèi)源性 mRNA 和 LMO 實(shí)現(xiàn)的,它們?cè)谀孓D(zhuǎn)錄期間都與 mRNA 捕獲珠雜交并附著到通用細(xì)胞barcode上。內(nèi)源性 mRNA 和 LMO 在擴(kuò)增后通過(guò)大小選擇分離,從而實(shí)現(xiàn)以用戶定義的比例進(jìn)行匯集測(cè)序。使用此方法可以對(duì)任何具有可及質(zhì)膜的物種的任何細(xì)胞類型或細(xì)胞核進(jìn)行barcode編碼。此外,這種方法涉及的樣品處理最少,從而保留了細(xì)胞活力和內(nèi)源基因表達(dá)模式。
2)基于微孔的 scRNA 測(cè)序方法。(i)CytoSeq。Cytoseq是一種高度可擴(kuò)展的 scRNA 測(cè)序方法,可同時(shí)分析幾千個(gè)細(xì)胞,并可輕松擴(kuò)展到 10,000 或 100,000 個(gè)細(xì)胞,每個(gè)細(xì)胞可檢測(cè)大約 100 個(gè)基因(Fan等,2015a)。該方法采用遞歸泊松策略來(lái)調(diào)整懸浮液中的細(xì)胞數(shù)量,促進(jìn)細(xì)胞在重力作用下高通量沉降在 100,000 個(gè)微孔中的 1/10 中。由于反應(yīng)中使用的體積為納升,因此文庫(kù)制備成本極低。此外,Cytoseq的優(yōu)勢(shì)在于它不受特定細(xì)胞大小和形狀的限制,可以研究大量異質(zhì)細(xì)胞群的表達(dá)譜。這種靈活性允許在大量背景群體中檢測(cè)稀有細(xì)胞類型。
(ii)Seq-Well。Seq-Well 是一種便攜、經(jīng)濟(jì)高效、用戶友好且高效的 scRNA-seq方法,專為低輸入樣本而設(shè)計(jì)(Gierahn等,2017)。該方法利用皮孔陣列,其中裝有barcode mRNA 捕獲珠和細(xì)胞,每個(gè)孔可容納一個(gè)細(xì)胞和近一個(gè)珠子。細(xì)胞在重力作用下沉入孔中后,半透膜會(huì)密封陣列,為每個(gè)孔創(chuàng)建獨(dú)特的環(huán)境,允許緩沖液交換但防止大分子遷移。隨后,細(xì)胞被裂解,并進(jìn)行擴(kuò)增和測(cè)序過(guò)程。Seq-Well 板有大約 86,000 個(gè)亞納升孔,可以同時(shí)分析來(lái)自不同來(lái)源的數(shù)千個(gè)細(xì)胞中的轉(zhuǎn)錄組。該方法特別適合于低樣本輸入,例如組織夾、細(xì)針抽吸物以及難以研究的細(xì)胞,如肝細(xì)胞和粒細(xì)胞(Kumar,2021)。值得注意的是,Seq-Well的實(shí)現(xiàn)只需要一個(gè)皮孔陣列、一個(gè)移液器、一個(gè)聚碳酸酯膜、一個(gè)烤箱或熱源、一個(gè)夾具和一個(gè)管旋轉(zhuǎn)器即可生成穩(wěn)定的 cDNA 產(chǎn)物。這種簡(jiǎn)單性使其能夠適應(yīng)資源有限的環(huán)境,例如診所和偏遠(yuǎn)地區(qū)(Aicher 等人,2019)。
(iii)ICELL8。ICELL8 是一種基于微孔的微流體系統(tǒng),通過(guò)結(jié)合一個(gè)包含 5,184 個(gè)納米孔的微芯片來(lái)提高吞吐量,從而可以捕獲和處理大約 1,300 個(gè)單細(xì)胞(Goldstein 等人,2017)。每個(gè)納米孔均含有預(yù)印的寡核苷酸,包括寡核苷酸 (dT 30 )引物、孔特異性barcode序列和 UMI。該過(guò)程包括使用多樣品納米分配器 (MSND)將單細(xì)胞懸浮液分配到微芯片納米孔中,然后通過(guò)凍融循環(huán)裂解細(xì)胞。細(xì)胞裂解后,進(jìn)行逆轉(zhuǎn)錄以合成 cDNA,采用 SCRB-seq方法。最終,將來(lái)自數(shù)百個(gè)細(xì)胞的 cDNA 匯集到一個(gè)試管中用于構(gòu)建文庫(kù)。該方法有幾個(gè)優(yōu)點(diǎn):i)使用 MSND 儀器將細(xì)胞準(zhǔn)確地分配到納米孔中,消除了與手動(dòng)移液相關(guān)的誤差;ii)結(jié)合成像軟件來(lái)識(shí)別含有活單細(xì)胞的納米孔,確保只有含有單細(xì)胞的孔才會(huì)被處理到測(cè)序文庫(kù)中,從而產(chǎn)生較低的細(xì)胞多重率 (<3%); iii)使用多樣本納米分配器在一個(gè)陣列上加載多達(dá)八種實(shí)驗(yàn)條件的能力,使得在一次實(shí)驗(yàn)中,一塊芯片上 5,184 個(gè)納米孔可同時(shí)處理 800–1,400 個(gè)細(xì)胞。
為了提高 ICELL8 的捕獲率,并能夠同時(shí)處理超過(guò) 5,000 個(gè)細(xì)胞用于測(cè)序文庫(kù), Shomroni 等人 (2022)介紹了一種名為 CellenONE-ICELL8 的新型 scRNA-seq方法。該方法將 ICELL8 處理儀器與 CellenONE 分離和分選系統(tǒng)相結(jié)合。CellenONE 依靠基于圖像的單細(xì)胞分離,能夠在隨后的樣品處理和測(cè)序之前,根據(jù)細(xì)胞形態(tài)、大小或熒光標(biāo)記等參數(shù)選擇高度純化的單個(gè)細(xì)胞。與單獨(dú)的 ICELL8 系統(tǒng)相比,CellenONEICELL8 中兩種儀器的集成顯著提高了細(xì)胞捕獲效率,捕獲的細(xì)胞數(shù)量從典型的 1,200 到 1,400 個(gè)細(xì)胞增加到 3,300 多個(gè)細(xì)胞。此外,該方法利用SMART-seq技術(shù),可以檢測(cè)非編碼RNA,特別是較長(zhǎng)的基因間非編碼RNA,以及內(nèi)含子和基因間序列。
(4)基于組合索引的高通量scRNA-seq技術(shù)
1)Sci-RNA-seq。Cao等(2017)開(kāi)發(fā)了第一個(gè)用于高通量scRNA-seq的組合索引方法,稱為sci-RNA-seq。這種創(chuàng)新方法有助于分析大量單細(xì)胞或細(xì)胞核的轉(zhuǎn)錄組,通過(guò)使用雙UMIbarcode提供3′覆蓋和高深度測(cè)序。sci-RNA-seq的可擴(kuò)展性允許在單次實(shí)驗(yàn)中生成約4×104個(gè)單個(gè)細(xì)胞轉(zhuǎn)錄組,索引規(guī)模高達(dá)576×960。這種可擴(kuò)展性使得通過(guò)加入額外輪次的索引或/和使用更多帶barcode的逆轉(zhuǎn)錄和 PCR 引物能夠以亞線性成本擴(kuò)展處理更多細(xì)胞。但sci-RNA-seq并非沒(méi)有缺點(diǎn),這些缺點(diǎn)包括繁瑣的實(shí)驗(yàn)程序、高通量轉(zhuǎn)座反應(yīng)的高成本以及 FACS 分選帶來(lái)的明顯細(xì)胞損失。
2)SPLiT-seq。SPLiT- seq代表了另一種專為 scRNA-seq分析而設(shè)計(jì)的創(chuàng)新組合索引方法,可以檢查保存在 1.33% 甲醛中的固定組織(Rosenberg等,2018)。與 sci-RNA-seq不同,SPLiT-seq通過(guò)連接將第二輪和第三輪barcode插入 cDNA 中。這種方法提供了更簡(jiǎn)單、更溫和、更具成本效益的工作流程。SPLiT-seq的第一輪barcode可以充當(dāng)樣本標(biāo)識(shí)符,從而實(shí)現(xiàn)多重并行的樣本處理。SPLiT-seq特別適合分析臨床相關(guān)組織樣本中產(chǎn)生的固定、難以完全解離的細(xì)胞或細(xì)胞核。然而,應(yīng)該考慮一些局限性,包括醛基細(xì)胞固定可能導(dǎo)致 mRNA 發(fā)生化學(xué)修飾、由于復(fù)雜的交聯(lián)細(xì)胞內(nèi)環(huán)境導(dǎo)致固定細(xì)胞內(nèi)逆轉(zhuǎn)錄和連接反應(yīng)效率不佳以及固定過(guò)程中 RNA 質(zhì)量可能下降,從而導(dǎo)致檢測(cè)到的基因水平降低。
單細(xì)胞核RNA測(cè)序
ScRNA-seq是探索復(fù)雜組織中細(xì)胞類型、功能過(guò)程和動(dòng)態(tài)狀態(tài)的有力工具。然而,在處理無(wú)法輕易分離的存檔樣本或組織時(shí),其應(yīng)用受到限制,從而阻礙了對(duì)新細(xì)胞類型或與免疫和疾病相關(guān)的關(guān)鍵信息的探索。為了解決這一困難,科學(xué)家們采用了單細(xì)胞核RNA測(cè)序 (snRNA-seq)技術(shù),其中 RNA 測(cè)序?qū)嶒?yàn)使用細(xì)胞核而不是整個(gè)細(xì)胞作為代理進(jìn)行。已經(jīng)開(kāi)發(fā)了幾種 snRNA-seq方法來(lái)分析從冷凍、輕度固定或新鮮組織中獲得的單細(xì)胞核RNA,包括 DroNc-Seq(Habib 等人,2017 )、Div-seq(Habib 等人,2016 )、snDrop-seq(Lake 等人,2019)。這些方法將轉(zhuǎn)錄組分析的適用性擴(kuò)展到更廣泛的樣本類型和樣本處理方式。
由于 snRNA-seq與傳統(tǒng) scRNA-seq方法檢測(cè)到的基因之間存在高度相關(guān)性,因此 snRNA-seq技術(shù)在各個(gè)研究領(lǐng)域的使用已被證明很有價(jià)值(Fischer and Ayers,2021 )。這些技術(shù)可用于多種樣本類型,例如新鮮組織,如腦 ( Affinati 等人,2021)、心臟 ( Nicin 等人,2021)、腎臟 ( Barwinska 等人,2021;Muto 等人,2021)、胰腺 ( Basile 等人,2021)、肌肉 ( Petrany 等人,2020)或脂肪組織 ( Sun 等人,2020b)、存檔組織 ( Basile 等人,2021)、植物細(xì)胞 ( Conde 等人,2021)。盡管有這些優(yōu)勢(shì),但與分離的細(xì)胞類型相比,分離的細(xì)胞核通常更具粘性。因此,應(yīng)采取預(yù)防措施防止結(jié)塊,否則會(huì)導(dǎo)致雙峰率膨脹。此外,值得注意的是,某些基因轉(zhuǎn)錄本可能在 snRNA-seq和 scRNA-seq數(shù)據(jù)集之間表現(xiàn)出富集差異。例如,長(zhǎng)鏈非編碼 RNA(lncRNA)在 snRNA-seq數(shù)據(jù)集中富集,而位于細(xì)胞質(zhì)中的線粒體轉(zhuǎn)錄本僅存在于 scRNA-seq數(shù)據(jù)集中(Fischer and Ayers,2021)。研究人員在選擇單個(gè)細(xì)胞核進(jìn)行測(cè)序之前,需要仔細(xì)評(píng)估這些亞定位基因?qū)λ麄兊奶囟ㄑ芯宽?xiàng)目是否至關(guān)重要。
參考文獻(xiàn)
Sun F, Li H, Sun D, et al. Single-cell omics: experimental workflow, data analyses and applications. Sci China LifSun F, Li H, Sun D, et al. Single-cell omics: experimental workflow, data analyses and applications. Sci China Life Sci. 2025;68(1):5-102. doi:10.1007/s11427-023-2561-0e Sci. 2025;68(1):5-102. doi:10.1007/s11427-023-2561-0