期刊:Science China-Life Sciences
影響因子:8.0
單細(xì)胞測序概述
單細(xì)胞測序(Single-cell RNA sequencing; scRNA-seq)是一種開創(chuàng)性的單細(xì)胞測序技術(shù),現(xiàn)在已得到廣泛普及,并涵蓋了多種方法。盡管方法多種多樣,但它們都遵循類似的一般過程,包括四個(gè)主要步驟:(i)單細(xì)胞分離、(ii)逆轉(zhuǎn)錄(RT)、(iii)cDNA 擴(kuò)增和(iv)測序文庫構(gòu)建和測序(Hedlund and Deng,2018)。scRNA-seq工作流程的主要步驟如圖 3所示。本節(jié)概述了與單細(xì)胞分離和測序文庫構(gòu)建相關(guān)的一些技術(shù)和解決方案。
(1)單細(xì)胞分離
在scRNA-seq中,第一步也是關(guān)鍵的一步是單細(xì)胞分離,其中組織解離和單細(xì)胞分離被認(rèn)為是造成污染、批次效應(yīng)和程序差異的重要因素(Tung等,2017)。因此,要進(jìn)行高通量和無偏差的單細(xì)胞測序,高效、可靠、準(zhǔn)確捕獲單細(xì)胞是關(guān)鍵決定因素。早期的單細(xì)胞分離方法包括有限連續(xù)稀釋 ( Gross等,2015 )、手動(dòng)顯微操作 ( Hu等,2016a )和激光捕獲顯微切割 (LCM)( Emmert-Buck等,1996 ),這些方法通量低、耗時(shí)、效率低、技術(shù)難度大,但仍用于分析少量細(xì)胞(例如稀有細(xì)胞)( Dal Molin and Di Camillo, 2019 )。
流式細(xì)胞熒光分選 (FACS)是一種常用的高通量技術(shù),可特異性地自動(dòng)分離數(shù)千個(gè)單個(gè)細(xì)胞,但對細(xì)胞數(shù)量的需求很大(需要分離的細(xì)胞數(shù)量 >10,000)( Hu等,2016a )。此外,由于熒光信號微弱,該技術(shù)不適用于某些標(biāo)志物表達(dá)較低的細(xì)胞,因此很難區(qū)分具有相似標(biāo)志物表達(dá)的亞群 ( Yasen等,2020 )。磁激活細(xì)胞分選 (MACS)是另一種高通量分離技術(shù),旨在通過與磁珠結(jié)合的酶、凝集素、抗體或鏈霉親和素分離各種細(xì)胞類型,從而促進(jìn)特定蛋白質(zhì)與靶細(xì)胞的結(jié)合 ( Hu等,2016a )。MACS 系統(tǒng)具有顯著的優(yōu)勢,可在特定細(xì)胞群中實(shí)現(xiàn) 90% 以上的純度 ( Miltenyi等,1990 )。然而,與 FACS 相比,MACS 具有固有的局限性,因?yàn)槊庖叽偶夹g(shù)只能將細(xì)胞分離為陰性和陽性細(xì)胞群。此外,它不能根據(jù)分子的低表達(dá)或高表達(dá)來分離細(xì)胞,而 FACS 可以做到這一點(diǎn) ( Hu等,2016a )。在當(dāng)前的高通量測序平臺中,基于微流體的單細(xì)胞操作方法已成為轉(zhuǎn)錄組研究中單細(xì)胞分離的主要技術(shù),這種技術(shù)顯著提高了分離過程的規(guī)模、效率和準(zhǔn)確性。微流體裝置使用反應(yīng)室或液滴捕獲細(xì)胞,然后分別進(jìn)行單獨(dú)的納升水平的反應(yīng)步驟,提供了更經(jīng)濟(jì)且樣品效率更高的分析方法。這些裝置主要分為基于微孔的方法、基于液滴的方法和集成流體回路 (IFC)。微流控系統(tǒng)在 scRNA 測序中的集成顯著提高了測序通量,能夠同時(shí)處理和分析數(shù)以萬計(jì)的單細(xì)胞。表S2 全面概述了當(dāng)前的單細(xì)胞分離技術(shù),包括其優(yōu)點(diǎn)和局限性。
(2)逆轉(zhuǎn)錄和 cDNA 擴(kuò)增
單個(gè)哺乳動(dòng)物細(xì)胞含有的 RNA總量約 10 pg,其中主要部分由核糖體RNA (rRNA)和轉(zhuǎn)運(yùn)RNA (tRNA)組成,而信使RNA (mRNA)僅占總量的1%–5%(Liu等,2014 ; Wang等,2023c)。由于單細(xì)胞中mRNA含量極低,因此必須在逆轉(zhuǎn)錄后對cDNA進(jìn)行擴(kuò)增,以獲得大量用于測序文庫制備的樣本。cDNA擴(kuò)增可以通過使用聚合酶鏈?zhǔn)椒磻?yīng) (PCR)的指數(shù)擴(kuò)增或基于體外轉(zhuǎn)錄 (IVT)的線性擴(kuò)增來實(shí)現(xiàn)。
目前,文庫構(gòu)建的主要方法是基于 PCR 的 cDNA 擴(kuò)增,包括 poly(A)加尾和模板轉(zhuǎn)換 (TS)方法(Kolodziejczyk等,2015)。poly(A)加尾法使用 oligo-dT 引物與 mRNA 3′-poly(A)尾結(jié)合,將mRNA 逆轉(zhuǎn)錄為 cDNA。poly(A)加尾法速度快但不能捕獲非多聚腺苷酸化(Poly(A)−)RNA(Hebenstreit,2012),且捕獲效率低,文獻(xiàn)報(bào)道現(xiàn)行捕獲方法的捕獲效率約為10%–15%(Islam等,2014)。此外,逆轉(zhuǎn)錄酶反應(yīng)的終止還可能導(dǎo)致轉(zhuǎn)錄中 mRNA 5′端的覆蓋率降低。TS 技術(shù)利用莫洛尼鼠白血病病毒 (MMLV)逆轉(zhuǎn)錄酶進(jìn)行 TS 過程。MMLV 逆轉(zhuǎn)錄酶可以在新合成的單鏈尾端附加一個(gè) poly(C)尾。poly(C)尾可以與模板轉(zhuǎn)換寡核苷酸 (TSO)接頭序列的 5′端 poly(G)尾結(jié)合。在這一互作之后會(huì)發(fā)生一個(gè)“切換”:逆轉(zhuǎn)錄酶以TSO為模板合成cDNA,完成銜接子的轉(zhuǎn)換(Picelli,2017)。TS法相對來說不易發(fā)生核酸丟失,但與poly(A)加尾法相比靈敏度較低。基于PCR的擴(kuò)增雖然能夠在短時(shí)間內(nèi)快速有效地?cái)U(kuò)增大量cDNA,但受到指數(shù)擴(kuò)增過程固有特性的制約。PCR傾向于擴(kuò)增較短和GC含量較低的擴(kuò)增子,從而導(dǎo)致定量偏差和非特異性轉(zhuǎn)錄本的積累,從而導(dǎo)致原始轉(zhuǎn)錄本信息的丟失(Aird等,2011)。此外,PCR會(huì)導(dǎo)致最終文庫中高表達(dá)的轉(zhuǎn)錄本過多(Aird等,2011)。
IVT代表了另一種cDNA合成和擴(kuò)增的方法。IVT 的主要優(yōu)勢在于其線性擴(kuò)增,這一特性可減輕人們通常所說的擴(kuò)增偏好,使其比 PCR 更精確、重復(fù)性更好 ( Chen等,2017a ; Grün and van Oudenaarden, 2015 )。在該策略中,一條oligo-dT 引物最初與 mRNA 的 3′-poly(A)尾結(jié)合,合成兩條 cDNA 鏈,該引物包含(i)唯一分子標(biāo)識符 (UMI,具有標(biāo)記單個(gè) mRNA分子的隨機(jī)核苷酸序列,用于量化唯一轉(zhuǎn)錄本和糾正擴(kuò)增偏好性);(ii)唯一的細(xì)胞條形碼(barcode);(iii)Illumina 接頭;和(iv)T7 啟動(dòng)子。將擴(kuò)增的 RNA 分子重新轉(zhuǎn)換為 cDNA需要另一輪逆轉(zhuǎn)錄,以便構(gòu)建測序文庫。因此,得到的 cDNA 在 3′端的覆蓋度上存在明顯的偏差。此外,這種方法耗時(shí)耗力,使之與 PCR 相比,沒有得到廣泛的應(yīng)用(Hashimshony 等人,2012)。
作為 scRNA-seq的一個(gè)獨(dú)特步驟,所有來自單個(gè)細(xì)胞的轉(zhuǎn)錄本都會(huì)獲得一個(gè)獨(dú)特的barcode-在逆轉(zhuǎn)錄期間引入 cDNA 的短寡核苷酸序列,用于區(qū)分單個(gè)細(xì)胞的轉(zhuǎn)錄組。利用獨(dú)特的barcode信息,這些轉(zhuǎn)錄本就可以被很容易地對應(yīng)到各自歸屬的細(xì)胞中去。因此,在每個(gè)細(xì)胞都用唯一的barcode標(biāo)記后,大量單細(xì)胞轉(zhuǎn)錄組才能被合并在一起,用于構(gòu)建文庫,然后在一次運(yùn)行中完成后續(xù)測序。這種方法顯著降低了成本并提高了測序通量。細(xì)胞barcode是一種非常有效的并行處理策略,2011首次用于 STRT-seq方法(Islam等,2011)。隨后,2014, Islam 等人進(jìn)一步創(chuàng)新,引入了 UMI 來識別細(xì)胞內(nèi)的每個(gè) cDNA 分子。與細(xì)胞barcode一樣,UMI 也是一個(gè)由 6–8 個(gè)堿基對組成的隨機(jī)寡核苷酸序列,可以在逆轉(zhuǎn)錄過程中整合到細(xì)胞內(nèi)的每一個(gè)轉(zhuǎn)錄本中。大量的UMI序列可以讓每個(gè)轉(zhuǎn)錄本都帶上不同的標(biāo)記,從而確保通過 PCR 擴(kuò)增產(chǎn)生的所有重復(fù)分子都保留原始轉(zhuǎn)錄本的UMI。通過計(jì)算UMI,就可以對轉(zhuǎn)錄本的原始拷貝數(shù)進(jìn)行精準(zhǔn)的定量,從而消除 PCR 擴(kuò)增的偏好性。
針對單細(xì)胞 RNA 測序的三個(gè)關(guān)鍵問題:(i)單細(xì)胞分離;(ii)最大限度地減少逆轉(zhuǎn)錄期間的RNA損失;以及 (iii)產(chǎn)生足夠的DNA進(jìn)行測序,研究人員近年來進(jìn)行了許多技術(shù)方面的探索,導(dǎo)致了各種 scRNA-seq方法的提出,專門用于單細(xì)胞轉(zhuǎn)錄組學(xué)的全面研究。
不同的 scRNA-seq技術(shù)都基于共同的基本原理,但它們在以下至少一個(gè)方面有所不同:(i)單細(xì)胞分離;(ii)逆轉(zhuǎn)錄;(iii)cDNA 擴(kuò)增;(iv)轉(zhuǎn)錄本覆蓋;(v)UMI;(vi)鏈特異性。每種方法都有其獨(dú)特的優(yōu)勢和局限性。這些不同的 scRNA-seq技術(shù)的主要特征合并整理在表S1 中。因此,研究人員可以根據(jù)技術(shù)特點(diǎn)、優(yōu)勢、成本因素和通量需求靈活地選擇合適的 scRNA-seq方法。
圖3. 單細(xì)胞測序工作流程的主要步驟
當(dāng)前可用的 scRNA-seq 技術(shù)
低通量 scRNA-seq 技術(shù)
如表S1 中所述,scRNA-seq已經(jīng)開發(fā)出了60多種不同的方法?傮w來說,這些方法可以分為兩大類:低通量方法和高通量方法。低通量方法發(fā)展出的基本化學(xué)方法旨在提高測序的靈敏度和準(zhǔn)確性,同時(shí)降低成本和技術(shù)噪音。其中,靈敏度是最為重要的關(guān)鍵特性,也是評估方法性能的基本指標(biāo)。高通量方法的基本化學(xué)原理也是從幾種經(jīng)典低通量方法中發(fā)展而來的。我們將在下面詳細(xì)討論這些技術(shù)。
(1)Tang's protocol
Tang's protocol于2009年由Surani課題組開發(fā),是一種具有開創(chuàng)性的scRNA-seq方法。在該技術(shù)中,單個(gè)小鼠胚泡是利用一臺顯微鏡來手動(dòng)進(jìn)行選擇的。隨后解列細(xì)胞,用帶有錨定序列(UP1)的 poly(T)引物將 mRNA 逆轉(zhuǎn)錄為 cDNA,并在末端轉(zhuǎn)移酶的幫助下將 poly(A)尾添加到第一鏈末端的尾端。此后,使用帶有另一個(gè)錨定序列(UP2)的第二條 poly(T)引物合成第二鏈 cDNA。在此之后,使用 UP1 和 UP2 引物通過PCR對cDNA進(jìn)行高效擴(kuò)增,構(gòu)建文庫,最后在SOLiD系統(tǒng)上進(jìn)行測序。該方法可以生成幾乎全長的轉(zhuǎn)錄本 cDNA 并檢測約 13,000 個(gè)基因(Tang等,2009)。該技術(shù)的主要用途是幫助揭示新的轉(zhuǎn)錄本和可變剪接異構(gòu)體。
盡管該技術(shù)代表了當(dāng)時(shí)新興的scRNA-seq領(lǐng)域的重大進(jìn)步,但它也有很多局限性。首先,該方法只能識別具有poly(A)尾的 mRNA;它不能捕獲沒有poly(A)尾的 mRNA,例如組蛋白 mRNA、miRNA、環(huán)狀 RNA(circRNA)和新生 RNA。這是因?yàn)樵摲椒ㄐ枰蕾囉趐oly(T)引物通過poly(A)尾來捕獲mRNA,進(jìn)而起始逆轉(zhuǎn)錄反應(yīng)。其次,酶反應(yīng)效率低下導(dǎo)致測序靈敏度降低,從而導(dǎo)致低表達(dá)轉(zhuǎn)錄本的丟失。第三,這種方法不是鏈特異性的,不能區(qū)分正義和反義轉(zhuǎn)錄本。因此,它沒有被廣泛使用。
(2)STRT-seq
2011年,Islam 等人(2011)開發(fā)了一種單細(xì)胞標(biāo)記逆轉(zhuǎn)錄測序 (single-cell tagged reverse transcription sequencing,STRT-seq)方法,這是一種基于Illumina 平臺多重測序的scRNA-seq方法。該方法在逆轉(zhuǎn)錄過程中通過模板切換機(jī)制引入barcode和上游引物結(jié)合序列,促進(jìn) 3′端鏈特異性擴(kuò)增以及高通量96細(xì)胞多重測序。STRT-seq在基于陣列的測序策略基礎(chǔ)上,支持處理多達(dá) 800 個(gè)單個(gè)細(xì)胞。該方法的一個(gè)關(guān)鍵優(yōu)勢是它可以在逆轉(zhuǎn)錄過程中為每個(gè)細(xì)胞添加獨(dú)特的barcode序列,從而能夠大規(guī)模檢測各種混合細(xì)胞樣本,例如高度異質(zhì)性的腫瘤細(xì)胞樣本。與Tang’s protocol相比,STRT-seq通過提前加入barcode的策略顯著降低了成本和處理時(shí)間。然而,該方法中包含了多個(gè)PCR循環(huán),可能會(huì)引入PCR偏差。該方法在生物醫(yī)學(xué)領(lǐng)域有許多應(yīng)用,包括探究腫瘤異質(zhì)性、識別潛在的用于疾病的診斷和治療的新型生物標(biāo)志物或者藥物靶點(diǎn)(Cui等,2021 ;Song等,2022a ;Tian等,2022)。(3)Smart-seq
2012, Ramsköld 等人開發(fā)了一種可靠、穩(wěn)定的 scRNA-seq方法 Smart-seq,該方法最顯著的進(jìn)步是通過轉(zhuǎn)錄本前端的切換機(jī)制,在轉(zhuǎn)錄本全長 cDNA 合成中達(dá)到超過40%的效率。該技術(shù)的發(fā)表是 scRNA-seq研究領(lǐng)域的一個(gè)里程碑。Smart-seq的核心原理是利用 poly(T)引物和 SMART-TS 技術(shù)將多聚腺苷酸化(poly(A)+)RNA 轉(zhuǎn)換為全長 cDNA。得到的cDNA分子經(jīng)PCR擴(kuò)增后,通過Nextera Tn5轉(zhuǎn)座子技術(shù)構(gòu)建Illumina測序文庫,該方法顯著提高了檢測可變剪接外顯子和低豐度表達(dá)轉(zhuǎn)錄本的能力。smart-seq方法在醫(yī)學(xué)領(lǐng)域有著廣泛的應(yīng)用,如分析膽道閉鎖小鼠模型肝臟中CD177+細(xì)胞的基因表達(dá)譜(Zhang等,2022d);分析骨骼肌干細(xì)胞、不同生態(tài)位的細(xì)胞和單根肌纖維的全基因組表達(dá)(Blackburn等,2019 ;Blackburn等,2021);研究急性皮膚紅斑狼瘡患者與正常對照組真皮CD4 + Trm細(xì)胞的差異(Zhao等,2022c)。
Smart-seq2被開發(fā)出來是為了克服 Smart-seq中存在的覆蓋范圍有限、cDNA擴(kuò)增產(chǎn)量較低和靈敏度不夠等問題(Picelli 等人,2013)。為了增加 cDNA 文庫的產(chǎn)量和長度,Smart-seq2進(jìn)行了幾項(xiàng)改進(jìn),包括增強(qiáng)逆轉(zhuǎn)錄、TSO 和PCR重新擴(kuò)增。與 Smart-seq相反,Smart-seq2是通過在 TSO 的 3 '端加入鎖核酸 (LNA)鳥苷酸,使得cDNA 產(chǎn)量顯著提高至大約兩倍。這種改善與LNA-DNA堿基對的熱穩(wěn)定性增強(qiáng)有關(guān)。此外,該技術(shù)通過添加甲基供體甜菜堿以及更高濃度的 MgCl2,使得cDNA 產(chǎn)量大幅增加。另一方面,不直接將脫氧核糖核苷三磷酸 (dNTP)加入RT主混合物中,而是在RNA 變性之前才加入反應(yīng)體系,這樣可以增加預(yù)擴(kuò)增cDNA的平均長度。上述改進(jìn)可能是由RNA 與oligo-dT 引物雜交穩(wěn)定性提高所導(dǎo)致的。KAPA HiFi Hot Start DNA 聚合酶的應(yīng)用改善了cDNA的生成并增加了cDNA的長度。Smart-seq2 轉(zhuǎn)錄組文庫在檢測強(qiáng)度、覆蓋率、偏差和準(zhǔn)確性方面均優(yōu)于 Smart-seq。Smart-seq2 轉(zhuǎn)錄組文庫的建立可以使用成本更低的現(xiàn)成試劑,使得深入分析每個(gè)轉(zhuǎn)錄本的全外顯子和檢測不同的剪接變體成為可能。該方法還有助于徹底分析單核苷酸多態(tài)性 (SNP)和突變。然而,該方法也存在局限性,例如缺乏鏈特異性和無法檢測 poly(A)− RNA(Picelli等,2014)。此外,使用微量移液器的細(xì)胞分離過程較為耗時(shí)且通量低。
(3)Smart-seq3
通過優(yōu)化逆轉(zhuǎn)錄和模板轉(zhuǎn)換的條件,提高了靈敏度(HagemannJensen等,2020)。優(yōu)化的參數(shù)包括使用Maxima H-minus逆轉(zhuǎn)錄酶、將逆轉(zhuǎn)錄鹽從KCl轉(zhuǎn)換為NaCl或CsCl、在體系中存在5% 聚乙二醇 (PEG)的條件下進(jìn)行逆轉(zhuǎn)錄,以及加入GTP或dCTP來增強(qiáng)和穩(wěn)定模板轉(zhuǎn)換反應(yīng)等。Smart-seq3 的一個(gè)顯著特點(diǎn)是它將全長轉(zhuǎn)錄組覆蓋與 5′UMI RNA計(jì)數(shù)策略相結(jié)合,從而無需犧牲整體覆蓋率即可提高轉(zhuǎn)錄本計(jì)數(shù)的精度。這種方法構(gòu)建了一個(gè)TSO引物,包含Tn5基序的一部分、11 個(gè)堿基對的標(biāo)簽序列、8 個(gè)堿基對的 UMI 序列和三個(gè)核糖鳥苷。測序后,利用上述11 個(gè)堿基對的標(biāo)簽就可以明確區(qū)分 5′UMI 標(biāo)記的reads和內(nèi)部reads,在單次測序反應(yīng)中就可以收集5′UMI標(biāo)記的reads和不帶 UMI 的整個(gè)轉(zhuǎn)錄本的內(nèi)部reads。這種方法允許利用UMIreads對原始轉(zhuǎn)錄本進(jìn)行準(zhǔn)確量化,從而校正非線性PCR擴(kuò)增偏差,通過使用內(nèi)部reads就可以重建全長轉(zhuǎn)錄本。當(dāng)前的很多測序文庫構(gòu)建方法結(jié)合了細(xì)胞barcode和 UMI 標(biāo)簽策略。然而,由于這些標(biāo)簽只能引入到cDNA的末端,因此得到的用于測序的cDNA序列僅限于轉(zhuǎn)錄本的一端,導(dǎo)致轉(zhuǎn)錄本中間的重要序列信息丟失。因此,基于標(biāo)簽的方法主要用于基因表達(dá)的量化,不適用于異構(gòu)體識別或剪接的研究。盡管 Smart-seq和 Smart-seq2 能夠捕獲全長轉(zhuǎn)錄本,但它們無法利用barcode或 UMI 來對轉(zhuǎn)錄本進(jìn)行標(biāo)記,這就使得它們與高通量并行的單細(xì)胞測序不兼容。此外,如果沒有 UMI 標(biāo)簽,這些方法也就無法解決PCR帶來的擴(kuò)增偏好性問題。然而,Smart-seq3 通過使用一種特殊的TSO引物克服了全長轉(zhuǎn)錄本覆蓋和UMI不兼容的限制。
Smart-seq-total被設(shè)計(jì)出來是為了針對之前的 Smart-seq技術(shù)只能捕獲 poly(A)+ RNA 分子的限制 ( Isakova等,2021 )。這種方法的主要進(jìn)步在于利用大腸桿菌 poly(A)聚合酶在 RNA 分子的 3′端添加腺嘌呤尾巴。因此,所有 poly(A)+ RNA在進(jìn)行逆轉(zhuǎn)錄時(shí)使用的poly(T)引物都包含UMI和TSO。這種修改使 Smart-seq-total 能夠同時(shí)捕獲多種形式的RNA,包括單個(gè)細(xì)胞內(nèi)的蛋白質(zhì)編碼RNA、長非編碼RNA、microRNA 和其他非編碼RNA轉(zhuǎn)錄本。這種方法有助于探索細(xì)胞內(nèi)編碼和非編碼轉(zhuǎn)錄本之間的調(diào)控聯(lián)系,從而深入了解復(fù)雜的調(diào)控景觀。但值得注意的是,Smart-seq-total確實(shí)也存在一些局限性。首先,它不能評估環(huán)狀RNA。其次,它會(huì)導(dǎo)致轉(zhuǎn)錄本內(nèi)源性多聚腺苷酸化狀態(tài)的喪失。盡管存在這些缺點(diǎn),Smart-seq-total 仍然表現(xiàn)出巨大的潛力,可以揭示控制細(xì)胞功能的非編碼調(diào)控模式,并有助于確定細(xì)胞身份。
(4)CEL-seq
CEL-seq(Cell expression by linear amplification and sequencing)是把IVT 中的線性的鏈特異性用于擴(kuò)增單細(xì)胞中的 RNA 的開創(chuàng)性方法 ( Hashimshony 等,2012 )。該過程的起始包括使用具有錨定 poly(T)、特定barcode、5′Illumina 測序接頭和 T7 啟動(dòng)子的引物合成cDNA的第一鏈。隨后生成第二條鏈,產(chǎn)生含有 T7 啟動(dòng)子的雙鏈cDNA。來自多個(gè)細(xì)胞的混合cDNA樣本由T7啟動(dòng)子起始IVT,從而實(shí)現(xiàn) cDNA 的線性擴(kuò)增,得到擴(kuò)增后的RNA隨后轉(zhuǎn)化為cDNA 進(jìn)行測序。通過線性擴(kuò)增,CEL-seq最大限度地減少了擴(kuò)增偏差,與Smart-seq等全長 cDNA 覆蓋技術(shù)相比,可提供更靈敏、更可重復(fù)的結(jié)果。然而,CEL-seq也有局限性,例如無法檢測 miRNA 和其他 poly(A)−轉(zhuǎn)錄本,并且由于其強(qiáng)烈的 3′偏差而難以區(qū)分不同的可變剪接形式。
CEL-seq2 是 CEL-seq的改進(jìn)版本,它提高了靈敏度、降低了成本并減少了動(dòng)手時(shí)間(Hashimshony 等人,2016)。為了減輕mRNA分子計(jì)數(shù)的偏差,CEL-seq2 在barcode上游引入了 5 個(gè)堿基對的 UMI。使用 SuperScript II 雙鏈 cDNA 合成試劑盒并改變CEL-seq引物長度,逆轉(zhuǎn)錄反應(yīng)效率顯著提高。CEL-seq2優(yōu)于原始 CEL-seq方法,每個(gè)細(xì)胞可檢測到兩倍多的轉(zhuǎn)錄本,檢測到的基因數(shù)增加30%。但值得注意的是,盡管 CEL-seq2 具有明顯的3′偏向性,但是大多數(shù)剪接事件的信息它都不能提供。盡管如此,其更高的靈敏度和單個(gè)轉(zhuǎn)錄本計(jì)數(shù)能力使其再轉(zhuǎn)錄組學(xué)中的各種應(yīng)用具有更多的優(yōu)勢。
(5)SUPeR-seq
SUPeR-seq(single-cell universal poly(A)-independent RNA sequencing)使用具有固定錨序列的隨機(jī)引物代替 cDNA 合成中常用的 oligo-dT 引物,這使得檢測單個(gè)細(xì)胞內(nèi)的poly(A)+ 和 poly(A)− RNA成為了可能(Fan等,2015b)。該過程涉及利用具有固定錨定序列的隨機(jī)引物(AnchorX-T15N6)將總 RNA 逆轉(zhuǎn)錄為cDNA第一條鏈。在合成初始的cDNA鏈后,用ExoSAP-IT 消化多余的引物,防止形成引物二聚體復(fù)合物。使用末端脫氧核苷酸轉(zhuǎn)移酶和含有1% ddATP 的 dATP將 poly(A)尾巴附加到初始 cDNA 鏈的 3′端,隨后,使用具有可變錨定序列的 poly(T)引物(AnchorY-T24)生成cDNA的第二條鏈。上述兩條鏈?zhǔn)褂?AnchorY-T24 和 AnchorX-T15 引物通過 PCR 擴(kuò)增并進(jìn)行測序。SUPeR-seq已被用于研究哺乳動(dòng)物早期胚胎發(fā)育過程中 circRNA 的調(diào)控機(jī)制。然而,由于缺乏UMI和細(xì)胞barcode,它給高通量測序和分子計(jì)數(shù)帶來了挑戰(zhàn)。
(6)MATQ-seq
2017年,Sheng 等人(2017)介紹了基于多重退火和加dC尾的定量單細(xì)胞 RNA 測序(MATQ-seq)方法。有別于SUPeR-seq,該技術(shù)結(jié)合barcode和UMI對polyA+和polyA − RNA進(jìn)行測序。該過程包括使用為多重退火和基于環(huán)狀的擴(kuò)增循環(huán)(MALBAC)設(shè)計(jì)的引物將總RNA轉(zhuǎn)化cDNA第一條鏈。這些引物主要包含G、A和T堿基,以及MALBAC-dT引物。逆轉(zhuǎn)錄后,cDNA一鏈進(jìn)行dC加尾,然后使用G富集的MALBAC引物合成cDNA二鏈。UMI在第二鏈合成過程中添加。與 Smart-seq2和SUPeR-seq不同的是,MATQ-seq利用UMI 顯著減少了HEK293T 轉(zhuǎn)錄本中的前導(dǎo)端或尾端偏差。此外,MATQ-seq在捕獲 polyA − RNA 方面表現(xiàn)出比 Smart-seq2 和 SUPeR-seq更高的靈敏度,捕獲效率為 89.2%±13.2%。這一改進(jìn)提高了檢測低豐度基因的效率。MATQ-seq的高準(zhǔn)確度和靈敏度可以檢測到同一類細(xì)胞中各個(gè)細(xì)胞之間基因表達(dá)的細(xì)微差異。然而,與 SUPeR-seq類似,MATQ依靠口吸管進(jìn)行單細(xì)胞分離的方法十分耗時(shí),限制了 MATQ-seq的通量。
(7)FLASH-seq
FLASH-seq是一種快速且透徹的全長 scRNA 測序方法,由Hahaut 等人(2022)開發(fā)。為了提高 Smart-seq2方法的效率,該技術(shù)進(jìn)行了幾個(gè)關(guān)鍵的修改:(i)將逆轉(zhuǎn)錄和 cDNA 預(yù)擴(kuò)增結(jié)合起來,簡化了流程;(ii)用更高效的逆轉(zhuǎn)錄酶 Superscript IV取代了Superscript II,縮短了逆轉(zhuǎn)錄反應(yīng)時(shí)間;(iii)增加了dCTP的量,有利于Superscript IV 的 C 尾活性并增強(qiáng)模板轉(zhuǎn)換反應(yīng);(iv)將模板轉(zhuǎn)換寡核苷酸中的 3′-末端鎖核酸鳥嘌呤替換為核糖鳥苷;(v)將反應(yīng)體積減少到 5 μL ( Hahaut等,2022 )。這些改動(dòng)共同導(dǎo)致時(shí)間和成本大幅降低。FLASH-seq可以在大約 4.5 小時(shí)內(nèi)完成,比 Smartseq2 等其他方法快2–3.5 小時(shí)。與 Smart-seq3 相比,它的單個(gè)細(xì)胞成本低于其他商業(yè)化和非商業(yè)化的方法,不到 1 美元。此外,F(xiàn)LASH-seq可以檢測到大量的 SNP。該方法適合于尋求經(jīng)濟(jì)實(shí)惠、自動(dòng)化友好、穩(wěn)定且高效的單細(xì)胞轉(zhuǎn)錄分析方法的研究人員。
高通量scRNA-seq技術(shù)
(1) 開發(fā)高通量 scRNA-seq的策略
ScRNA-seq的早期階段使用顯微操作器或 LCM 分離單個(gè)細(xì)胞,進(jìn)行單獨(dú)的轉(zhuǎn)錄組擴(kuò)增和文庫構(gòu)建。然而,這些方法有局限性,因?yàn)樗鼈冊谝淮螌?shí)驗(yàn)中只能分析幾個(gè)細(xì)胞。細(xì)胞特異性barcode的引入徹底改變了該領(lǐng)域,允許將數(shù)千個(gè)單細(xì)胞轉(zhuǎn)錄組混合在一起,在單次運(yùn)行中進(jìn)行文庫構(gòu)建和測序,從而實(shí)現(xiàn)高通量并行測序。該方向上的一個(gè)顯著進(jìn)步是 MARS-seq方法的開發(fā),該方法將 FACS 與自動(dòng)液體處理相結(jié)合,在一次實(shí)驗(yàn)中成功測序數(shù)千個(gè)細(xì)胞(Jaitin 等人,2014)。該方法采用三種不同水平上的標(biāo)識用于標(biāo)記細(xì)胞、培養(yǎng)板和mRNA,便于混合所有材料進(jìn)行后續(xù)自動(dòng)化處理。與 MARS-seq類似,STRT-Seq-2i 旨在通過實(shí)施專門的 FACS 和barcode流程來提高測序通量(Hochgerner 等人,2017)。該方法使用定制的鋁板,該鋁板上有 9,600 個(gè)孔,排列成 96 個(gè)子陣列,每個(gè)子陣列有 100 個(gè)孔,一次運(yùn)行即可同時(shí)對 9,600 個(gè)細(xì)胞進(jìn)行測序。然而,盡管這些基于培養(yǎng)板的方法提高了通量,但可分析的細(xì)胞數(shù)量仍然有限。微流控技術(shù)的引入從根本上解決了高通量單細(xì)胞操作帶來的挑戰(zhàn)。2012,F(xiàn)luidigm C1 系統(tǒng)成為首個(gè)商用自動(dòng)化微流控平臺,可同時(shí)對 96 個(gè)單細(xì)胞進(jìn)行自動(dòng)細(xì)胞分離、細(xì)胞裂解、cDNA 合成、擴(kuò)增和文庫制備。但該系統(tǒng)的處理能力有限,無法滿足高通量并行測序的需求。2015年,基于液滴的微流控 scRNA-seq技術(shù)的出現(xiàn)帶來了革命性的突破。以Klein 等人和Macosko 等人開發(fā)的方法為例,這類方法能夠同時(shí)處理數(shù)千個(gè)細(xì)胞(Klein等,2015 ; Macosko等,2015)。這項(xiàng)重大進(jìn)步使單細(xì)胞基因組學(xué)領(lǐng)域真正大規(guī)模并行測序成為可能。隨后,其他高通量并行測序策略也被開發(fā)出來,包括 sci-RNA-seq(Cao等,2017)和 SPLiT-seq(Rosenberg等,2018)。這些方法采用組合式索引方法來標(biāo)記細(xì)胞,而無需對單個(gè)細(xì)胞進(jìn)行物理分隔。這些技術(shù)具有很高的細(xì)胞標(biāo)記效率,操作簡單,并可大幅降低測序成本。我們將在下文詳細(xì)討論這些創(chuàng)新技術(shù)。
(2)基于微孔板的高通量 scRNA-seq方法
基于微孔板的高通量 scRNA-seq方法包括通過 FACS 將細(xì)胞分選到微孔板上,并標(biāo)記細(xì)胞轉(zhuǎn)錄本以進(jìn)行后續(xù)高通量測序。這些方法的優(yōu)勢在于可以處理任意數(shù)量的單個(gè)細(xì)胞,而不會(huì)顯著影響每個(gè)細(xì)胞的成本。另一方面,其他高通量方法,例如基于液滴的技術(shù),如 Drop-seq(Macosko等,2015)、InDrop(Klein等,2015)和 10x Chromium(Zheng等,2017),在同時(shí)分析大量細(xì)胞時(shí)能夠分?jǐn)偝杀,使成本的效益更高;诳装宓姆椒ǖ臏y序通量受所用微孔板數(shù)量的限制。接下來將詳細(xì)討論這些技術(shù)。
1)Quartz-seq。為了揭示非遺傳細(xì)胞異質(zhì)性的生物學(xué)功能和根本原因,Sasagawa 等人開發(fā)了簡單但定量水平很高的Quartz-seq技術(shù)。Quartz-seq通過解決三個(gè)關(guān)鍵方面提高了全轉(zhuǎn)錄本擴(kuò)增的簡單性和定量性能。首先,為了克服以往基于 poly(A)尾反應(yīng)的全轉(zhuǎn)錄本擴(kuò)增技術(shù)中副產(chǎn)物過多的問題,Quartz-seq結(jié)合了外切酶 I 處理、調(diào)控 poly(A)尾以及優(yōu)化的阻抑PCR。這種策略方法完全消除了副產(chǎn)物的合成,簡化了后續(xù)的 scRNA-seq分析。其次,該技術(shù)采用了針對單管反應(yīng)優(yōu)化的強(qiáng)效 DNA 聚合酶 (MightyAmp DNA Polymerase)。這種 PCR 酶的選擇提高了 cDNA 產(chǎn)量,提高了全轉(zhuǎn)錄本擴(kuò)增復(fù)制的可重復(fù)性,并減少了所需的 PCR 循環(huán)次數(shù)。最后,Quartz-seq通過調(diào)節(jié)退火溫度來優(yōu)化 RT 和第二鏈合成的效率。值得注意的是,該方法的所有步驟都合并到一個(gè) PCR 管中,無需純化,每個(gè)單細(xì)胞僅涉及六個(gè)反應(yīng)步驟。這種精簡大大簡化了 Quartzseq方法,有助于其高通量實(shí)施。除了簡單之外,Quartz-seq還表現(xiàn)出很高的定量準(zhǔn)確性、可重復(fù)性和靈敏度。因此,它可以辨別各種類型的非遺傳細(xì)胞異質(zhì)性,并區(qū)分不同細(xì)胞類型和同一細(xì)胞類型內(nèi)的細(xì)胞周期階段。
Quartz-seq2 ( Sasagawa等,2018 )是一種創(chuàng)新的高通量 scRNA-seq方法,是作為 Quartz-seq的擴(kuò)展而開發(fā)的。該方法包括使用 FACS 將單個(gè)細(xì)胞分選到 384 孔板中,然后使用結(jié)合了 oligo-dT 序列、細(xì)胞barcode序列和 UMI 序列的引物進(jìn)行 RT。通過應(yīng)用多個(gè)分子生物學(xué)階段的進(jìn)步,包括對 poly(A)標(biāo)記的重大升級,Quartz-seq2 實(shí)現(xiàn)了出色的 UMI 轉(zhuǎn)換效率。值得注意的是,Quartz-seq2采用了基于T55緩沖液和遞增溫度條件組合的poly(A)標(biāo)記策略,使cDNA的數(shù)量增加了約3.6倍。
Quartz-seq2的UMI轉(zhuǎn)換效率非常高,從32%到35%不等,超過了CEL-seq2、SCRB-seq和MARS-seq(7%-22%)等其他方法。由于效率的提高, Quartz -seq2可以從更少的序列讀取中以更低的成本識別出更多的轉(zhuǎn)錄本。與MARSseq類似,Quartz-seq2使用FACS進(jìn)行細(xì)胞分選,這一過程需要熟練的工人。盡管有這個(gè)要求,但該技術(shù)更高的UMI轉(zhuǎn)換效率和成本效益使其成為scRNA-seq應(yīng)用的一種有價(jià)值方法。
2)MARS-seq。MARS-seq是一種自動(dòng)化、高度并行的RNA單細(xì)胞測序技術(shù),開發(fā)于 2014(Jaitin等,2014),通過在 oligo-dT 引物中引入U(xiǎn)MI實(shí)現(xiàn)對唯一RNA分子的計(jì)數(shù),從而徹底改變了這一領(lǐng)域。MARS-seq流程使用 FACS 將單細(xì)胞分選到384 孔板中。逆轉(zhuǎn)錄和文庫構(gòu)建過程遵循 CEL-seq流程,確保方法具有系統(tǒng)性和可重復(fù)性。MARS-seq的關(guān)鍵創(chuàng)新之一在于其自動(dòng)化,該方法的每一步都由液體處理機(jī)器人執(zhí)行。這種自動(dòng)化提高了該技術(shù)的可重復(fù)性,并顯著提高了通量。MARS-seq的高通量和自動(dòng)化特性使其適用于正常和疾病狀態(tài)下的各種組織和器官。通過描述組織的細(xì)胞類型和細(xì)胞狀態(tài)組成,MARS-seq有助于全面了解這些生物實(shí)體,并將這些信息與詳細(xì)的全基因組轉(zhuǎn)錄譜聯(lián)系起來。
2019,研究團(tuán)隊(duì)在 MARS-seq方法的基礎(chǔ)上,開發(fā)了用于索引排序和大規(guī)模并行單細(xì)胞 RNA 測序的集成流程 (MARS-seq2.0)(Keren-Shaul等,2019)。MARS-seq2.0 能夠在一次運(yùn)行中高效測序 8,000–10,000 個(gè)細(xì)胞,顯著提高了通量。值得注意的是,該方法將逆轉(zhuǎn)錄反應(yīng)的體積減少了八倍,從 4 μ L 減少到 500 nL。由于體積減少,制備單細(xì)胞文庫的成本將下降六倍。MARS-seq2.0 是一種基于 3′的 scRNA-seq技術(shù),這限制了它在確定基因 5′端的可變剪接異構(gòu)體或特定序列方面的應(yīng)用。這是需要記住的關(guān)鍵一點(diǎn)。盡管存在這一限制,MARS-seq2.0 中索引式 FACS 分類與 scRNAseq的整合已被證明有利于識別稀有亞群和處理人類臨床樣本中的稀有細(xì)胞。此外,MARS-seq2.0 提供了一個(gè)靈活的平臺,通過將無偏轉(zhuǎn)錄圖譜與大量熒光標(biāo)記相結(jié)合,能夠同時(shí)獲得同一單細(xì)胞的多層信息,涵蓋遺傳學(xué)、信號傳導(dǎo)、表觀遺傳學(xué)和空間定位。這種多方面的方法有助于更深入地從分子層面理解生理過程和疾病。
3)SCRB-seq。為了降低探究異質(zhì)性細(xì)胞群中基因表達(dá)變異的主要模式的成本, Soumillon 等人基于 Smart-seq方案開發(fā)了SCRB-seq(single-cell RNA barcoding and sequencing),使用最少的試劑和最少的單個(gè)細(xì)胞測序讀數(shù)來分析大量細(xì)胞中的mRNA。SCRB-seq利用FACS將單個(gè)細(xì)胞分選到 384 孔板中。Poly(A)+ mRNA 通過 RT 轉(zhuǎn)化為 cDNA,逆轉(zhuǎn)錄使用模板轉(zhuǎn)換逆轉(zhuǎn)錄酶和由barcode、UMI 和 poly(T)引物組成的逆轉(zhuǎn)錄引物。此后,鏈信息被保留下來,來自多個(gè)細(xì)胞的被修飾過的cDNA混合在一起進(jìn)行擴(kuò)增,用改進(jìn)的基于轉(zhuǎn)座子的片段化技術(shù)進(jìn)行測序,該技術(shù)富集 3′端。SCRB-seq技術(shù)能夠測序大約 12,000 個(gè)單細(xì)胞,提供深度和全長轉(zhuǎn)錄組覆蓋測序。此外,它所需的酶反應(yīng)、純化和液體轉(zhuǎn)移步驟比 MARSseq方法少大約兩倍 ( Jaitin等,2014 )。與 Smartseq相比,SCRB-seq在逆轉(zhuǎn)錄期間添加了獨(dú)特的細(xì)胞barcode,從而更容易識別來自同一細(xì)胞的讀取并提高測序通量。盡管如此,對大量單細(xì)胞進(jìn)行測序仍然面臨挑戰(zhàn)。
4)STRT-seq-2i。STRT -seq-2i 是一種雙索引 5′單細(xì)胞和細(xì)胞核 RNA 測序方法,旨在顯著提高通量 ( Hochgerner等,2017 )。它使用專門設(shè)計(jì)的 9,600 微孔板,有助于提高效率。微孔陣列可以對單細(xì)胞孔進(jìn)行成像驗(yàn)證,減少單孔中雙聯(lián)體的出現(xiàn)。除了保留了一些優(yōu)點(diǎn),例如可顯示轉(zhuǎn)錄起始位點(diǎn)的 5′端reads、添加 UMI 進(jìn)行絕對定量,以及使用單端測序而非雙端測序以最大限度提高成本效率之外,STRT-seq-2i 仍然與之前描述的 STRT-seq方法兼容。該技術(shù)已證明其可適應(yīng)各種實(shí)驗(yàn)環(huán)境,因?yàn)樗捎糜跈z查新鮮單個(gè)小鼠皮質(zhì)細(xì)胞和冷凍的死后人類皮質(zhì)細(xì)胞核的轉(zhuǎn)錄譜。
(3)基于微流體的高通量 scRNA-seq方法
基于液滴和微孔的平臺是高通量 scRNA-seq的主要技術(shù)能夠在一次實(shí)驗(yàn)中分析大約 10,000 個(gè)單細(xì)胞的轉(zhuǎn)錄組。這兩種方法基本上都涉及將單個(gè)細(xì)胞分離到許多納升大小的容器(例如微孔或油包水液滴)中,其中包含逆轉(zhuǎn)錄所需的化學(xué)物質(zhì)。與非微流體方法和帶有閥門的微流體方法相比,將細(xì)胞barcode集成到這些微流體平臺中的策略可顯著提高通量,同時(shí)降低成本。這一進(jìn)步對于需要對大量細(xì)胞進(jìn)行全面轉(zhuǎn)錄組分析的生物醫(yī)學(xué)研究應(yīng)用尤其有利。
1)基于液滴的 scRNA-seq技術(shù)。(i)InDrop。inDrop 的基本技術(shù)(Klein 等人,2015)是將單個(gè)細(xì)胞包裹在含有裂解緩沖液、逆轉(zhuǎn)錄試劑和barcode水凝膠微球 (BHM)的液滴中。每個(gè) BHM 包含 ~109個(gè)可以光解的標(biāo)簽引物(147,456 個(gè)不同的標(biāo)簽)。該技術(shù)中采用的微流體裝置包含用于載體油、細(xì)胞、裂解/逆轉(zhuǎn)錄試劑和 BHM 的入口,以及用于液滴收集的出口。每個(gè) BHM 都通過光釋放鍵共價(jià)連接到標(biāo)簽引物,這些引物具有 T7 RNA 聚合酶啟動(dòng)子、Illumina 測序接頭、獨(dú)特細(xì)胞barcode、UMI 和 poly(T)尾。樣本中的所有 BHM 共享相同的細(xì)胞barcode以區(qū)分樣本,但擁有不同的 UMI 以進(jìn)行精確的轉(zhuǎn)錄計(jì)數(shù)。封裝后,紫外線 (UV)暴露使引物釋放并結(jié)合mRNA ,在 cDNA 合成過程中進(jìn)行barcode編碼,同時(shí)使反應(yīng)仍限制在同一液滴中。隨后,按照 CEL-seq方案(Hashimshony 等,2012),在液滴破裂后匯集所有細(xì)胞的 cDNA 以進(jìn)行文庫構(gòu)建和測序。與傳統(tǒng)方法不同,InDrop固有的可擴(kuò)展性不受反應(yīng)室數(shù)量的限制。此外,通過在液滴內(nèi)進(jìn)行裂解和逆轉(zhuǎn)錄簡化了操作過程。然而,inDrop 的一個(gè)顯著缺點(diǎn)是其相對較低的 mRNA 捕獲效率(~7%),這使得轉(zhuǎn)錄本豐度低于 20–50 個(gè)轉(zhuǎn)錄本的基因在單細(xì)胞中難以可靠地檢測到。
(ii)Drop-seq。與inDrop 類似,Drop-seq旨在對數(shù)千個(gè)單細(xì)胞中的 mRNA 表達(dá)進(jìn)行高通量分析。它通過將每個(gè)細(xì)胞與帶有唯一標(biāo)記的珠子共同封裝在納升級的油包水液滴中以同時(shí)處理來實(shí)現(xiàn)這一點(diǎn)(Macosko等,2015)。與使用標(biāo)記水凝膠微球的 inDrop 不同,Drop-seq使用由不變的硬樹脂制成的珠子。這些樹脂珠直接用標(biāo)記引物合成,其中包括用于捕獲 mRNA 的 poly(T)序列、細(xì)胞barcode、UMI 和用于擴(kuò)增的通用PCR序列。每個(gè)珠子含有超過 108種不同的引物。細(xì)胞在液滴中裂解后,釋放的 mRNA 與伴隨珠子上引物的poly(T)尾巴雜交,生成固定在微粒上的單細(xì)胞轉(zhuǎn)錄組 (STAMP)。液滴破裂后,數(shù)千個(gè) STAMP 匯集在一起,在一次反應(yīng)中進(jìn)行逆轉(zhuǎn)錄、PCR 擴(kuò)增和測序。與 inDrop (147,456)相比,Drop-seq方法擁有更多獨(dú)特的barcode (16,777,216),從而能夠?qū)崿F(xiàn)經(jīng)濟(jì)高效且快速的高通量分析。
(iii)10x Genomics。10x Genomics 系統(tǒng) ( Zheng等,2017 )是一個(gè)完全商業(yè)化的平臺,與 inDrop 和 Drop-seq有相似之處。反應(yīng)體系中的凝膠珠 (GEM)是該方法的基本組成部分。創(chuàng)建 GEM需要使用 8 通道微流體裝置,該芯片在6分鐘內(nèi)可以生成 100,000 個(gè) GEM,每個(gè) GEM 可容納數(shù)千個(gè)細(xì)胞。GEM 中的每個(gè)凝膠珠都含有標(biāo)簽寡核苷酸,包括 Illumina 接頭、10x barcode、UMI 和 poly(T)尾巴,使得poly(A)+ RNA能夠逆轉(zhuǎn)錄。細(xì)胞與凝膠珠共封裝成液滴后,細(xì)胞立即裂解,釋放出mRNA。隨后,凝膠珠溶解并釋放帶標(biāo)簽的寡核苷酸,從而實(shí)現(xiàn)poly(A)+RNA的RT。RT反應(yīng)在每個(gè)液滴內(nèi)進(jìn)行,產(chǎn)生的cDNA分子具有每個(gè)GEM共享的barcode、唯一的UMI,并在3′端以TSO結(jié)尾。去除油相后,帶標(biāo)簽的cDNA混合起來,遵循Smart-seq流程進(jìn)行PCR擴(kuò)增。
InDrop、Drop-seq和Chromium是三個(gè)類似的平臺,它們采用液滴微流控方法分離單細(xì)胞以進(jìn)行高通量測序。這三種方法每天都可以快速處理數(shù)萬個(gè)細(xì)胞。這三種技術(shù)在以下四個(gè)方面有所不同:
首先,inDrop和10x Genomics使用的是水凝膠微球,而Drop-seq中使用的珠子是硬樹脂。inDrop 和 10x Genomics 使用的水凝膠珠子較柔軟,封裝在微流控通道中時(shí)可以同步產(chǎn)生超泊松分布。對于單個(gè)細(xì)胞和珠子在同一個(gè)液滴中的封裝,雙泊松分布控制著微小硬珠子的封裝。因此,inDrop 和 10x Genomics 可以獲得比 Drop-seq更高得多的細(xì)胞捕獲效率。據(jù)報(bào)道,10x Genomics 的細(xì)胞捕獲率約為 50%(Zheng等,2017)。
其次,inDrop 和 10x Genomics 使用水凝膠珠子,可以將引物固定在珠子內(nèi)部,而 Drop-seq的引物只能固定在更小的硬珠表面。封裝后,inDrop 利用紫外線誘導(dǎo)的裂解來釋放引物。10x Genomics通過直接溶解珠子將引物全部釋放到溶液中,提高了mRNA的捕獲效率,而Drop-seq的引物不能從珠子中釋放出來,mRNA分子會(huì)與珠子上的poly(T)尾雜交形成STAMP進(jìn)行RT,這是Drop-seq相較于inDrop和10x Genomics的一個(gè)缺點(diǎn)。再次,Drop-seq在mRNA與引物雜交后立即分裂液滴,將所有STAMP混合在一起進(jìn)行RT,而inDrop和10x Genomics方法將RT試劑共封裝在液滴中,每個(gè)液滴內(nèi)獨(dú)立進(jìn)行RT反應(yīng),有利于提高cDNA轉(zhuǎn)化的特異性,提高相對產(chǎn)量,減少試劑消耗(Streets等,2014)。
最后,三個(gè)平臺采用了不同的建庫策略。Drop-seq和 10x Genomics 使用類似于眾所周知的 Smart-seq化學(xué)的模板切換程序,而 inDrop 使用 CEL-seq方法。因此,它們分別繼承了 Smart-seq和 CEL-seq的優(yōu)點(diǎn)和缺點(diǎn)。
(iv)MULTI-seq。為了在逆轉(zhuǎn)錄期間傳遞細(xì)胞特異性barcode,之前討論的所有基于液滴的技術(shù)通常都使用共封裝策略,這需要同時(shí)封裝細(xì)胞和barcode珠子。MULTI-seq方法(使用脂質(zhì)標(biāo)記進(jìn)行單細(xì)胞和單核 RNA的樣本多重測序)最近由McGinnis 等人 (2019b)引入,作為一種以獨(dú)特方式使用細(xì)胞barcode的替代策略。在這項(xiàng)技術(shù)中,DNA barcode通過與“錨”脂質(zhì)修飾寡核苷酸 (LMO)雜交而被標(biāo)記到單細(xì)胞的質(zhì)膜上。“錨定” LMO 的疏水性 5 '二十六酸酰胺與膜結(jié)合;與帶有 3 '棕櫚酸酰胺的“共錨定” LMO 雜交可增強(qiáng)復(fù)合物的疏水性,延長膜保留時(shí)間。3'poly(A)捕獲序列、8 bp 樣本barcode和 5'PCR 手柄組成 LMO。LMO 攜帶的每個(gè)單細(xì)胞或細(xì)胞核與 mRNA 捕獲珠共同封裝到由 10x Genomics 系統(tǒng)生成的乳液液滴中。樣本解復(fù)用是通過在液滴內(nèi)細(xì)胞裂解時(shí)釋放內(nèi)源性 mRNA 和 LMO 實(shí)現(xiàn)的,它們在逆轉(zhuǎn)錄期間都與 mRNA 捕獲珠雜交并附著到通用細(xì)胞barcode上。內(nèi)源性 mRNA 和 LMO 在擴(kuò)增后通過大小選擇分離,從而實(shí)現(xiàn)以用戶定義的比例進(jìn)行匯集測序。使用此方法可以對任何具有可及質(zhì)膜的物種的任何細(xì)胞類型或細(xì)胞核進(jìn)行barcode編碼。此外,這種方法涉及的樣品處理最少,從而保留了細(xì)胞活力和內(nèi)源基因表達(dá)模式。
2)基于微孔的 scRNA 測序方法。(i)CytoSeq。Cytoseq是一種高度可擴(kuò)展的 scRNA 測序方法,可同時(shí)分析幾千個(gè)細(xì)胞,并可輕松擴(kuò)展到 10,000 或 100,000 個(gè)細(xì)胞,每個(gè)細(xì)胞可檢測大約 100 個(gè)基因(Fan等,2015a)。該方法采用遞歸泊松策略來調(diào)整懸浮液中的細(xì)胞數(shù)量,促進(jìn)細(xì)胞在重力作用下高通量沉降在 100,000 個(gè)微孔中的 1/10 中。由于反應(yīng)中使用的體積為納升,因此文庫制備成本極低。此外,Cytoseq的優(yōu)勢在于它不受特定細(xì)胞大小和形狀的限制,可以研究大量異質(zhì)細(xì)胞群的表達(dá)譜。這種靈活性允許在大量背景群體中檢測稀有細(xì)胞類型。
(ii)Seq-Well。Seq-Well 是一種便攜、經(jīng)濟(jì)高效、用戶友好且高效的 scRNA-seq方法,專為低輸入樣本而設(shè)計(jì)(Gierahn等,2017)。該方法利用皮孔陣列,其中裝有barcode mRNA 捕獲珠和細(xì)胞,每個(gè)孔可容納一個(gè)細(xì)胞和近一個(gè)珠子。細(xì)胞在重力作用下沉入孔中后,半透膜會(huì)密封陣列,為每個(gè)孔創(chuàng)建獨(dú)特的環(huán)境,允許緩沖液交換但防止大分子遷移。隨后,細(xì)胞被裂解,并進(jìn)行擴(kuò)增和測序過程。Seq-Well 板有大約 86,000 個(gè)亞納升孔,可以同時(shí)分析來自不同來源的數(shù)千個(gè)細(xì)胞中的轉(zhuǎn)錄組。該方法特別適合于低樣本輸入,例如組織夾、細(xì)針抽吸物以及難以研究的細(xì)胞,如肝細(xì)胞和粒細(xì)胞(Kumar,2021)。值得注意的是,Seq-Well的實(shí)現(xiàn)只需要一個(gè)皮孔陣列、一個(gè)移液器、一個(gè)聚碳酸酯膜、一個(gè)烤箱或熱源、一個(gè)夾具和一個(gè)管旋轉(zhuǎn)器即可生成穩(wěn)定的 cDNA 產(chǎn)物。這種簡單性使其能夠適應(yīng)資源有限的環(huán)境,例如診所和偏遠(yuǎn)地區(qū)(Aicher 等人,2019)。
(iii)ICELL8。ICELL8 是一種基于微孔的微流體系統(tǒng),通過結(jié)合一個(gè)包含 5,184 個(gè)納米孔的微芯片來提高吞吐量,從而可以捕獲和處理大約 1,300 個(gè)單細(xì)胞(Goldstein 等人,2017)。每個(gè)納米孔均含有預(yù)印的寡核苷酸,包括寡核苷酸 (dT 30 )引物、孔特異性barcode序列和 UMI。該過程包括使用多樣品納米分配器 (MSND)將單細(xì)胞懸浮液分配到微芯片納米孔中,然后通過凍融循環(huán)裂解細(xì)胞。細(xì)胞裂解后,進(jìn)行逆轉(zhuǎn)錄以合成 cDNA,采用 SCRB-seq方法。最終,將來自數(shù)百個(gè)細(xì)胞的 cDNA 匯集到一個(gè)試管中用于構(gòu)建文庫。該方法有幾個(gè)優(yōu)點(diǎn):i)使用 MSND 儀器將細(xì)胞準(zhǔn)確地分配到納米孔中,消除了與手動(dòng)移液相關(guān)的誤差;ii)結(jié)合成像軟件來識別含有活單細(xì)胞的納米孔,確保只有含有單細(xì)胞的孔才會(huì)被處理到測序文庫中,從而產(chǎn)生較低的細(xì)胞多重率 (<3%); iii)使用多樣本納米分配器在一個(gè)陣列上加載多達(dá)八種實(shí)驗(yàn)條件的能力,使得在一次實(shí)驗(yàn)中,一塊芯片上 5,184 個(gè)納米孔可同時(shí)處理 800–1,400 個(gè)細(xì)胞。
為了提高 ICELL8 的捕獲率,并能夠同時(shí)處理超過 5,000 個(gè)細(xì)胞用于測序文庫, Shomroni 等人 (2022)介紹了一種名為 CellenONE-ICELL8 的新型 scRNA-seq方法。該方法將 ICELL8 處理儀器與 CellenONE 分離和分選系統(tǒng)相結(jié)合。CellenONE 依靠基于圖像的單細(xì)胞分離,能夠在隨后的樣品處理和測序之前,根據(jù)細(xì)胞形態(tài)、大小或熒光標(biāo)記等參數(shù)選擇高度純化的單個(gè)細(xì)胞。與單獨(dú)的 ICELL8 系統(tǒng)相比,CellenONEICELL8 中兩種儀器的集成顯著提高了細(xì)胞捕獲效率,捕獲的細(xì)胞數(shù)量從典型的 1,200 到 1,400 個(gè)細(xì)胞增加到 3,300 多個(gè)細(xì)胞。此外,該方法利用SMART-seq技術(shù),可以檢測非編碼RNA,特別是較長的基因間非編碼RNA,以及內(nèi)含子和基因間序列。
(4)基于組合索引的高通量scRNA-seq技術(shù)
1)Sci-RNA-seq。Cao等(2017)開發(fā)了第一個(gè)用于高通量scRNA-seq的組合索引方法,稱為sci-RNA-seq。這種創(chuàng)新方法有助于分析大量單細(xì)胞或細(xì)胞核的轉(zhuǎn)錄組,通過使用雙UMIbarcode提供3′覆蓋和高深度測序。sci-RNA-seq的可擴(kuò)展性允許在單次實(shí)驗(yàn)中生成約4×104個(gè)單個(gè)細(xì)胞轉(zhuǎn)錄組,索引規(guī)模高達(dá)576×960。這種可擴(kuò)展性使得通過加入額外輪次的索引或/和使用更多帶barcode的逆轉(zhuǎn)錄和 PCR 引物能夠以亞線性成本擴(kuò)展處理更多細(xì)胞。但sci-RNA-seq并非沒有缺點(diǎn),這些缺點(diǎn)包括繁瑣的實(shí)驗(yàn)程序、高通量轉(zhuǎn)座反應(yīng)的高成本以及 FACS 分選帶來的明顯細(xì)胞損失。
2)SPLiT-seq。SPLiT- seq代表了另一種專為 scRNA-seq分析而設(shè)計(jì)的創(chuàng)新組合索引方法,可以檢查保存在 1.33% 甲醛中的固定組織(Rosenberg等,2018)。與 sci-RNA-seq不同,SPLiT-seq通過連接將第二輪和第三輪barcode插入 cDNA 中。這種方法提供了更簡單、更溫和、更具成本效益的工作流程。SPLiT-seq的第一輪barcode可以充當(dāng)樣本標(biāo)識符,從而實(shí)現(xiàn)多重并行的樣本處理。SPLiT-seq特別適合分析臨床相關(guān)組織樣本中產(chǎn)生的固定、難以完全解離的細(xì)胞或細(xì)胞核。然而,應(yīng)該考慮一些局限性,包括醛基細(xì)胞固定可能導(dǎo)致 mRNA 發(fā)生化學(xué)修飾、由于復(fù)雜的交聯(lián)細(xì)胞內(nèi)環(huán)境導(dǎo)致固定細(xì)胞內(nèi)逆轉(zhuǎn)錄和連接反應(yīng)效率不佳以及固定過程中 RNA 質(zhì)量可能下降,從而導(dǎo)致檢測到的基因水平降低。
單細(xì)胞核RNA測序
ScRNA-seq是探索復(fù)雜組織中細(xì)胞類型、功能過程和動(dòng)態(tài)狀態(tài)的有力工具。然而,在處理無法輕易分離的存檔樣本或組織時(shí),其應(yīng)用受到限制,從而阻礙了對新細(xì)胞類型或與免疫和疾病相關(guān)的關(guān)鍵信息的探索。為了解決這一困難,科學(xué)家們采用了單細(xì)胞核RNA測序 (snRNA-seq)技術(shù),其中 RNA 測序?qū)嶒?yàn)使用細(xì)胞核而不是整個(gè)細(xì)胞作為代理進(jìn)行。已經(jīng)開發(fā)了幾種 snRNA-seq方法來分析從冷凍、輕度固定或新鮮組織中獲得的單細(xì)胞核RNA,包括 DroNc-Seq(Habib 等人,2017 )、Div-seq(Habib 等人,2016 )、snDrop-seq(Lake 等人,2019)。這些方法將轉(zhuǎn)錄組分析的適用性擴(kuò)展到更廣泛的樣本類型和樣本處理方式。
由于 snRNA-seq與傳統(tǒng) scRNA-seq方法檢測到的基因之間存在高度相關(guān)性,因此 snRNA-seq技術(shù)在各個(gè)研究領(lǐng)域的使用已被證明很有價(jià)值(Fischer and Ayers,2021 )。這些技術(shù)可用于多種樣本類型,例如新鮮組織,如腦 ( Affinati 等人,2021)、心臟 ( Nicin 等人,2021)、腎臟 ( Barwinska 等人,2021;Muto 等人,2021)、胰腺 ( Basile 等人,2021)、肌肉 ( Petrany 等人,2020)或脂肪組織 ( Sun 等人,2020b)、存檔組織 ( Basile 等人,2021)、植物細(xì)胞 ( Conde 等人,2021)。盡管有這些優(yōu)勢,但與分離的細(xì)胞類型相比,分離的細(xì)胞核通常更具粘性。因此,應(yīng)采取預(yù)防措施防止結(jié)塊,否則會(huì)導(dǎo)致雙峰率膨脹。此外,值得注意的是,某些基因轉(zhuǎn)錄本可能在 snRNA-seq和 scRNA-seq數(shù)據(jù)集之間表現(xiàn)出富集差異。例如,長鏈非編碼 RNA(lncRNA)在 snRNA-seq數(shù)據(jù)集中富集,而位于細(xì)胞質(zhì)中的線粒體轉(zhuǎn)錄本僅存在于 scRNA-seq數(shù)據(jù)集中(Fischer and Ayers,2021)。研究人員在選擇單個(gè)細(xì)胞核進(jìn)行測序之前,需要仔細(xì)評估這些亞定位基因?qū)λ麄兊奶囟ㄑ芯宽?xiàng)目是否至關(guān)重要。
參考文獻(xiàn)
Sun F, Li H, Sun D, et al. Single-cell omics: experimental workflow, data analyses and applications. Sci China LifSun F, Li H, Sun D, et al. Single-cell omics: experimental workflow, data analyses and applications. Sci China Life Sci. 2025;68(1):5-102. doi:10.1007/s11427-023-2561-0e Sci. 2025;68(1):5-102. doi:10.1007/s11427-023-2561-0