應(yīng)用單細(xì)胞測(cè)序技術(shù)研究科學(xué)問(wèn)題越來(lái)越普遍,當(dāng)下應(yīng)用最火熱的是10x Genomics公司的Chromium解決方案(以下簡(jiǎn)稱10X)。但是基于2017年Christoph Ziegenhain et al[1]對(duì)6種單細(xì)胞轉(zhuǎn)錄組技術(shù)及2019 Broad研究所的團(tuán)隊(duì)對(duì)7種單細(xì)胞RNA測(cè)序方法進(jìn)行了比較[2],某些特殊或者少量細(xì)胞樣本的單細(xì)胞轉(zhuǎn)錄組研究中,Smart-seq2技術(shù)還是一項(xiàng)研究利器。
Smart-seq2與10x技術(shù)的區(qū)別與應(yīng)用的科研場(chǎng)景有哪些呢?北京大學(xué)張澤民團(tuán)隊(duì)在2019年發(fā)表的預(yù)印文章“Direct Comparative Analysis of 10x Genomics Chromium and Smart-seq2”中給予了答案。
那么今天小編再次對(duì)Smart-seq 2與10x Genomics Chromium的技術(shù)原理和應(yīng)用進(jìn)行闡明。
Smart-Seq簡(jiǎn)介
Smart-Seq (Switching mechanism at 5' end of the RNA transcript)于2012年發(fā)表[3],2013年發(fā)表了其改進(jìn)技術(shù)的應(yīng)用Smart-Seq2[4],2014年Smart-Seq2 protocol發(fā)表[5]。Smart-Seq2 對(duì)原始的Smart-Seq實(shí)驗(yàn)流程進(jìn)行了多項(xiàng)改進(jìn)優(yōu)化,它不再需要純化步驟,可大大提高產(chǎn)量,最重要的改進(jìn)是下面兩項(xiàng):
- TSO 3'端最后一個(gè)鳥(niǎo)苷酸替換為鎖核酸LNA(locked nucleic acid)。LNA單體的熱穩(wěn)定性增強(qiáng),其退火溫度增強(qiáng)非模板cDNA的3'延伸能力。
- 甜菜堿(一種具有兩個(gè)重要作用的甲基供體:它會(huì)增加蛋白質(zhì)的熱穩(wěn)定性,并通過(guò)破壞DNA螺旋來(lái)降低甚至消除了DNA熱融變對(duì)堿基對(duì)組成的依賴性)與較高的MgCl2濃度結(jié)合使用。解決某些RNA形成二級(jí)結(jié)構(gòu)(例如發(fā)夾或環(huán))由于空間位阻,可能導(dǎo)致酶終止鏈延長(zhǎng)的問(wèn)題。
Smart技術(shù)是基于高保真的反轉(zhuǎn)錄酶、模板轉(zhuǎn)換和前置放大來(lái)增加cDNA得率,實(shí)驗(yàn)流程2天,得到的是全長(zhǎng)轉(zhuǎn)錄本。該方法有較好的覆蓋范圍,可檢測(cè)到稀有轉(zhuǎn)錄本,不需要額外的專業(yè)設(shè)備,因此應(yīng)用范圍較廣。
Smart-Seq2建庫(kù)原理
- 單細(xì)胞分選:Smart-seq2使用流式細(xì)胞儀或顯微操作進(jìn)行細(xì)胞分選,體積不超過(guò)0.5 ul。
- 細(xì)胞裂解:將分離細(xì)胞直接轉(zhuǎn)移到細(xì)胞裂解液中進(jìn)行細(xì)胞裂解。
- 反轉(zhuǎn)錄( 一鏈合成 ):使用Oligo(dT) primer 對(duì)帶有polyA尾的RNA( 主要mRNA )進(jìn)行反轉(zhuǎn)錄。由于使用了特殊活性反轉(zhuǎn)錄酶( Moloney Murine Leukemia Virus )進(jìn)行反轉(zhuǎn)錄,所以會(huì)在cDNA鏈3'端加上三個(gè)C。
- 模板置換( 二鏈合成 ):該步使用TSO ( template-switching oligo )引物合成了cDNA的二鏈,從而置換了與一鏈cDNA互補(bǔ)的RNA。要注意的是TSO 3'端有三個(gè)G能與一鏈3'端的三個(gè)C互補(bǔ),而最末端的+G是一個(gè)修飾過(guò)的G,能增加TSO的熱穩(wěn)定性,以及其與一鏈cDNA游離的3’端的互補(bǔ)的能力。
- PCR擴(kuò)增:該步進(jìn)行輕度的cDNA富集,將cDNA擴(kuò)增至ng級(jí)即可。
- 標(biāo)記:利用改造后的高活性Tn5轉(zhuǎn)座酶對(duì)DNA進(jìn)行打斷的同時(shí)將接頭添加到cDNA的兩端。標(biāo)記完成后的DNA片段通常在200-600bp。
- PCR富集及上機(jī)測(cè)序:在進(jìn)行最后一次PCR擴(kuò)增后,即可上機(jī)測(cè)序。
10x Genomics單細(xì)胞技術(shù)
ChromiumTM Single Cell 3' Solution是基于10 X Genomics平臺(tái),能夠一次性分離、并標(biāo)記5000–10000個(gè)單細(xì)胞,并能在單細(xì)胞水平進(jìn)行檢測(cè)的技術(shù)。該方法基于微流控技術(shù)(Microfluidics-based approaches),與Smart有相似的分子生物學(xué)原理,運(yùn)用了模板轉(zhuǎn)換技術(shù),但與Smart的細(xì)胞捕獲和通量不同。droplet-based方法是將單個(gè)細(xì)胞包裹在一個(gè)小油滴中(含有barcode和RT primer)反轉(zhuǎn)錄成cDNA,然后油滴破裂釋放cDNA,統(tǒng)一進(jìn)行文庫(kù)構(gòu)建,增大了實(shí)驗(yàn)通量,但需要專門的實(shí)驗(yàn)設(shè)備。
10x Genomics建庫(kù)原理
- 制備好的細(xì)胞懸液、10x barcode凝膠磁珠和油滴分別加入到Chromium Chip B的不同小室,經(jīng)由微流體“雙十字”交叉系統(tǒng)形成GEM。為了獲得單細(xì)胞反應(yīng)體系,細(xì)胞懸液濃度建議控制在700-1200細(xì)胞/ul,因此產(chǎn)生的90-99% GEM不含有細(xì)胞,剩下的大部分GEM含有一個(gè)細(xì)胞。
- 單個(gè)GEM依次形成后再全部混合,細(xì)胞裂解,凝膠珠自動(dòng)溶解釋放大量引物序列。
3. 釋放的引物中包含30nt poly dT反轉(zhuǎn)錄引物,帶有polyA的RNA被反轉(zhuǎn)錄為帶有10x Barcode和UMI信息的cDNA一鏈,再以SMART方式完成二鏈合成。
4. 油滴破碎,磁珠純化cDNA一鏈,然后PCR擴(kuò)增cDNA。
5. cDNA擴(kuò)增完成后酶切片段化并磁珠篩選最適片段,通過(guò)末端修復(fù)、加A、接頭連接Read2測(cè)序引物,再以PCR方式構(gòu)建含有P5和P7接頭的cDNA文庫(kù)即可。
Smart-Seq2 和 10X Genomics 優(yōu)點(diǎn)與限制
數(shù)據(jù)差異
張澤民團(tuán)隊(duì)通過(guò)直接比較兩個(gè)平臺(tái)上來(lái)自相同CD45細(xì)胞樣本的scRNA-seq數(shù)據(jù),廣泛系統(tǒng)地分析評(píng)估了各自數(shù)據(jù)特征。 Smart-seq2在細(xì)胞中檢測(cè)到更多的基因和更為復(fù)雜的數(shù)據(jù)集,尤其是豐度較低的轉(zhuǎn)錄本以及可變剪切的轉(zhuǎn)錄本,但捕獲了更高比例的線粒體基因。 Smart-seq2數(shù)據(jù)的組合也更類似于bulk RNA-seq數(shù)據(jù)。
盡管都是基于poly(A)富集策略,兩個(gè)平臺(tái)檢測(cè)到的所有轉(zhuǎn)錄本中約有10-30%來(lái)自非編碼基因,而lncRNA在10x中所占的比例更高。
Smart-seq2具有更高的敏感度,檢測(cè)到的表達(dá)基因數(shù)目遠(yuǎn)高于10x的檢測(cè)到的表達(dá)基因數(shù)目。
對(duì)于檢測(cè)到的基因,Smart-seq2數(shù)據(jù)呈單峰分布,在所有細(xì)胞中檢測(cè)到的低表達(dá)基因很少。相比之下,10x的數(shù)據(jù)由于有大量的接近零表達(dá)的基因,呈現(xiàn)出明顯的雙峰分布,說(shuō)明10x數(shù)據(jù)中mRNA在很低的表達(dá)水平上有較高的噪聲或隨機(jī)捕獲。
基于10x的數(shù)據(jù)顯示出更嚴(yán)重的dropout問(wèn)題(dropout是scRNA-Seq數(shù)據(jù)的一大特點(diǎn),就是很多基因在某些細(xì)胞根本就檢測(cè)不到表達(dá),但是在另外的細(xì)胞卻檢測(cè)為高表達(dá)。通常認(rèn)為這個(gè)dropout是因?yàn)樵谖膸?kù)構(gòu)建的過(guò)程中,有部分基因沒(méi)有被成功的反轉(zhuǎn)錄。),尤其是對(duì)于表達(dá)水平較低的基因。
10x 技術(shù)測(cè)序數(shù)據(jù)由于技術(shù)特色在mRNA的3’端有著較強(qiáng)的bias,而Smart-seq2技術(shù)則在gene上有著更為均一的分布。同時(shí), 10x技術(shù)數(shù)據(jù)在splicing分析層面并不適用。
但是,由于10x數(shù)據(jù)能夠覆蓋大量細(xì)胞,因此可以更好地檢測(cè)稀有細(xì)胞類型。此外,每個(gè)平臺(tái)檢測(cè)到的細(xì)胞簇之間差異表達(dá)基因的不同集合,表明這些技術(shù)是具有互補(bǔ)性的。
Smart-seq2技術(shù)案例
Björklund 2016年利用Smart-seq2單細(xì)胞轉(zhuǎn)錄組測(cè)序揭示人CD127+先天淋巴細(xì)胞的異質(zhì)性[6]。先天淋巴細(xì)胞(ILCs)是一種免疫細(xì)胞,它通過(guò)釋放可溶性的因素調(diào)節(jié)對(duì)病毒、細(xì)菌和寄生蟲的早期免疫反應(yīng)。這些細(xì)胞可以根據(jù)細(xì)胞表面的轉(zhuǎn)錄因子及細(xì)胞因子被分為三個(gè)亞型,每種亞型都有不同的功能。利用流式細(xì)胞儀分選患有阻塞性睡眠呼吸暫停綜合癥患者的扁桃體組織中的ILCs(Lin−CD127+)和NK cells(CD45+Lin−CD127−NKG2A+CD56+CD16− )。采用Smart-seq2進(jìn)行單細(xì)胞轉(zhuǎn)錄組擴(kuò)增建庫(kù);Illumina HiSeq 2000 3M reads /樣本進(jìn)行測(cè)序分析。采用PCA(主成分分析)和t-SNE對(duì)ILC中847個(gè)表達(dá)的基因進(jìn)行分型分析,將細(xì)胞分為4類:ILC1、ILC2、ILC3、NK cells。應(yīng)用SCDE軟件包對(duì)4類細(xì)胞的差異基因進(jìn)行分析,找出共有及特有差異基因,結(jié)果發(fā)現(xiàn),CD127+ILCs中共有的差異基因的表達(dá)量比NK細(xì)胞中明顯要高。 ILC1、 ILC2、ILC3差異基因表達(dá)分析,結(jié)果表明,ILC1 cells共有79個(gè)上調(diào)表達(dá)基因,參與干擾素γ的調(diào)控,ILC2 cells共有58個(gè)上調(diào)表達(dá)的基因,在前列腺素、Notch信號(hào)通路及環(huán)境感應(yīng)中發(fā)揮作用,ILC3 cells共有371個(gè)上調(diào)表達(dá)的基因,根據(jù)GO注釋有85個(gè)與免疫相關(guān),且存在未知功能的基因。
采用PCA和t-SNE分析ILC3中1,958個(gè)注釋的免疫基因,將ILC3分為3個(gè)亞型:Cluster A、Cluster B、Cluster C, 通過(guò)對(duì)這3種亞型細(xì)胞的分析,發(fā)現(xiàn)了新的免疫細(xì)胞CD62L+ ILC3。本研究通過(guò)對(duì)648個(gè)單細(xì)胞進(jìn)行單細(xì)胞轉(zhuǎn)錄組的分析,應(yīng)用t-SNE細(xì)胞分型、SCDE基因差異表達(dá)分析,在ILC3中發(fā)現(xiàn)新的免疫細(xì)胞CD62L+ ILC3。
10x Genomics技術(shù)案例
比利時(shí)的研究團(tuán)隊(duì)通過(guò)對(duì)數(shù)以千計(jì)的健康與癌變肺細(xì)胞的研究,創(chuàng)建了史上第一個(gè)完整的肺癌細(xì)胞圖譜。研究結(jié)果表明,肺癌較先前認(rèn)識(shí)復(fù)雜得多,其包含了52種不同類型的基質(zhì)細(xì)胞,這些新信息可用于開(kāi)發(fā)新的肺癌治療途徑[7]。
Smart-seq2與10x Genomics聯(lián)合技術(shù)案例
2019年10月31日,北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)、生命科學(xué)學(xué)院、北京未來(lái)基因診斷高精尖創(chuàng)新中心(ICG)張澤民教授、任仙文副教授聯(lián)合首都醫(yī)科大學(xué)附屬北京世紀(jì)壇醫(yī)院彭吉潤(rùn)教授以及勃林格殷格翰公司劉康博士,在Cell上發(fā)表了題為L(zhǎng)andscape and Dynamics of Single Immune Cells in Hepatocellular Carcinoma的研究論文[8]。該研究結(jié)合10x Genomics和SMART-seq2兩種單細(xì)胞RNA測(cè)序技術(shù),對(duì)肝癌患者多個(gè)組織的免疫細(xì)胞做出了系統(tǒng)性的刻畫,分析了免疫細(xì)胞動(dòng)態(tài)遷移和狀態(tài)轉(zhuǎn)化的特征,探索了它們?cè)诟伟┲委熒系臐撛趦r(jià)值。
主要發(fā)現(xiàn)
- 不同組織的免疫組成有較大差異,腫瘤中的巨噬細(xì)胞構(gòu)成腹水中髓系細(xì)胞的主要來(lái)源。
- 腫瘤中的巨噬細(xì)胞呈現(xiàn)兩種不同的狀態(tài)(TAM-like和MDSC-like)。
- 腫瘤中的LAMP3+ DC是成熟態(tài)的DC,具有向肝淋巴結(jié)遷移和與多種淋巴細(xì)胞相互作用的潛在能力。
參考文獻(xiàn)
1. Ziegenhain, C., et al., Comparative Analysis of Single-Cell RNA Sequencing Methods. Mol Cell, 2017. 65(4): p. 631-643 e4.
2. Vieth, B., et al., A systematic evaluation of single cell RNA-seq analysis pipelines. Nat Commun, 2019. 10(1): p. 4667.
3. Ramskold, D., et al., Full-length mRNA-Seq from single-cell levels of RNA and individual circulating tumor cells. Nat Biotechnol, 2012. 30(8): p. 777-82.
4. Picelli, S., et al., Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nat Methods, 2013. 10(11): p. 1096-8.
5. Picelli, S., et al., Full-length RNA-seq from single cells using Smart-seq2. Nat Protoc, 2014. 9(1): p. 171-81.
6. Bjorklund, A.K., et al., The heterogeneity of human CD127(+) innate lymphoid cells revealed by single-cell RNA sequencing. Nat Immunol, 2016. 17(4): p. 451-60.
7. Lambrechts, D., et al., Phenotype molding of stromal cells in the lung tumor microenvironment. Nat Med, 2018. 24(8): p. 1277-1289.
8. Zhang, Q., et al., Landscape and Dynamics of Single Immune Cells in Hepatocellular Carcinoma. Cell, 2019. 179(4): p. 829-845 e20.