無(wú)論所使用的real-time PCR是何種型號(hào),正確的數(shù)據(jù)分析對(duì)于獲得有效的實(shí)驗(yàn)結(jié)果都是至關(guān)重要的。這里介紹有關(guān)real-time PCR數(shù)據(jù)分析的知識(shí)。
在討論基本分析過(guò)程之前,先介紹如何設(shè)計(jì)一個(gè)好的實(shí)驗(yàn)。如果你是自己設(shè)計(jì)的引物和探針,那有助于下一步的工作。但是在有些情況下,人們使用出版文獻(xiàn)上的序列會(huì)更方便。記住,即便是出版物提供的序列也不能保證會(huì)得到優(yōu)化的實(shí)驗(yàn)結(jié)果。而且排版錯(cuò)誤的可能性也需要考慮在內(nèi)。所以進(jìn)入實(shí)驗(yàn)室之前使用BLAST對(duì)全部序列進(jìn)行核實(shí)確保他們是正確的。下訂單前先檢察引物和探針的序列和Tm值是實(shí)驗(yàn)設(shè)計(jì)的基本要求。
標(biāo)準(zhǔn)曲線是判斷實(shí)驗(yàn)質(zhì)量的重要手段。使用一個(gè)已知的模板,PCR產(chǎn)物,合成的寡核苷酸或轉(zhuǎn)錄的RNA做個(gè)標(biāo)準(zhǔn)曲線能夠確定PCR的效率,敏感性,動(dòng)態(tài)范圍和其他的參數(shù)。建立標(biāo)準(zhǔn)曲線時(shí)使用OD260的模板樣本。模板的總量以DNA分子的數(shù)量來(lái)描述,把質(zhì)量轉(zhuǎn)化為DNA含量的公式如下:
(質(zhì)量(克)*阿伏伽德羅常數(shù))每個(gè)堿基的平均質(zhì)量*模板的長(zhǎng)度。
例如,合成70-mer的單鏈DNA,樣本質(zhì)量為0.8*10ˆ-11gm。代入公式得:
(0.8*10ˆ-11*6.023*10ˆ23molecules/mole)330gm/mole/base*70 base。
如果使用雙鏈的模板,則堿基的平均質(zhì)量為660gm/mole/base。
標(biāo)準(zhǔn)曲線使用的模板含量從1*10ˆ7開(kāi)始連續(xù)稀釋7次每次稀釋10倍,最終得到10個(gè)模板拷貝。這樣的濃度有助于得到最高的ΔRn和最低的Ct。用Excel畫(huà)曲線時(shí)以模板數(shù)量的對(duì)數(shù)值為X,Ct(cycle threshold)值為Y軸。標(biāo)準(zhǔn)曲線的計(jì)算公式如下:
y=mx+b。y就是Ct,m是斜率,x=log10template amount,b=y-intercept。
用斜率計(jì)算出實(shí)驗(yàn)效率Efficiency【10ˆ(-1/斜率)】-1。實(shí)驗(yàn)效率告訴我們PCR反應(yīng)的執(zhí)行情況。鑒定系數(shù)rˆ2是實(shí)際結(jié)果和理論值相符程度,表示稀釋和移液的準(zhǔn)確性。y-intercept說(shuō)明實(shí)驗(yàn)的敏感度和模板含量的精確度。
通過(guò)已知的模板含量,可以計(jì)算合成一定的DNA含量需要多少次循環(huán):
n=Log(Nn)-Log(N0)/Log(1+E)
Nn是n次循環(huán)后的模板含量,N0是原來(lái)的模板含量,E是實(shí)驗(yàn)效率Efficiency,n是所需的循環(huán)數(shù)。
一個(gè)完美實(shí)驗(yàn)的斜率是-3.32,效率Efficiency是100%,y-intercept在33到37次循環(huán)之間,r^2是1.00。如果效率(Efficiency)較低,y-intercept較高,這意味著循環(huán)開(kāi)始時(shí)DNA的含量不足或需要多跑幾個(gè)循環(huán)?梢越邮苄蔈fficiency在95-100%之間的實(shí)驗(yàn)結(jié)果,但如果y-intercept大大高于37或低于33,這說(shuō)明沒(méi)有準(zhǔn)確的查明樣本數(shù)量。通常偏高的y-intercept值是以低濃度存儲(chǔ),反復(fù)冷凍解凍造成樣本變性的結(jié)果。以標(biāo)準(zhǔn)曲線證實(shí)實(shí)驗(yàn)有效后,就能把同樣的規(guī)范用于cDNA或RNA來(lái)優(yōu)化樣本準(zhǔn)備。
設(shè)備運(yùn)行后的數(shù)據(jù)分析建議按照以下的步驟進(jìn)行。
1. Amplification curves。
如果沒(méi)有這個(gè)曲線或看上去不正常,一定要查明原因解決問(wèn)題。首先應(yīng)檢查染色層(dye layer)和指定的reporter,看似簡(jiǎn)單的方法確是最有可能的解釋。如果曲線看上去很不規(guī)則,可能是樣本中沒(méi)有熒光劑,或者是加樣口根本沒(méi)有樣本。具體是那種情況大約在40次循環(huán)后就可以判明,解決方法是調(diào)節(jié)設(shè)備放棄那些無(wú)用的加樣口,使曲線得以連貫。
2. Baseline
所有的real-time PCR都用基線(Baseline)在早先的幾次循環(huán)時(shí)來(lái)檢測(cè)背景噪音和熒光劑里的試劑。這樣不完整的弧線出現(xiàn)在正式的讀出數(shù)據(jù)之前,大約在第1個(gè)到第10個(gè)循環(huán)之間。如果Ct的最低值小于基線的上限,應(yīng)該調(diào)整基線值。通常設(shè)置2-3個(gè)循環(huán)基線的上限低于Ct最低值。判斷基線設(shè)置是否合適可以觀察增擴(kuò)曲線(amplification curve)Y軸(ΔRn)的線性表達(dá)而不是對(duì)數(shù)方式,有時(shí)對(duì)數(shù)曲線上看似較好的趨勢(shì)在線性圖上則能反映出問(wèn)題。如果上限過(guò)高,會(huì)出現(xiàn)在基線之下很低的Ct。調(diào)節(jié)基線直到曲線的直線部分與基線相仿。正確的調(diào)節(jié)會(huì)使得彩虹狀殘缺的對(duì)數(shù)曲線消失。同樣地,極限的上限可能會(huì)過(guò)低,也可以觀察線性增擴(kuò)曲線來(lái)了解。調(diào)節(jié)基線的影響主要在于低Ct的樣本或高含量的模板,如果必須重復(fù)試驗(yàn),稀釋模板2倍就相當(dāng)于把Ct系數(shù)改變1。
下一步的重點(diǎn)在設(shè)置正確的閾值。當(dāng)所有增擴(kuò)標(biāo)定點(diǎn)處于指數(shù)級(jí)增長(zhǎng)階段,用對(duì)數(shù)值顯示Y軸。不太可能設(shè)置閾值能適合所有的曲線,一個(gè)實(shí)驗(yàn)里采用多種閾值只適用于mRNA含量低造成ΔRn非常低的情況。有人認(rèn)為閾值盡可能比較好,有些分析軟件調(diào)整閾值造成標(biāo)準(zhǔn)曲線有很高的R^2。還有人認(rèn)為最精確的Ct來(lái)源于選擇SDM最大的曲率。其實(shí)并沒(méi)有最佳的閾值,設(shè)置低造成低Ct也許有益于某些情況。樣本含量上2倍的差異帶來(lái)Ct值1倍的變化,對(duì)效率(efficiency)的影響接近100%。
3. 污染控制(No template controls,NTC)
確保測(cè)試的是樣本為不是污染物,建議在正式樣本前的加樣孔中加入2-3個(gè)無(wú)模板對(duì)照樣本。加入正式樣本前先封閉對(duì)照組,同樣準(zhǔn)備2-3對(duì)照樣本在加樣完成后加入。這個(gè)步驟能發(fā)現(xiàn)樣本是否被污染及其程度。NTC顯示Ct值低于40,可以檢查增擴(kuò)曲線來(lái)了解詳情。如果曲線平穩(wěn)的增加不存在指數(shù)級(jí)的提高,或增擴(kuò)速度很慢,用線性圖觀察ΔRn圖形。一種情況是下降的ROX同時(shí)FAM不變。另一種是FAM上升但ROX不變。使用多重試圖檢查每個(gè)加樣孔的所有熒光試劑,搞清楚報(bào)告的信號(hào)和有關(guān)染料的關(guān)系。如果是輕度污染,可以調(diào)節(jié)閾值來(lái)消除影響或移除有關(guān)的加樣孔。如果NTC出現(xiàn)指數(shù)級(jí)增擴(kuò),會(huì)是先前實(shí)驗(yàn)留下的PCR產(chǎn)物造成的。處理方法:用dUTP (2’deoxyurindine 5’triphosphate)和酶UNG(uracil-N-glycosylase)替換dTTP。
4. 無(wú)逆轉(zhuǎn)錄控制(No reverse transcription control)
如果real-time PCR用于mRNA定量分析,需要評(píng)估樣本中染色體污染物的總量。加入一個(gè)不含逆轉(zhuǎn)錄酶的樣本(-RT)。如果-RT的結(jié)果是陽(yáng)性的,可以用DNase處理樣本去掉主要的污染物但會(huì)減低RNA的產(chǎn)量,或設(shè)計(jì)引物/探針跨基因間區(qū),或一直使用逆轉(zhuǎn)錄控制。
陽(yáng)性控制
陽(yáng)性控制最好的方法是標(biāo)準(zhǔn)曲線。用它來(lái)做量化分析,斜率和y-intercept反映了實(shí)驗(yàn)質(zhì)量。如果不能使用一條人工標(biāo)準(zhǔn)曲線,一條覆蓋小段DNA或全長(zhǎng)RNA的標(biāo)準(zhǔn)曲線能反映出實(shí)驗(yàn)的效率。如果實(shí)驗(yàn)沒(méi)有增擴(kuò)效果,把注意力放在試劑和模板可能存在的問(wèn)題上。
5. 實(shí)驗(yàn)樣本
不同廠商的探針會(huì)有不同的表現(xiàn)和不同的最大ΔRn值,這個(gè)差別能從實(shí)質(zhì)上影響ΔRn。但它們不會(huì)妨礙指數(shù)級(jí)增擴(kuò),只要增擴(kuò)期間在設(shè)置好閾值相關(guān)數(shù)據(jù)就可用于分析工作。
有可能出現(xiàn)當(dāng)ROX平穩(wěn)下降,一些曲線在指數(shù)級(jí)增擴(kuò)前是平行的狀況。還有可能看似存在增擴(kuò)的曲線其實(shí)是假的。分析軟件會(huì)盡其所能處理數(shù)據(jù),然而如果ΔRn大大的低于1,應(yīng)該直接懷疑沒(méi)有真正的增擴(kuò)存在無(wú)論曲線看上去如何。
6. CV(coefficient of variance)
CV(coefficient of variance)是標(biāo)準(zhǔn)偏差除以算數(shù)平均,用來(lái)測(cè)量實(shí)驗(yàn)內(nèi)的再現(xiàn)性和實(shí)驗(yàn)的變化。如果CV值較小對(duì)實(shí)驗(yàn)沒(méi)有影響。如果一個(gè)加樣口的值明顯不同于其他的,重復(fù)后的實(shí)驗(yàn)任然出現(xiàn)這樣的結(jié)果,使用多成分窗口(multicomponent view)或光譜窗口(raw spectra)檢查增擴(kuò)情況。如確實(shí)沒(méi)增擴(kuò)就需檢查是否加入了探針熒光劑,也要可能缺少了探針。排除了探針的可能性后再檢查是否加入了模板。如果異常加樣口的Ct較低,可能模板被加了2次。重復(fù)加入模板只會(huì)降低Ct 1,如果CV值大,這個(gè)想象不會(huì)被發(fā)覺(jué)。另一個(gè)推測(cè)是容器沒(méi)有很好的密封,一些加樣口或試管里的試劑蒸發(fā)了。
7. 定量數(shù)據(jù)
完成初步的實(shí)驗(yàn)和分析后,下一步要決定如何有意義地比對(duì)數(shù)據(jù)。量化mRNA和DNA的標(biāo)準(zhǔn)曲線有時(shí)作為絕對(duì)量化的參考。標(biāo)準(zhǔn)曲線允許在質(zhì)量基礎(chǔ)上計(jì)算總量未知的樣本,但是無(wú)論材料濃度的精確性如何,最終結(jié)果是相對(duì)于一個(gè)單位的定義。大部分設(shè)備的軟件可以按事先指定的單位計(jì)算總量,也可按以下的公式:
Log10 copy number = Ct–y-intercept/slope。
重要的是檢驗(yàn)?zāi)愕脑噭┠軌蚪o出100%的反應(yīng)效率。沒(méi)必要指望你的樣本里會(huì)有一個(gè)能給出精確的基因表達(dá)測(cè)量。有關(guān)規(guī)范化和相對(duì)量化的內(nèi)容本文不做展開(kāi)討論。
8. 數(shù)據(jù)統(tǒng)計(jì)
實(shí)驗(yàn)完成了,數(shù)據(jù)也分析了,還有什么可做的?還有很多,real-time PCR統(tǒng)計(jì)與大量參數(shù)有關(guān),如實(shí)驗(yàn)過(guò)程中的細(xì)胞收獲,核苷酸,提取技術(shù),逆轉(zhuǎn)錄,PCR條件和試劑等情況。使用你的數(shù)據(jù)之前有必要先進(jìn)行統(tǒng)計(jì)整理。數(shù)據(jù)的表達(dá)取決于實(shí)驗(yàn)的目的,如測(cè)試受某因素影響前和后的基因表達(dá),正常細(xì)胞對(duì)比癌癥細(xì)胞,時(shí)間的影響等等。另一類(lèi)如食物、水、環(huán)境中的微生物含量,確認(rèn)生物芯片、siRNA的結(jié)果等等。
根據(jù)實(shí)驗(yàn)的類(lèi)型,有關(guān)數(shù)據(jù)應(yīng)該按一定的原則整理有助于讀者觀察到變化,包括數(shù)據(jù)含義,標(biāo)準(zhǔn)差,置信區(qū)間。有些統(tǒng)計(jì)用于告訴讀者存在重大差異的可能性,大多數(shù)real-time PCR是檢驗(yàn)假設(shè)的結(jié)果,有時(shí)這些差異很明顯統(tǒng)計(jì)步驟只是走過(guò)場(chǎng)。但是生物系統(tǒng)是不斷變化的,不精確的,有時(shí)統(tǒng)計(jì)能說(shuō)明數(shù)據(jù)的排他性。