設(shè)置重復(fù)樣本的重要意義:測(cè)序無(wú)法消除個(gè)體間基因表達(dá)水平的差異
瀏覽次數(shù):572 發(fā)布日期:2023-4-12
來(lái)源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
二代測(cè)序及基因芯片技術(shù)使得過(guò)去的十多年涌現(xiàn)出大量關(guān)于RNA-seq的研究。但似乎一些研究人員沒(méi)有注意到,基因表達(dá)的異質(zhì)性不僅僅是由技術(shù)誤差導(dǎo)致的�;虮磉_(dá)是一個(gè)相對(duì)隨機(jī)的過(guò)程,同一類(lèi)型樣本中的不同個(gè)體,基因的表達(dá)可能會(huì)不一樣。一般來(lái)說(shuō),基因表達(dá)的異質(zhì)性(Var(Expr))可以被分解為以下三個(gè)部分:
Var(Expr) = Across Group Variability + Measurement Error + Biological Variability
Across Group Variability即由于不同的處理或不同的細(xì)胞類(lèi)型等導(dǎo)致的表達(dá)水平差異,即通常所說(shuō)的組間差異。例如,腫瘤樣本與正常樣本之間的表達(dá)差異。
Measurement Error指實(shí)驗(yàn)或測(cè)序過(guò)程中的技術(shù)誤差。技術(shù)誤差會(huì)導(dǎo)致一定的基因表達(dá)異質(zhì)性,但其可以通過(guò)對(duì)同一樣本進(jìn)行多次實(shí)驗(yàn)/測(cè)序(即技術(shù)重復(fù))來(lái)消除。
Biological Variability指同一分組的不同樣本之間的表達(dá)差異。即使排除掉Measurement Error,這種樣本間的表達(dá)差異也是存在的,即無(wú)法通過(guò)測(cè)序來(lái)消除Biological Variability。
在實(shí)驗(yàn)設(shè)計(jì)中,如果關(guān)注的是組間差異(Across Group Variability),那么Measurement Error和Biological Variability就會(huì)成為影響分析結(jié)果的因素。
Measurement Error可以通過(guò)技術(shù)重復(fù)來(lái)消除,我們下面主要關(guān)注一下Biological Variability為何不能通過(guò)測(cè)序來(lái)消除。
以下利用兩個(gè)研究的數(shù)據(jù),評(píng)估了不同測(cè)量方法(二代測(cè)序和基因芯片)導(dǎo)致的表達(dá)水平差異:

說(shuō)明:
每個(gè)點(diǎn)表示一個(gè)基因;
橫坐標(biāo)表示利用基因芯片方法檢測(cè)得到的某個(gè)基因在不同樣本之間的表達(dá)水平的標(biāo)準(zhǔn)差;
縱坐標(biāo)表示利用二代測(cè)序方法檢測(cè)得到的某個(gè)基因在不同樣本之間的表達(dá)水平的標(biāo)準(zhǔn)差;
黑色線表示對(duì)表達(dá)異質(zhì)性(s.d.)的最佳線性擬合;
紅色線表示y=x。
高亮的兩個(gè)點(diǎn)/三角表示基因COX4NB和RASGRP1。
從上述結(jié)果可以看到,兩種技術(shù)檢測(cè)得到的表達(dá)抑制性相差很小。
以下展示了不同樣本的兩個(gè)基因(COX4NB和RASGRP1)的標(biāo)準(zhǔn)化(圓:均值歸一化;三角:中心化)后的表達(dá)量。上圖表示二代測(cè)序,下圖表示基因芯片。

從結(jié)果可見(jiàn),無(wú)論使用哪種技術(shù),基因COX4NB在不同樣本中的表達(dá)水平都較為一致,基因RASGRP1則異質(zhì)性較高。
綜合上述兩個(gè)結(jié)果,Biological Variability是基因的特性,而與檢測(cè)方法無(wú)關(guān)。
Biological Variability對(duì)于實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)分析影響很大�?紤]上述基因COX4NB和RASGRP1,如果檢測(cè)到不同處理組之間COX4NB的表達(dá)有差異,那么這個(gè)差異很可能是真陽(yáng)性,因?yàn)榻M內(nèi)異質(zhì)性很��;但如果檢測(cè)到兩組之間RASGRP1表達(dá)有差異,如果重復(fù)樣本數(shù)量不夠,很有可能檢測(cè)到的差異是假陽(yáng)性,因?yàn)闊o(wú)法排除是否是Biological Variability導(dǎo)致的。
綜上所述,為了得到更可信的結(jié)果,需要足夠的生物學(xué)重復(fù)。