《聲聲慢·基因測序》
尋尋覓覓,SNP,測序測序測序。
報(bào)告出來時(shí)候,一臉懵逼。
七零八落數(shù)據(jù),怎樣搞,生存統(tǒng)計(jì)?
欲結(jié)題,正憂心,預(yù)后怎么分析?
滿地?cái)?shù)據(jù)堆積,測完序,課題如何繼續(xù)?
守著樣本,勞資只想靜靜。
被人忽悠掏錢,到頭來,滿手垃圾。
這測序,怎一個(gè),坑字了得。
以二代基因測序?yàn)榇淼母咄垦芯坎呗院w了臨床前研究的方方面面,我們可以在短時(shí)間內(nèi)拿到大量樣本的檢測結(jié)果,研究進(jìn)程大大加快了。但新技術(shù)帶來了新問題,高通量檢測帶來的海量數(shù)據(jù)怎么分析?
如何讓大數(shù)據(jù)解決大問題?
新技術(shù)的意義并不是為了發(fā)文章灌水,而是創(chuàng)造臨床價(jià)值,一切沒有臨床相關(guān)性研究的基因測序都是耍流氓!還在研究“少數(shù)民族的特殊基因突變”嗎?老師啊,已經(jīng)2016年了,這種小破文章對得起您手里的寶貴樣本嗎?這種坐在金礦上被餓死的感覺酸爽不?
別慌,吉?jiǎng)P強(qiáng)大的生物信息平臺(tái)給您支支招。
今天陳博以“Cancer Panel腫瘤基因熱點(diǎn)突變測序”數(shù)據(jù)的深度分析為例,講一講二代測序結(jié)果的正確打開方式。
Cancer Panel技術(shù)是一種快速的癌基因掃描手段。它選取50個(gè)已知的腫瘤高相關(guān)性基因,將其常見的熱點(diǎn)突變(共2800種)集合到一起同時(shí)檢測,可以在短時(shí)間內(nèi)高效地完成對腫瘤樣本的突變掃描,獲取重要的腫瘤基因突變譜。
Cancer Panel實(shí)驗(yàn)是在Ion Torrent測序儀上完成的,這種二代測序儀的主要原理是:在半導(dǎo)體芯片的微孔中固定DNA鏈,隨后依次摻入ATCG。隨著每個(gè)堿基的摻入,釋放出氫離子,在它們穿過每個(gè)孔底部時(shí)能被檢測到,通過對氫離子的檢測,實(shí)時(shí)判讀堿基。Cancer Panel的測序深度高達(dá)1000X以上,數(shù)據(jù)精度遠(yuǎn)超普通的全基因組測序或外顯子組測序。
Cancer Panel采用AmpliSeqTM技術(shù),通過多重PCR完成,只需極低起始量樣品(10 ng級(jí)),能夠在一管中同時(shí)擴(kuò)增幾千種PCR片段,能夠快速完成疾病相關(guān)基因的突變篩察。
Cancer Panel的檢測數(shù)據(jù)首先經(jīng)過常規(guī)數(shù)據(jù)分析,包括:數(shù)據(jù)預(yù)處理、數(shù)據(jù)過濾統(tǒng)計(jì)、基因組mapping、SNV檢測及注釋、InDel檢測及注釋等,至此我們完成了進(jìn)一步數(shù)據(jù)挖掘的準(zhǔn)備工作。
(很多半成品測序結(jié)果就是這個(gè)狀態(tài)的,勞資褲子都脫了,就只給看這個(gè)數(shù)據(jù),實(shí)在坑爹。
接下來,才是見證奇跡的時(shí)刻!
(以某腫瘤的預(yù)后預(yù)測及指導(dǎo)用藥為例)
在Cancer Panel數(shù)據(jù)分析過程中,通常首先對50個(gè)腫瘤基因中存在非同義突變、移碼突變或終止密碼突變的基因進(jìn)行篩選;其次對這些突變基因的突變情況對臨床療效、藥效、起效時(shí)間及治療的預(yù)后情況是否有顯著影響進(jìn)行分析;對于顯著影響療效或預(yù)后的突變基因,對它們對于這些因素的影響趨勢進(jìn)行分析。綜合以上分析,為早期預(yù)測哪些患者會(huì)獲得更好的療效及指導(dǎo)用藥提供依據(jù)。
突變基因在各臨床療效樣本組中的分布如下圖所示,吉?jiǎng)P采用Mann-Whitney U檢驗(yàn)法對各個(gè)基因的突變情況對于臨床療效性是否具有顯著影響進(jìn)行檢驗(yàn)。
(圖中每一行代表一個(gè)基因,每一列代表一個(gè)樣本;頂端的藍(lán)色條碼由淺到深依次代表Complete Response、Partial Response、Stable Disease和Progressive Disease;灰色代表該基因在所對應(yīng)的樣本中有突變,白色代表沒有突變。)
在“突變基因與臨床療效性的相關(guān)性”項(xiàng)目中,吉?jiǎng)P采用Spearman檢驗(yàn)法對相關(guān)突變基因與臨床療效性之間的相關(guān)性進(jìn)行檢驗(yàn),初步探索這些腫瘤基因?qū)τ谂R床療效的潛在作用。
在臨床研究中,對于治療方案的療效的考核,通常可以采用治愈率、病死率等指標(biāo)來評(píng)價(jià)。但是對于腫瘤、結(jié)核及其他慢性或長期性疾病,其治療的預(yù)后效果不能在短期內(nèi)判斷,需要通過對病人進(jìn)行長期隨訪,統(tǒng)計(jì)一定期限后的生存或死亡狀況來加以評(píng)判。
但是此類生存數(shù)據(jù)分布類型不確定,通常不符合正態(tài)分布,且常含有刪失值(censored,如由于病人痊愈、失聯(lián)或其他原因死亡等造成隨訪失效或終檢),因此不適合使用傳統(tǒng)的統(tǒng)計(jì)分析方法(例如:T 檢驗(yàn)、線性回歸分析等)。
生存分析(Survival Analysis)是研究生存現(xiàn)象和響應(yīng)時(shí)間數(shù)據(jù)及其統(tǒng)計(jì)規(guī)律的一種統(tǒng)計(jì)學(xué)方法。常用的生存分析方法包括:參數(shù)方法、非參數(shù)方法(例如:壽命表分析、 Kaplan-Meier 分析等)和半?yún)?shù)方法(例如:Cox 回歸分析等)。
在本項(xiàng)目中,吉?jiǎng)P采用 Kaplan-Meier 方法檢驗(yàn)?zāi)[瘤基因的突變情況對于治療后生存時(shí)間的影響是否顯著,如上圖所示。
各位老師看到這里,是不是覺得當(dāng)初砸在手里的測序數(shù)據(jù)有救了?還等什么,快來找陳博吧。除了基因數(shù)據(jù)的深度分析之外,吉?jiǎng)P的基因研究工具還有很多,下一期陳博給大家講講為什么《五塊錢買不了吃虧!買不了上當(dāng)》。