BGISEQ-500宏基因組測(cè)序應(yīng)用性能測(cè)試結(jié)果發(fā)表于GigaScience
2017年12月24日,深圳華大生命科學(xué)研究院宏基因組研究所轉(zhuǎn)化應(yīng)用實(shí)驗(yàn)團(tuán)隊(duì)首次公開了使用BGISEQ-500對(duì)健康人群腸道樣本進(jìn)行深度宏基因組測(cè)序的數(shù)據(jù),并通過一系列的性能評(píng)估,展示了BGISEQ-500宏基因組測(cè)序應(yīng)用性能的優(yōu)異性、準(zhǔn)確性、穩(wěn)定性及跨平臺(tái)一致性,相應(yīng)成果發(fā)表于GigaScience。
BGISEQ-500
BGISEQ-500是華大自主研發(fā)的首款桌面型高通量測(cè)序系統(tǒng),采用先進(jìn)的聯(lián)合探針錨定聚合技術(shù)(cPAS)和改進(jìn)的DNA納米球(DNB)核心測(cè)序技術(shù),搭建開放的一站式測(cè)序平臺(tái),具有精準(zhǔn)、簡(jiǎn)易、快速、靈活、可拓等特點(diǎn),并全面覆蓋科研到臨床領(lǐng)域的多種應(yīng)用。BGISEQ-500新型桌面化測(cè)序系統(tǒng)自2015年推出以來,因其高通量、高質(zhì)量、便捷性、低成本等特點(diǎn)已被廣泛應(yīng)用于人全基因組測(cè)序 (Whole Genome Sequencing,WGS)、RNA-Seq、Small RNA-Seq等研究領(lǐng)域。
宏基因組學(xué)(Metagenomics)
宏基因組學(xué)(Metagenomics)又稱為環(huán)境基因組學(xué),其研究對(duì)象是直接從環(huán)境中獲得的全部微小生物的遺傳物質(zhì)的總和。宏基因組鳥槍法測(cè)序(Metagenomic shotgun sequencing)作為微生物學(xué)領(lǐng)域繼顯微鏡發(fā)明之后又一重大技術(shù)突破,使得直接研究微生物群落成為可能,無須分離培養(yǎng)即能發(fā)現(xiàn)大量微生物"暗物質(zhì)",大大推動(dòng)了包括人體腸道菌群在內(nèi)的新興微生物學(xué)領(lǐng)域的研究。華大自 2008 年作為唯一一個(gè)非歐盟單位參與歐盟 MetaHIT 項(xiàng)目以來,始終致力于以宏基因組為核心的多組學(xué)技術(shù)開發(fā)以及在人體疾病等方面的應(yīng)用,取得了一系列標(biāo)志性成果,包括Nature封面文章在內(nèi)的19篇CNS論文,提交專利申請(qǐng)70余件,開發(fā)產(chǎn)品嬰幼兒腸道菌群檢測(cè)服務(wù)1項(xiàng)。
宏基因組研究所依托深圳華大生命科學(xué)研究院高通量測(cè)序平臺(tái)和大數(shù)據(jù)分析平臺(tái),致力于人體共生微生物對(duì)人體健康影響的研究,包括:(1)人體各個(gè)部位的共生微生物的群落結(jié)構(gòu)以及與健康之間的關(guān)系,如口腔,生殖道,皮膚,特別是消化道; (2)人體腸道微生物與慢性復(fù)雜疾病發(fā)生發(fā)展相關(guān)的內(nèi)容,從"飲食-人體共生微生物-宿主代謝"的角度嘗試和尋找新的健康管理及疾病干預(yù)手段。
為評(píng)估BGISEQ-500的宏基因組測(cè)序應(yīng)用性能,該研究團(tuán)隊(duì)收集并提取了20例健康成年人糞便DNA,采用BGISEQ-500的SE100測(cè)序策略完成該20例樣本的深度宏基因組測(cè)序。同時(shí),研究人員隨機(jī)選擇8例DNA樣本作為技術(shù)重復(fù),產(chǎn)出8對(duì)文庫構(gòu)建重復(fù)與8對(duì)測(cè)序重復(fù)數(shù)據(jù)集以評(píng)估該測(cè)序平臺(tái)的穩(wěn)定性,并完成全部20例DNA樣本在Illumina HiSeq2000 與HiSeq4000雙平臺(tái)的測(cè)序以評(píng)估跨平臺(tái)數(shù)據(jù)的一致性 (圖1)。
圖1. BGISEQ-500平臺(tái)內(nèi)技術(shù)重復(fù)一致性
針對(duì)BGISEQ-500數(shù)據(jù)特征,研究人員開發(fā)了宏基因組數(shù)據(jù)質(zhì)控流程,結(jié)果顯示,質(zhì)控后高質(zhì)量數(shù)據(jù)占原始數(shù)據(jù)的96.06%,其中Q30比例超過90.56%。這一結(jié)果顯示了BGISEQ-500的高質(zhì)量性;同時(shí),基于文庫重復(fù)數(shù)據(jù)集與測(cè)序重復(fù)數(shù)據(jù)集的評(píng)估顯示:在定性層面,BGISEQ-500平臺(tái)內(nèi)的兩組技術(shù)重復(fù)內(nèi)可穩(wěn)定檢測(cè)的基因數(shù)高達(dá)99.5%以上,在定量層面,兩組數(shù)據(jù)間的基因相對(duì)豐度相關(guān)性可高達(dá)0.92以上,物種相對(duì)豐度相關(guān)性可高達(dá)0.99(圖2)。這一結(jié)果顯示了BGISEQ-500平臺(tái)內(nèi)高穩(wěn)定性;此外,對(duì)BGISEQ-500與HiSeq2000的比較展示: 跨平臺(tái)數(shù)據(jù)集可穩(wěn)定檢測(cè)的基因數(shù)高達(dá)91.8%,對(duì)平臺(tái)間基因豐度的統(tǒng)計(jì)檢驗(yàn)僅檢出3.25%顯著差異基因。兩平臺(tái)在物種豐度的相關(guān)性仍達(dá)94.8%(圖3)。有趣的是,這些差異基因在GC含量上存在一定的平臺(tái)特異性,表現(xiàn)為GC富集基因在HiSeq2000平臺(tái)相對(duì)豐度偏高;該一發(fā)現(xiàn)隨后在BGISEQ-500與HiSeq4000的數(shù)據(jù)集比較中也隨后得到了驗(yàn)證。 這一結(jié)果表明了BGISEQ-500 與 HiSeq2000&4000的跨平臺(tái)高一致性。
圖2. BGISEQ-500與HiSeq2000/HiSeq4000平臺(tái)間的一致性評(píng)價(jià)
圖3. BGISEQ-500與HiSeq2000平臺(tái)間差異基因的比較
此外,來自Joslin diabetes center的Dr. Kostic及其團(tuán)隊(duì)也受邀參與了該數(shù)據(jù)集的評(píng)估工作,證實(shí)了物種GC含量在BGISEQ-500與HiSeq2000平臺(tái)間、以及物種豐度之間的獨(dú)立性,表明極少數(shù)差異基因的GC偏向性對(duì)物種的定量并無顯著影響。
綜上,該研究團(tuán)隊(duì)表示,通過對(duì)BGISEQ-500在平臺(tái)內(nèi)、平臺(tái)間的宏基因組定性和定量性能全面評(píng)估,全面證實(shí)了BGISEQ-500平臺(tái)對(duì)宏基因組應(yīng)用的高度可行性,其高通量的測(cè)序能力與更經(jīng)濟(jì)的測(cè)序成本也將為未來大規(guī)模的宏基因組研究提供可行的技術(shù)與平臺(tái)支撐。