BGISEQ-500宏基因組測序應(yīng)用性能測試結(jié)果發(fā)表于GigaScience
2017年12月24日,深圳華大生命科學(xué)研究院宏基因組研究所轉(zhuǎn)化應(yīng)用實驗團(tuán)隊首次公開了使用BGISEQ-500對健康人群腸道樣本進(jìn)行深度宏基因組測序的數(shù)據(jù),并通過一系列的性能評估,展示了BGISEQ-500宏基因組測序應(yīng)用性能的優(yōu)異性、準(zhǔn)確性、穩(wěn)定性及跨平臺一致性,相應(yīng)成果發(fā)表于GigaScience。
BGISEQ-500
BGISEQ-500是華大自主研發(fā)的首款桌面型高通量測序系統(tǒng),采用先進(jìn)的聯(lián)合探針錨定聚合技術(shù)(cPAS)和改進(jìn)的DNA納米球(DNB)核心測序技術(shù),搭建開放的一站式測序平臺,具有精準(zhǔn)、簡易、快速、靈活、可拓等特點,并全面覆蓋科研到臨床領(lǐng)域的多種應(yīng)用。BGISEQ-500新型桌面化測序系統(tǒng)自2015年推出以來,因其高通量、高質(zhì)量、便捷性、低成本等特點已被廣泛應(yīng)用于人全基因組測序 (Whole Genome Sequencing,WGS)、RNA-Seq、Small RNA-Seq等研究領(lǐng)域。
宏基因組學(xué)(Metagenomics)
宏基因組學(xué)(Metagenomics)又稱為環(huán)境基因組學(xué),其研究對象是直接從環(huán)境中獲得的全部微小生物的遺傳物質(zhì)的總和。宏基因組鳥槍法測序(Metagenomic shotgun sequencing)作為微生物學(xué)領(lǐng)域繼顯微鏡發(fā)明之后又一重大技術(shù)突破,使得直接研究微生物群落成為可能,無須分離培養(yǎng)即能發(fā)現(xiàn)大量微生物"暗物質(zhì)",大大推動了包括人體腸道菌群在內(nèi)的新興微生物學(xué)領(lǐng)域的研究。華大自 2008 年作為唯一一個非歐盟單位參與歐盟 MetaHIT 項目以來,始終致力于以宏基因組為核心的多組學(xué)技術(shù)開發(fā)以及在人體疾病等方面的應(yīng)用,取得了一系列標(biāo)志性成果,包括Nature封面文章在內(nèi)的19篇CNS論文,提交專利申請70余件,開發(fā)產(chǎn)品嬰幼兒腸道菌群檢測服務(wù)1項。
宏基因組研究所依托深圳華大生命科學(xué)研究院高通量測序平臺和大數(shù)據(jù)分析平臺,致力于人體共生微生物對人體健康影響的研究,包括:(1)人體各個部位的共生微生物的群落結(jié)構(gòu)以及與健康之間的關(guān)系,如口腔,生殖道,皮膚,特別是消化道; (2)人體腸道微生物與慢性復(fù)雜疾病發(fā)生發(fā)展相關(guān)的內(nèi)容,從"飲食-人體共生微生物-宿主代謝"的角度嘗試和尋找新的健康管理及疾病干預(yù)手段。
為評估BGISEQ-500的宏基因組測序應(yīng)用性能,該研究團(tuán)隊收集并提取了20例健康成年人糞便DNA,采用BGISEQ-500的SE100測序策略完成該20例樣本的深度宏基因組測序。同時,研究人員隨機(jī)選擇8例DNA樣本作為技術(shù)重復(fù),產(chǎn)出8對文庫構(gòu)建重復(fù)與8對測序重復(fù)數(shù)據(jù)集以評估該測序平臺的穩(wěn)定性,并完成全部20例DNA樣本在Illumina HiSeq2000 與HiSeq4000雙平臺的測序以評估跨平臺數(shù)據(jù)的一致性 (圖1)。
圖1. BGISEQ-500平臺內(nèi)技術(shù)重復(fù)一致性
針對BGISEQ-500數(shù)據(jù)特征,研究人員開發(fā)了宏基因組數(shù)據(jù)質(zhì)控流程,結(jié)果顯示,質(zhì)控后高質(zhì)量數(shù)據(jù)占原始數(shù)據(jù)的96.06%,其中Q30比例超過90.56%。這一結(jié)果顯示了BGISEQ-500的高質(zhì)量性;同時,基于文庫重復(fù)數(shù)據(jù)集與測序重復(fù)數(shù)據(jù)集的評估顯示:在定性層面,BGISEQ-500平臺內(nèi)的兩組技術(shù)重復(fù)內(nèi)可穩(wěn)定檢測的基因數(shù)高達(dá)99.5%以上,在定量層面,兩組數(shù)據(jù)間的基因相對豐度相關(guān)性可高達(dá)0.92以上,物種相對豐度相關(guān)性可高達(dá)0.99(圖2)。這一結(jié)果顯示了BGISEQ-500平臺內(nèi)高穩(wěn)定性;此外,對BGISEQ-500與HiSeq2000的比較展示: 跨平臺數(shù)據(jù)集可穩(wěn)定檢測的基因數(shù)高達(dá)91.8%,對平臺間基因豐度的統(tǒng)計檢驗僅檢出3.25%顯著差異基因。兩平臺在物種豐度的相關(guān)性仍達(dá)94.8%(圖3)。有趣的是,這些差異基因在GC含量上存在一定的平臺特異性,表現(xiàn)為GC富集基因在HiSeq2000平臺相對豐度偏高;該一發(fā)現(xiàn)隨后在BGISEQ-500與HiSeq4000的數(shù)據(jù)集比較中也隨后得到了驗證。 這一結(jié)果表明了BGISEQ-500 與 HiSeq2000&4000的跨平臺高一致性。
圖2. BGISEQ-500與HiSeq2000/HiSeq4000平臺間的一致性評價
圖3. BGISEQ-500與HiSeq2000平臺間差異基因的比較
此外,來自Joslin diabetes center的Dr. Kostic及其團(tuán)隊也受邀參與了該數(shù)據(jù)集的評估工作,證實了物種GC含量在BGISEQ-500與HiSeq2000平臺間、以及物種豐度之間的獨立性,表明極少數(shù)差異基因的GC偏向性對物種的定量并無顯著影響。
綜上,該研究團(tuán)隊表示,通過對BGISEQ-500在平臺內(nèi)、平臺間的宏基因組定性和定量性能全面評估,全面證實了BGISEQ-500平臺對宏基因組應(yīng)用的高度可行性,其高通量的測序能力與更經(jīng)濟(jì)的測序成本也將為未來大規(guī)模的宏基因組研究提供可行的技術(shù)與平臺支撐。