抗原表位預(yù)測(cè)適用于已知一級(jí)結(jié)構(gòu)的蛋白質(zhì)或多肽抗原的線(xiàn)性表位的預(yù)測(cè)。人們通過(guò)觀察抗原表位與已知氨基酸序列的蛋白質(zhì)某些結(jié)構(gòu)特征關(guān)系,發(fā)現(xiàn)一些蛋白質(zhì)的序列或結(jié)構(gòu)特征與抗原表位有關(guān)。在抗原抗體的結(jié)合反應(yīng)中,抗原參與結(jié)合的部位稱(chēng)為 B 細(xì)胞抗原決定簇或者表位。從空間結(jié)構(gòu)上看,B 細(xì)胞表位可分為線(xiàn)性表位(也稱(chēng) 連續(xù)表位)和構(gòu)象表位(也稱(chēng)不連續(xù)表位)。線(xiàn)性表位由肽鏈上連續(xù)的氨基酸組 成;構(gòu)象性表位由空間結(jié)構(gòu)上接近但肽鏈上不連續(xù)的氨基酸組成; Rubinstein 等研究從 PDB 數(shù)據(jù)庫(kù)篩選的抗原抗體復(fù)合物,總結(jié)了
B 細(xì)胞表位生化、結(jié)構(gòu)特點(diǎn):(1) 75%的表位是由跨越 600Å ~1000Å 40 面積的 15~25 個(gè)氨基酸組成;(2)平均 90% 的表位殘基是與抗體的互補(bǔ)決定區(qū) (CDR)的殘基相互作用;(3)表位和非表位區(qū)的氨基酸組成有很大的不同;(4)環(huán)狀結(jié)構(gòu)利于抗體的結(jié)合,因此表位多含有環(huán)狀結(jié)構(gòu),而螺旋和折疊結(jié)構(gòu)比較少見(jiàn)。
表位是蛋白質(zhì)抗原性的基礎(chǔ),確定 B 細(xì)胞表位對(duì)于設(shè)計(jì)疫苗和藥物具有重要的指導(dǎo)作用。確定 B 細(xì)胞表位的傳統(tǒng)方法有兩種:X-射線(xiàn)衍射方法和實(shí)驗(yàn)方法。但是這些方法比較繁瑣,工作量也非常大。隨著計(jì)算機(jī)技術(shù)的發(fā)展和生物信息數(shù)據(jù)庫(kù)的日益擴(kuò)大,從已有數(shù)據(jù)中總結(jié)抗原表位的序列及結(jié)構(gòu)特征,并通過(guò)計(jì)算手段對(duì)可能的表位進(jìn)行預(yù)測(cè),然后結(jié)合實(shí)驗(yàn)手段予以驗(yàn)證成為另外一條可能的技術(shù)路線(xiàn)。
1、B 細(xì)胞表位在線(xiàn)預(yù)測(cè)工具:
名稱(chēng) |
網(wǎng)址 |
說(shuō)明 |
ABCpred |
http:///raghava/abcpred |
線(xiàn)性表位預(yù)測(cè) |
BCPREDS |
http://ailab.cs.iastate.edu/bcpreds/predict.html |
線(xiàn)性表位預(yù)測(cè) |
Bepipred |
http://www.cbs.dtu.dk/services/BepiPred |
線(xiàn)性表位預(yù)測(cè) |
IEDB tools |
http://www.immuneepitope.org/tools/bcell/iedb_input |
線(xiàn)性表位預(yù)測(cè) |
COBEpro |
http://scratch.proteomics.ics.uci.edu/ |
線(xiàn)性表位預(yù)測(cè) |
CEP |
http://bioinfo.ernet.in/cep.htm |
構(gòu)象表位預(yù)測(cè) |
DiscoTope |
http://www.cbs.dtu.dk/services/DiscoTope |
構(gòu)象表位預(yù)測(cè) |
PEPITO |
http://www.igb.uci.edu/ |
構(gòu)象表位預(yù)測(cè) |
SEPPA |
http://lifecenter.sgst.cn/seppa/ |
構(gòu)象表位預(yù)測(cè) |
Epitopia |
http://epitopia.tau.ac.il/ |
構(gòu)象表位預(yù)測(cè) |
EPCES |
http://sysbio.unl.edu/EPCES/ |
構(gòu)象表位預(yù)測(cè) |
EPSVR |
http://sysbio.unl.edu/EPSVR |
構(gòu)象表位預(yù)測(cè) |
EPMeta |
http://sysbio.unl.edu/EPMeta/ |
構(gòu)象表位預(yù)測(cè) |
CBTOPE |
http:///raghava/cbtope/ |
構(gòu)象表位預(yù)測(cè) |
Ensemble Method |
http://bcell.whu.edu.cn/ |
構(gòu)象表位預(yù)測(cè) |
2、B 細(xì)胞表位數(shù)據(jù)庫(kù)
數(shù)據(jù)是 B 細(xì)胞表位分析與預(yù)測(cè)的基礎(chǔ)。研究者們通過(guò)收集和整理已有的研究成果,開(kāi)發(fā)了一些 B 細(xì)胞表位數(shù)據(jù)庫(kù)。常用數(shù)據(jù)庫(kù)見(jiàn)下表:
數(shù)據(jù)庫(kù) |
網(wǎng)址 |
PDB |
http://www.rcsb.org/ |
IEDB |
http://www.iedb.org/ |
BCIPEP |
http:///raghava/bcipep |
CED |
http:///ced/ |
EPITOME |
http://www.rostlab.org/services/epitome/ |
AntiJen |
http://www.ddg-pharmfac.net/antijen/AntiJen/aj_bcell.htm |
HIV |
http://www.hiv.lanl.gov/ |
PDB 數(shù)據(jù)庫(kù)于1971 年建立,主要收集通過(guò) X-射線(xiàn)單晶衍射、核磁共振、 電子衍射等實(shí)驗(yàn)手段確定的蛋白質(zhì)、核酸和糖的三維結(jié)構(gòu)。因此,該數(shù)據(jù)庫(kù)也存儲(chǔ)了一些抗原或者抗原-抗體復(fù)合物的三維結(jié)構(gòu)。
IEDB 數(shù)據(jù)庫(kù)[5]在 2004 年建立,是使用最為廣泛和最具權(quán)威性的表位數(shù)據(jù)庫(kù)。 該數(shù)據(jù)庫(kù)存儲(chǔ)由實(shí)驗(yàn)確定的 B 細(xì)胞表位(線(xiàn)性表位和構(gòu)象表位),這些表位收 60 集自公開(kāi)發(fā)表的出版物或者由研究組自行提交。目前,IEDB 數(shù)據(jù)庫(kù)包含 159,339 條 B 細(xì)胞相關(guān)記錄。每個(gè)表位都提供了對(duì)應(yīng)的參考文獻(xiàn)、結(jié)構(gòu)、來(lái)源抗原等信息。此外,該數(shù)據(jù)庫(kù)還集成了一些表位預(yù)測(cè)工具。
Bcipep 數(shù)據(jù)庫(kù)包含實(shí)驗(yàn)確定的線(xiàn)性 B 細(xì)胞表位(來(lái)源于文獻(xiàn)或者其它的數(shù)據(jù)庫(kù))。目前,該數(shù)據(jù)庫(kù)存儲(chǔ)了 555 條表位。對(duì)于每一條表位,數(shù)據(jù)庫(kù)給出了其肽段序列、來(lái)源蛋白、病原體等。如果數(shù)據(jù)來(lái)源于其它數(shù)據(jù)庫(kù),Bcipep 數(shù)據(jù)庫(kù)也提供了鏈接。
CED 數(shù)據(jù)庫(kù)存儲(chǔ)了 293 條構(gòu)象表位記錄。研究者從 PubMed 和 ScienceDirect 數(shù)據(jù)庫(kù)收集和整理文獻(xiàn),然后手工分析超過(guò) 3000 條文獻(xiàn),保留了高分辨率和完整的構(gòu)象表位,并存入數(shù)據(jù)庫(kù)。CED 數(shù)據(jù)庫(kù)提供了表位的相關(guān)信 70 息,包括表位在抗原體的位置、表位的免疫特性、抗原體、抗原所對(duì)應(yīng)的抗體等。 該數(shù)據(jù)庫(kù)提供了友好的操作界面,能夠展示表位的 3D 結(jié)構(gòu)。
Epitome 數(shù)據(jù)庫(kù)存儲(chǔ)從抗原-抗體復(fù)合物推斷的抗原表位。在該數(shù)據(jù)庫(kù)中, 抗原殘基和 CDRs 之間的反應(yīng)稱(chēng)為免疫反應(yīng)。研究者通過(guò)對(duì)復(fù)合物的比對(duì)和分析,識(shí)別抗原的 CDRs 區(qū)域,然后根據(jù)抗原抗體反應(yīng)來(lái)標(biāo)注與 CDRs 反應(yīng)的抗原 75 殘基。該數(shù)據(jù)庫(kù)存儲(chǔ)了 142 條標(biāo)記抗原,也提供了可視化工具分析抗原-抗體復(fù)合物以及標(biāo)注的表位。
AntiJen是一個(gè)綜合數(shù)據(jù)庫(kù),涵蓋了與免疫和疫苗相關(guān)的動(dòng)力學(xué)、熱力學(xué)和分子數(shù)據(jù)。AntiJen v2.0 包含 3541 條 B 細(xì)胞表位(線(xiàn)性表位和構(gòu)象表位)。每條表位都提供了其肽段來(lái)源、抗體、外部鏈接。
HIV 分子免疫數(shù)據(jù)庫(kù)包含 HIV 病毒表位。該數(shù)據(jù)庫(kù)中的數(shù)據(jù)來(lái)源于 HIV 免疫文獻(xiàn),目前包含 11,361 條 HIV 相關(guān)的 B 細(xì)胞反應(yīng)和 T 細(xì)胞反應(yīng)數(shù)據(jù)。
3、B細(xì)胞表位預(yù)測(cè)方案簡(jiǎn)介
從80年代Hopp和Woods提出親水性參數(shù)對(duì)抗原表位預(yù)測(cè)的方法以來(lái),已有許多參數(shù)、算法發(fā)表,對(duì)B細(xì)胞蛋白抗原表位研究起到巨大的推動(dòng)作用。現(xiàn)已被大眾認(rèn)可并具有較好預(yù)測(cè)效果的方法,主要有以下6種:
(1)親水性方案(Hydrophilicity)
常用的有五種方法:Nozaki-Tanford scale,Hopp-Woods scale,Eisenberg scale,Kyte-Doolittle scale,HPLC scale。其中尤以Hopp-Woods方案最為有名。認(rèn)為蛋白質(zhì)抗原各氨基酸殘基可分為親水殘基和疏水殘基兩類(lèi)。在機(jī)體內(nèi),疏水性殘基一般埋在蛋白內(nèi)部,而親水性殘基位于表面,因此蛋白的親水部位與蛋白抗原表位有密切的聯(lián)系。Hopp-Woods方案是以殘基由有機(jī)相環(huán)境轉(zhuǎn)移到水相環(huán)境的自由能為依據(jù)計(jì)算各個(gè)氨基酸的親水性,F(xiàn)已明確,親水性部位與抗原表位并無(wú)很好的一致性,即高親水性部位不一定是表位,表位也不一定是親水性部位。
(2)可及性方案(Accessibility)
如Janin可及性參數(shù),指蛋白質(zhì)抗原中氨基酸殘基被溶劑分子接觸的可能性。它反映了蛋白質(zhì)抗原內(nèi)、外各層殘基的分布情況。
(3)抗原性方案(Antigenicity)
對(duì)20個(gè)已研究得很透的蛋白質(zhì)的69個(gè)連續(xù)位點(diǎn)的606個(gè)氨基酸統(tǒng)計(jì)分析,Welling建立了抗原性刻度。每個(gè)氨基酸用出現(xiàn)在抗原區(qū)的頻率描述,此頻率除以各氨基酸在所有蛋白質(zhì)中的頻率就可推出此刻度值。該法研究表明,疏水性氨基酸殘基對(duì)抗原表位形成亦有貢獻(xiàn)。缺點(diǎn)是其所用的數(shù)據(jù)庫(kù)有限,并且連續(xù)位點(diǎn)內(nèi)的殘基被認(rèn)為是同等重要的。顯然那些不重要的殘基歸入計(jì)算會(huì)明顯降低相關(guān)性。
(4)可塑性方案(Flexibility)
指蛋白抗原構(gòu)象不是剛性不變的,其多肽鏈骨架有一定程度的活動(dòng)性,活動(dòng)性強(qiáng)的氨基酸殘基即可塑性大的位點(diǎn),易形成抗原表位。Karplas 和Schulz基于已知結(jié)構(gòu)的31個(gè)蛋白質(zhì)的Cx的溫度β因子,發(fā)展了一種預(yù)測(cè)蛋白質(zhì)片段活動(dòng)性的方法。
(5)電荷分布方案(Charge distribution)
認(rèn)為對(duì)堿性抗原特異的抗體多趨于酸性,對(duì)酸性抗原特異的抗體多趨于堿性。
(6)二級(jí)結(jié)構(gòu)預(yù)測(cè)方案(Secondary structure)
認(rèn)為β轉(zhuǎn)角結(jié)構(gòu)為凸出結(jié)構(gòu),多出現(xiàn)在蛋白質(zhì)抗原表面,利于與抗體嵌合,較可能成為抗原表位。而α螺旋、β片層結(jié)構(gòu)規(guī)則不易形變,較難嵌和抗體,一般不作為抗原表位。可預(yù)測(cè)蛋白質(zhì)β轉(zhuǎn)角的有Chou-Fasman,Garnier,Cohen等方法。其中各種方法預(yù)測(cè)的成功率均不超過(guò)65%。一般認(rèn)為Cohen方法對(duì)轉(zhuǎn)角的預(yù)測(cè)正確率很高,對(duì)于已知折疊類(lèi)型的蛋白質(zhì)(αα類(lèi),ββ類(lèi),α/β類(lèi))正確率高達(dá)95%,對(duì)于未知結(jié)構(gòu)類(lèi)型的蛋白質(zhì),可用3種類(lèi)型分別預(yù)測(cè),3類(lèi)預(yù)測(cè)一致的轉(zhuǎn)角對(duì)預(yù)測(cè)表位有幫助。
對(duì)上述各種參數(shù)的預(yù)測(cè)比較表明,各種方案預(yù)測(cè)的正確率均不高。一般將上述多種方案綜合考慮,尤以可及性方案、可塑性方案、抗原性方案及二級(jí)結(jié)構(gòu)預(yù)測(cè)為重要。概括而言,作為B細(xì)胞蛋白抗原的表位首先應(yīng)易于位于或移動(dòng)于蛋白質(zhì)抗原表面,有利于與抗體結(jié)合。另外,具有一定柔韌性,因?yàn)榭乖c抗體結(jié)合時(shí)蛋白構(gòu)象有一定的變化。已經(jīng)有一些文獻(xiàn)提出了各自不同的綜合分析方法。1988年Jameson和Worf提出一種綜合預(yù)測(cè)方案。權(quán)重選擇為:40%來(lái)自二級(jí)結(jié)構(gòu)成分,可及性、柔韌性各15%,30%來(lái)自親水性。在吳加金等編的Goldkey軟件中,以六種參數(shù)Hopp-Woods,HPLC,Accessibility,F(xiàn)lexibility,Charge,Antigenivity綜合考慮,得出綜合判斷圖,閾值以上的峰即認(rèn)為是預(yù)測(cè)的抗原表位。