圖 1. 藥理活性分子從設(shè)計到知識交流和傳遞的開發(fā)過程[1]。
基于 AI 篩選的優(yōu)勢:
1. AI 算法可以篩選龐大的生物數(shù)據(jù)庫,以前所未有的速度和高精度識別潛在的藥物靶點。
2. 通過分析從基因組到臨床的所有數(shù)據(jù),AI 工具可以精確定位在疾病進(jìn)展中起關(guān)鍵作用的分子和生物途經(jīng),為研究人員提供關(guān)于潛在治療干預(yù)措施的寶貴見解。
3. 同時基于 AI 篩選技術(shù)對大型的化合物庫數(shù)據(jù)進(jìn)行快速的篩選,以識別最有可能與靶標(biāo)結(jié)合的化合物,這個過程曾經(jīng)耗時且成本高昂,現(xiàn)在可以在短時間內(nèi)完成,大大加快了藥物發(fā)現(xiàn)的步伐。
4. 此外,AI 驅(qū)動的預(yù)測模型可以幫助研究人員更準(zhǔn)確的評估候選藥物的有效性和安全性,從而指導(dǎo)優(yōu)先對哪些化合物進(jìn)行進(jìn)一步的優(yōu)化和測試。
02
基于 AI 的藥物發(fā)現(xiàn),如何應(yīng)用?
AI 輔助藥物研發(fā)成功案例
AI 在藥物發(fā)現(xiàn)中的潛力已經(jīng)在很多案例中得到證明。例如,Gupta,R. 等人 2021 年報道了基于已知癌癥相關(guān)化合物和相應(yīng)的生物活性的大型數(shù)據(jù)集訓(xùn)練了 DL (深度學(xué)習(xí)) 算法,結(jié)果獲得了具有癌癥治療潛力的新型化合物,證明了 AI 在發(fā)現(xiàn)新型候選藥物的能力[2]。
MEK 也是治療癌癥的潛在靶點,但是該靶點的有效抑制劑的開發(fā)一直具有挑戰(zhàn)性,Zhu,J 等人在 2021 年報道了通過訓(xùn)練 ML (機(jī)器學(xué)習(xí)) 算法,識別出這種蛋白質(zhì)的新型抑制劑[3]。另一個例子是通過使用 ML 算法發(fā)現(xiàn) β-分泌酶 (BACE1) 的新型抑制劑,BACE1 是一種參與阿爾茲海默癥的蛋白[4]。在 COVID-19 大流行期間,AI 的潛力顯得尤為突出,AI 算法被用于分析潛在的大型化合物數(shù)據(jù)集,并確定了最有可能對抗該病毒的化合物[5][6][7][8][9][10]。
本次 AI 大賽獲得一等獎的團(tuán)隊為上科大的 GeminiMol 團(tuán)隊,構(gòu)象空間是他們的一大亮點,該模型能夠識別 2D 結(jié)構(gòu)不相似,但 3D 構(gòu)象相似的潛在活性分子,有助于發(fā)現(xiàn)具有新穎結(jié)構(gòu)的先導(dǎo)化合物。該模型基于分子間構(gòu)象空間相似性對比學(xué)習(xí)來進(jìn)行訓(xùn)練,能夠表征藥物小分子的構(gòu)象空間特征,全面反映與分子結(jié)構(gòu)相關(guān)的分子屬性、潛在藥效性質(zhì)等,進(jìn)而在包括基于配體的虛擬篩選、靶標(biāo)鑒定、分子屬性預(yù)測等多種藥物發(fā)現(xiàn)任務(wù)上表現(xiàn)出均衡的優(yōu)良性能。
近日,該模型相關(guān)論文“Conformational Space Profiling Enhances Generic Molecular Representation for AI-powered Ligand-based Drug Discovery”已發(fā)布于國際期刊 Advanced Science 雜志。
未來,平臺將緊跟全球研發(fā)前沿,持續(xù)豐富專業(yè)資源與科研工具,提升視覺形象與用戶體驗,鏈接全球產(chǎn)業(yè)鏈資源,推進(jìn)產(chǎn)業(yè)提質(zhì)增效。在系統(tǒng)化、專業(yè)化、精益化的戰(zhàn)略引領(lǐng)下,平臺致力于打造適合科學(xué)研究領(lǐng)域的一站式藥物發(fā)現(xiàn)及研究服務(wù)平臺,構(gòu)建開放、公益的化合物信息共享平臺,為科學(xué)研究提供各種化合物與試劑,為科研工作者和學(xué)術(shù)界提供一個創(chuàng)新、高效、協(xié)作的平臺,為新藥研發(fā)提供智能化解決方案,更好推動科學(xué)發(fā)展和知識共享。
產(chǎn)品推薦 |
DNA 編碼化合物庫(DNA Encoded compound Library,DEL)技術(shù)作為新穎、強大的苗頭化合物發(fā)現(xiàn)引擎,可快速從幾千萬至數(shù)十億分子中,遴選出結(jié)構(gòu)新穎、具有潛在成藥性的化合物,大大縮短藥物研究周期,降低研發(fā)成本。在 DEL 庫中,每一個分子砌塊(Building Block)都由一段已知唯一的 DNA 序列進(jìn)行標(biāo)記,通過 DNA 兼容反應(yīng)和組合化學(xué)模式,歷經(jīng)數(shù)個循環(huán)即可獲得上億 DEL 分子。數(shù)十億化合物可以混合在一管中篩選,最終通過高通量測序技術(shù),解碼 DEL 分子的專屬 DNA 標(biāo)簽,快速獲得針對靶點的苗頭化合物信息。 |
50K Diversity Library (HY-L901) 由 50,000 種類藥化合物組成。本多樣性庫具備新穎性、類藥性,結(jié)構(gòu)多樣性等特點,庫中化合物可重復(fù)供應(yīng),是新藥研發(fā)的有力工具,可以廣泛地應(yīng)用于高通量篩選 (HTS) 和高內(nèi)涵篩選 (HCS)。 |
5K Scaffold Library(HY-L902) 由 5,000 種類藥化合物組成,每種化合物代表一種結(jié)構(gòu)骨架,最大程度保證了庫的結(jié)構(gòu)多樣性。庫中的化合物均經(jīng)過 MedChem & PAINS filters 篩選,剔除了不合適的化學(xué)結(jié)構(gòu),避免“目標(biāo)錯誤”。本庫化合物數(shù)量少但結(jié)構(gòu)足夠多樣,是藥物篩選的有力工具。 |
3D Diverse Fragment Library (HY-L903) 由 5,196 個非平面片段分子組成 (平均 Fsp3 值為 0.58),超過 4,700 個片段至少包含一個手性中心。本庫設(shè)計的關(guān)鍵元素是 3D 結(jié)構(gòu)、多樣性、生物反應(yīng)性等,有效提高了片段潛在生物活性,為基于片段的藥物發(fā)現(xiàn)提供了更高的片段命中概率。 |
Drug Fragment Library (HY-L904) MCE Drug Fragment Library 由 1,000 個藥物片段組成。這些藥物片段來自 2,946 個 FDA 已批準(zhǔn)的藥物分子,同一藥物的不同片段可以出現(xiàn)在其他藥物中,這些片段和 PK/PD 性質(zhì)存在一定的相關(guān)性,基于片段的篩選可以為后續(xù)優(yōu)化結(jié)構(gòu)預(yù)留出足夠的化學(xué)空間,該化合物庫是 FBDD(基于片段的藥物設(shè)計)藥物篩選的必備工具。 |
Natural Product-like Library (HY-L905) MCE Natural Product-like Compound Library 由 5,000 個來自類藥庫的類天然產(chǎn)物化合物組成,庫中每個分子含有天然產(chǎn)物關(guān)鍵骨架(42 個)或者和天然產(chǎn)物的谷本相似系數(shù)大于 0.6,且Natural-likeness scoring > -2,該化合物庫同時具備類藥性和新穎性,庫中化合物可重復(fù)供應(yīng),是新藥研發(fā)的有力工具,可以廣泛地應(yīng)用于高通量篩選 (HTS) 和高內(nèi)涵篩選 (HCS)。 |