本文原創(chuàng):克里斯 本文來(lái)源:細(xì)胞基因研究圈
近日,美國(guó)斯坦福大學(xué)計(jì)算機(jī)科學(xué)系Charlotte Bunne教授團(tuán)隊(duì)在國(guó)際知名期刊《Cell》發(fā)表了題為:How to build the virtual cell with artificial intelligence: Priorities and opportunities的研究文章。
文章開篇闡述了細(xì)胞作為生命基本單位的復(fù)雜性,指出其復(fù)雜性給物理和計(jì)算建模帶來(lái)了巨大挑戰(zhàn)。隨后,文章探討了當(dāng)前細(xì)胞模型的不足之處,并引入了AIVC(人工智能虛擬細(xì)胞)的概念。文章深入描述了AIVC的設(shè)計(jì)愿景,涵蓋其在不同生物尺度上的功能、評(píng)估體系、自洽性、可解釋性與生物學(xué)效用之間的平衡,以及推動(dòng)合作建模和確保倫理責(zé)任的框架。最后,文章強(qiáng)調(diào)了AIVC在生物工程、癌癥治療和精準(zhǔn)醫(yī)學(xué)中的潛在應(yīng)用價(jià)值,并倡導(dǎo)開展跨學(xué)科合作。
1、前言
研究背景
傳統(tǒng)細(xì)胞模型在模擬和預(yù)測(cè)細(xì)胞功能及行為時(shí)表現(xiàn)出明顯的局限性,難以全面捕捉細(xì)胞在時(shí)間和空間維度上的多尺度動(dòng)態(tài)變化以及復(fù)雜的生物分子相互作用。然而,隨著人工智能(AI)和組學(xué)技術(shù)的飛速發(fā)展,如今已具備了構(gòu)建能夠直接從數(shù)據(jù)中學(xué)習(xí)的新型細(xì)胞模型的條件。這些技術(shù)的突破為開發(fā)人工智能虛擬細(xì)胞(AIVC)帶來(lái)了前所未有的機(jī)遇。
研究設(shè)計(jì)
文章闡述了AIVC(人工智能虛擬細(xì)胞)實(shí)驗(yàn)設(shè)計(jì)的思路,旨在構(gòu)建一個(gè)綜合性的AI框架。該框架涵蓋多個(gè)相互連接的基礎(chǔ)模型,這些模型分別代表從分子到細(xì)胞、組織乃至更高級(jí)別的動(dòng)態(tài)生物系統(tǒng)。實(shí)驗(yàn)設(shè)計(jì)的核心包括開發(fā)一個(gè)通用的多模態(tài)、多尺度生物狀態(tài)表征,以及一系列虛擬儀器(VIs)。這些虛擬儀器本質(zhì)上是用于操作或解碼上述表征的神經(jīng)網(wǎng)絡(luò)。文章還探討了如何從分子層面入手,逐步構(gòu)建每個(gè)物理尺度的AIVC,并著重強(qiáng)調(diào)了數(shù)據(jù)生成、模型評(píng)估與解釋以及開放合作的關(guān)鍵性。
2、AVICs(人工智能虛擬細(xì)胞)
人工智能虛擬細(xì)胞(AIVC)是一個(gè)多尺度、多模態(tài)的大型神經(jīng)網(wǎng)絡(luò)模型,能夠模擬分子、細(xì)胞和組織在不同狀態(tài)下的動(dòng)態(tài)行為。AIVC的目標(biāo)是整合廣泛的細(xì)胞生物學(xué)知識(shí),以預(yù)測(cè)細(xì)胞功能、行為及其動(dòng)態(tài)變化,并能夠開展虛擬實(shí)驗(yàn)來(lái)生成和驗(yàn)證新的科學(xué)假設(shè)。該模型致力于構(gòu)建一個(gè)通用的生物狀態(tài)表征,涵蓋不同物種、數(shù)據(jù)模態(tài)、數(shù)據(jù)集和環(huán)境條件,包括多種細(xì)胞類型、發(fā)育階段以及外部條件。借助這種通用表征,AIVC有助于揭示細(xì)胞狀態(tài)的共性特征,并作為一個(gè)全面的參考框架,助力研究人員利用現(xiàn)有的生物學(xué)知識(shí)來(lái)關(guān)聯(lián)不同數(shù)據(jù)之間的聯(lián)系。
3、建立 AVIC
AIVC被設(shè)計(jì)為一個(gè)全面的人工智能框架,由多個(gè)相互連接的基礎(chǔ)模型構(gòu)成,這些模型能夠描述從分子層面到細(xì)胞、組織乃至更高級(jí)別的復(fù)雜生物系統(tǒng)中的動(dòng)態(tài)變化。該框架的核心要素是一個(gè)通用的多模態(tài)、多尺度生物狀態(tài)表征,以及一套虛擬儀器(VIs),這些儀器實(shí)際上是能夠操作或解碼這些表征的神經(jīng)網(wǎng)絡(luò)。
文章強(qiáng)調(diào)了從分子層面開始,逐步構(gòu)建每個(gè)物理尺度的AIVC的重要性,并探討了構(gòu)建每個(gè)物理尺度AIVC的設(shè)計(jì)原則及可用數(shù)據(jù)類型。這涵蓋了從單個(gè)分子到整個(gè)組織的模型,每個(gè)尺度都通過(guò)獨(dú)特的表征相互連接,從而在不同生物尺度之間實(shí)現(xiàn)一致性。通過(guò)這種多層次的表征方式,AIVC能夠無(wú)縫整合新數(shù)據(jù),并適應(yīng)新的生物學(xué)知識(shí),從而為生物醫(yī)學(xué)研究提供一個(gè)強(qiáng)大的工具。
4、模型升級(jí)
評(píng)估人工智能虛擬細(xì)胞(AIVC)模型需要一個(gè)全面且靈活的基準(zhǔn)框架。AIVC必須證明其在多種生物學(xué)環(huán)境和下游任務(wù)中的泛化能力,同時(shí)考慮由環(huán)境變化、感染、遺傳變異等因素引起的動(dòng)態(tài)分布變化。評(píng)估不僅要衡量模型在未見過(guò)的情境中的表現(xiàn),例如新的細(xì)胞類型和遺傳背景,還要評(píng)估其發(fā)現(xiàn)新生物學(xué)現(xiàn)象的能力。
AIVC模型的評(píng)估應(yīng)優(yōu)先考慮其生物學(xué)相關(guān)性的表現(xiàn),包括生成有價(jià)值的可測(cè)試假設(shè),以及是否能夠通過(guò)模型性能的統(tǒng)計(jì)度量或需要解釋性和生物學(xué)因果關(guān)系來(lái)充分評(píng)估。最終,AIVC模型的評(píng)價(jià)將基于其擴(kuò)展我們對(duì)生物學(xué)理解的能力,無(wú)論是提供新的生物學(xué)見解還是加速科學(xué)進(jìn)程。
5、可解釋性與交互性
在開發(fā)人工智能虛擬細(xì)胞(AIVC)的過(guò)程中,如何平衡模型的可解釋性與生物學(xué)效用是一個(gè)關(guān)鍵問(wèn)題。隨著深度學(xué)習(xí)在生物學(xué)領(lǐng)域的廣泛應(yīng)用,模型性能的提升常常伴隨著可解釋性的降低,即所謂的“黑箱”現(xiàn)象。然而,提升AIVC模型的可解釋性仍然是一個(gè)重要的目標(biāo),因?yàn)檫@有助于科學(xué)家理解模型預(yù)測(cè)背后的生物學(xué)機(jī)制,從而更有效地信任和應(yīng)用這些模型。構(gòu)建直觀的用戶界面至關(guān)重要,以便不同專業(yè)水平的研究人員能夠高效地理解和利用AIVC的預(yù)測(cè)結(jié)果。
此外,研究指出,利用大型語(yǔ)言模型(LLMs)作為虛擬研究助理,為非專家提供直觀的交互界面,幫助他們深入理解AIVC的預(yù)測(cè)結(jié)果,并進(jìn)一步探索其生物學(xué)意義。這種方法不僅能夠促進(jìn)跨學(xué)科合作,還能使更多研究人員受益于AIVC的強(qiáng)大功能。
6、開放協(xié)作方法
開發(fā)人工智能虛擬細(xì)胞(AIVC)需要采用開放且協(xié)作的方式。鑒于創(chuàng)建AIVC需要大量的資源投入、跨學(xué)科的專業(yè)知識(shí)以及多次迭代優(yōu)化,因此需要整個(gè)科學(xué)界的共同參與。文章倡導(dǎo)開放數(shù)據(jù)資源、統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)、搭建協(xié)作平臺(tái),以及共享基準(zhǔn)數(shù)據(jù)集和驗(yàn)證策略,以確保AIVC模型的生物學(xué)保真度和實(shí)際應(yīng)用價(jià)值。這種協(xié)作模式有助于加快個(gè)體研究的進(jìn)展,并將全球范圍內(nèi)的科學(xué)研究整合起來(lái)。
作者呼吁來(lái)自不同領(lǐng)域的利益相關(guān)者,包括學(xué)術(shù)界、生物制藥行業(yè)以及人工智能領(lǐng)域,開展預(yù)競(jìng)爭(zhēng)性合作,以加速AIVC的開發(fā)進(jìn)程。同時(shí),建議與監(jiān)管機(jī)構(gòu)和生物倫理專家合作,制定新的規(guī)范,以促進(jìn)AIVC的部署,確保其符合法律要求,并為虛擬細(xì)胞的負(fù)責(zé)任使用設(shè)定倫理標(biāo)準(zhǔn)。
7、未來(lái)前景
AIVC有潛力徹底變革生物醫(yī)學(xué)研究的模式,推動(dòng)我們?cè)趥(gè)性化醫(yī)療、藥物發(fā)現(xiàn)、細(xì)胞工程和可編程生物學(xué)等領(lǐng)域?qū)崿F(xiàn)重大突破。作為虛擬實(shí)驗(yàn)室,AIVC能夠促進(jìn)計(jì)算機(jī)系統(tǒng)、現(xiàn)代生成性人工智能與生物學(xué)之間的無(wú)縫銜接,使科學(xué)家能夠?qū)⒓?xì)胞視為信息處理系統(tǒng),并構(gòu)建生命的虛擬表征。
隨著AIVC對(duì)細(xì)胞和分子系統(tǒng)的理解不斷深化,科學(xué)家將能夠更高效地對(duì)這些系統(tǒng)進(jìn)行編程,并設(shè)計(jì)新的合成系統(tǒng)。AI模型已被用于設(shè)計(jì)新的CRISPR酶、功能性蛋白,甚至整個(gè)原核生物基因組。所有領(lǐng)域的利益相關(guān)者都應(yīng)積極參與這一宏偉的科學(xué)事業(yè)。我們堅(jiān)信,通過(guò)大規(guī)模的科學(xué)合作、共享目標(biāo)、開放的洞察力分享,以及安全、倫理和可靠的AI技術(shù)的應(yīng)用,我們正邁向一個(gè)科學(xué)探索和理解的新紀(jì)元。AI與生物學(xué)的融合,尤其是通過(guò)AIVC,標(biāo)志著生物學(xué)領(lǐng)域的一次范式轉(zhuǎn)變,并為解開細(xì)胞的多重謎團(tuán)帶來(lái)了樂(lè)觀的希望。
參考文獻(xiàn)
Bunne C, Roohani Y, Rosen Y, Gupta A, Zhang X, Roed M, Alexandrov T, AlQuraishi M, Brennan P, Burkhardt DB, Califano A, Cool J, Dernburg AF, Ewing K, Fox EB, Haury M, Herr AE, Horvitz E, Hsu PD, Jain V, Johnson GR, Kalil T, Kelley DR, Kelley SO, Kreshuk A, Mitchison T, Otte S, Shendure J, Sofroniew NJ, Theis F, Theodoris CV, Upadhyayula S, Valer M, Wang B, Xing E, Yeung-Levy S, Zitnik M, Karaletsos T, Regev A, Lundberg E, Leskovec J, Quake SR. How to build the virtual cell with artificial intelligence: Priorities and opportunities. Cell. 2024 Dec 12;187(25):7045-7063. doi: 10.1016/j.cell.2024.11.015. PMID: 39672099.