分子之心許錦波:生成式AI幫助高效設(shè)計(jì)出所需特殊功能的蛋白質(zhì)

AI能很好地預(yù)測單個(gè)蛋白質(zhì)結(jié)構(gòu),但蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測等很多問題還沒解決。
據(jù)IPO早知道消息,以“以終為始,致遠(yuǎn)盡微”為主題的2023紅杉全球醫(yī)療健康產(chǎn)業(yè)峰會于5月10日和11日在上海張江科學(xué)會堂成功舉辦。
在“AI蛋白生成引領(lǐng)生物科學(xué)新時(shí)代”主旨演講中,分子之心創(chuàng)始人、清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)卓越訪問教授許錦波分享了生成式AI生成蛋白質(zhì)的優(yōu)勢及發(fā)展程度。
AI對蛋白質(zhì)的研究在過去幾年發(fā)生了顛覆式影響。用AI去做蛋白質(zhì)的生成,相比傳統(tǒng)的基于物理學(xué)的方法或者實(shí)驗(yàn)方法,AI有非常多的優(yōu)點(diǎn),首先AI效率非常高;第二,用AI設(shè)計(jì)的蛋白質(zhì),成功率超過以前傳統(tǒng)的分子動力學(xué)模擬方法。
蛋白質(zhì)在細(xì)胞里有執(zhí)行功能,是細(xì)胞里面非常重要的一個(gè)大分子。蛋白質(zhì)在細(xì)胞里面會折疊成某一種特殊形狀,去執(zhí)行功能?!岸鞍踪|(zhì)的結(jié)構(gòu)是由氨基酸序列決定的,也就是說如果我們有了它的氨基酸序列,原則上來說,這個(gè)蛋白質(zhì)的結(jié)構(gòu)其實(shí)是確定的。我們想通過用計(jì)算的方法,而不是用濕實(shí)驗(yàn)的方法,去把這個(gè)蛋白質(zhì)里面所有的三維坐標(biāo)確定出來。”
從CASP發(fā)起人John Moult教授總結(jié)的圖表來看,科學(xué)家在用計(jì)算的方法預(yù)測蛋白質(zhì)三維結(jié)構(gòu)的30年中,2016年開始到2020年,使用AI技術(shù),可以把蛋白質(zhì)結(jié)構(gòu)預(yù)測精度從30幾分大幅提高到80幾分。
最近幾年,AI可以把單個(gè)蛋白質(zhì)預(yù)測做得非常好,改變了很多分子生物學(xué)家研究蛋白質(zhì)的行為方式。但還是有很多問題沒有解決。比如AlphaFold2可以預(yù)測單個(gè)蛋白質(zhì)結(jié)構(gòu),但是它在預(yù)測蛋白質(zhì)復(fù)合物結(jié)構(gòu)的時(shí)候效果不是那么好。AlphaFold2還有很多事情不能做,例如它本來只能做結(jié)構(gòu)預(yù)測,也就是氨基酸序列到三維坐標(biāo)的映射,不能用來做蛋白質(zhì)的優(yōu)化和設(shè)計(jì),也不能用來預(yù)測蛋白質(zhì)跟其他的分子,比如跟DNA、RNA、小分子的結(jié)合,我們要開發(fā)新的AI算法才能實(shí)現(xiàn)這些。
我們能不能通過AI去設(shè)計(jì)出自然界中不存在的蛋白質(zhì),找到一個(gè)結(jié)構(gòu)或功能都滿足特定需求的氨基酸序列?蛋白質(zhì)序列搜索空間巨大,如果我們想設(shè)計(jì)只有100個(gè)氨基酸的蛋白質(zhì),自然界有20種常見的氨基酸,這個(gè)空間是20的100次方。找到滿足我們需求的蛋白質(zhì)氨基酸序列相當(dāng)于大海撈針的過程。
蛋白質(zhì)設(shè)計(jì)在各行各業(yè)有很多的應(yīng)用,例如應(yīng)用在藥物設(shè)計(jì)上面,可以用AI方法設(shè)計(jì)抗體、結(jié)合蛋白等。而在合成生物學(xué)方面的應(yīng)用,常常包括用AI改造一個(gè)酶,甚至完全重新設(shè)計(jì)一個(gè)酶。
分子之心開發(fā)了AI蛋白優(yōu)化和設(shè)計(jì)平臺MolecureOS,以生成而非發(fā)現(xiàn)蛋白質(zhì)。平臺架構(gòu)包含基礎(chǔ)層、能力層、應(yīng)用層、產(chǎn)品層?;A(chǔ)層包含AI蛋白質(zhì)大模型及一些大的數(shù)據(jù)庫和算力支撐平臺,基礎(chǔ)層上面的各種下游功能模塊可以做單個(gè)蛋白質(zhì)結(jié)構(gòu)預(yù)測,也可以預(yù)測蛋白質(zhì)復(fù)合物結(jié)構(gòu)、抗體抗原如何結(jié)合等。分子之心在基于AI的蛋白質(zhì)從頭設(shè)計(jì)、基于AI的抗體抗原復(fù)合物預(yù)測、抗體CDR從頭設(shè)計(jì),基于AI的蛋白疫苗設(shè)計(jì)等場景都有了應(yīng)用產(chǎn)品并完成了一定的測試。例如,在給定抗體、抗原的結(jié)合表位,預(yù)測抗體抗原復(fù)合物結(jié)構(gòu)的應(yīng)用中,分子之心算法成功率為70%-80%,高于AlphaFold-Multiplier(約34%)的準(zhǔn)確度。
許錦波表示,AI不僅可以用來預(yù)測自然界里面蛋白質(zhì)的三維構(gòu)型,也可以用來產(chǎn)生各種各樣我們所需要的基于某種特殊功能的蛋白,“相信在不遠(yuǎn)的將來,AI可以用來產(chǎn)生一些大分子藥物。”
本文為IPO早知道原創(chuàng)
編輯|C叔
微信公眾號|ipozaozhidao