最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

文心生物計算大模型重磅升級,構(gòu)象預(yù)測準(zhǔn)確度全面提升!

2023-11-15 14:04 作者:飛槳PaddlePaddle  | 我要投稿

文心生物計算大模型家族又迎來了重磅的升級:蛋白質(zhì)-小分子對接構(gòu)象預(yù)測模型HelixDock,以及蛋白-蛋白復(fù)合物結(jié)構(gòu)預(yù)測模型HelixFold-Multimer準(zhǔn)確度全面提升。這兩項(xiàng)新技術(shù)可以大幅提升蛋白質(zhì)-小分子的對接構(gòu)象及蛋白-蛋白復(fù)合物結(jié)構(gòu)預(yù)測的精度,為基于結(jié)構(gòu)的藥物設(shè)計奠定了扎實(shí)的基礎(chǔ)。

蛋白質(zhì)-小分子對接構(gòu)象預(yù)測模型HelixDock

蛋白質(zhì)-小分子對接構(gòu)象預(yù)測是小分子藥物發(fā)現(xiàn)的核心環(huán)節(jié)。傳統(tǒng)的分子對接工具(如LeDock,AutoDock Vina,Glide等)受限于有限的構(gòu)象采樣次數(shù)及粗糙的打分函數(shù),精度不足。當(dāng)前也有一些基于深度學(xué)習(xí)的技術(shù)(如Equibind,TankBind,DiffDock和Uni-Mol),其表現(xiàn)相比起傳統(tǒng)工具有提升,但這些模型在泛化能力與預(yù)測的結(jié)構(gòu)合法性上仍存在較大的問題。 百度飛槳螺旋槳團(tuán)隊(duì)通過構(gòu)建大規(guī)模的模擬數(shù)據(jù)集、升級基于幾何的神經(jīng)網(wǎng)絡(luò)等手段,構(gòu)建蛋白質(zhì)-小分子對接構(gòu)象預(yù)測模型HelixDock,大幅度提升了構(gòu)象預(yù)測的準(zhǔn)確度。在PDBBind core set上對比其他方法RMSD≤2?的比例高達(dá)89%(圖一)。在數(shù)據(jù)分布不一樣且更加難的數(shù)據(jù)集上(RCSB PDB中收集的最近的數(shù)據(jù)集Recent-PDB和PoseBusters基準(zhǔn)集),HelixDock的預(yù)測結(jié)果大幅度領(lǐng)先其他方法(圖二),也包括DeepMind最新公布的AlphaFold-lastest(圖三)。

圖一 PDBBind core set的對比效果

圖二 Recent PDB上的對比效果

圖三 在PoseBusters基準(zhǔn)集上達(dá)到業(yè)界最佳

對比AlphaFold-latest技術(shù)文檔中展示的的示例,HelixDock的預(yù)測結(jié)果也極具競爭力,在2個示例中預(yù)測結(jié)果明顯優(yōu)于AlphaFold-latest(圖四)。這充分體現(xiàn)出HelixDock的強(qiáng)泛化能力。

圖四 HelixDock vs AlphaFold-latest 在3個示例上的對比效果圖

更多結(jié)果詳見HelixDock文章:

https://arxiv.org/abs/2310.13913

蛋白-蛋白復(fù)合物結(jié)構(gòu)預(yù)測模型HelixFold-Multimer

在大分子藥物發(fā)現(xiàn)中,蛋白質(zhì)復(fù)合體的結(jié)構(gòu)預(yù)測發(fā)揮著至關(guān)重要的作用。無論是基于能量函數(shù)打分的對接工具(如ZDock和HDock),還是基于深度神經(jīng)網(wǎng)絡(luò)的對接方法(如Equidock和AlphaFold),精度上都有很大的提升空間。特別地,在與大分子藥物發(fā)現(xiàn)更相關(guān)的抗原-抗體和多肽-蛋白復(fù)合物的場景上,現(xiàn)有方法的準(zhǔn)確度都難以達(dá)到應(yīng)用狀態(tài)(一般認(rèn)為DockQ大于0.23即可用)。 鑒于此,百度飛槳螺旋槳團(tuán)隊(duì)研發(fā)了蛋白-蛋白復(fù)合物結(jié)構(gòu)預(yù)測模型HelixFold-Multimer,在抗原-抗體、多肽-蛋白等場景上取得了突破進(jìn)展,相比其他方法DockQ大幅提升。HelixFold-Multimer 在68例2022年10月后公開的Sabdab抗原-抗體測試數(shù)據(jù)上,單模型的DockQ達(dá)到0.49,多模型融合的DockQ達(dá)到0.5,成功率達(dá)到67.6%,遠(yuǎn)超其他已公開方法(圖五)。

圖五 HelixFold-Multimer在抗原-抗體復(fù)合物結(jié)構(gòu)預(yù)測的結(jié)果

在多肽-蛋白復(fù)合物結(jié)構(gòu)預(yù)測場景,選取PDB數(shù)據(jù)庫在2021年10月后發(fā)布的 61個多肽-蛋白復(fù)合體結(jié)構(gòu)數(shù)據(jù)進(jìn)行評估。單模型DockQ達(dá)到0.380,多模型融合的DockQ達(dá)到0.387,領(lǐng)先于其他結(jié)構(gòu)預(yù)測方法(圖六)。

圖六 HelixFold-Multimer 在多肽-蛋白復(fù)合物結(jié)構(gòu)預(yù)測的結(jié)果

示例:

示例1:

7VD7 沙門氏菌的毒素-抗毒素復(fù)合物,復(fù)合體構(gòu)象預(yù)測可以幫助理解毒素和抗毒素如何相互作用以調(diào)節(jié)細(xì)胞內(nèi)過程。Alphafold 2.3在紅色圈部分預(yù)測差異大,而 HelixFold-Multimer 預(yù)測得到了準(zhǔn)確的構(gòu)象(圖七)。

圖七:7VD7復(fù)合體預(yù)測結(jié)果

示例2:

7UA2 瘧疾傳播阻斷抗原Pfs230 domain 1 (Pfs230D1) 與納米抗體的復(fù)合體構(gòu)象,其中Pfs230D1是一種高功能活性的瘧疾傳播阻斷疫苗抗原,已在臨床試驗(yàn)中得到廣泛驗(yàn)證。7UA2復(fù)合體包含了Pfs230D1疫苗接種的受試者產(chǎn)生的人源單克隆抗體(hmAbs)和Pfs230D1構(gòu)象??梢钥吹?HelixFold-Multimer 預(yù)測的構(gòu)象(藍(lán)色)幾乎與真值重合,對接面的預(yù)測 DockQ也達(dá)到0.819,Interface RMSD為0.826 ?(圖八)。

圖八 7UA2復(fù)合體預(yù)測結(jié)果

很高興和大家分享文心生物計算大模型現(xiàn)階段已經(jīng)取得的進(jìn)展,同時我們也關(guān)注到了DeepMind最近公開的AlphaFold-latest的相關(guān)成果,但由于DeepMind并未開源,也未放出線上服務(wù),因此我們只能在公開可比的數(shù)據(jù)集上進(jìn)行了比較(詳見正文)。我們將于近期面向公眾開放 HelixDock和HelixFold-Multimer等相關(guān)工作的試用,敬請期待。同時我們也深知,AI技術(shù)的更迭日新月異,想要全面領(lǐng)先,就需要集結(jié)大家的力量。我們希望探索出一種新形式,將強(qiáng)大的底座模型能力開放給國內(nèi)的科研工作者們,以在更加廣泛的維度上推動生物計算領(lǐng)域的技術(shù)變革。也希望對此工作感興趣的專家學(xué)者與我們聯(lián)系,共同推進(jìn)生物計算大模型在應(yīng)用側(cè)的研究。 飛槳螺旋槳訪問地址:

https://paddlehelix.baidu.com/

聯(lián)系我們:

baidubio_cooperate@baidu.com

文心生物計算大模型重磅升級,構(gòu)象預(yù)測準(zhǔn)確度全面提升!的評論 (共 條)

分享到微博請遵守國家法律
亚东县| 巩义市| 叙永县| 湘西| 清河县| 锦州市| 宾川县| 长垣县| 怀柔区| 玛曲县| 九江市| 达孜县| 容城县| 云浮市| 太白县| 涞水县| 阳谷县| 芒康县| 泽州县| 重庆市| 常熟市| 东乌珠穆沁旗| 连州市| 柯坪县| 库车县| 克什克腾旗| 安康市| 阳曲县| 龙胜| 佛山市| 石渠县| 甘洛县| 南城县| 饶阳县| 亳州市| 辽宁省| 鞍山市| 黄石市| 金山区| 兴山县| 曲松县|