伽利略:實(shí)現(xiàn)三維藥效搜索,在化學(xué)庫(kù)中高效發(fā)現(xiàn)化合物的算法
今天為大家?guī)淼氖菨h堡大學(xué)Matthias Rarey教授的文章Galileo: Three?dimensional searching in large combinatorial fragment ?spaces on the example of pharmacophores。
摘要
片段空間利用小片段和連接規(guī)則可以有效地模擬大型化學(xué)空間。Enamine's REAL Space表明,通過這種方法可以創(chuàng)建大量隨時(shí)可用的化合物庫(kù)。然而,這些空間內(nèi)的導(dǎo)航和搜索主要局限于拓?fù)浞椒?。為了解決這一局限性,作者引入了新穎的遺傳算法伽利略(Galileo)。伽利略可以對(duì)片段空間進(jìn)行采樣,并與多種評(píng)分函數(shù)相結(jié)合。該方法與新穎的藥效映射技術(shù) Phariety 結(jié)合使用,可在片段空間內(nèi)進(jìn)行三維搜索。作者利用一個(gè)小型片段空間展示了伽利略的有效性,并將其應(yīng)用于 Enamine's REAL Space 中的藥效搜索,得到了數(shù)百種與 HSP90 和 FXIa 藥效相匹配的化合物。
方法
2.1 解決方案
受 Lauck 等人的啟發(fā),分子不再使用傳統(tǒng)的位向量,而是使用片段樹來表示。片段被描述為頂點(diǎn),代表連接原子的潛在連接點(diǎn)將它們連接起來。只有當(dāng)片段可以按照有效的連接規(guī)則進(jìn)行連接時(shí),兩個(gè)頂點(diǎn)才是相鄰的。這種表示方法可以容納通過片段組合產(chǎn)生的各種分子。

2.2 初始化
Population從隨機(jī)初始化開始,包括使用隨機(jī)生長(zhǎng)程序生成隨機(jī)片段樹。該程序通過選擇片段、枚舉其鏈接原子、尋找兼容片段并將其連接到片段樹上,直到片段樹達(dá)到飽和或達(dá)到預(yù)設(shè)的片段限制,從而迭代地將片段添加到片段樹上。

2.3 交叉
在兩個(gè)片段樹之間進(jìn)行交叉需要考慮連接規(guī)則的特殊性。由于連接規(guī)則數(shù)量龐大,直截了當(dāng)?shù)姆椒ㄍ鶡o法奏效。取而代之的是一種更為細(xì)致的方法。第一個(gè)片段樹中的每條邊都會(huì)被依次檢查,以尋找潛在的交叉點(diǎn)。在某條邊上剪切片段樹,然后從第二棵樹中找出兼容的邊(具有兼容的連接點(diǎn))。然后將這些邊緣作為第二棵樹的交叉點(diǎn)。這個(gè)過程通過合并兩棵父樹的子樹來生成有效的子樹。這種方法可以為每對(duì)父樹創(chuàng)建數(shù)量不等的子樹。
2.4 片段空間探索中的變異算子
本節(jié)概述在探索片段空間的遺傳算法(GA)框架中使用的三種變異操作符--替換、插入和刪除。替換:在替換突變中,片段樹中的單個(gè)片段(基因)被片段空間中的兼容片段替換。這一過程包括選擇一個(gè)片段,識(shí)別與其相鄰頂點(diǎn)兼容的片段,然后根據(jù)其與原始片段的相似度選擇一個(gè)片段。所選片段的鏈接原子分配將被確定,以確保有效的連接。這種突變旨在引入多樣性,同時(shí)保持片段之間的相似性。插入:插入突變通過隨機(jī)選擇一個(gè)鏈接原子或一條現(xiàn)有的邊,為片段樹引入一個(gè)新的末端片段。如果選擇的是鏈接原子,那么過程就是從該原子中生長(zhǎng)出一個(gè)新的末端片段,與初始化過程類似。如果選擇了一條邊,樹會(huì)在這條邊上被分割,然后使用替換法插入一個(gè)兼容的片段。刪除:當(dāng)片段從片段樹中刪除時(shí),就會(huì)發(fā)生刪除突變。如果片段是末端,或者有兩個(gè)相鄰的片段具有兼容的連接原子,就會(huì)發(fā)生這種情況。在后一種情況下,周圍的片段會(huì)使用現(xiàn)在可用的鏈接原子連接起來。
這些突變算子通過對(duì)片段樹中的單個(gè)片段引入變化來促進(jìn)片段空間的探索,從而使?jié)撛诮鉀Q方案的數(shù)量多樣化。
評(píng)分
伽利略提供了一個(gè)接口,用于整合符合特定標(biāo)準(zhǔn)的外部評(píng)分程序。這些程序必須可編寫腳本,接受 SDF 文件作為輸入,為分子分配正分?jǐn)?shù),并按照與輸入分子相同的順序輸出分?jǐn)?shù)。系統(tǒng)還提供內(nèi)置功能,如藥效圖譜(稍后介紹)和理化性質(zhì)建模。分子量、logP、氫鍵供體/受體、氮原子/氧原子和芳香環(huán)等屬性可用作評(píng)分標(biāo)準(zhǔn)。評(píng)分函數(shù)可以合并和加權(quán),合并分?jǐn)?shù)由歸一化加權(quán)分?jǐn)?shù)的線性組合計(jì)算得出。

藥效圖譜--Phariety
Phariety 是集成到伽利略系統(tǒng)中的藥效圖譜算法。它建立在NAOMI框架之上,用于在化合物庫(kù)中搜索三維藥效學(xué)匹配。該算法包括三個(gè)主要步驟:
預(yù)處理:?去除不合適的分子。使用 Conformator 生成分子的構(gòu)象。使用 NAOMI 相互作用模型確定相互作用類型(疏水相互作用、氫鍵供體/受體相互作用、芳香族相互作用、帶電基團(tuán)相互作用)。檢查相互作用點(diǎn)的兼容性,并允許部分映射。
映射算法:?查詢藥效特征點(diǎn)與候選分子相互作用點(diǎn)的映射是通過回溯式深度優(yōu)先行走來實(shí)現(xiàn)的。該算法試圖為每個(gè)查詢特征點(diǎn)找到兼容的相互作用點(diǎn),確保幾何和特征類型的兼容性。當(dāng)所有點(diǎn)都被映射或所有可能性都被窮盡時(shí),算法就會(huì)停止。
后過濾:?有效的映射需要經(jīng)過后過濾。對(duì)查詢藥效模型的約束條件進(jìn)行驗(yàn)證,包括距離偏差、方向角度偏差和排除體積重疊檢查。根據(jù)距離和方向偏差,為有效映射計(jì)算 [0, 1] 范圍內(nèi)的分?jǐn)?shù)。
該算法會(huì)返回候選分子的得分,以便用戶評(píng)估三維藥效學(xué)匹配的質(zhì)量。
總之,伽利略的評(píng)分機(jī)制涉及外部評(píng)分程序和內(nèi)置函數(shù)的整合。藥效庫(kù)映射算法 Phariety 提供了一種在化合物庫(kù)中進(jìn)行三維藥效庫(kù)搜索的方法,可評(píng)估候選分子與查詢藥效庫(kù)模型的匹配程度。
結(jié)果


1.Phariety基準(zhǔn)
- Phariety是一種集成到伽利略平臺(tái)中的藥效圖譜繪制算法,該算法以分子操作環(huán)境(MOE)為基準(zhǔn),用于基于藥效圖譜的虛擬篩選。
- 使用了兩種藥效模型:熱休克蛋白 90 (HSP90) 和因子 XIa (FXIa)。
- 就檢索到的先導(dǎo)化合物數(shù)目而言,Phariety 的表現(xiàn)與 MOE 相似,這證明了它在藥效圖譜方面的有效性。
2.伽利略驗(yàn)證
- 對(duì)三種已知藥物進(jìn)行了概念驗(yàn)證實(shí)驗(yàn),比伽利略與隨機(jī)抽樣的性能。- 隨著代數(shù)的增加,伽利略的性能比隨機(jī)抽樣有所提高,這證明了遺傳算法方法的有效性。
3.利用 Phariety 進(jìn)行三維藥效搜索
- Phariety 用于在完全枚舉的 ZB 樣本空間中搜索匹配的藥效。- 利用伽利略和 Phariety 作為擬合函數(shù),為 HSP90 和 FXIa 藥效優(yōu)化化合物。- 與隨機(jī)抽樣相比,伽利略在HSP90和FXIa藥效中檢索到的先導(dǎo)化合物數(shù)都比較合理,顯示了其在三維搜索中的有效性。- 雖然氫鍵特征的某些方向性方面具有挑戰(zhàn)性,但伽利略檢索到的先導(dǎo)化合物總體上符合藥效模型的要求。
4.先導(dǎo)化合物分布和得分分析
- 各次運(yùn)行的得分和先導(dǎo)化合物數(shù)分布情況表明,伽利略能夠針對(duì)給定的藥效模型生成多種多樣的相關(guān)先導(dǎo)化合物結(jié)果。- 評(píng)分函數(shù)中距離和方向項(xiàng)之間的平衡被認(rèn)為是獲得合理評(píng)分的關(guān)鍵。總之,實(shí)驗(yàn)凸顯了伽利略在三維藥效搜索和優(yōu)化方面的優(yōu)勢(shì)。與隨機(jī)抽樣相比,該平臺(tái)的性能有所提高,并有望生成具有理想藥效學(xué)特征的新藥。
參考資料:Meyenburg, C., Dolfus, U., Briem, H.?et al.?Galileo: Three-dimensional searching in large combinatorial fragment spaces on the example of pharmacophores.?J Comput Aided Mol Des?37, 1–16 (2023). https://doi.org/10.1007/s10822-022-00485-y
版權(quán)信息
本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點(diǎn)僅代表作者本人觀點(diǎn),不代表AIDD Pro平臺(tái),如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵?jǐn)_或者其他信息錯(cuò)誤解讀,請(qǐng)及時(shí)聯(lián)系A(chǔ)IDD Pro (請(qǐng)?zhí)砑游⑿盘?hào)sixiali_fox59)進(jìn)行刪改處理。
原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺(tái)。有問題可發(fā)郵件至sixiali@stonewise.cn