藥物分子設(shè)計(jì)part3:看這一篇就夠了!全網(wǎng)最詳細(xì)分子對(duì)接教程?。ㄉ希?/h1>
小伙伴們大家好,在之前的分享中小果詳細(xì)地給大家介紹了小分子配體的準(zhǔn)備和蛋白結(jié)構(gòu)的處理,那么這一次小果就給大家?guī)砼潴w和蛋白的對(duì)接方法。廢話不多說,我們直接進(jìn)入正題~
什么是分子對(duì)接?
分子對(duì)接(Molecular docking)是一種計(jì)算方法,用于預(yù)測(cè)蛋白質(zhì)和小分子(配體)之間的結(jié)合方式和相互作用強(qiáng)度。它是藥物設(shè)計(jì)、生物活性研究和分子識(shí)別中重要的工具之一。 分子對(duì)接的目標(biāo)是預(yù)測(cè)蛋白質(zhì)和配體在空間上的最佳相互排列,以尋找穩(wěn)定的結(jié)合構(gòu)象和判斷結(jié)合強(qiáng)度。通過模擬這種結(jié)合過程,可以預(yù)測(cè)藥物候選物與靶蛋白的相互作用模式,為藥物發(fā)現(xiàn)和設(shè)計(jì)提供指導(dǎo)。
分子對(duì)接的步驟?
以下是小果給大家總結(jié)的分子對(duì)接一般步驟:
預(yù)處理
:準(zhǔn)備蛋白質(zhì)和配體的結(jié)構(gòu),包括去除水分子、離子等、修正構(gòu)象問題;添加氫原子等操作。這一步小果在之前的文章中給大家特別詳細(xì)地分享過如何使用Discovery Studio進(jìn)行操作,沒有看過的小伙伴們記得去看一看哦~
定義活性位點(diǎn)
:確定蛋白質(zhì)上可能與配體相互作用的區(qū)域,即活性位點(diǎn)(或稱受體結(jié)合位點(diǎn))?;钚晕稽c(diǎn)的選擇通常基于蛋白質(zhì)的結(jié)構(gòu)信息和相關(guān)生物活性數(shù)據(jù)。
定義搜索空間
:根據(jù)活性位點(diǎn)確定一個(gè)合理的搜索空間,限制配體的探索范圍,以提高計(jì)算效率。
對(duì)接搜索
:使用適當(dāng)?shù)姆肿訉?duì)接算法,在搜索空間內(nèi)進(jìn)行多個(gè)配體構(gòu)象的快速探索,并評(píng)估它們與蛋白質(zhì)的結(jié)合能。
結(jié)果分析和評(píng)估
:對(duì)對(duì)接結(jié)果進(jìn)行分析,包括預(yù)測(cè)的最佳配體構(gòu)象、結(jié)合位點(diǎn)和相互作用模式等。使用評(píng)分函數(shù)對(duì)不同構(gòu)象進(jìn)行評(píng)估,判斷其親和性和穩(wěn)定性。
結(jié)果優(yōu)化
:根據(jù)對(duì)接結(jié)果,可以進(jìn)行后續(xù)的結(jié)構(gòu)優(yōu)化,包括引入修飾基團(tuán)、設(shè)計(jì)藥物衍生物等,以進(jìn)一步改善結(jié)合親和性和選擇性。 小果提醒大家,在進(jìn)行分子對(duì)接時(shí),需要注意以下幾個(gè)方面:
活性位點(diǎn)準(zhǔn)確性
:活性位點(diǎn)定義的準(zhǔn)確性對(duì)于分子對(duì)接的結(jié)果至關(guān)重要。需要依賴蛋白質(zhì)結(jié)構(gòu)信息和生物活性數(shù)據(jù)來確定活性位點(diǎn)。
活性位點(diǎn)不完全等于受體結(jié)合位點(diǎn)
:活性位點(diǎn)和受體結(jié)合位點(diǎn)在大多數(shù)情況下是相互重疊的,指的是同一個(gè)區(qū)域或位置。然而,它們可能在以下情況下有所不同: 多個(gè)結(jié)合位點(diǎn):某些蛋白質(zhì)可能具有多個(gè)結(jié)合位點(diǎn),其中只有一個(gè)是活性位點(diǎn),其他位點(diǎn)可能與配體結(jié)合,但沒有明顯的生物活性。因此,活性位點(diǎn)是在多個(gè)結(jié)合位點(diǎn)中具有特定功能的子區(qū)域。 構(gòu)象變化:在某些情況下,蛋白質(zhì)可以通過構(gòu)象變化來改變其結(jié)合位點(diǎn)的位置或形狀。這可能導(dǎo)致活性位點(diǎn)和受體結(jié)合位點(diǎn)不完全重疊,因?yàn)樵谔囟?gòu)象下才能呈現(xiàn)出活性位點(diǎn)。 配體選擇性:某些蛋白質(zhì)可能具有與不同類別的配體結(jié)合的能力,并且這些配體與受體結(jié)合的位置可能略有不同。在這種情況下,活性位點(diǎn)可以指的是針對(duì)特定類別配體的優(yōu)先選擇區(qū)域。
靈活性處理
:蛋白質(zhì)和配體的靈活性(指它們?cè)诮Y(jié)合過程中可能發(fā)生的構(gòu)象變化或柔性運(yùn)動(dòng))在結(jié)合過程中起著重要作用,可以采用柔性對(duì)接方法或分子動(dòng)力學(xué)模擬等技術(shù)來考慮靈活性。 (注:蛋白質(zhì)的靈活性通常指的是蛋白質(zhì)的構(gòu)象變化能力。蛋白質(zhì)可以通過內(nèi)部構(gòu)象變化(如側(cè)鏈旋轉(zhuǎn)、片段移動(dòng)等)或整體構(gòu)象變化(如蛋白質(zhì)的收縮、延伸、折疊等)來適應(yīng)與配體的結(jié)合,這種靈活性是蛋白質(zhì)功能的重要基礎(chǔ),使得蛋白質(zhì)能夠與多種不同結(jié)構(gòu)和大小的配體發(fā)生結(jié)合。 而配體的靈活性通常指的是配體的構(gòu)象變化或柔性運(yùn)動(dòng)。配體可能是小分子藥物、底物或其他與蛋白質(zhì)相互作用的小分子。配體的靈活性意味著它可以通過構(gòu)象調(diào)整來適應(yīng)與蛋白質(zhì)的結(jié)合位點(diǎn)的形狀、電荷分布和其他特征。這種靈活性使得配體能夠與蛋白質(zhì)形成穩(wěn)定的結(jié)合,并發(fā)揮其生物活性或功能。)
參數(shù)設(shè)置
:選擇適當(dāng)?shù)乃惴ê蛥?shù)非常重要。不同的算法和評(píng)分函數(shù)可能適用于不同類型的結(jié)合系統(tǒng),需要根據(jù)具體情況進(jìn)行調(diào)整和驗(yàn)證。
結(jié)果解釋與驗(yàn)證
:分子對(duì)接結(jié)果應(yīng)當(dāng)謹(jǐn)慎解釋。在最高評(píng)分的結(jié)合模式下,仍然需要考慮實(shí)驗(yàn)驗(yàn)證和進(jìn)一步優(yōu)化。
實(shí)驗(yàn)驗(yàn)證
:分子對(duì)接是一種計(jì)算方法,在結(jié)果的解釋和驗(yàn)證方面需要與實(shí)驗(yàn)相結(jié)合。實(shí)驗(yàn)技術(shù)如結(jié)晶學(xué)、核磁共振等可以提供更準(zhǔn)確的結(jié)合模式和親和性信息。 相信大家已經(jīng)清楚了分子對(duì)接的基本步驟,那么小果現(xiàn)在就向大家介紹如何使用Discovery Studio進(jìn)行分子對(duì)接~
如何定義活性位點(diǎn)?
小果在之前的文章中給大家特別詳細(xì)地分享過如何使用Discovery Studio對(duì)小分子配體和蛋白結(jié)構(gòu)進(jìn)行處理,因此我們直接從定義活性位點(diǎn)這一步開始,沒有看過前面分享的小伙伴們記得去看一看哦~ 首先第一步我們需要將經(jīng)過預(yù)處理的蛋白定義為受體,具體位置如下圖所示:Receptor-Ligand Interactions>Define and Edit Binding Site>Define Receptor
這一步操作完成之后,我們要選擇定義哪里為活性位點(diǎn)。定義活性位點(diǎn)我們需要考慮以下幾個(gè)因素: 保守性氨基酸:在蛋白質(zhì)家族中,活性位點(diǎn)通常包含高度保守的氨基酸殘基,這些殘基在不同成員之間存在較低的變異率,這些氨基酸可能是關(guān)鍵的催化或配體結(jié)合殘基。例如,血紅蛋白家族中的活性位點(diǎn)通常包含高度保守的組氨酸殘基(His)和亮氨酸殘基(Leu)。 催化殘基:活性位點(diǎn)常包含一些特定的催化殘基,如親核殘基、酸或堿殘基等,這些催化殘基能夠參與催化反應(yīng)中的特定步驟,從而促進(jìn)催化活性。例如丙酮酸激酶(Acetolactate synthase)的活性位點(diǎn)包含Lys殘基,該殘基在催化反應(yīng)中起到堿催化的作用。 底物識(shí)別殘基:活性位點(diǎn)上的某些氨基酸殘基可能參與底物的識(shí)別和特異性結(jié)合,這些殘基可以通過氫鍵、疏水相互作用、離子相互作用等方式與底物分子發(fā)生相互作用。例如乳酸脫氫酶(Lactate dehydrogenase)的活性位點(diǎn)上的Arg殘基與底物丙酮酸之間形成氫鍵,從而識(shí)別并結(jié)合特定的底物。 金屬離子配位位點(diǎn):某些蛋白質(zhì)需要金屬離子來實(shí)現(xiàn)催化活性,活性位點(diǎn)中的特定氨基酸殘基可以形成金屬離子的配位位點(diǎn),從而穩(wěn)定金屬離子并參與催化過程。例如類胰島素樣生長(zhǎng)因子受體(Insulin-like growth factor receptor)的活性位點(diǎn)中通過His殘基形成的配位位點(diǎn)可以穩(wěn)定金屬離子,進(jìn)而參與催化過程。 氫鍵網(wǎng)絡(luò):活性位點(diǎn)中的氨基酸殘基可以通過氫鍵形成特定的網(wǎng)絡(luò)結(jié)構(gòu),這有助于保持位點(diǎn)的穩(wěn)定性和功能活性。例如乙醇脫氫酶(Alcohol dehydrogenase)的活性位點(diǎn)中的氨基酸殘基形成氫鍵網(wǎng)絡(luò),維持活性位點(diǎn)的穩(wěn)定性和催化活性。 疏水口袋:某些活性位點(diǎn)可能包含疏水口袋,能夠在催化過程中與疏水性底物或配體相互作用。例如乙酰膽堿酯酶(Acetylcholinesterase)的活性位點(diǎn)中的疏水口袋能夠與底物乙酰膽堿分子的疏水部分相互作用。 活性位點(diǎn)的拓?fù)涮卣鳎夯钚晕稽c(diǎn)的拓?fù)涮卣髦傅氖强臻g結(jié)構(gòu)和殘基之間的關(guān)系。例如,凹槽、隧道或開放的面積等特征可以影響底物分子的進(jìn)入和結(jié)合,蛋白酪氨酸激酶(Tyrosine kinase)的活性位點(diǎn)具有凹槽結(jié)構(gòu),該結(jié)構(gòu)能夠容納和定位底物分子,從而實(shí)現(xiàn)催化反應(yīng)。 這里可能有小伙伴反映說,參考這么多因素實(shí)在太麻煩了,我不需要做到這么完美,有沒有簡(jiǎn)單點(diǎn)的方法?那么小果在這里給大家兩個(gè)定義活性位點(diǎn)的建議: 首先,小伙伴們可以去查閱文獻(xiàn),關(guān)于這個(gè)蛋白是否有相應(yīng)的研究來報(bào)道最適合定義為活性位點(diǎn)的區(qū)域在哪里。 如果沒有相關(guān)的文獻(xiàn)怎么辦呢?小果再給大家推薦一個(gè)常用的方法,那就是通過Discovery Studio來分析哪里適合作為活性位點(diǎn): 具體的操作按鈕是Receptor-Ligand Interactions->Define and Edit Binding Site->From Receptor Cavities
想要深入了解的小伙伴可以查詢官方的文檔:
點(diǎn)擊之后等待一段時(shí)間,軟件會(huì)幫我們分析出推薦的位點(diǎn),展示在左側(cè),我們可以挨個(gè)勾選來進(jìn)行查看(注:紅球內(nèi)部即為活性位點(diǎn)): 全部位點(diǎn):
位點(diǎn)一:
位點(diǎn)二:
位點(diǎn)三:
如何查看活性位點(diǎn)?
上面的紅球叫做SBD(Shape-Based Descriptors),它是SBD方法中的一種基于形狀的描述符,用于表示分子的三維結(jié)構(gòu)和表面特征,即描述蛋白質(zhì)活性位點(diǎn)周圍的球形體積。在蛋白質(zhì)的活性位點(diǎn)中,通常存在著特定的空間要求和形狀特征,以適配與其相互作用的小分子配體。SBD_Site_Sphere通過將位點(diǎn)周圍的空間劃分為多個(gè)球形體積來描述活性位點(diǎn)的形狀特征。每個(gè)球形體積都可以具有不同的屬性,例如半徑、位置和物理化學(xué)特性。 通過使用SBD_Site_Sphere描述符,可以將蛋白質(zhì)活性位點(diǎn)的形狀信息轉(zhuǎn)化為數(shù)值化的表示,以便進(jìn)行計(jì)算和比較。這些描述符可用于藥物設(shè)計(jì)、虛擬篩選和活性位點(diǎn)預(yù)測(cè)等應(yīng)用。下面小果再教大家?guī)渍杏^察和調(diào)整SBD_Site_Sphere的方法: Show/Hide Site Spheres 可以控制是否顯示紅球
通過change site size下的contract和expand可以調(diào)整紅球的大?。?
我們也可以通過另一種方式調(diào)整紅球的參數(shù):選中紅球后點(diǎn)擊右鍵展開菜單欄,點(diǎn)擊attribute of 球體名稱
其中要注意的一點(diǎn)是,半徑的調(diào)整會(huì)對(duì)描述蛋白質(zhì)活性位點(diǎn)的形狀特征產(chǎn)生影響,并且直接影響后續(xù)對(duì)接的結(jié)果,因此需要十分的謹(jǐn)慎。它可能會(huì)導(dǎo)致以下幾個(gè)方面的變化: 捕捉到的空間范圍:通過調(diào)整半徑,可以增加或減少描述符所捕捉到的空間范圍。較小的半徑將僅考慮活性位點(diǎn)中的更局部區(qū)域,而較大的半徑將包括更廣泛的周圍空間。因此,選擇合適的半徑可以影響描述符對(duì)活性位點(diǎn)內(nèi)外空間的表征程度。 形狀特征的表示:調(diào)整半徑還會(huì)對(duì)活性位點(diǎn)的形狀特征進(jìn)行表示。較小的半徑可能更關(guān)注較細(xì)微的形狀細(xì)節(jié),而較大的半徑可能更關(guān)注整體形狀和空間分布。因此,半徑的調(diào)整可能會(huì)改變描述符對(duì)于活性位點(diǎn)形狀特征的表達(dá)方式。 配體相互作用的涵蓋程度:活性位點(diǎn)半徑的調(diào)整也會(huì)影響描述符對(duì)與配體相互作用相關(guān)的殘基或功能殘基的涵蓋程度。較小的半徑可能只包含位于活性位點(diǎn)核心的關(guān)鍵殘基,而較大的半徑可能還包括鄰近殘基。因此,調(diào)整半徑可以影響描述符對(duì)配體相互作用特征的表示。 計(jì)算效率和精確性的權(quán)衡:選擇合適的半徑還需要平衡計(jì)算效率和描述符精確性之間的關(guān)系。較小的半徑可能導(dǎo)致復(fù)雜的計(jì)算和較長(zhǎng)的計(jì)算時(shí)間,而較大的半徑可能會(huì)減少計(jì)算量但會(huì)喪失一些細(xì)節(jié)信息。因此,半徑的調(diào)整需要考慮計(jì)算資源和應(yīng)用需求之間的平衡。 因此,小伙伴們?cè)谶M(jìn)行 SBD_Site_Sphere 的半徑調(diào)整時(shí),有幾個(gè)注意事項(xiàng)需要考慮: 根據(jù)目標(biāo)蛋白質(zhì)的特性進(jìn)行調(diào)整:SBD_Site_Sphere 的半徑應(yīng)該根據(jù)目標(biāo)蛋白質(zhì)的結(jié)構(gòu)和功能進(jìn)行調(diào)整。不同的蛋白質(zhì)可能具有不同大小和形狀的活性位點(diǎn),因此需要根據(jù)具體情況進(jìn)行調(diào)整。 考慮與配體的相互作用:活性位點(diǎn)的半徑應(yīng)該適當(dāng)?shù)匕c配體相互作用的關(guān)鍵殘基或功能殘基。這樣可以確?;钚晕稽c(diǎn)的描述符能夠捕捉到蛋白質(zhì)和配體之間的相互作用特征。 平衡精確性和計(jì)算效率:調(diào)整半徑時(shí)需要平衡描述符的精確性和計(jì)算效率之間的關(guān)系。較小的半徑可以提供更精確的描述,但會(huì)增加計(jì)算復(fù)雜性。較大的半徑可以減少計(jì)算量,但可能會(huì)損失一些細(xì)節(jié)信息。需要根據(jù)具體需求進(jìn)行權(quán)衡選擇。 通過交叉驗(yàn)證進(jìn)行驗(yàn)證:為了確認(rèn)所選的半徑調(diào)整是否合適,可以使用交叉驗(yàn)證等方法進(jìn)行驗(yàn)證。將調(diào)整后的 SBD_Site_Sphere 描述符應(yīng)用于一組已知的蛋白質(zhì)-配體復(fù)合物,然后評(píng)估其預(yù)測(cè)性能和準(zhǔn)確性。 小果在這里建議初學(xué)的小伙伴們,如果沒有十分確定的合適參數(shù),保持軟件默認(rèn)的參數(shù)即可,可以通過change site size下的contract和expand進(jìn)行微調(diào),輕易不要大幅更改半徑參數(shù)。
分子對(duì)接如何操作?
首先,為了便于觀察蛋白,小果習(xí)慣第一步先讓蛋白線性顯示,具體調(diào)整方式如下:在黑色區(qū)域右鍵,點(diǎn)擊display style
隨后關(guān)閉蛋白的顯示并讓原子以線性方式顯示:
再關(guān)閉紅球的顯示
隨后我們打開處理好的小分子配體
然后就可以點(diǎn)開分子對(duì)接選項(xiàng)啦:Receptor-Ligand Interactions->Dock Ligands,可以看到這里有三種方式:Dock Ligands (LibDock)、Dock Ligands (GOLD)、Dock Ligands (CDOCKER)
小果在這里給大家簡(jiǎn)單介紹一下,"LibDock"、"GOLD"和"CDOCKER"是三種分子對(duì)接軟件,它們的介紹如下: "LibDock"是一種常用的基于晶格匹配和特征評(píng)分的對(duì)接方法,它使用小分子庫進(jìn)行高通量篩選,通過判斷分子與蛋白質(zhì)之間的親和力來預(yù)測(cè)結(jié)合能力和親合性。 "GOLD"(Genetic Optimization for Ligand Docking)是一種基于遺傳算法的對(duì)接程序,它通過在分子內(nèi)搜索合適的位姿和構(gòu)象來尋找最佳的配體-蛋白質(zhì)結(jié)合方式。"GOLD"使用分子力學(xué)力場(chǎng)和評(píng)分函數(shù)進(jìn)行評(píng)估,并利用遺傳算法進(jìn)行優(yōu)化。 "CDOCKER"(Chemical Docking)是一種基于藥物設(shè)計(jì)的自動(dòng)化對(duì)接軟件,它使用分子對(duì)接算法來預(yù)測(cè)小分子與蛋白質(zhì)之間的相互作用。"CDOCKER"使用的是一種基于能量和相互作用的評(píng)估指標(biāo),以確定最佳的配體-蛋白質(zhì)結(jié)合模式。 這里小果再對(duì)三種分子對(duì)接軟件的適用情況、特點(diǎn)和優(yōu)劣進(jìn)行簡(jiǎn)要說明: LibDock: ??適用情況:適用于高通量篩選,從大型小分子庫中快速篩選出可能的結(jié)合配體。 ??特點(diǎn):基于晶格匹配和特征評(píng)分,速度較快,適用于大規(guī)模篩選。 ??優(yōu)劣: –?優(yōu)點(diǎn):計(jì)算速度快,適用于高通量篩選;易于使用和實(shí)施。 –?缺點(diǎn):較簡(jiǎn)化的評(píng)分函數(shù),可能無法捕捉到復(fù)雜的相互作用;結(jié)果可能有一定誤差。 GOLD: ??適用情況:適用于預(yù)測(cè)精確的配體-蛋白質(zhì)結(jié)合位姿,并優(yōu)化配體的構(gòu)象。 ??特點(diǎn):基于遺傳算法,能夠搜索多種配體位姿和構(gòu)象,并通過評(píng)分函數(shù)進(jìn)行優(yōu)化。 ??優(yōu)劣: –?優(yōu)點(diǎn):能夠找到更準(zhǔn)確的配體結(jié)合位姿和構(gòu)象;適用于結(jié)合模式較復(fù)雜的系統(tǒng)。 –?缺點(diǎn):計(jì)算耗時(shí)較長(zhǎng);需要更多的參數(shù)和設(shè)置,較復(fù)雜。 CDOCKER: ??適用情況:適用于藥物設(shè)計(jì)和藥物優(yōu)化過程中的自動(dòng)化對(duì)接。 ??特點(diǎn):基于能量和相互作用評(píng)估配體-蛋白質(zhì)結(jié)合,支持分子力學(xué)模擬。 ??優(yōu)劣: –?優(yōu)點(diǎn):適用于藥物設(shè)計(jì)過程,能夠考慮能量和相互作用;能夠進(jìn)行分子力學(xué)模擬。 –?缺點(diǎn):需要較長(zhǎng)的計(jì)算時(shí)間;結(jié)果可能受到力場(chǎng)參數(shù)的影響。 感興趣的小伙伴可以去查閱官方文檔獲得更詳細(xì)的信息:
三種分子對(duì)接方法的操作方法對(duì)于我們使用者來說大同小異,這里小果就以CDOCKER為例向大家介紹: 點(diǎn)擊CDOCKER,參數(shù)Input Receptor 設(shè)置為蛋白名:蛋白名;參數(shù)Input Ligands 設(shè)置為小分子名:All;Input Site Sphere參數(shù)為定義好的活性位點(diǎn)的坐標(biāo); 小果提醒大家,其余參數(shù)根據(jù)自己的需求設(shè)置,沒有統(tǒng)一標(biāo)準(zhǔn),但每一項(xiàng)參數(shù)的設(shè)置都應(yīng)該十分謹(jǐn)慎,因?yàn)闀?huì)對(duì)后續(xù)研究造成很大的影響。例如,Top Hits 下的Pose Cluster Radius參數(shù)(指在分子對(duì)接過程中,用于對(duì)生成的配體位姿進(jìn)行聚類的半徑值,位于該半徑內(nèi)的位姿將被認(rèn)為是相似的,并被歸為同一類)一般設(shè)置的會(huì)較大一些,從而減少生成的位姿數(shù)量,這有助于提高研究效率并減少后續(xù)分析的復(fù)雜性。這里小果設(shè)置為了0.5.
參數(shù)設(shè)置完成后,點(diǎn)擊run等待一會(huì)即可。限于篇幅,分子對(duì)接的進(jìn)階內(nèi)容和結(jié)果分析小果會(huì)在下次分享中介紹,本次的分享就到這里啦,我們下次再見,拜拜~