最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

(分子對接教程)選擇合適的蛋白受體20220602

2022-06-02 23:05 作者:菜鳥博士_雜貨鋪  | 我要投稿

(分子對接教程)選擇合適的蛋白受體20220602

菜鳥博士Caesar


蛋白質(zhì)的三級結(jié)構(gòu)是指整條多肽鏈的三維空間結(jié)構(gòu),也就是包括碳骨架和側(cè)鏈在內(nèi)的所有原子的空間排列。第一個蛋白質(zhì)的三維空間結(jié)構(gòu)于 1958 年用 X-射線衍射法(X-ray Crystallography)測定。這種方法目前仍然是獲取蛋白質(zhì)三級結(jié)構(gòu)的主要方法。PDB 數(shù)據(jù)庫中絕大多數(shù)蛋白質(zhì)結(jié)構(gòu)都是用這種方法測定的。另一個測定蛋白質(zhì)三維空間結(jié)構(gòu)的方法是核磁共振法(Nuclear Magnetic Resonance, NMR)。無法結(jié)晶的蛋白質(zhì),可以利用核磁共振法在液體環(huán)境中進(jìn)行結(jié)構(gòu)測定。但是核磁共振法只能用于質(zhì)量小于 70 千道爾頓的分子,大約對應(yīng) 200 個氨基酸的長度。除此之外,還有一些不太常用的方法也可以測定分子的三維空間結(jié)構(gòu),比如冷凍電子顯微鏡技術(shù)(Cyro-Electron Microscopy)。無論用什么方法測定的空間結(jié)構(gòu),都要提交到 PDB 數(shù)據(jù)庫。所以我們獲取蛋白質(zhì)三級結(jié)構(gòu)最直接的辦法就是去PDB 搜索(rcsb.org/)。

從PDB首頁的搜索條里,可以通過搜索PDB ID、分子名稱、作者姓名等關(guān)鍵詞來查找蛋白質(zhì)三級結(jié)構(gòu)。此外,利用高級搜索工具,可以通過序列相似性搜索獲得與輸入序列在序列水平上相似的蛋白質(zhì)的三級結(jié)構(gòu)。搜索方法選 BLAST,輸入序列,點擊“Result Count”。這里不詳細(xì)介紹,因為我們做分子對接,通常蛋白名稱是已知的。我們重點介紹怎么選擇合適的蛋白結(jié)構(gòu)文件。

比如我們搜索PI3K這個蛋白,結(jié)果是有很多的??梢钥吹接?93個結(jié)構(gòu)信息。

首先我們可以通過左邊的欄進(jìn)行篩選,比如物種信息,我們選擇人。當(dāng)然,結(jié)果的顯示排序可通過結(jié)果上面的選項卡進(jìn)行選擇不同的排序方式。我們篩選合適的蛋白結(jié)構(gòu),常用Score這個選項。

我們選擇分辨率較好的在前。這里的0.9?,?是光波長度和分子直徑的常用計量單位,值越小,分辨率越高,結(jié)構(gòu)越準(zhǔn)確。頁面往下拉,可以看見這個值越來越大,我們優(yōu)先選擇值小的。我們可以從頁面里面看見一下基本信息,比如方法,物種以及被解析的時間等。這里5GJI這個結(jié)構(gòu)獲取的方法就是X-RAY。

我們點擊這個蛋白,進(jìn)入后可以看見詳細(xì)的信息。

然后我們還要看這個蛋白的描述是不是我們想要的蛋白,從這里面感覺看起來比較費勁。這里我們借助uniprot這個數(shù)據(jù)庫來選擇是比較方便的。這里簡單介紹一下這個數(shù)據(jù)庫,可能有的同學(xué)是第一次知道。翻了多年前的筆記,粘貼在下面。
UniProt 數(shù)據(jù)庫有三個層次。
第一層叫 UniParc,收錄了所有 UniProt 數(shù)據(jù)庫子庫中的蛋白質(zhì)序列,量大,粗糙。
第二層是 UniRef,他歸納了 UniProt 幾個主要數(shù)據(jù)庫并且是將重復(fù)序列去除后的數(shù)據(jù)庫。
第三層是 UniProtKB,他有詳細(xì)注釋并與其他數(shù)據(jù)庫有鏈接,分為 UniProtKB 下的 Swiss-Prot和 UniProtKB 下的 TrEMBL 數(shù)據(jù)庫。
關(guān)系稍有點復(fù)雜,但實際上我們最常用的就是 UniProtKB下的 Swiss-Prot 數(shù)據(jù)庫。
從 UniProt 數(shù)據(jù)庫查看一條蛋白質(zhì)序列(uniprot.org/)。在UniProt數(shù)據(jù)庫的首頁上有一個關(guān)于 UniProtKB 數(shù)據(jù)庫的統(tǒng)計表??梢钥吹?,TrEMBL 數(shù)據(jù)庫里存儲的序列數(shù)量遠(yuǎn)遠(yuǎn)大于 Swiss-Prot 中的。統(tǒng)計表里清楚的寫著:TrEMBL 是自動注釋的,沒有經(jīng)過檢查,而 Swiss-Prot 是人工注釋的,并且經(jīng)過檢查。

UniProt 數(shù)據(jù)庫的首頁上也有一個搜索條,選擇UniprotKB 數(shù)據(jù)庫,然后輸入“human dutpase”,第一條就是我們要的。Entry 這一列是蛋白質(zhì)序列在 UniProtKB 數(shù)據(jù)庫中的檢索號,Entry_Name 是檢索名,檢索號與檢索名平行運行,都是一條序列在數(shù)據(jù)庫中的唯一標(biāo)識,兩者作用相同,只是寫法不同。從檢索名可以更直觀的知道是哪個物種的什么蛋白質(zhì)。從加星文檔圖標(biāo)(Entry_Name后一列)我們可以獲知序列是被人工檢查過的還是沒有。也就是說,有加星文檔圖標(biāo)的是 Swiss-Prot 中的數(shù)據(jù),沒有的是 TrEMBL 里的。后面這幾列,依次是蛋白質(zhì)的名字,編碼這一蛋白質(zhì)的基因的名字,所屬物種以及序列長度。點擊第一條序列的檢索號,打開這條數(shù)據(jù)庫記錄。

UniProtKB 中的數(shù)據(jù)庫記錄分成幾個部分,左側(cè)是注釋標(biāo)簽,點擊其中某一個標(biāo)簽可以直接跳轉(zhuǎn)到該部分注釋。上方是工具標(biāo)簽,可以用于和其他序列進(jìn)行比較,格式轉(zhuǎn)換,存儲等。工具標(biāo)簽下方是這條蛋白質(zhì)序列的基本信息,蛋白質(zhì)的名字,基因的名字,所屬物種,以及狀態(tài)。這里有加星文檔圖標(biāo),是被人工檢查過的,應(yīng)該屬于 Swiss-Prot 數(shù)據(jù)庫。注釋打分 5 星,說明注釋得很全面,并且這些注釋在蛋白質(zhì)水平上有實驗依據(jù)。
Function:功能這部分注釋很詳細(xì)的說明了這個蛋白質(zhì)的功能。從這里可以得知dUTPase 是一種在核酸代謝過程中的酶、它的催化反應(yīng)方程式、它的輔助因子、它參與的代謝途徑等。每條注釋信息都提供出處來源,讓你有據(jù)可查。
Names & Taxomomy:?給出了蛋白質(zhì)的各種名字,包括全稱、縮寫以及別名。還列出了所屬物種以及該物種的分類學(xué)譜系等。
Subcellular location:提供蛋白質(zhì)亞細(xì)胞定位(subcellular localization)的信息。目前,研究亞細(xì)胞定位的數(shù)據(jù)來源基本都是Swiss-Prot 數(shù)據(jù)庫。

Pathology & Biotechnology:提供蛋白質(zhì)突變或缺失導(dǎo)致的疾病及表型信息。
PTM/Processing:提供蛋白質(zhì)翻譯后修飾或翻譯后加工的相關(guān)信息。
Expression:提供了基因在 mRNA 水平上的表達(dá)信息,或者在細(xì)胞中蛋白質(zhì)水平上的表達(dá)信息,或者在不同器官組織中的表達(dá)信息。
Interaction:提供了蛋白質(zhì)之間相互作用的信息。包括 UniProtKB 中直接與這個蛋白質(zhì)有兩兩相互作用的蛋白質(zhì)序列的鏈接,以及這個蛋白質(zhì)在各種蛋白質(zhì)相互作用數(shù)據(jù)庫或蛋白質(zhì)網(wǎng)絡(luò)數(shù)據(jù)庫中涉及的數(shù)據(jù)庫記錄鏈接。
Structure:提供蛋白質(zhì)二級結(jié)構(gòu)和三級結(jié)構(gòu)信息。只有那些已通過實驗方法測定三級結(jié)構(gòu)并且已提交到蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫 PDB 的蛋白質(zhì)才有結(jié)構(gòu)注釋。二級結(jié)構(gòu)以圖形拓?fù)涞男问匠尸F(xiàn)。三級結(jié)構(gòu)列出了該蛋白質(zhì)在蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫 PDB 中涉及的數(shù)據(jù)庫記錄鏈接。這些結(jié)構(gòu)經(jīng)常只對應(yīng)蛋白質(zhì)的部分序列。
Family & Domains:提供蛋白質(zhì)家族及結(jié)構(gòu)域信息。
Sequence:提供蛋白質(zhì)氨基酸序列信息。含有多個異構(gòu)體的蛋白質(zhì)會顯示多條序列。
Cross-references:列出了所有通往其他含有該蛋白質(zhì)信息的數(shù)據(jù)庫的鏈接。
Publications:列出了有關(guān)這個蛋白質(zhì)已發(fā)表的所有文獻(xiàn)的信息。
Entry information:提供有關(guān)這條數(shù)據(jù)庫記錄的錄入信息,外加一個免責(zé)聲明。
Miscellaneous:雜項,包含任何無法歸入前幾項的內(nèi)容。
Similar Proteins:在 UniRef 數(shù)據(jù)庫里找到與該蛋白質(zhì)在序列水平上相似的其他蛋白質(zhì),并按相似度高低分組。
好了我們接著前面的介紹。我們在uniprot的搜索框中輸入關(guān)鍵詞,左側(cè)選擇相應(yīng)的物種。

新頁面下直接選擇Structure。左邊就是顯示結(jié)果,有一個列表給我們快速查看相關(guān)參數(shù)??梢愿鶕?jù)這些參數(shù)選擇合適的結(jié)構(gòu),注意positions這一欄,我們首先選擇resolution小的,但結(jié)構(gòu)不是我們要的,就不行,resolution這一欄只是該結(jié)構(gòu)只是該蛋白的序列區(qū)段,比如這里1-143這一段氨基酸序列是不在該結(jié)構(gòu)中的。我們需要根據(jù)一些文獻(xiàn)知識,了解一般配體所在的部位即相關(guān)活性位點。有沒有已知的結(jié)合區(qū)域來參考選擇,我個人認(rèn)為,如果不知道,越長的越好。有的還是多條肽鏈的復(fù)合物,如果是二聚體的,后面對接可以刪除一個??傊?,需要先了解這些所解析的晶體結(jié)構(gòu)是否已經(jīng)包含了擬對接分子的潛在結(jié)合位點,已知的配體和我們要對接的分子結(jié)構(gòu)相似度。越相似越好,還需注意晶體結(jié)構(gòu)中蛋白序列是否為野生型、是否含有PTM、是否存在有可能引起構(gòu)象變化的特殊有機(jī)溶劑和別構(gòu)效應(yīng)分子等。如果系列晶體結(jié)構(gòu)的性質(zhì)都類似,選擇分辨率最高的。

點擊鏈接欄中的PDB,就可以直接進(jìn)入該結(jié)構(gòu)的PDB頁面了,然后點擊下載文件就可以直接下載PDB格式的蛋白結(jié)構(gòu)文件。下載的PDB文件可以用pymol或者VMD觀察結(jié)構(gòu)。能夠?qū)崿F(xiàn)蛋白質(zhì)三維結(jié)構(gòu)可視化的軟件非常多。比專業(yè)級的PyMOL(pymol.org/2/)。這個軟件已經(jīng)被世界上著名的生物醫(yī)藥軟件公司“薛定諤公司(Schr?dinger)”收購。這種專業(yè)級的可視化軟件不僅能夠做出非常漂亮的圖片,它還有強(qiáng)大的插件支持各種各樣的蛋白質(zhì)結(jié)構(gòu)分析,這款軟件需要購買,如果你發(fā)表的文章里提到某些內(nèi)容是使用PyMOL制作的,而文章中所有作者和作者單位都沒有PyMOL的購買記錄的話,你可能會面臨薛定諤公司的追責(zé)。
下面給大家介紹一個功能同樣強(qiáng)大的免費蛋白質(zhì)三維結(jié)構(gòu)可視化軟件,VMD(ks.uiuc.edu/Research/vm)。VMD由伊利諾伊大學(xué)研發(fā)。下載 VMD 需要先注冊獲得一個賬戶,之后就可以根據(jù)你的操作系統(tǒng)和機(jī)器配置選擇合適的版本下載了。當(dāng)然,注冊和下載對于非商業(yè)用途的用戶都是免費的。VMD 的安裝也極其簡單。不需要預(yù)裝任何語言環(huán)境,完全圖形化安裝過程,絕對可以輕松搞定。

最后,這些都是在蛋白結(jié)構(gòu)已知的蛋白分子對接,如果我們要對接的蛋白,沒有晶體結(jié)構(gòu),在PDB中是檢索不到的,在UniProt 中的Structure是不會顯示的。比如DRAM1這個蛋白,是沒有結(jié)構(gòu)的,所以在UniProt 中的Structure是灰色。

如果要對接的蛋白沒有結(jié)構(gòu),我們又要對接,那就只能是自己通過軟件預(yù)測了。蛋白質(zhì)結(jié)構(gòu)預(yù)測的方法有從頭計算法,同源建模法,穿線法和綜合法。常用的是同源建模法,SWISS-MODEL(swissmodel.expasy.org)就是一款用同源建模法預(yù)測蛋白質(zhì)三級結(jié)構(gòu)的全自動軟件,這里不詳細(xì)介紹了,預(yù)測的模型還要涉及模型好壞的評價,后續(xù)有時間,再介紹蛋白質(zhì)三級結(jié)構(gòu)的預(yù)測。


(分子對接教程)選擇合適的蛋白受體20220602的評論 (共 條)

分享到微博請遵守國家法律
琼海市| 奈曼旗| 若羌县| 景东| 湛江市| 新闻| 永州市| 琼结县| 澳门| 唐河县| 莱芜市| 阿拉善右旗| 西青区| 上蔡县| 桃园县| 叶城县| 六枝特区| 蓬溪县| 林周县| 大埔县| 长泰县| 交口县| 靖江市| 池州市| 邯郸市| 镇康县| 修水县| 察隅县| 靖宇县| 秀山| 山西省| 华池县| 崇信县| 九龙县| 尉犁县| 当阳市| 阳西县| 聂拉木县| 永清县| 黔南| 沧州市|