最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

一次性get!6種pdb文件獲取方式(附李繼存老師翻譯版)

2022-05-23 09:47 作者:唯理計(jì)算  | 我要投稿

在聊第一性原理計(jì)算課題的時(shí)候,相信大家一定不陌生的這句話就是,你有沒有這個(gè)材料的cif?


cif文件記錄了很多有價(jià)值的信息,但其實(shí)在第一性原理計(jì)算的過(guò)程中,最重要的信息其實(shí)只有原子坐標(biāo)位置晶胞參數(shù)比較重要。具體的cif文件包含了什么信息和如何獲取cif我們之前進(jìn)行了介紹,大家可以點(diǎn)擊鏈接查看

MS建模教程第二期——CIF文件的獲取
而在聊分子對(duì)接虛擬篩選、分子動(dòng)力學(xué)模擬等課題的時(shí)候,經(jīng)常有同學(xué)對(duì)于PDB文件是啥感到茫然。為何我都給出了測(cè)到的蛋白質(zhì)的序列,還需要提供什么PDB文件?


今天我們就來(lái)聊聊PDB文件。


1.PDB文件相關(guān)理論


序列只能提供蛋白質(zhì)一級(jí)結(jié)構(gòu)的相關(guān)信息,這個(gè)信息對(duì)于實(shí)際計(jì)算需求差太遠(yuǎn)了。一般可以通過(guò)同源模建、折疊類型識(shí)別和從頭預(yù)測(cè)等手段獲得預(yù)測(cè)的三維結(jié)構(gòu)。但一般來(lái)說(shuō)能有實(shí)驗(yàn)測(cè)到的結(jié)構(gòu)就別用預(yù)測(cè)得到的結(jié)構(gòu)。


說(shuō)句不太嚴(yán)謹(jǐn)?shù)脑?,蛋白質(zhì)的三級(jí)結(jié)構(gòu)某些情況下比起一級(jí)結(jié)構(gòu)序列更能決定蛋白質(zhì)的行為。同樣的序列假設(shè)可以通過(guò)一些手段呈現(xiàn)出跟原始的蛋白質(zhì)完全不同的折疊方式,那么很可能在生物體中呈現(xiàn)的是完全不同的效果。


如上圖,研究人員通過(guò)同源建模分析發(fā)現(xiàn)COVID-19受體結(jié)合結(jié)構(gòu)域的外部子結(jié)構(gòu)域與SARS-CoV十分相似,這表明COVID-19和SARS-CoV可能通過(guò)相同的受體入侵宿主細(xì)胞,即ACE2。
總之一句話,對(duì)于研究蛋白質(zhì)性質(zhì)的課題,都需要明確知道物質(zhì)結(jié)構(gòu)信息而非簡(jiǎn)單的序列信息。
PDB文件就是用來(lái)記錄蛋白質(zhì)結(jié)構(gòu)信息的文件。PDB文件的格式在下面網(wǎng)頁(yè)可以查看:http://www.wwpdb.org/documentation/file-format-content/format33/v3.3.html
本次推送的附件中也放上了PDB文件3.3版的PDF版說(shuō)明。
中文的簡(jiǎn)要說(shuō)明可以查看李繼存老師的博文:http://blog.sciencenet.cn/blog-548663-895916.html
PDB文件格式定義十分嚴(yán)格,甚至對(duì)每行定義中第N到第M個(gè)字符是什么都做出了定義。手動(dòng)修改PDB文件很可能會(huì)導(dǎo)致文件無(wú)法被嚴(yán)格遵循PDB語(yǔ)法的軟件讀取。不同的軟件在寫入的時(shí)候可能會(huì)因?yàn)閷懭胍?guī)則不同而導(dǎo)致保存的PDB文件不能被其他軟件識(shí)別使用。
大家可以看上面放出的鏈接自行研究一下相關(guān)字段的含義。這里帶領(lǐng)大家看一下ATOM字段,來(lái)學(xué)習(xí)一下怎么查看PDB的原始信息。
ATOM:http://www.wwpdb.org/documentation/file-format-content/format33/sect9.html#ATOM該字段是用來(lái)記錄原子信息的,每個(gè)PDB文件必有該字段。


這里同時(shí)附上李老師的翻譯版本:


大家根據(jù)下面的實(shí)際例子去理解一下


這個(gè)例子的前兩行是為了方便大家查看理解本例子,特地加上去定位用的,不會(huì)出現(xiàn)在實(shí)際的PDB文件中。
比如上面定義每行7-11的位置是留給原子序號(hào)的,當(dāng)前版本的PDB文件能夠支持的一個(gè)殘基中的原子最多只能為99999個(gè)。此時(shí)我們看原子序號(hào)才2位數(shù),不需要占用那么四個(gè)位置。再一看,李老師給的說(shuō)明是右對(duì)齊,那么只需要填充第10和第11空位就可以了。
然后再看13-16位是定義原子名的,13-14寫的是原子的元素名如果是C那就寫在14位,如果是Fe就寫在13-14位。看上面的例子,顯然我們知道,沒有一種元素叫做CZ。這時(shí)候看列數(shù)可知,C在13-14列,所以CZ指代的是碳元素。當(dāng)然這里的CA也不是鈣的意思,而是指碳。原子名稱后的字符是遠(yuǎn)程標(biāo)識(shí)符, 表示離氨基碳原子的遠(yuǎn)近, 含義如下:
A: α??B: βG: γD: δE: εZ: ζH: η
如果需要, 原子名稱的最后一個(gè)字符可以代表分支標(biāo)識(shí)符。
79-80的位置是電荷位置,一般寫作2+ ?1- ?這樣的格式,更多的時(shí)候這里是留空的。
以上啰嗦這么多只是為了向大家介紹一下PDB文件的查看規(guī)則和強(qiáng)迫癥一樣的列敏感寫入方式。


2.PDB文件獲取


以下部分參考了盧天老師的推文http://sobereva.com/43

0(孤獨(dú)求敗,故設(shè)為0)



RCSB PDB數(shù)據(jù)庫(kù):http://www.rcsb.org/pdb/home/home.do
簡(jiǎn)介:五星級(jí)重要的數(shù)據(jù)庫(kù),匯集實(shí)驗(yàn)表征以及少數(shù)由模擬預(yù)測(cè)方法獲得的蛋白質(zhì)/核酸結(jié)構(gòu),可下載或在線觀看。目前已經(jīng)收錄172560結(jié)構(gòu)(2020.12.16),每個(gè)結(jié)構(gòu)都有唯一的PDB ID。

01NCBI的結(jié)構(gòu)數(shù)據(jù)庫(kù):https://www.ncbi.nlm.nih.gov/protein/簡(jiǎn)介:該數(shù)據(jù)庫(kù)包含來(lái)自多種來(lái)源的蛋白質(zhì)序列記錄,包括GenPept,RefSeq,TPA,Swiss-Prot,PIR,PRF和PDB。其中不僅有測(cè)到的結(jié)構(gòu)數(shù)據(jù),還有一些從核酸序列翻譯而來(lái)的蛋白質(zhì)序列文件。


02PDBbind-CN:http://www.pdbbind.org.cn/index.asp簡(jiǎn)介:上海有機(jī)所維護(hù)的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)收集了RCSB數(shù)據(jù)庫(kù)中篩選出來(lái)的生物大分子復(fù)合物。包含蛋白質(zhì)-配體、核酸-配體、蛋白質(zhì)-核酸、蛋白質(zhì)-蛋白質(zhì)等復(fù)合物。目前有21382條記錄??梢栽诰€觀看或下載結(jié)構(gòu),可根據(jù)配體名稱、結(jié)構(gòu)搜索含有此配體的復(fù)合物。


03MOAD:http://www.bindingmoad.org簡(jiǎn)介:是RCSB數(shù)據(jù)庫(kù)的子集,專門收錄蛋白-配體復(fù)合物的信息,目前有38702蛋白質(zhì)-配體結(jié)構(gòu)??梢愿鶕?jù)配體,或者根據(jù)蛋白酶的EC分類、功能查詢。


04sc-PDB:http://bioinfo-pharma.u-strasbg.fr/scPDB簡(jiǎn)介:收集了RCSB數(shù)據(jù)庫(kù)中含有可以為藥物結(jié)合的位點(diǎn)的蛋白??筛鶕?jù)配體、蛋白、結(jié)合方式為特征進(jìn)行搜索。


05PDBTM跨膜蛋白質(zhì)數(shù)據(jù)庫(kù):http://pdbtm.enzim.hu簡(jiǎn)介:收集了RCSB蛋白質(zhì)數(shù)據(jù)庫(kù)中所有跨膜蛋白。

數(shù)據(jù)庫(kù)里搜索到的信息會(huì)有很多,比如在RCSB中搜索Hemoglobin會(huì)出現(xiàn)2500+命中數(shù)據(jù),具體該使用那種,還需要使用更精確關(guān)鍵詞進(jìn)行進(jìn)一步篩選。


*本期附件獲?。?br>公眾號(hào)后臺(tái)回復(fù)—20201218


一次性get!6種pdb文件獲取方式(附李繼存老師翻譯版)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
湘潭市| 寿宁县| 西吉县| 刚察县| 万安县| 秀山| 老河口市| 商城县| 桐城市| 玉溪市| 利辛县| 永吉县| 邢台市| 区。| 旺苍县| 龙山县| 响水县| 台山市| 文水县| 福鼎市| 永济市| 边坝县| 平潭县| 南木林县| 江山市| 房产| 慈溪市| 东安县| 丰宁| 玉龙| 南通市| 南漳县| 武宣县| 开阳县| 嫩江县| 新巴尔虎左旗| 儋州市| 米易县| 巫溪县| 白朗县| 巴南区|