Bio.PDB.DSSP模块

使用DSSP程序计算二级结构和可访问性。

您需要有DSSP的工作版本(以及免费供学术使用的许可证)才能使用它。有关DSSP,请参阅http://swift.cmbi.ru.nl/gv/dssp/.

可以使用以下可访问表面积(ASA)值,默认为SANDER和ROST值:

米勒

Miller等人的研究成果。1987年https://doi.org/10.1016/0022-2836(87)90038-6

砂光机

桑德和罗斯特1994年https://doi.org/10.1002/prot.340200303

威尔克

Ten等人。2013年https://doi.org/10.1371/journal.pone.0080635

此处使用的二级结构的DSSP代码为:

代码

结构

H

α螺旋(4-12)

B

分离的β-桥基残留物

E

钢绞线

G

3-10个螺旋

I

PI螺旋

T

转弯

S

本德

-

用法

DSSP类可用于在PDB或mmCIF文件上运行DSSP,并提供DSSP二级结构和可访问性的句柄。

Note 该DSSP只能处理一个模型,并且只能对提供的PDB文件中的第一个模型运行计算。

示例

典型用法::

from Bio.PDB import PDBParser
from Bio.PDB.DSSP import DSSP
p = PDBParser()
structure = p.get_structure("1MOT", "/local-pdb/1mot.pdb")
model = structure[0]
dssp = DSSP(model, "/local-pdb/1mot.pdb")

请注意,DSSP-2软件包中最新的DSSP可执行文件已重命名为 dsspmkdssp 。如果使用最新的DSSP版本,您可能需要提供DSSP可执行文件的名称::

dssp = DSSP(model, '/local-pdb/1mot.pdb', dssp='mkdssp')

DSSP数据通过元组-(链ID,残基ID)::

a_key = list(dssp.keys())[2]
dssp[a_key]

为单个残基返回的dssp数据是以下形式的元组:

元组索引

价值

0

DSSP索引

1

氨基酸

2

二级结构

3

相对ASA

4

PHI

5

PSI

6

NH-->O_1_relidx

7

NH-->O_1_能

8

O-->NH_1_relidx

9

O-->NH_1能量

10

NH-->O_2_reldx

11

NH-->O_2能量

12

O-->NH_2_reldx

13

O-->NH_2能量

Bio.PDB.DSSP.ss_to_index(ss)

要索引的次要结构符号。

H=0 E=1 C=2

Bio.PDB.DSSP.dssp_dict_from_pdb_file(in_file, DSSP='dssp')

从PDB文件创建DSSP字典。

参数:
in_file字符串

PDB文件

DSSP字符串

DSSP可执行文件(子进程的参数)

退货:
(out_dict, keys)元组

将(链ID、残基)映射到氨基酸类型、二级结构代码和可访问性的字典。

示例

如何使用dssp_dict_frompdb_file::

from Bio.PDB.DSSP import dssp_dict_from_pdb_file
dssp_tuple = dssp_dict_from_pdb_file("/local-pdb/1fat.pdb")
dssp_dict = dssp_tuple[0]
print(dssp_dict['A',(' ', 1, ' ')])
Bio.PDB.DSSP.make_dssp_dict(filename)

DSSP字典将标识符映射到属性。

从DSSP文件返回映射(chainid、resid)到aa、ss和可访问性的DSSP字典。

参数:
filename字符串

DSSP输出文件

class Bio.PDB.DSSP.DSSP(model, in_file, dssp='dssp', acc_array='Sander', file_type='')

基类:AbstractResiduePropertyMap

运行DSSP并解析二级结构和可访问性。

在PDB/mmCIF文件上运行DSSP,并提供DSSP二级结构和可访问性的句柄。

Note 该DSSP只能处理一个型号。

示例

如何使用DSSP::

from Bio.PDB import PDBParser
from Bio.PDB.DSSP import DSSP
p = PDBParser()
structure = p.get_structure("1MOT", "/local-pdb/1mot.pdb")
model = structure[0]
dssp = DSSP(model, "/local-pdb/1mot.pdb")
# DSSP data is accessed by a tuple (chain_id, res_id)
a_key = list(dssp.keys())[2]
# (dssp index, amino acid, secondary structure, relative ASA, phi, psi,
# NH_O_1_relidx, NH_O_1_energy, O_NH_1_relidx, O_NH_1_energy,
# NH_O_2_relidx, NH_O_2_energy, O_NH_2_relidx, O_NH_2_energy)
dssp[a_key]
__init__(model, in_file, dssp='dssp', acc_array='Sander', file_type='')

创建一个DSSP对象。

参数:
model型号

结构的第一个模型

in_file字符串

PDB文件或DSSP文件。

dssp字符串

dssp可执行文件(即子进程的参数)

acc_array字符串

由Miller等人提供的可访问表面积(ASA)。(1987),Sander&Rost(1994),或Wilke:Ten et al.2013年,作为弦桑德/威尔克/米勒。默认为SANDER。

file_type: string

文件类型开关:PDB、MMCIF或DSSP。默认情况下从文件扩展名推断。