Bio.PDB.FragmentMapper模块

用Kolodny等人的片段文库对蛋白质骨架结构进行分类。

它可以看作是客观二级结构分类的一种形式。仅支持长度为5或7的片段(即,存在“中心”残基)。

完整参考资料:

Kolodny R,Koehl P,Guibas L,Levitt M.蛋白质片段的小文库精确地模拟了天然蛋白质结构。J·摩尔·比奥(J Mol Biol)2002年323(2):297-307

片段的定义文件可以从以下位置获得:

http://github.com/csblab/fragments/

您需要这些文件才能使用此模块。

下面的示例使用长度为5的10个片段的库。库文件可以在目录‘Fragment_Data’中找到。

>>> from Bio.PDB.PDBParser import PDBParser
>>> from Bio.PDB.FragmentMapper import FragmentMapper
>>> parser = PDBParser()
>>> structure = parser.get_structure("1a8o", "PDB/1A8O.pdb")
>>> model = structure[0]
>>> fm = FragmentMapper(model, lsize=10, flength=5, fdir="PDB")
>>> chain = model['A']
>>> res152 = chain[152]
>>> res157 = chain[157]
>>> res152 in fm # is res152 mapped? (fragment of a C-alpha polypeptide)
False
>>> res157 in fm # is res157 mapped? (fragment of a C-alpha polypeptide)
True
class Bio.PDB.FragmentMapper.Fragment(length, fid)

基类:object

代表多肽C-α片段。

__init__(length, fid)

初始化片段对象。

参数:
  • length (int) -- 片段的长度

  • fid (int) -- 片段的ID

get_resname_list()

拿到残留物清单。

返回:

残留物的名字

返回类型:

[string, string,...]

get_id()

获取片段的标识符。

返回:

片段的ID

返回类型:

int

get_coords()

获取碎片中的CA坐标。

返回:

片段中的CA坐标

返回类型:

Numeric (Nx3) array

add_residue(resname, ca_coord)

加入残留物。

参数:
  • resname (string) -- 残留物名称(例如Gly)。

  • ca_coord (Numeric array with length 3) -- 残基的c-α配位

__len__()

片段的返回长度。

__sub__(other)

在两个片段之间返回RMSD。

返回:

片段之间的RMSD

返回类型:

float

示例

这是一个不完整但具有说明性的示例:

rmsd = fragment1 - fragment2
__repr__()

将片段对象表示为字符串。

返回<Fragment Length=L id=ID>,其中L=片段长度,ID为标识符(在库中排名)。

class Bio.PDB.FragmentMapper.FragmentMapper(model, lsize=20, flength=5, fdir='.')

基类:object

将模型中的多肽映射到代表性片段列表。

__init__(model, lsize=20, flength=5, fdir='.')

创建FragmentMapper的实例。

参数:
  • model (L{Model}) -- 将映射的模型

  • lsize (int) -- 库中的片段数

  • flength (int) -- 库中片段的长度

  • fdir (string) -- 找到定义文件的目录(默认值=“.”)

__contains__(res)

检查给定的残留物是否在任何映射片段中。

__getitem__(res)

找个入口。

返回:

碎片分类

返回类型:

L{Fragment}