Bio.PDB多肽模块

多肽相关类(构造和表示)。

具有多个链的简单示例,

>>> from Bio.PDB.PDBParser import PDBParser
>>> from Bio.PDB.Polypeptide import PPBuilder
>>> structure = PDBParser().get_structure('2BEG', 'PDB/2BEG.pdb')
>>> ppb=PPBuilder()
>>> for pp in ppb.build_peptides(structure):
...     print(pp.get_sequence())
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA

在PDB文件中使用HETATM行的非标准氨基酸示例,在本例中为硒蛋氨酸(MSE):

>>> from Bio.PDB.PDBParser import PDBParser
>>> from Bio.PDB.Polypeptide import PPBuilder
>>> structure = PDBParser().get_structure('1A8O', 'PDB/1A8O.pdb')
>>> ppb=PPBuilder()
>>> for pp in ppb.build_peptides(structure):
...     print(pp.get_sequence())
DIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNW
TETLLVQNANPDCKTILKALGPGATLEE
TACQG

如果你愿意,你可以在肽中加入非标准氨基酸:

>>> for pp in ppb.build_peptides(structure, aa_only=False):
...     print(pp.get_sequence())
...     print("%s %s" % (pp.get_sequence()[0], pp[0].get_resname()))
...     print("%s %s" % (pp.get_sequence()[-7], pp[-7].get_resname()))
...     print("%s %s" % (pp.get_sequence()[-6], pp[-6].get_resname()))
MDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPGATLEEMMTACQG
M MSE
M MSE
M MSE

在这种情况下,硒蛋氨酸(倒数第七个和倒数第六个残基)通过GET_Sequence方法显示为M(蛋氨酸)。

Bio.PDB.Polypeptide.index_to_one(index)

对应一个字母的氨基酸名称的索引。

>>> index_to_one(0)
'A'
>>> index_to_one(19)
'Y'
Bio.PDB.Polypeptide.one_to_index(s)

要索引的一个字母代码。

>>> one_to_index('A')
0
>>> one_to_index('Y')
19
Bio.PDB.Polypeptide.index_to_three(i)

索引对应的三个字母的氨基酸名称。

>>> index_to_three(0)
'ALA'
>>> index_to_three(19)
'TYR'
Bio.PDB.Polypeptide.three_to_index(s)

索引的三个字母代码。

>>> three_to_index('ALA')
0
>>> three_to_index('TYR')
19
Bio.PDB.Polypeptide.three_to_one(s)

三个字母代码对应一个字母代码。

>>> three_to_one('ALA')
'A'
>>> three_to_one('TYR')
'Y'

对于非标准氨基酸,您会得到一个KeyError:

>>> three_to_one('MSE')
Traceback (most recent call last):
   ...
KeyError: 'MSE'
Bio.PDB.Polypeptide.one_to_three(s)

一个字母代码到三个字母代码。

>>> one_to_three('A')
'ALA'
>>> one_to_three('Y')
'TYR'
Bio.PDB.Polypeptide.is_aa(residue, standard=False)

如果残基对象/字符串是氨基酸,则返回True。

参数:
  • residue (L{Residue} or string) -- L{残基}对象或三个字母的氨基酸编码

  • standard (boolean) -- 检查20个AA的标志(默认值为FALSE)

>>> is_aa('ALA')
True

支持已知的用于修饰氨基酸的三个字母代码,

>>> is_aa('FME')
True
>>> is_aa('FME', standard=True)
False
class Bio.PDB.Polypeptide.Polypeptide(iterable=(), /)

基类:list

多肽仅仅是L{残基}个对象的列表。

get_ca_list()

获取多肽中C-α原子的列表。

返回:

C-α原子的列表

返回类型:

[L{Atom}, L{Atom}, ...]

get_phi_psi_list()

返回φ/psi二面角的列表。

get_tau_list()

所有4个连续的Calpha原子的tau扭角列表。

get_theta_list()

所有3个连续Calpha原子的θ角列表。

get_sequence()

将AA序列作为Seq对象返回。

返回:

多肽序列

返回类型:

L{Seq}

__repr__()

返回多肽的字符串表示形式。

返回<多肽start=start end=end>,其中start和end是外部残基的序列标识符。

class Bio.PDB.Polypeptide.CaPPBuilder(radius=4.3)

基类:_PPBuilder

利用CA--CA距离寻找多肽。

__init__(radius=4.3)

初始化类。

class Bio.PDB.Polypeptide.PPBuilder(radius=1.8)

基类:_PPBuilder

使用C--N距离寻找多肽。

__init__(radius=1.8)

初始化类。