生物.PDB.多肽模块

与肽相关的类别(结构和表示)。

具有多个链的简单示例,

>>> from Bio.PDB.PDBParser import PDBParser
>>> from Bio.PDB.Polypeptide import PPBuilder
>>> structure = PDBParser().get_structure('2BEG', 'PDB/2BEG.pdb')
>>> ppb=PPBuilder()
>>> for pp in ppb.build_peptides(structure):
...     print(pp.get_sequence())
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA

非标准氨基酸的示例,使用DBC文件中的HEATM线,在这种情况下是次甲基硫醚(SSE):

>>> from Bio.PDB.PDBParser import PDBParser
>>> from Bio.PDB.Polypeptide import PPBuilder
>>> structure = PDBParser().get_structure('1A8O', 'PDB/1A8O.pdb')
>>> ppb=PPBuilder()
>>> for pp in ppb.build_peptides(structure):
...     print(pp.get_sequence())
DIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNW
TETLLVQNANPDCKTILKALGPGATLEE
TACQG

如果您愿意,可以在肽中加入非标准氨基酸:

>>> for pp in ppb.build_peptides(structure, aa_only=False):
...     print(pp.get_sequence())
...     print("%s %s" % (pp.get_sequence()[0], pp[0].get_resname()))
...     print("%s %s" % (pp.get_sequence()[-7], pp[-7].get_resname()))
...     print("%s %s" % (pp.get_sequence()[-6], pp[-6].get_resname()))
MDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPGATLEEMMTACQG
M MSE
M MSE
M MSE

在这种情况下,通过get_order方法,Se甲硫醚(第一个以及倒数第七个和第六个残基)显示为M(甲硫醚)。

Bio.PDB.Polypeptide.index_to_one(index)

对应的单字母氨基酸名称的索引。

>>> index_to_one(0)
'A'
>>> index_to_one(19)
'Y'
Bio.PDB.Polypeptide.one_to_index(s)

要索引的一个字母代码。

>>> one_to_index('A')
0
>>> one_to_index('Y')
19
Bio.PDB.Polypeptide.index_to_three(i)

对应的三字母氨基酸名称的索引。

>>> index_to_three(0)
'ALA'
>>> index_to_three(19)
'TYR'
Bio.PDB.Polypeptide.three_to_index(s)

要索引的三个字母代码。

>>> three_to_index('ALA')
0
>>> three_to_index('TYR')
19
Bio.PDB.Polypeptide.is_aa(residue, standard=False)

如果残基对象/字符串是氨基酸,则返回True。

参数:
  • residue (L{Residue} or string) -- L{Residue}对象或三个字母的氨基酸代码

  • standard (boolean) -- 检查20 AA的标志(默认为假)

>>> is_aa('ALA')
True

支持已知的修饰氨基酸的三字母代码,

>>> is_aa('FME')
True
>>> is_aa('FME', standard=True)
False
Bio.PDB.Polypeptide.is_nucleic(residue, standard=False)

如果residue对象/字符串是核酸,则返回True。

参数:
  • residue (L{Residue} or string) -- L{Residue}对象或三个字母代码

  • standard (boolean) -- 标记以检查8个(DNA + RNA)典型碱基。默认为假。

>>> is_nucleic('DA ')
True
>>> is_nucleic('A  ')
True

支持已知的修饰核苷的三个字母代码,

>>> is_nucleic('A2L')
True
>>> is_nucleic('A2L', standard=True)
False
class Bio.PDB.Polypeptide.Polypeptide(iterable=(), /)

基类:list

一个肽只是L{残留}对象的列表。

get_ca_list()

获取多肽中C-α原子的列表。

返回:

C-阿尔法原子列表

返回类型:

[L{Atom}, L{Atom}, ...]

get_phi_psi_list()

返回ph/si二面角列表。

get_tau_list()

所有4个连续的Calpha原子的τ扭转角列表。

get_theta_list()

所有3个连续Calpa原子的theta角列表。

get_sequence()

将AA序列作为Seq对象返回。

返回:

多肽序列

返回类型:

L{Seq}

__repr__()

返回该肽的字符串表示。

返回<Polypeptide start=START end=END>,其中START和End是外部残基的序列标识符。

__firstlineno__ = 187
__static_attributes__ = ()
class Bio.PDB.Polypeptide.CaPPBuilder(radius=4.3)

基类:_PPBuilder

使用CA--CA距离来寻找肽。

__init__(radius=4.3)

初始化课程。

__firstlineno__ = 383
__static_attributes__ = ()
class Bio.PDB.Polypeptide.PPBuilder(radius=1.8)

基类:_PPBuilder

使用C-N距离寻找肽。

__init__(radius=1.8)

初始化课程。

__annotations__ = {}
__firstlineno__ = 412
__static_attributes__ = ()