Bio.PDB多肽模块¶
多肽相关类(构造和表示)。
具有多个链的简单示例,
>>> from Bio.PDB.PDBParser import PDBParser
>>> from Bio.PDB.Polypeptide import PPBuilder
>>> structure = PDBParser().get_structure('2BEG', 'PDB/2BEG.pdb')
>>> ppb=PPBuilder()
>>> for pp in ppb.build_peptides(structure):
... print(pp.get_sequence())
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
LVFFAEDVGSNKGAIIGLMVGGVVIA
在PDB文件中使用HETATM行的非标准氨基酸示例,在本例中为硒蛋氨酸(MSE):
>>> from Bio.PDB.PDBParser import PDBParser
>>> from Bio.PDB.Polypeptide import PPBuilder
>>> structure = PDBParser().get_structure('1A8O', 'PDB/1A8O.pdb')
>>> ppb=PPBuilder()
>>> for pp in ppb.build_peptides(structure):
... print(pp.get_sequence())
DIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNW
TETLLVQNANPDCKTILKALGPGATLEE
TACQG
如果你愿意,你可以在肽中加入非标准氨基酸:
>>> for pp in ppb.build_peptides(structure, aa_only=False):
... print(pp.get_sequence())
... print("%s %s" % (pp.get_sequence()[0], pp[0].get_resname()))
... print("%s %s" % (pp.get_sequence()[-7], pp[-7].get_resname()))
... print("%s %s" % (pp.get_sequence()[-6], pp[-6].get_resname()))
MDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPGATLEEMMTACQG
M MSE
M MSE
M MSE
在这种情况下,硒蛋氨酸(倒数第七个和倒数第六个残基)通过GET_Sequence方法显示为M(蛋氨酸)。
- Bio.PDB.Polypeptide.index_to_one(index)¶
对应一个字母的氨基酸名称的索引。
>>> index_to_one(0) 'A' >>> index_to_one(19) 'Y'
- Bio.PDB.Polypeptide.one_to_index(s)¶
要索引的一个字母代码。
>>> one_to_index('A') 0 >>> one_to_index('Y') 19
- Bio.PDB.Polypeptide.index_to_three(i)¶
索引对应的三个字母的氨基酸名称。
>>> index_to_three(0) 'ALA' >>> index_to_three(19) 'TYR'
- Bio.PDB.Polypeptide.three_to_index(s)¶
索引的三个字母代码。
>>> three_to_index('ALA') 0 >>> three_to_index('TYR') 19
- Bio.PDB.Polypeptide.three_to_one(s)¶
三个字母代码对应一个字母代码。
>>> three_to_one('ALA') 'A' >>> three_to_one('TYR') 'Y'
对于非标准氨基酸,您会得到一个KeyError:
>>> three_to_one('MSE') Traceback (most recent call last): ... KeyError: 'MSE'
- Bio.PDB.Polypeptide.one_to_three(s)¶
一个字母代码到三个字母代码。
>>> one_to_three('A') 'ALA' >>> one_to_three('Y') 'TYR'
- Bio.PDB.Polypeptide.is_aa(residue, standard=False)¶
如果残基对象/字符串是氨基酸,则返回True。
- 参数:
residue (L{Residue} or string) -- L{残基}对象或三个字母的氨基酸编码
standard (boolean) -- 检查20个AA的标志(默认值为FALSE)
>>> is_aa('ALA') True
支持已知的用于修饰氨基酸的三个字母代码,
>>> is_aa('FME') True >>> is_aa('FME', standard=True) False
- class Bio.PDB.Polypeptide.Polypeptide(iterable=(), /)¶
基类:
list
多肽仅仅是L{残基}个对象的列表。
- get_ca_list()¶
获取多肽中C-α原子的列表。
- 返回:
C-α原子的列表
- 返回类型:
[L{Atom}, L{Atom}, ...]
- get_phi_psi_list()¶
返回φ/psi二面角的列表。
- get_tau_list()¶
所有4个连续的Calpha原子的tau扭角列表。
- get_theta_list()¶
所有3个连续Calpha原子的θ角列表。
- get_sequence()¶
将AA序列作为Seq对象返回。
- 返回:
多肽序列
- 返回类型:
L{Seq}
- __repr__()¶
返回多肽的字符串表示形式。
返回<多肽start=start end=end>,其中start和end是外部残基的序列标识符。