Bio.SeqUtils.ProtParam模块¶

简单的蛋白质分析。

示例¶

>>> from Bio.SeqUtils.ProtParam import ProteinAnalysis
>>> X = ProteinAnalysis("MAEGEITTFTALTEKFNLPPGNYKKPKLLYCSNGGHFLRILPDGTVDGT"
...                     "RDRSDQHIQLQLSAESVGEVYIKSTETGQYLAMDTSGLLYGSQTPSEEC"
...                     "LFLERLEENHYNTYTSKKHAEKNWFVGLKKNGSCKRGPRTHYGQKAILF"
...                     "LPLPV")
>>> print(X.count_amino_acids()['A'])
6
>>> print(X.count_amino_acids()['E'])
12
>>> print("%0.2f" % X.get_amino_acids_percent()['A'])
0.04
>>> print("%0.2f" % X.get_amino_acids_percent()['L'])
0.12
>>> print("%0.2f" % X.molecular_weight())
17103.16
>>> print("%0.2f" % X.aromaticity())
0.10
>>> print("%0.2f" % X.instability_index())
41.98
>>> print("%0.2f" % X.isoelectric_point())
7.72
>>> sec_struc = X.secondary_structure_fraction()  # [helix, turn, sheet]
>>> print("%0.2f" % sec_struc[0])  # helix
0.28
>>> epsilon_prot = X.molar_extinction_coefficient()  # [reduced, oxidized]
>>> print(epsilon_prot[0])  # with reduced cysteines
17420
>>> print(epsilon_prot[1])  # with disulfid bridges
17545

其他公共方法包括：

肉汁
protein_scale
灵活性
charge_at_pH

class Bio.SeqUtils.ProtParam.ProteinAnalysis(prot_sequence, monoisotopic=False)¶

基类：object

包含蛋白质分析方法的类。

构造函数有两个参数。第一个是将蛋白质序列作为字符串，然后使用Bio.Seq模块将其转换为序列对象。这样做只是为了确保序列是蛋白质序列，而不是其他任何序列。

第二个参数是可选的。如果设置为True，将使用其单同位素质量(每个元素最丰富的同位素的重量)而不是平均分子质量(每个元素的所有稳定同位素的平均重量)来计算氨基酸的重量。如果设置为FALSE(默认值)或忽略，则将使用IUPAC平均分子量进行计算。

__init__(prot_sequence, monoisotopic=False)¶: 初始化类。

count_amino_acids()¶

清点标准氨基酸，返回判决书。

计算蛋白质序列中每个氨基酸出现的次数。返回字典{Aminoacid：Number}。

返回值缓存在self.amineacidescontent中。它不会在后续调用时重新计算。

get_amino_acids_percent()¶

以百分比计算氨基酸含量。

与COUNT_APNAME_ACDICES相同，仅返回整个序列的百分比数字。返回{氨基酸：百分比}的字典。

返回值缓存在self.amineacidespercent中。

输入是字典self.amineaccesdscontent。输出是一本以氨基酸为关键字的字典。

molecular_weight()¶: 根据蛋白质序列计算分子量。

aromaticity()¶

根据Lobry，1994计算芳香度。

根据Lobry，1994计算蛋白质的芳香值。它简单地说就是Phe+Trp+Tyr的相对频率。

instability_index()¶

根据Guruprasad等人1990年计算的不稳定指数。

Guruprasad等人方法的实现。1990年测试一种蛋白质的稳定性。任何高于40的值都表示蛋白质不稳定(半衰期很短)。

参见：Guruprasad K.，Reddy B.V.B.，Pandit M.W.蛋白质工程4：155-161(1990)。

flexibility()¶

根据Vihinen，1994计算弹性。

没有用于更改窗口大小的参数，因为参数是特定于窗口=9的。所使用的参数是为确定灵活性而优化的。

gravy(scale='KyteDoolitle')¶

根据Kyte和Doolitle，1982计算肉汁(水病的总平均数)。

使用给定的疏水性比例，默认情况下使用Kyte和Doolitle(KyteDoolitle)建议的原始比例。其他选择还有：Aboderin，AbrahamLeo，Argos，BlackMold，BullBreese，Casari，Cid，Cowan3.4，Cowan7.5，Eisenberg，Engelman，Fasman，Fuchere，Goldsack，Guy，Jones，Juretic，Kidera，Miyazawa，Parker，Ponnuswamy，Rose，Roseman，Sweet，Tanford，Wilson和Zimmerman。

可以在ProtParamData中添加新比例。

protein_scale(param_dict, window, edge=1.0)¶

用任何氨基酸刻度来计算轮廓。

氨基酸等级由分配给每种氨基酸的数值定义。最常用的标尺有疏水性标尺或亲水性标尺和二级结构构象参数标尺，但也有许多其他标尺是基于氨基酸的不同化学和物理性质。可以设置多个参数来控制缩放剖面的计算，例如窗口大小和窗口边缘相对权重值。

WindowSize：窗口大小是用于配置文件计算的间隔长度。对于窗口大小n，我们使用每边的i-(n-1)/2个相邻残基来计算残基i的分数。残基i的分数是这些氨基酸的标度值之和，可根据它们在窗口中的位置进行加权。

边缘：窗口的中心氨基酸的重量始终为1。默认情况下，其余窗口位置的氨基酸具有相同的重量，但您可以通过将间隔开始和结束处的残留物的边缘值设置为介于0和1之间的值，使窗口中心的残留物具有比其他残留物更大的重量。例如，对于边缘=0.4，窗口大小为5，权重将为：0.4、0.7、1.0、0.7、0.4。

该方法返回一个值列表，可以绘制该列表以查看蛋白质序列的变化。存在许多尺度。只需将您的收藏夹添加到ProtParamData模块即可。

类似于Expasy的ProtScale：http://www.expasy.org/cgi-bin/protscale.pl

isoelectric_point()¶

计算等电点。

使用等电点模块计算蛋白质的等电点。

charge_at_pH(pH)¶: 计算蛋白质在给定pH下的电荷。

secondary_structure_fraction()¶

计算螺旋分数、转数和板数。

返回倾向于螺旋、转角或片状的氨基酸部分的列表。

螺旋中的氨基酸：V，I，Y，F，W，L。氨基酸顺序为：N，P，G，S。片中氨基酸：E，M，A，L。

返回三个浮点数的元组(螺旋线、转角、板材)。

molar_extinction_coefficient()¶

计算摩尔消光系数。

假设半胱氨酸(还原)和半胱氨酸残基(Cys-Cys-键)，计算摩尔消光系数