生物。图案。矩阵模块
支持各种形式的序列基序矩阵。
频率(计数)矩阵、位置权重矩阵和位置特定评分矩阵的实现。
- class Bio.motifs.matrix.GenericPositionMatrix(alphabet, values)
基类:
dict
支持位置矩阵操作的基本类。
- __init__(alphabet, values)
初始化课程。
- __str__()
返回包含碱基组中字母表计数的字符串。
- __getitem__(key)
返回索引键位置矩阵。
- property consensus
返回共识序列。
- property anticonsensus
返回反共识序列。
- property degenerate_consensus
返回简并共有序列。
- calculate_consensus(substitution_matrix=None, plurality=None, identity=0, setcase=None)
返回给定参数的共识序列(作为字符串)。
该功能在很大程度上遵循CLASS的惯例 cons 工具.
- 论点:
substitution_matrix -比较序列时使用的评分矩阵。默认情况下,它是无,在这种情况下,我们只需计算每个字母的频率。您可以使用Bio.Align.substitution_matrix中提供的替代矩阵,而不是默认值。常见的选择是蛋白质的BLOSUM 62(也称为EBLOSUM 62),以及核苷酸的NUC.4.4(也称为EDNAAFSYS)。注:这尚未实施。
多 - 达到共识所需的阳性匹配数量的阈值,除以列中的总计数。如果substitution_matrix为无,则此参数必须为无,并被忽略;否则将引发ValueHelp。如果substitution_matrix不为无,则复数的默认值为0.5。
身份 - 定义共识值所需的身份数,除以列中的总计数。如果同一性的数量小于一列中的同一性 * 总计数,则在共有序列中使用未定义的字符(“N”代表核苷,“X”代表氨基酸序列)。如果身份为1.0,那么只有相同字母的列才能达成共识。默认值为零。
布景 - 正匹配的阈值,除以列中的总计数,高于该阈值的共识为大写字母,低于该阈值的共识为大写字母。默认情况下,这等于0.5。
- property gc_content
计算馏分GC含量。
- reverse_complement()
计算反码。
- __firstlineno__ = 24
- __static_attributes__ = ('alphabet', 'length')
- class Bio.motifs.matrix.FrequencyPositionMatrix(alphabet, values)
-
用于支持位置矩阵上的频率计算的类。
- normalize(pseudocounts=None)
通过标准化计数矩阵来创建并返回位置权重矩阵。
如果伪计数为无(默认),则不会向计数中添加伪计数。
如果pseudocounts是一个数字,则在计算位置权重矩阵之前将其添加到计数中。
或者,伪计数可以是一个字典,其中包含与主题相关的字母表中的每个字母的关键字。
- __annotations__ = {}
- __firstlineno__ = 316
- __static_attributes__ = ()
- class Bio.motifs.matrix.PositionWeightMatrix(alphabet, counts)
-
类,用于支持位置矩阵上的权重计算。
- __init__(alphabet, counts)
初始化课程。
- log_odds(background=None)
返回特定于职位的评分矩阵。
位置特定评分矩阵(PSSM)包含根据概率矩阵和背景概率计算的对比分数。如果背景为无,则假设背景分布均匀。
- __annotations__ = {}
- __firstlineno__ = 348
- __static_attributes__ = ()
- class Bio.motifs.matrix.PositionSpecificScoringMatrix(alphabet, values)
-
支持特定职位评分矩阵计算的类。
- calculate(sequence)
返回所有位置的给定序列的脉宽调制分数。
- 注:
该序列只能是DNA序列
仅对一条链执行搜索
如果序列和基序具有相同的长度,则返回单个数字
否则,结果是一维numpy数组
- search(sequence, threshold=0.0, both=True, chunksize=10**6)
查找脉宽调制分数高于给定阈值的匹配项。
生成器函数,返回给定序列中发现的pwm分数高于阈值的命中。
- property max
此主题的最大可能得分。
返回为共识序列计算的分数。
- property min
该主题的最低可能得分。
返回为反共识序列计算的分数。
- property gc_content
计算GC比。
- mean(background=None)
返回主题得分的期望值。
- std(background=None)
返回主题得分的标准差。
- dist_pearson(other)
根据给定主题与自我的Pearson相关性返回相似性分数。
我们使用各自概率的皮尔逊相关性。
- dist_pearson_at(other, offset)
基于给定偏差处的Pearson相关性返回相似性分数。
- __annotations__ = {}
- __firstlineno__ = 399
- __static_attributes__ = ()
- distribution(background=None, precision=10**3)
计算给定精度下的分数分布。