Bio.Motifs.Matrix模块

支持各种形式的序列基序矩阵。

实现频率(计数)矩阵、位置-权重矩阵和特定位置评分矩阵。

class Bio.motifs.matrix.GenericPositionMatrix(alphabet, values)

基类:dict

用于支持位置矩阵运算的基类。

__init__(alphabet, values)

初始化类。

__str__()

返回一个字符串,其中包含Matrix中字母表的核苷酸和计数。

__getitem__(key)

返回索引键的位置矩阵。

property consensus

返回一致序列。

property anticonsensus

返回反共识序列。

property degenerate_consensus

返回退化的共识序列。

property gc_content

计算馏分GC含量。

reverse_complement()

计算反补。

class Bio.motifs.matrix.FrequencyPositionMatrix(alphabet, values)

基类:GenericPositionMatrix

用于支持位置矩阵上的频率计算的类。

normalize(pseudocounts=None)

通过规范化计数矩阵创建并返回位置权重矩阵。

如果伪计数为无(默认值),则不会向计数中添加伪计数。

如果伪计数是一个数字,则在计算位置-权重矩阵之前将其与计数相加。

备选地,伪计数可以是具有与主题相关联的字母表中的每个字母的关键字的字典。

class Bio.motifs.matrix.PositionWeightMatrix(alphabet, counts)

基类:GenericPositionMatrix

用于支持位置矩阵上的权重计算的类。

__init__(alphabet, counts)

初始化类。

log_odds(background=None)

返回特定位置的评分矩阵。

位置特定计分矩阵(PSSM)包含根据概率矩阵和背景概率计算的对数赔率分数。如果背景为无,则假定背景分布均匀。

class Bio.motifs.matrix.PositionSpecificScoringMatrix(alphabet, values)

基类:GenericPositionMatrix

类,用于支持特定于职位的计分矩阵计算。

calculate(sequence)

返回所有位置的给定序列的PWM分数。

注:
  • 该序列只能是DNA序列

  • 仅在一条链上执行搜索

  • 如果序列和基序的长度相同,则返回单个数字

  • 否则,结果是一个一维numpy数组

search(sequence, threshold=0.0, both=True, chunksize=10**6)

查找PWM分数高于给定阈值的命中。

一个生成器函数,返回给定序列中PWM分数高于阈值的找到的命中。

property max

此主题的最高可能得分。

返回为一致序列计算的分数。

property min

此主题的最低可能得分。

返回为反共识序列计算的分数。

property gc_content

计算GC-Ratio。

mean(background=None)

返回主题得分的期望值。

std(background=None)

返回主题得分的标准差。

dist_pearson(other)

根据皮尔逊相关性返回给定主题对自身的相似性得分。

我们使用各自概率的皮尔逊相关性。

dist_pearson_at(other, offset)

根据给定偏移量处的皮尔逊相关性返回相似性得分。

distribution(background=None, precision=10**3)

计算给定精度下的分数分布。