Bio.Align.Align.AlignInfo模块¶

从路线对象中提取信息。

为了尽量避免具有大量函数的大型对齐对象，应将返回有关对齐的汇总类型信息的函数放入此模块的类中。

class Bio.Align.AlignInfo.SummaryInfo(alignment)¶

基类：object

计算有关路线的摘要信息。

此类应用于计算汇总路线结果的信息。这可能是直接的共识信息，也可能是更复杂的事情。

__init__(alignment)¶

使用要计算其信息的对齐进行初始化。

IC_VECTOR属性。每个列号的IC内容列表。

dumb_consensus(threshold=0.7, ambiguous='X', require_multiple=False)¶

输出比对的快速一致序列。

这一点也不花哨。它将仅逐个残基遍历序列残基，并将每种残基的数量加起来(即，DNA为A或G或T或C)。如果最常见的残留物类型的百分比大于通过的阈值，则我们将添加该残留物类型，否则将添加不明确的字符。

这可以做得更花哨一些(即。考虑到替代矩阵)，但这只意味着快速和肮脏的共识。

参数：

阈值-添加特定原子所需的阈值。
歧义-未达到阈值时要添加的歧义字符。
REQUIRED_MULTIPLE-如果设置为True，则需要将多个序列作为比对的一部分才能将其放入共识(即而不仅仅是1个序列和空位)。

gap_consensus(threshold=0.7, ambiguous='X', require_multiple=False)¶

输出快速一致的比对序列，允许间隙。

与dumb_consensus()相同，但允许输出上的间隙。

要做的事情：

让用户定义在只有一个缺口的情况下，共识中的结果字符是缺口。
让用户选择间隙字符，现在它与输入相同。

replacement_dictionary(skip_chars=None, letters=None)¶

生成替换字典以插入到替换矩阵中。

这应该着眼于比对，并且能够在比对的对象中生成不同残基的彼此替换的数量。

然后将返回包含以下信息的字典：：

{('A', 'C') : 10, ('C', 'A') : 12, ('G', 'C') : 15 ....}

这也处理加权序列。下面的示例显示了我们如何计算替换词典。给定以下多序列比对：

GTATC  0.5
AT--C  0.8
CTGTC  1.0

对于第一列，我们有：：

('A', 'G') : 0.5 * 0.8 = 0.4
('C', 'G') : 0.5 * 1.0 = 0.5
('A', 'C') : 0.8 * 1.0 = 0.8

然后，我们继续对对齐中的所有列执行此操作，对每列中每个替换的信息求和，直到得到替换字典为止。

参数：

SKIP_CHARS-未使用；将其设置为除无之外的任何值都会引发ValueError
字母-可迭代的(例如，要包括的字符串或字符列表)。

pos_specific_score_matrix(axis_seq=None, chars_to_ignore=None)¶

为路线创建特定于职位的分数矩阵对象。

这创建了位置特定得分矩阵(PSM)，这是查看共识序列的另一种方法。

参数：

CHARS_TO_IGNORE-不包括在pssm中的所有字符的列表。
axis_seq-一个可选参数，指定要放在PSSM轴上的序列。这应该是一个Seq对象。如果未指定任何内容，将使用使用默认参数计算的一致序列。

退货：

PSSM(位置特定得分矩阵)对象。

information_content(start=0, end=None, e_freq_table=None, log_base=2, chars_to_ignore=None, pseudo_count=0)¶

计算沿排列的每个残基的信息量。

参数：

开始、结束-计算信息内容的开始和结束点。这些点应该相对于比对中的第一个序列，从零开始(即即使在初始序列中，SEQ中的“真实”第一个位置是203，对于信息内容，我们需要使用零)。这默认为第一个序列的整个长度。
E_freq_table-指定每个字母的预期频率的字典(例如{‘G’：0.4，‘C’：0.4，‘T’：0.1，‘A’：0.1})。不应包括间隙字符，因为这些字符不应具有预期的频率。
LOG_BASE-用于计算信息内容的对数的底。该默认值为2，因此信息以位为单位。
CHARS_TO_IGNORE-计算信息内容时应忽略的字符列表。默认为无。

退货：

表示指定区域的信息内容的数字。

有关如何计算信息内容的更多信息，请参阅Biopython手册。

get_column(col)¶: 返回对齐列。

class Bio.Align.AlignInfo.PSSM(pssm)¶

基类：object

表示特定于职位的得分矩阵。

这个类旨在使访问PSSM中的信息变得容易，也使在漂亮的表格中打印信息变得容易。

假设您有如下对齐方式：：

GTATC
AT--C
CTGTC

特定位置得分矩阵(打印时)如下所示：：

您可以使用以下内容访问PSSM的单个元素：

your_pssm[sequence_number][residue_count_name]

例如，要获得上述对齐中第二个元素的‘T’残差，您需要执行以下操作：

your_pssm[1]['T']

__init__(pssm)¶

用要表示的pssm数据进行初始化。

传入的pssm应该是如下结构的列表：

列表 [0] -表示的残数的字母(例如，从上面的示例中，前几个列表 [0] 应该是GTAT..。列表 [1] -一本包含字母替换和计数的字典。

__getitem__(pos)¶

__str__()¶: 返回str(Self)。

get_residue(pos)¶: 返回指定位置的剩余字母。

Bio.Align.AlignInfo.print_info_content(summary_info, fout=None, rep_record=0)¶: 3列输出：位置、代表序列中的aa、ic_Vector值。