skbio.alignment.global_pairwise_align_protein¶

skbio.alignment.global_pairwise_align_protein(seq1, seq2, gap_open_penalty=11, gap_extend_penalty=1, substitution_matrix=None, penalize_terminal_gaps=False)[源代码]¶

将一对蛋白质序列或序列与neederman-Wunsch进行全球比对

状态：从0.4.0开始实验。

参数:

seq1 (Protein or TabularMSA[Protein]) -- 第一个未对齐的序列。
seq2 (Protein or TabularMSA[Protein]) -- 第二个未对齐的序列。
gap_open_penalty (int or float, optional) -- 拉开差距的惩罚（这是从以前的最佳对齐分数中减去的，所以通常是正的）。
gap_extend_penalty (int or float, optional) -- 扩大差距的惩罚（这是从以前的最佳对齐分数中减去的，所以通常是正的）。
substitution_matrix (2D dict (or similar), optional) -- 查找替换分数（这些值将添加到上一个最佳对齐分数）；默认值为BLOSUM 50。
penalize_terminal_gaps (bool, optional) -- 如果为真，将继续惩罚差距，即使在一个序列已通过其结束对齐。这种行为是真正的neederman-Wunsch比对，但是当被比对的序列长度不同时，会产生（生物学上不相关的）伪影。这是 False 默认情况下，这很可能是您在所有或几乎所有情况下想要的行为。

返回:

TabularMSA 包含对齐序列、对齐分数（float）和每个输入序列的开始/结束位置（两个项目元组的iterable）的对象。注意，起始/结束位置是未对齐序列的索引。

返回类型:

tuple

参见

local_pairwise_align, local_pairwise_align_protein, local_pairwise_align_nucleotide, skbio.alignment.local_pairwise_align_ssw, global_pairwise_align, global_pairwise_align_nucelotide

备注

违约 gap_open_penalty 和 gap_extend_penalty 参数从NCBI BLAST服务器派生 [1].

BLOSUM（块替换矩阵）氨基酸替换矩阵最初定义于 [2].

此函数可用于对齐一对序列、一对对齐或一个序列与对齐。

引用