skbio.alignment.global_pairwise_align_protein

skbio.alignment.global_pairwise_align_protein(seq1, seq2, gap_open_penalty=11, gap_extend_penalty=1, substitution_matrix=None, penalize_terminal_gaps=False)[源代码]

将一对蛋白质序列或序列与neederman-Wunsch进行全球比对

状态:从0.4.0开始实验。

参数:
  • seq1 (Protein or TabularMSA[Protein]) -- 第一个未对齐的序列。

  • seq2 (Protein or TabularMSA[Protein]) -- 第二个未对齐的序列。

  • gap_open_penalty (int or float, optional) -- 拉开差距的惩罚(这是从以前的最佳对齐分数中减去的,所以通常是正的)。

  • gap_extend_penalty (int or float, optional) -- 扩大差距的惩罚(这是从以前的最佳对齐分数中减去的,所以通常是正的)。

  • substitution_matrix (2D dict (or similar), optional) -- 查找替换分数(这些值将添加到上一个最佳对齐分数);默认值为BLOSUM 50。

  • penalize_terminal_gaps (bool, optional) -- 如果为真,将继续惩罚差距,即使在一个序列已通过其结束对齐。这种行为是真正的neederman-Wunsch比对,但是当被比对的序列长度不同时,会产生(生物学上不相关的)伪影。这是 False 默认情况下,这很可能是您在所有或几乎所有情况下想要的行为。

返回:

TabularMSA 包含对齐序列、对齐分数(float)和每个输入序列的开始/结束位置(两个项目元组的iterable)的对象。注意,起始/结束位置是未对齐序列的索引。

返回类型:

tuple

备注

违约 gap_open_penaltygap_extend_penalty 参数从NCBI BLAST服务器派生 [1].

BLOSUM(块替换矩阵)氨基酸替换矩阵最初定义于 [2].

此函数可用于对齐一对序列、一对对齐或一个序列与对齐。

引用