skbio.alignment.global_pairwise_align_nucleotide

skbio.alignment.global_pairwise_align_nucleotide(seq1, seq2, gap_open_penalty=5, gap_extend_penalty=2, match_score=1, mismatch_score=-2, substitution_matrix=None, penalize_terminal_gaps=False)[源代码]

全球比对核苷酸序列或与Needleman Wunsch比对

状态:从0.4.0开始实验。

参数:
  • seq1 (DNA, RNA, or TabularMSA[DNA|RNA]) -- 第一个未对齐的序列。

  • seq2 (DNA, RNA, or TabularMSA[DNA|RNA]) -- 第二个未对齐的序列。

  • gap_open_penalty (int or float, optional) -- 拉开差距的惩罚(这是从以前的最佳对齐分数中减去的,所以通常是正的)。

  • gap_extend_penalty (int or float, optional) -- 扩大差距的惩罚(这是从以前的最佳对齐分数中减去的,所以通常是正的)。

  • match_score (int or float, optional) -- 为一对底数之间的比赛加上的分数(这是加在以前的最佳对齐分数上的,所以通常是正的)。

  • mismatch_score (int or float, optional) -- 一对底数不匹配时要加的分数(这将加到之前的最佳对齐分数中,因此通常为负数)。

  • substitution_matrix (2D dict (or similar)) -- 查找替换分数(这些值将添加到上一个最佳对齐分数)。如果提供,则此重写 match_scoremismatch_score .

  • penalize_terminal_gaps (bool, optional) -- 如果为真,将继续惩罚差距,即使在一个序列已通过其结束对齐。这种行为是真正的neederman-Wunsch比对,但是当被比对的序列长度不同时,会产生(生物学上不相关的)伪影。这是 False 默认情况下,这很可能是您在所有或几乎所有情况下想要的行为。

返回:

TabularMSA 包含对齐序列、对齐分数(float)和每个输入序列的开始/结束位置(两个项目元组的iterable)的对象。注意,起始/结束位置是未对齐序列的索引。

返回类型:

tuple

备注

违约 match_scoremismatch_scoregap_open_penaltygap_extend_penalty 参数从NCBI BLAST服务器派生 [1].

此函数可用于对齐一对序列、一对对齐或一个序列与对齐。

引用