skbio.alignment.global_pairwise_align_nucleotide¶

skbio.alignment.global_pairwise_align_nucleotide(seq1, seq2, gap_open_penalty=5, gap_extend_penalty=2, match_score=1, mismatch_score=-2, substitution_matrix=None, penalize_terminal_gaps=False)[源代码]¶

全球比对核苷酸序列或与Needleman Wunsch比对

状态：从0.4.0开始实验。

参数:

seq1 (DNA, RNA, or TabularMSA[DNA|RNA]) -- 第一个未对齐的序列。
seq2 (DNA, RNA, or TabularMSA[DNA|RNA]) -- 第二个未对齐的序列。
gap_open_penalty (int or float, optional) -- 拉开差距的惩罚（这是从以前的最佳对齐分数中减去的，所以通常是正的）。
gap_extend_penalty (int or float, optional) -- 扩大差距的惩罚（这是从以前的最佳对齐分数中减去的，所以通常是正的）。
match_score (int or float, optional) -- 为一对底数之间的比赛加上的分数（这是加在以前的最佳对齐分数上的，所以通常是正的）。
mismatch_score (int or float, optional) -- 一对底数不匹配时要加的分数（这将加到之前的最佳对齐分数中，因此通常为负数）。
substitution_matrix (2D dict (or similar)) -- 查找替换分数（这些值将添加到上一个最佳对齐分数）。如果提供，则此重写 match_score 和 mismatch_score .
penalize_terminal_gaps (bool, optional) -- 如果为真，将继续惩罚差距，即使在一个序列已通过其结束对齐。这种行为是真正的neederman-Wunsch比对，但是当被比对的序列长度不同时，会产生（生物学上不相关的）伪影。这是 False 默认情况下，这很可能是您在所有或几乎所有情况下想要的行为。

返回:

TabularMSA 包含对齐序列、对齐分数（float）和每个输入序列的开始/结束位置（两个项目元组的iterable）的对象。注意，起始/结束位置是未对齐序列的索引。

返回类型:

tuple

参见

local_pairwise_align, local_pairwise_align_protein, local_pairwise_align_nucleotide, skbio.alignment.local_pairwise_align_ssw, global_pairwise_align, global_pairwise_align_protein

备注

违约 match_score ， mismatch_score ， gap_open_penalty 和 gap_extend_penalty 参数从NCBI BLAST服务器派生 [1].

此函数可用于对齐一对序列、一对对齐或一个序列与对齐。

引用