skbio.alignment.global_pairwise_align_nucleotide¶
- skbio.alignment.global_pairwise_align_nucleotide(seq1, seq2, gap_open_penalty=5, gap_extend_penalty=2, match_score=1, mismatch_score=-2, substitution_matrix=None, penalize_terminal_gaps=False)[源代码]¶
全球比对核苷酸序列或与Needleman Wunsch比对
状态:从0.4.0开始实验。
- 参数:
seq1 (DNA, RNA, or TabularMSA[DNA|RNA]) -- 第一个未对齐的序列。
seq2 (DNA, RNA, or TabularMSA[DNA|RNA]) -- 第二个未对齐的序列。
gap_open_penalty (int or float, optional) -- 拉开差距的惩罚(这是从以前的最佳对齐分数中减去的,所以通常是正的)。
gap_extend_penalty (int or float, optional) -- 扩大差距的惩罚(这是从以前的最佳对齐分数中减去的,所以通常是正的)。
match_score (int or float, optional) -- 为一对底数之间的比赛加上的分数(这是加在以前的最佳对齐分数上的,所以通常是正的)。
mismatch_score (int or float, optional) -- 一对底数不匹配时要加的分数(这将加到之前的最佳对齐分数中,因此通常为负数)。
substitution_matrix (2D dict (or similar)) -- 查找替换分数(这些值将添加到上一个最佳对齐分数)。如果提供,则此重写
match_score
和mismatch_score
.penalize_terminal_gaps (bool, optional) -- 如果为真,将继续惩罚差距,即使在一个序列已通过其结束对齐。这种行为是真正的neederman-Wunsch比对,但是当被比对的序列长度不同时,会产生(生物学上不相关的)伪影。这是
False
默认情况下,这很可能是您在所有或几乎所有情况下想要的行为。
- 返回:
TabularMSA
包含对齐序列、对齐分数(float)和每个输入序列的开始/结束位置(两个项目元组的iterable)的对象。注意,起始/结束位置是未对齐序列的索引。- 返回类型:
tuple
参见
local_pairwise_align
,local_pairwise_align_protein
,local_pairwise_align_nucleotide
,skbio.alignment.local_pairwise_align_ssw
,global_pairwise_align
,global_pairwise_align_protein
备注
违约
match_score
,mismatch_score
,gap_open_penalty
和gap_extend_penalty
参数从NCBI BLAST服务器派生 [1].此函数可用于对齐一对序列、一对对齐或一个序列与对齐。
引用