skbio.sequence.distance.hamming¶

skbio.sequence.distance.hamming(seq1, seq2)[源代码]¶

计算两个序列之间的汉明距离。

状态：从0.4.2开始实验。

两个等长序列之间的汉明距离是不同字符的比例。

参数:

seq1 (Sequence) -- 用于计算序列之间的汉明距离的序列。
seq2 (Sequence) -- 用于计算序列之间的汉明距离的序列。

返回:

海明距离，海明距离 seq1 和 seq2 。

返回类型:

float

抛出:

TypeError -- 如果 seq1 和 seq2 不是 Sequence 实例。
TypeError -- 如果 seq1 和 seq2 是不同类型的。
ValueError -- 如果 seq1 和 seq2 是不一样的长度。

参见

scipy.spatial.distance.hamming

备注

np.nan 如果序列不包含任何字符，将返回。

此函数不对正在使用的序列字母表进行假设。每个序列对象的底层字符序列被用来计算汉明距离。在某些上下文中可被认为是等价的字符(例如， - 和 . 作为间隙字符)在计算汉明距离时被视为不同的字符。

示例

>>> from skbio import Sequence
>>> from skbio.sequence.distance import hamming
>>> seq1 = Sequence('AGGGTA')
>>> seq2 = Sequence('CGTTTA')
>>> hamming(seq1, seq2)
0.5