skbio.sequence.distance.hamming

skbio.sequence.distance.hamming(seq1, seq2)[源代码]

计算两个序列之间的汉明距离。

状态:从0.4.2开始实验。

两个等长序列之间的汉明距离是不同字符的比例。

参数:
  • seq1 (Sequence) -- 用于计算序列之间的汉明距离的序列。

  • seq2 (Sequence) -- 用于计算序列之间的汉明距离的序列。

返回:

海明距离,海明距离 seq1seq2

返回类型:

float

抛出:
  • TypeError -- 如果 seq1seq2 不是 Sequence 实例。

  • TypeError -- 如果 seq1seq2 是不同类型的。

  • ValueError -- 如果 seq1seq2 是不一样的长度。

备注

np.nan 如果序列不包含任何字符,将返回。

此函数不对正在使用的序列字母表进行假设。每个序列对象的底层字符序列被用来计算汉明距离。在某些上下文中可被认为是等价的字符(例如, -. 作为间隙字符)在计算汉明距离时被视为不同的字符。

示例

>>> from skbio import Sequence
>>> from skbio.sequence.distance import hamming
>>> seq1 = Sequence('AGGGTA')
>>> seq2 = Sequence('CGTTTA')
>>> hamming(seq1, seq2)
0.5