skbio.sequence.distance.kmer_distance

skbio.sequence.distance.kmer_distance(seq1, seq2, k, overlap=True)[源代码]

计算一对序列之间的kmer距离

状态:从0.5.0开始实验。

两个序列之间的kmer距离是两个序列中唯一的kmer的比例。

参数:
  • seq1 (Sequence) -- 要计算其间kmer距离的序列。

  • seq2 (Sequence) -- 要计算其间kmer距离的序列。

  • k (int) -- kmer长度。

  • overlap (bool, optional) -- 定义kmers是否应该重叠。

返回:

之间的Kmer距离 seq1seq2

返回类型:

float

抛出:
  • ValueError -- 如果 k 小于1。

  • TypeError -- 如果 seq1seq2 不是 Sequence 实例。

  • TypeError -- 如果 seq1seq2 是不同类型的。

备注

Kmer计数不包括在此距离度量中。

np.nan 如果没有为序列定义Kmer,将返回。

示例

>>> from skbio import Sequence
>>> seq1 = Sequence('ATCGGCGAT')
>>> seq2 = Sequence('GCAGATGTG')
>>> kmer_distance(seq1, seq2, 3) 
0.9230769230...