skbio.sequence.RNA.kmer_frequencies

RNA.kmer_frequencies(k, overlap=True, relative=False)[源代码]

返回字长计数 k 从这个序列。

状态:0.4.0稳定。

参数:
  • k (int) -- 字长。

  • overlap (bool, optional) -- 定义kmers是否应该重叠。

  • relative (bool, optional) -- 如果 True ,返回每个kmer的相对频率,而不是其计数。

返回:

长度词的频率 k 包含在这个序列中。

返回类型:

dict

抛出:

ValueError -- 如果 k 小于1。

示例

>>> from pprint import pprint
>>> from skbio import Sequence
>>> s = Sequence('ACACATTTATTA')
>>> freqs = s.kmer_frequencies(3, overlap=False)
>>> pprint(freqs) # using pprint to display dict in sorted order
{'ACA': 1, 'CAT': 1, 'TTA': 2}
>>> freqs = s.kmer_frequencies(3, relative=True, overlap=False)
>>> pprint(freqs)
{'ACA': 0.25, 'CAT': 0.25, 'TTA': 0.5}