skbio.sequence.Sequence.kmer_frequencies¶
- Sequence.kmer_frequencies(k, overlap=True, relative=False)[源代码]¶
返回字长计数 k 从这个序列。
状态:0.4.0稳定。
- 参数:
k (int) -- 字长。
overlap (bool, optional) -- 定义kmers是否应该重叠。
relative (bool, optional) -- 如果
True
,返回每个kmer的相对频率,而不是其计数。
- 返回:
长度词的频率 k 包含在这个序列中。
- 返回类型:
dict
- 抛出:
ValueError -- 如果 k 小于1。
示例
>>> from pprint import pprint >>> from skbio import Sequence >>> s = Sequence('ACACATTTATTA') >>> freqs = s.kmer_frequencies(3, overlap=False) >>> pprint(freqs) # using pprint to display dict in sorted order {'ACA': 1, 'CAT': 1, 'TTA': 2} >>> freqs = s.kmer_frequencies(3, relative=True, overlap=False) >>> pprint(freqs) {'ACA': 0.25, 'CAT': 0.25, 'TTA': 0.5}