skbio.sequence.DNA.find_motifs¶
- DNA.find_motifs(motif_type, min_length=1, ignore=None)[源代码]¶
在生物序列中寻找母题。
选项 motif_type :
- “嘌呤跑”
确定嘌呤运行
- “嘧啶跑”
识别嘧啶
- 参数:
motif_type (str) -- 要查找的主题类型。
min_length (int, optional) -- 只有图案至少和 min_length 将被退回。
ignore (1D array_like (bool), optional) -- 布尔向量,表示匹配时要忽略的位置。
- 生成器:
片 --基序在生物序列中的位置。
- 抛出:
ValueError -- 如果一个未知的 motif_type 指定。
示例
>>> from skbio import DNA >>> s = DNA('ACGGGGAGGCGGAG') >>> for motif_slice in s.find_motifs('purine-run', min_length=2): ... motif_slice ... str(s[motif_slice]) slice(2, 9, None) 'GGGGAGG' slice(10, 14, None) 'GGAG'
空白字符会破坏母题:
>>> s = DNA('GG-GG') >>> for motif_slice in s.find_motifs('purine-run'): ... motif_slice slice(0, 2, None) slice(3, 5, None)
通过将间隙布尔向量传递给 ignore :
>>> s = DNA('GG-GG') >>> for motif_slice in s.find_motifs('purine-run', ignore=s.gaps()): ... motif_slice slice(0, 5, None)