skbio.sequence.Protein.find_motifs

Protein.find_motifs(motif_type, min_length=1, ignore=None)[源代码]

在生物序列中寻找母题。

选项 motif_type

“N-糖基化”

确定N-糖基化运行

参数:
  • motif_type (str) -- 要查找的主题类型。

  • min_length (int, optional) -- 只有图案至少和 min_length 将被退回。

  • ignore (1D array_like (bool), optional) -- 布尔向量,表示匹配时要忽略的位置。

生成器:

--基序在生物序列中的位置。

抛出:

ValueError -- 如果一个未知的 motif_type 指定。

示例

>>> from skbio import DNA
>>> s = DNA('ACGGGGAGGCGGAG')
>>> for motif_slice in s.find_motifs('purine-run', min_length=2):
...     motif_slice
...     str(s[motif_slice])
slice(2, 9, None)
'GGGGAGG'
slice(10, 14, None)
'GGAG'

空白字符会破坏母题:

>>> s = DNA('GG-GG')
>>> for motif_slice in s.find_motifs('purine-run'):
...     motif_slice
slice(0, 2, None)
slice(3, 5, None)

通过将间隙布尔向量传递给 ignore

>>> s = DNA('GG-GG')
>>> for motif_slice in s.find_motifs('purine-run', ignore=s.gaps()):
...     motif_slice
slice(0, 5, None)