skbio.alignment.TabularMSA.gap_frequencies

TabularMSA.gap_frequencies(axis='sequence', relative=False)[源代码]

计算轴上间隙字符的频率。

状态:从0.4.1开始试验。

参数:
  • axis ({'sequence', 'position'}, optional) -- 用于计算间隙字符频率的轴。如果“序列”或0,则计算MSA中每个位置的频率。如果“位置”或1,则计算每个序列的频率。

  • relative (bool, optional) -- 如果 True ,返回间隔字符的相对频率,而不是计数。

返回:

穿过指定轴的间隙字符频率矢量。会有 int 数据类型if relative=Falsefloat 数据类型if relative=True .

返回类型:

1D np.ndarray (int or float)

抛出:

ValueError -- 如果 axis 无效。

备注

如果MSA没有职位, axis='position'and relative=True ,则每个序列中间隙字符的相对频率为 np.nan .

示例

计算MSA中每个位置的间隙字符频率(即。, 穿过 序列轴):

>>> from skbio import DNA, TabularMSA
>>> msa = TabularMSA([DNA('ACG'),
...                   DNA('A--'),
...                   DNA('AC.'),
...                   DNA('AG.')])
>>> msa.gap_frequencies()
array([0, 1, 3])

计算同一轴线上的相对频率:

>>> msa.gap_frequencies(relative=True)
array([ 0.  ,  0.25,  0.75])

计算每个序列的间隔字符的频率(即。, 穿过 位置轴):

>>> msa.gap_frequencies(axis='position')
array([0, 2, 1, 1])