skbio.alignment.TabularMSA.gap_frequencies¶
- TabularMSA.gap_frequencies(axis='sequence', relative=False)[源代码]¶
计算轴上间隙字符的频率。
状态:从0.4.1开始试验。
- 参数:
axis ({'sequence', 'position'}, optional) -- 用于计算间隙字符频率的轴。如果“序列”或0,则计算MSA中每个位置的频率。如果“位置”或1,则计算每个序列的频率。
relative (bool, optional) -- 如果
True
,返回间隔字符的相对频率,而不是计数。
- 返回:
穿过指定轴的间隙字符频率矢量。会有
int
数据类型ifrelative=False
和float
数据类型ifrelative=True
.- 返回类型:
1D np.ndarray (int or float)
- 抛出:
ValueError -- 如果 axis 无效。
备注
如果MSA没有职位,
axis='position'
, andrelative=True
,则每个序列中间隙字符的相对频率为np.nan
.示例
计算MSA中每个位置的间隙字符频率(即。, 穿过 序列轴):
>>> from skbio import DNA, TabularMSA >>> msa = TabularMSA([DNA('ACG'), ... DNA('A--'), ... DNA('AC.'), ... DNA('AG.')]) >>> msa.gap_frequencies() array([0, 1, 3])
计算同一轴线上的相对频率:
>>> msa.gap_frequencies(relative=True) array([ 0. , 0.25, 0.75])
计算每个序列的间隔字符的频率(即。, 穿过 位置轴):
>>> msa.gap_frequencies(axis='position') array([0, 2, 1, 1])