incr_mean_variance_axis#
- sklearn.utils.sparsefuncs.incr_mean_variance_axis(X, *, axis, last_mean, last_var, last_n, weights=None)[源代码]#
计算CSR或CSC矩阵上沿轴的增量平均值和方差。
last_mean、last_var是该函数在最后一步计算的统计数据。两者都必须初始化为适当大小的0-数组,即X中的要素数量。last_n是迄今为止遇到的样本数。
- 参数:
- X形状的CSR或CSC稀疏矩阵(n_samples,n_features)
输入数据。
- axis{0,1}
计算轴的轴。
- last_meannd形状数组(n_features,)或(n_samples,),dype =浮动
用新数据X进行更新的方法数组。如果轴=0,则形状应为(n_features,);如果轴=1,则形状应为(n_samples,)。
- last_varnd形状数组(n_features,)或(n_samples,),dype =浮动
要用新数据X更新的方差数组。如果轴=0,则形状应为(n_features,);如果轴=1,则形状应为(n_samples,)。
- last_n形状(n_features,)或(n_samples,)的float或ndray, d类型=浮动
到目前为止看到的权重之和,不包括当前权重如果不是浮动的,则如果轴=0,它应该是形状(n_features,)或如果轴=1,它应该是形状(n_samples,)。如果浮动,则对应于所有样本(或特征)具有相同的权重。
- weights形状的nd数组(n_samples,)或(n_features,),默认=无
如果轴设置为0,形状为(n_samples,),或者如果轴设置为1,形状为(n_features,)。如果设置为无,则样本的加权相等。
Added in version 0.24.
- 返回:
- meansnd形状数组(n_features,)或(n_samples,),dype =浮动
如果轴= 0,则更新特征平均值或如果轴= 1,则更新样本平均值。
- variancesnd形状数组(n_features,)或(n_samples,),dype =浮动
如果轴= 0,则更新特征方差,如果轴= 1,则更新样本方差。
- nnd形状数组(n_features,)或(n_samples,),dype =积分
如果轴=0,更新每个特征的可见样本数或如果轴=1,更新每个样本的可见特征数。
如果权重不为无,则n是所看到的样本或特征的权重之和,而不是所看到的样本或特征的实际数量。
注意到
NaN在算法中被忽略。
示例
>>> from sklearn.utils import sparsefuncs >>> from scipy import sparse >>> import numpy as np >>> indptr = np.array([0, 3, 4, 4, 4]) >>> indices = np.array([0, 1, 2, 2]) >>> data = np.array([8, 1, 2, 5]) >>> scale = np.array([2, 3, 2]) >>> csr = sparse.csr_matrix((data, indices, indptr)) >>> csr.todense() matrix([[8, 1, 2], [0, 0, 5], [0, 0, 0], [0, 0, 0]]) >>> sparsefuncs.incr_mean_variance_axis( ... csr, axis=0, last_mean=np.zeros(3), last_var=np.zeros(3), last_n=2 ... ) (array([1.3..., 0.1..., 1.1...]), array([8.8..., 0.1..., 3.4...]), array([6., 6., 6.]))