incr_mean_variance_axis#

sklearn.utils.sparsefuncs.incr_mean_variance_axis(X, *, axis, last_mean, last_var, last_n, weights=None)[源代码]#

计算CSR或CSC矩阵上沿轴的增量平均值和方差。

last_mean、last_var是该函数在最后一步计算的统计数据。两者都必须初始化为适当大小的0-数组，即X中的要素数量。last_n是迄今为止遇到的样本数。

参数:

X形状的CSR或CSC稀疏矩阵（n_samples，n_features）: 输入数据。
axis{0，1}: 计算轴的轴。
last_meannd形状数组（n_features，）或（n_samples，），dype =浮动: 用新数据X进行更新的方法数组。如果轴=0，则形状应为（n_features，）;如果轴=1，则形状应为（n_samples，）。
last_varnd形状数组（n_features，）或（n_samples，），dype =浮动: 要用新数据X更新的方差数组。如果轴=0，则形状应为（n_features，）;如果轴=1，则形状应为（n_samples，）。
last_n形状（n_features，）或（n_samples，）的float或ndray， d类型=浮动: 到目前为止看到的权重之和，不包括当前权重如果不是浮动的，则如果轴=0，它应该是形状（n_features，）或如果轴=1，它应该是形状（n_samples，）。如果浮动，则对应于所有样本（或特征）具有相同的权重。
weights形状的nd数组（n_samples，）或（n_features，），默认=无: 如果轴设置为0，形状为（n_samples，），或者如果轴设置为1，形状为（n_features，）。如果设置为无，则样本的加权相等。

Added in version 0.24.

返回:

meansnd形状数组（n_features，）或（n_samples，），dype =浮动

如果轴= 0，则更新特征平均值或如果轴= 1，则更新样本平均值。

variancesnd形状数组（n_features，）或（n_samples，），dype =浮动

如果轴= 0，则更新特征方差，如果轴= 1，则更新样本方差。

nnd形状数组（n_features，）或（n_samples，），dype =积分

如果轴=0，更新每个特征的可见样本数或如果轴=1，更新每个样本的可见特征数。

如果权重不为无，则n是所看到的样本或特征的权重之和，而不是所看到的样本或特征的实际数量。

注意到

NaN在算法中被忽略。

示例

>>> from sklearn.utils import sparsefuncs
>>> from scipy import sparse
>>> import numpy as np
>>> indptr = np.array([0, 3, 4, 4, 4])
>>> indices = np.array([0, 1, 2, 2])
>>> data = np.array([8, 1, 2, 5])
>>> scale = np.array([2, 3, 2])
>>> csr = sparse.csr_matrix((data, indices, indptr))
>>> csr.todense()
matrix([[8, 1, 2],
        [0, 0, 5],
        [0, 0, 0],
        [0, 0, 0]])
>>> sparsefuncs.incr_mean_variance_axis(
...     csr, axis=0, last_mean=np.zeros(3), last_var=np.zeros(3), last_n=2
... )
(array([1.3..., 0.1..., 1.1...]), array([8.8..., 0.1..., 3.4...]),
array([6., 6., 6.]))