mean_variance_axis#

sklearn.utils.sparsefuncs.mean_variance_axis(X, axis, weights=None, return_sum_weights=False)[源代码]#

计算CSR或CSC矩阵上轴的均值和方差。

参数:

X形状稀疏矩阵（n_samples，n_features）: 输入数据。它可以是CSR或CSC格式。
axis{0，1}: 计算轴的轴。
weights形状的nd数组（n_samples，）或（n_features，），默认=无: 如果轴设置为0，形状为（n_samples，），或者如果轴设置为1，形状为（n_features，）。如果设置为无，则样本的加权相等。

Added in version 0.24.
return_sum_weights布尔，默认=假: 如果为True，则返回每个要素的权重总和，如果 axis=0 或每个样本，如果 axis=1 .

Added in version 0.24.

返回:

meansnd形状数组（n_features，），dype =浮动: 竞争明智的手段。
variancesnd形状数组（n_features，），dype =浮动: 竞争方面的差异。
sum_weightsnd形状数组（n_features，），dype =浮动: 退回因故 return_sum_weights 是 True .

示例

>>> from sklearn.utils import sparsefuncs
>>> from scipy import sparse
>>> import numpy as np
>>> indptr = np.array([0, 3, 4, 4, 4])
>>> indices = np.array([0, 1, 2, 2])
>>> data = np.array([8, 1, 2, 5])
>>> scale = np.array([2, 3, 2])
>>> csr = sparse.csr_matrix((data, indices, indptr))
>>> csr.todense()
matrix([[8, 1, 2],
        [0, 0, 5],
        [0, 0, 0],
        [0, 0, 0]])
>>> sparsefuncs.mean_variance_axis(csr, axis=0)
(array([2.  , 0.25, 1.75]), array([12.    ,  0.1875,  4.1875]))