scipy.stats.mstats.zscore

scipy.stats.mstats.zscore(a, axis=0, ddof=0, nan_policy='propagate')[源代码]

计算z分数。

计算样本中每个值相对于样本平均值和标准差的z得分。

参数
aarray_like

包含示例数据的类似数组的对象。

axis整型或无型,可选

要沿其运行的轴。默认值为0。如果没有,则对整个阵列进行计算 a

ddof整型,可选

标准偏差计算中的自由度修正。默认值为0。

nan_policy{‘Propagate’,‘RAISE’,‘OMIT’},可选

定义输入包含NaN时的处理方式。‘Propagate’返回NaN,‘Raise’抛出错误,‘omit’执行忽略NaN值的计算。默认值为“Propagate”。请注意,当值为‘omit’时,输入中的NaN也会传播到输出,但它们不会影响为非NaN值计算的z分数。

退货
zscorearray_like

z分数,由输入数组的平均值和标准差标准化 a

注意事项

此函数保留ndarray子类,还可用于矩阵和掩码数组(它使用 asanyarray 而不是 asarray 用于参数)。

示例

>>> a = np.array([ 0.7972,  0.0767,  0.4383,  0.7866,  0.8091,
...                0.1954,  0.6307,  0.6599,  0.1065,  0.0508])
>>> from scipy import stats
>>> stats.zscore(a)
array([ 1.1273, -1.247 , -0.0552,  1.0923,  1.1664, -0.8559,  0.5786,
        0.6748, -1.1488, -1.3324])

使用n-1个自由度沿指定的轴进行计算 (ddof=1 )要计算标准偏差,请执行以下操作:

>>> b = np.array([[ 0.3148,  0.0478,  0.6243,  0.4608],
...               [ 0.7149,  0.0775,  0.6072,  0.9656],
...               [ 0.6341,  0.1403,  0.9759,  0.4064],
...               [ 0.5918,  0.6948,  0.904 ,  0.3721],
...               [ 0.0921,  0.2481,  0.1188,  0.1366]])
>>> stats.zscore(b, axis=1, ddof=1)
array([[-0.19264823, -1.28415119,  1.07259584,  0.40420358],
       [ 0.33048416, -1.37380874,  0.04251374,  1.00081084],
       [ 0.26796377, -1.12598418,  1.23283094, -0.37481053],
       [-0.22095197,  0.24468594,  1.19042819, -1.21416216],
       [-0.82780366,  1.4457416 , -0.43867764, -0.1792603 ]])

具有以下内容的示例 nan_policy='omit'

>>> x = np.array([[25.11, 30.10, np.nan, 32.02, 43.15],
...               [14.95, 16.06, 121.25, 94.35, 29.81]])
>>> stats.zscore(x, axis=1, nan_policy='omit')
array([[-1.13490897, -0.37830299,         nan, -0.08718406,  1.60039602],
       [-0.91611681, -0.89090508,  1.4983032 ,  0.88731639, -0.5785977 ]])