scipy.stats.describe¶

scipy.stats.describe(a, axis=0, ddof=1, bias=True, nan_policy='propagate')[源代码]¶

计算传递的数组的几个描述性统计信息。

参数

aarray_like

输入数据。

axis整型或无型，可选

沿其计算统计信息的轴。默认值为0。如果没有，则对整个阵列进行计算 a 。

ddof整型，可选

增量自由度(仅用于变化)。默认值为1。

bias布尔值，可选

如果为False，则偏斜度和峰度计算将针对统计偏差进行更正。

nan_policy{‘Propagate’，‘RAISE’，‘OMIT’}，可选

定义输入包含NaN时的处理方式。以下选项可用(默认值为‘Propagate’)：

‘Propagate’：返回NaN
“raise”：引发错误
‘omit’：执行计算时忽略NaN值

退货

nobs整数或整数的ndarray: 观测值数量(沿线的数据长度 axis )。当‘omit’被选为NaN_POLICY时，沿每个轴切片的长度被单独计数。
minmax：ndarray或浮点数的元组: 的最小值和最大值 a 沿着给定的轴线。
meanndarray或浮动: 的算术平均值 a 沿着给定的轴线。
variancendarray或浮动: 的无偏方差 a 沿给定轴；分母是观测次数减一。
skewnessndarray或浮动: 的偏度 a 沿给定轴，基于分母等于观测值的矩计算，即无自由度校正。
kurtosisndarray或浮动: 峰度(Fisher) a 沿着给定的轴线。峰度被归一化，使得正态分布的峰度为零。不使用任何自由度。

参见

skew, kurtosis

示例

>>> from scipy import stats
>>> a = np.arange(10)
>>> stats.describe(a)
DescribeResult(nobs=10, minmax=(0, 9), mean=4.5,
               variance=9.166666666666666, skewness=0.0,
               kurtosis=-1.2242424242424244)
>>> b = [[1, 2], [3, 4]]
>>> stats.describe(b)
DescribeResult(nobs=2, minmax=(array([1, 2]), array([3, 4])),
               mean=array([2., 3.]), variance=array([2., 2.]),
               skewness=array([0., 0.]), kurtosis=array([-2., -2.]))

scipy.stats.zipfian

scipy.stats.gmean