scipy.stats.describe¶
- scipy.stats.describe(a, axis=0, ddof=1, bias=True, nan_policy='propagate')[源代码]¶
计算传递的数组的几个描述性统计信息。
- 参数
- aarray_like
输入数据。
- axis整型或无型,可选
沿其计算统计信息的轴。默认值为0。如果没有,则对整个阵列进行计算 a 。
- ddof整型,可选
增量自由度(仅用于变化)。默认值为1。
- bias布尔值,可选
如果为False,则偏斜度和峰度计算将针对统计偏差进行更正。
- nan_policy{‘Propagate’,‘RAISE’,‘OMIT’},可选
定义输入包含NaN时的处理方式。以下选项可用(默认值为‘Propagate’):
‘Propagate’:返回NaN
“raise”:引发错误
‘omit’:执行计算时忽略NaN值
- 退货
- nobs整数或整数的ndarray
观测值数量(沿线的数据长度 axis )。当‘omit’被选为NaN_POLICY时,沿每个轴切片的长度被单独计数。
- minmax:ndarray或浮点数的元组
的最小值和最大值 a 沿着给定的轴线。
- meanndarray或浮动
的算术平均值 a 沿着给定的轴线。
- variancendarray或浮动
的无偏方差 a 沿给定轴;分母是观测次数减一。
- skewnessndarray或浮动
的偏度 a 沿给定轴,基于分母等于观测值的矩计算,即无自由度校正。
- kurtosisndarray或浮动
峰度(Fisher) a 沿着给定的轴线。峰度被归一化,使得正态分布的峰度为零。不使用任何自由度。
示例
>>> from scipy import stats >>> a = np.arange(10) >>> stats.describe(a) DescribeResult(nobs=10, minmax=(0, 9), mean=4.5, variance=9.166666666666666, skewness=0.0, kurtosis=-1.2242424242424244) >>> b = [[1, 2], [3, 4]] >>> stats.describe(b) DescribeResult(nobs=2, minmax=(array([1, 2]), array([3, 4])), mean=array([2., 3.]), variance=array([2., 2.]), skewness=array([0., 0.]), kurtosis=array([-2., -2.]))