scipy.stats.skew

scipy.stats.skew(a, axis=0, bias=True, nan_policy='propagate')[源代码]

计算数据集的样本偏斜度。

对于正态分布的数据,偏度应该大约为零。对于单峰连续分布,偏斜度值大于零表示分布的右尾有更多权重。该函数 skewtest 可以用来确定统计意义上的偏斜度值是否足够接近于零。

参数
andarray

输入数组。

axis整型或无型,可选

沿其计算偏斜度的轴。默认值为0。如果没有,则对整个阵列进行计算 a

bias布尔值,可选

如果为False,则会更正计算的统计偏差。

nan_policy{‘Propagate’,‘RAISE’,‘OMIT’},可选

定义输入包含NaN时的处理方式。以下选项可用(默认值为‘Propagate’):

  • ‘Propagate’:返回NaN

  • “raise”:引发错误

  • ‘omit’:执行计算时忽略NaN值

退货
skewnessndarray

值沿轴的偏斜度,在所有值相等的情况下返回0。

注意事项

样本偏度计算为费希尔-皮尔逊偏度系数,即

\[g_1=\frac{m_3}{m_2^{3/2}}\]

哪里

\[M_i=\frac{1}{N}\sum_{n=1}^N(x [n] -\bar{x})^i\]

是有偏的样本吗? \(i\texttt{{th}}\) 中心时刻,以及 \(\bar{{x}}\) 是样本均值。如果 bias 为假,则会校正计算的偏差,并且计算值是调整后的费舍尔-皮尔逊标准化弯矩系数,即

\[G_1=\frac{k_3}{k_2^{3/2}}= \frac{\sqrt{N(N-1)}}{N-2}\frac{m_3}{m_2^{3/2}}.\]

参考文献

1

Zvelinger,D.和Kokoska,S.(2000)。CRC标准概率和统计表和公式。查普曼与霍尔:纽约。2000年。第2.2.24.1节

示例

>>> from scipy.stats import skew
>>> skew([1, 2, 3, 4, 5])
0.0
>>> skew([2, 8, 0, 4, 1, 9, 9, 0])
0.2650554122698573