scipy.stats.skew¶

scipy.stats.skew(a, axis=0, bias=True, nan_policy='propagate')[源代码]¶

计算数据集的样本偏斜度。

对于正态分布的数据，偏度应该大约为零。对于单峰连续分布，偏斜度值大于零表示分布的右尾有更多权重。该函数 skewtest 可以用来确定统计意义上的偏斜度值是否足够接近于零。

参数

andarray

输入数组。

axis整型或无型，可选

沿其计算偏斜度的轴。默认值为0。如果没有，则对整个阵列进行计算 a 。

bias布尔值，可选

如果为False，则会更正计算的统计偏差。

nan_policy{‘Propagate’，‘RAISE’，‘OMIT’}，可选

定义输入包含NaN时的处理方式。以下选项可用(默认值为‘Propagate’)：

‘Propagate’：返回NaN

“raise”：引发错误

‘omit’：执行计算时忽略NaN值

退货

注意事项

样本偏度计算为费希尔-皮尔逊偏度系数，即

\[g_1=\frac{m_3}{m_2^{3/2}}\]

哪里

\[M_i=\frac{1}{N}\sum_{n=1}^N(x [n] -\bar{x})^i\]

是有偏的样本吗？ \(i\texttt{{th}}\) 中心时刻，以及 \(\bar{{x}}\) 是样本均值。如果 bias 为假，则会校正计算的偏差，并且计算值是调整后的费舍尔-皮尔逊标准化弯矩系数，即

\[G_1=\frac{k_3}{k_2^{3/2}}= \frac{\sqrt{N(N-1)}}{N-2}\frac{m_3}{m_2^{3/2}}.\]

参考文献

示例

>>> from scipy.stats import skew
>>> skew([1, 2, 3, 4, 5])
0.0
>>> skew([2, 8, 0, 4, 1, 9, 9, 0])
0.2650554122698573

scipy.stats.moment

scipy.stats.kstat