scipy.stats.skew¶
- scipy.stats.skew(a, axis=0, bias=True, nan_policy='propagate')[源代码]¶
计算数据集的样本偏斜度。
对于正态分布的数据,偏度应该大约为零。对于单峰连续分布,偏斜度值大于零表示分布的右尾有更多权重。该函数
skewtest
可以用来确定统计意义上的偏斜度值是否足够接近于零。- 参数
- andarray
输入数组。
- axis整型或无型,可选
沿其计算偏斜度的轴。默认值为0。如果没有,则对整个阵列进行计算 a 。
- bias布尔值,可选
如果为False,则会更正计算的统计偏差。
- nan_policy{‘Propagate’,‘RAISE’,‘OMIT’},可选
定义输入包含NaN时的处理方式。以下选项可用(默认值为‘Propagate’):
‘Propagate’:返回NaN
“raise”:引发错误
‘omit’:执行计算时忽略NaN值
- 退货
- skewnessndarray
值沿轴的偏斜度,在所有值相等的情况下返回0。
注意事项
样本偏度计算为费希尔-皮尔逊偏度系数,即
\[g_1=\frac{m_3}{m_2^{3/2}}\]哪里
\[M_i=\frac{1}{N}\sum_{n=1}^N(x [n] -\bar{x})^i\]是有偏的样本吗? \(i\texttt{{th}}\) 中心时刻,以及 \(\bar{{x}}\) 是样本均值。如果
bias
为假,则会校正计算的偏差,并且计算值是调整后的费舍尔-皮尔逊标准化弯矩系数,即\[G_1=\frac{k_3}{k_2^{3/2}}= \frac{\sqrt{N(N-1)}}{N-2}\frac{m_3}{m_2^{3/2}}.\]参考文献
- 1
Zvelinger,D.和Kokoska,S.(2000)。CRC标准概率和统计表和公式。查普曼与霍尔:纽约。2000年。第2.2.24.1节
示例
>>> from scipy.stats import skew >>> skew([1, 2, 3, 4, 5]) 0.0 >>> skew([2, 8, 0, 4, 1, 9, 9, 0]) 0.2650554122698573