scipy.stats.kruskal

scipy.stats.kruskal(*args, nan_policy='propagate', axis=0)[源代码]

计算独立样本的Kruskal-Wallis H检验。

Kruskal-Wallis H检验检验了所有组的总体中位数相等的零假设。它是方差分析的非参数版本。该测试对2个或更多可能具有不同大小的独立样本进行测试。请注意,拒绝零假设并不表明哪一组不同。需要在组之间进行事后比较,以确定哪些组不同。

参数
样本1,样本2,.array_like

具有样本测量的两个或多个数组可以作为参数给出。样本必须是一维的。

nan_policy{‘传播’,‘省略’,‘提升’}

定义如何处理输入NAN。

  • propagate :如果沿其计算统计的轴切片(例如行)中存在NaN,则输出的相应条目将为NaN。

  • omit :执行计算时将省略NAN。如果沿其计算统计数据的轴片中剩余的数据不足,则输出的相应条目将为NaN。

  • raise :如果存在NaN,则 ValueError 都会被举起。

axis整型或无,默认值:0

如果为int,则为要沿其计算统计信息的输入轴。输入的每个轴切片(例如行)的统计将出现在输出的相应元素中。如果 None ,则在计算统计数据之前将分解输入。

退货
statistic浮动

Kruskal-Wallis H统计数据,修正了平局。

pvalue浮动

假设H为卡方分布的检验的p值。返回的p值是在H处计算的卡方分布的生存函数。

参见

f_oneway

单因素方差分析。

mannwhitneyu

两个样本的Mann-Whitney秩和检验。

friedmanchisquare

对重复测量进行弗里德曼检验。

注意事项

由于假设H服从卡方分布,所以每组样本的数量不能太少。一个典型的规则是每个样本必须至少有5个尺寸。

参考文献

1

W.H.Kruskal和W.W.Wallis,“单标准方差分析中秩的使用”,“美国统计协会杂志”,第47卷,第260期,第583-621页,1952年。

2

https://en.wikipedia.org/wiki/Kruskal-Wallis_one-way_analysis_of_variance

示例

>>> from scipy import stats
>>> x = [1, 3, 5, 7, 9]
>>> y = [2, 4, 6, 8, 10]
>>> stats.kruskal(x, y)
KruskalResult(statistic=0.2727272727272734, pvalue=0.6015081344405895)
>>> x = [1, 1, 1]
>>> y = [2, 2, 2]
>>> z = [2, 2]
>>> stats.kruskal(x, y, z)
KruskalResult(statistic=7.0, pvalue=0.0301973834223185)