scipy.stats.boschloo_exact¶
- scipy.stats.boschloo_exact(table, alternative='two-sided', n=32)[源代码]¶
在2x2列联表上执行Boschloo的精确测试。
- 参数
- table整数的类似数组(ARRAY_LIKE)
2x2列联表。元素应为非负整数。
- alternative{‘双面’,‘少’,‘大’},可选
定义空的和可选的假设。默认值为“双面”。请参阅下面注释部分的说明。
- n整型,可选
构建采样方法时使用的采样点数量。请注意,此参数将自动转换为2的下一个更高的幂,因为
scipy.stats.qmc.Sobol
用于选择采样点。默认值为32。一定是阳性的。在大多数情况下,32点就足以达到很好的精度。更多的分数是以性能为代价的。
- 退货
- berBoschlooExactResult
具有以下属性的结果对象。
- 统计数据浮动
Boschloo检验中使用的统计量;即来自Fisher精确检验的p值。
- p值浮动
p值,在假设零假设为真的情况下,获得至少与实际观察到的分布一样极端的分布的概率。
参见
chi2_contingency
列联表中变量独立性的卡方检验。
fisher_exact
2x2列联表上的Fisher精确检验。
barnard_exact
Barnard的精确检验,这是一个比Fisher的2x2列联表的精确检验更有效的替代方法。
注意事项
Boschloo检验是用于分析列联表的精确检验。它检查了两个分类变量之间的联系,是比Fisher的2x2列联表的精确检验更有效的选择。
让我们定义一下 \(X_0\) 表示观察样本的2x2矩阵,其中每列存储二项式实验,如下例所示。让我们也定义一下 \(p_1, p_2\) 的理论二项概率 \(x_{{11}}\) 和 \(x_{{12}}\) 。在使用Boschloo精确检验时,我们可以断言三个不同的零假设:
\(H_0 : p_1=p_2\) 与 \(H_1 : p_1 < p_2\) ,具有 alternative =“较少”
\(H_0 : p_1=p_2\) 与 \(H_1 : p_1 > p_2\) ,具有 alternative =“更大”
\(H_0 : p_1=p_2\) 与 \(H_1 : p_1 \neq p_2\) ,具有 alternative =“双面”(默认一面)
Boschloo的精确检验使用Fisher精确检验的p值作为统计量,Boschloo的p值是在零假设下观察到该统计量的极值的概率。
博什卢和巴纳德的测试都比费舍尔的精确测试更有效。
1.7.0 新版功能.
参考文献
- 1
R.D.博什卢。“检验两个概率相等时,提高了2×2表的条件显著性水平”,“新西兰统计”,24(1),1970。
- 2
“博什卢氏试验”,维基百科,https://en.wikipedia.org/wiki/Boschloo%27s_test
- 3
Lise M.Saari等人。“员工态度与工作满意度”,“人力资源管理”,43(4),395-407,2004 DOI:10.1002/hrm.20032 。
示例
在下面的例子中,我们考虑文章“员工态度和工作满意度”。 [3] 报告了63名科学家和117名大学教授的调查结果。在63名科学家中,31人表示他们对自己的工作非常满意,而74名大学教授对自己的工作非常满意。这是大学教授比科学家对自己的工作更满意的重要证据吗?下表汇总了上述数据:
college professors scientists Very Satisfied 74 31 Dissatisfied 43 32
当使用统计假设检验时,我们通常使用阈值概率或显著性水平,在该阈值概率或显著性水平上我们决定拒绝零假设 \(H_0\) 。假设我们选择5%的共同显著性水平。
我们的另一种假设是,大学教授确实比科学家对他们的工作更满意。因此,我们预计 \(p_1\) 非常满意的大学教授的比例将大于 \(p_2\) ,非常满意的科学家的比例。因此我们称之为
boschloo_exact
使用alternative="greater"
选项:>>> import scipy.stats as stats >>> res = stats.boschloo_exact([[74, 31], [43, 32]], alternative="greater") >>> res.statistic 0.0483... >>> res.pvalue 0.0355...
在科学家比大学教授对自己的工作更满意的零假设下,获得至少与观测数据一样极端的测试结果的概率约为3.55%。因为这个p值小于我们选择的显著性水平,所以我们有证据可以拒绝。 \(H_0\) 支持另一种假设。