scipy.stats.contingency.association

scipy.stats.contingency.association(observed, method='cramer', correction=False, lambda_=None)[源代码]

计算两个名义变量之间的关联度。

该函数提供了从2D列联表中给出的数据计算两个名义变量之间关联的三个度量之一的选项:Tschuprow的T、Pearson的列联系数和Cramer的V。

参数
observed类似阵列的

观测值的数组

method{“Cramer”,“tschuprow”,“Pearson”}(默认值=“Cramer”)

关联测试统计。

correction布尔值,可选

继承自 scipy.stats.contingency.chi2_contingency()

lambda_浮点或字符串,可选

继承自 scipy.stats.contingency.chi2_contingency()

退货
statistic浮动

测试统计的值

注意事项

Cramer‘s V、Tschuprow’s T和Pearson‘s权变系数都衡量了两个名义或顺序变量相关的程度,或它们之间的关联程度。这与相关性不同,尽管许多人经常错误地认为它们是等价的。相关性衡量的是两个变量之间的关联方式,而关联性衡量的是变量之间的关联程度。因此,关联性并不包含自变量,而是对独立性的一种检验。值1.0表示完全关联,值0.0表示变量没有关联。

Cramer‘s V和Tschuprow’s T都是φ系数的推广。此外,由于Cramer‘s V和Tschuprow’s T之间的密切关系,返回值通常可以是相似的,甚至是相等的。当阵列形状偏离2x2时,它们可能会有更大的分歧。

参考文献

1

“Tschuprow‘s T”,https://en.wikipedia.org/wiki/Tschuprow’s_T

2

Tschuprow,A.A.(1939年),数学相关理论原理;M.Kantorowitsch翻译。W.Hodge&Co.

3

“克雷默的V”,https://en.wikipedia.org/wiki/Cramer‘s_V

4

“名义联想:Phi和Cramer‘s V”,http://www.people.vcu.edu/~pdattalo/702SuppRead/MeasAssoc/NominalAssoc.html

5

保罗·金里奇,“变量之间的关联”,http://uregina.ca/~gingrich/ch11a.pdf

示例

使用4x2列联表的示例:

>>> from scipy.stats.contingency import association
>>> obs4x2 = np.array([[100, 150], [203, 322], [420, 700], [320, 210]])

皮尔逊关联系数>关联性(ob4x2,method=“Pearson”)0.18303298140595667

克雷默V

>>> association(obs4x2, method="cramer")
0.18617813077483678

Tschuprow‘s T

>>> association(obs4x2, method="tschuprow")
0.14146478765062995