scipy.stats.pointbiserialr

scipy.stats.pointbiserialr(x, y)[源代码]

计算点的双列相关系数及其p值。

点二元序列相关用于测量二元变量x和连续变量y之间的关系。与其他相关系数一样,此相关系数在-1和+1之间变化,0表示没有相关性。-1或+1的相关性暗示了一种决定性的关系。

此函数使用快捷公式,但产生的结果与 pearsonr

参数
x布尔型数组

输入数组。

yarray_like

输入数组。

退货
correlation浮动

R值。

pvalue浮动

双面p值。

注意事项

pointbiserialr 对以下内容使用t检验 n-1 自由度。它相当于 pearsonr

点-双序相关的值可以通过以下公式计算:

\[R_{pb}=\frac{\overline{Y_{1}}- \overline{Y_{0}{s_{y}}\sqrt{\frac{N_{1}N_{2}}{N(N-1)}\]

哪里 \(Y_{{0}}\)\(Y_{{1}}\) 分别是编码为0和1的度量观测值的平均值; \(N_{{0}}\)\(N_{{1}}\) 分别编码为0和1的观测值数量; \(N\) 是观察到的总数,并且 \(s_{{y}}\) 是所有公制观测值的标准偏差。

值为 \(r_{{pb}}\) 即显着不同于零完全等同于两组均值有显着差异。因此,独立的组t测试使用 \(N-2\) 自由度可以用来测试 \(r_{{pb}}\) 不是零。比较两个独立组别的t统计量与t统计量的关系 \(r_{{pb}}\) 由以下人员提供:

\[t=\sqrt{N-2}\frac{r_{pb}}{\sqrt{1-r^{2}_{pb}\]

参考文献

1

J·列夫,“点双列相关系数”,ANN。数学课。“统计学家”,第20卷,第1期,第125-126页,1949年。

2

一个离散变量和一个连续变量之间的相关性,点-双序相关性>,ANN,R.F.Tate,<离散变量与连续变量之间的相关性>,点-双序列相关性。数学课。统计员,第25卷,NP。3,第603-607页,1954年。

3

D.Kornbrot“点双序列相关”,载于Wiley StatsRef:Statistics Reference Online(编辑N.Balakrishnan等人),2014年。 DOI:10.1002/9781118445112.stat06227

示例

>>> from scipy import stats
>>> a = np.array([0, 0, 0, 1, 1, 1, 1])
>>> b = np.arange(7)
>>> stats.pointbiserialr(a, b)
(0.8660254037844386, 0.011724811003954652)
>>> stats.pearsonr(a, b)
(0.86602540378443871, 0.011724811003954626)
>>> np.corrcoef(a, b)
array([[ 1.       ,  0.8660254],
       [ 0.8660254,  1.       ]])