scipy.stats.pointbiserialr¶
- scipy.stats.pointbiserialr(x, y)[源代码]¶
计算点的双列相关系数及其p值。
点二元序列相关用于测量二元变量x和连续变量y之间的关系。与其他相关系数一样,此相关系数在-1和+1之间变化,0表示没有相关性。-1或+1的相关性暗示了一种决定性的关系。
此函数使用快捷公式,但产生的结果与
pearsonr
。- 参数
- x布尔型数组
输入数组。
- yarray_like
输入数组。
- 退货
- correlation浮动
R值。
- pvalue浮动
双面p值。
注意事项
pointbiserialr
对以下内容使用t检验n-1
自由度。它相当于pearsonr
。点-双序相关的值可以通过以下公式计算:
\[R_{pb}=\frac{\overline{Y_{1}}- \overline{Y_{0}{s_{y}}\sqrt{\frac{N_{1}N_{2}}{N(N-1)}\]哪里 \(Y_{{0}}\) 和 \(Y_{{1}}\) 分别是编码为0和1的度量观测值的平均值; \(N_{{0}}\) 和 \(N_{{1}}\) 分别编码为0和1的观测值数量; \(N\) 是观察到的总数,并且 \(s_{{y}}\) 是所有公制观测值的标准偏差。
值为 \(r_{{pb}}\) 即显着不同于零完全等同于两组均值有显着差异。因此,独立的组t测试使用 \(N-2\) 自由度可以用来测试 \(r_{{pb}}\) 不是零。比较两个独立组别的t统计量与t统计量的关系 \(r_{{pb}}\) 由以下人员提供:
\[t=\sqrt{N-2}\frac{r_{pb}}{\sqrt{1-r^{2}_{pb}\]参考文献
- 1
J·列夫,“点双列相关系数”,ANN。数学课。“统计学家”,第20卷,第1期,第125-126页,1949年。
- 2
一个离散变量和一个连续变量之间的相关性,点-双序相关性>,ANN,R.F.Tate,<离散变量与连续变量之间的相关性>,点-双序列相关性。数学课。统计员,第25卷,NP。3,第603-607页,1954年。
- 3
D.Kornbrot“点双序列相关”,载于Wiley StatsRef:Statistics Reference Online(编辑N.Balakrishnan等人),2014年。 DOI:10.1002/9781118445112.stat06227
示例
>>> from scipy import stats >>> a = np.array([0, 0, 0, 1, 1, 1, 1]) >>> b = np.arange(7) >>> stats.pointbiserialr(a, b) (0.8660254037844386, 0.011724811003954652) >>> stats.pearsonr(a, b) (0.86602540378443871, 0.011724811003954626) >>> np.corrcoef(a, b) array([[ 1. , 0.8660254], [ 0.8660254, 1. ]])