numpy.corrcoef¶

numpy.corrcoef(x, y=None, rowvar=True, bias=<no value>, ddof=<no value>, *, dtype=None)[源代码]¶

返回皮尔逊积矩相关系数。

请参考文档 cov 更多细节。相关系数矩阵之间的关系， R 以及协方差矩阵， C 是

$R_ij=\frac c ij \sqrt c ii*c jj$

价值观 R 介于-1和1之间（含1）。

参数

xarray_like: 包含多个变量和观测值的一维或二维数组。每行 x 表示一个变量，每列都是对所有这些变量的单个观察。也看到 rowvar 下面。
y阵列式，可选: 一组附加的变量和观察值。 y 形状与 x .
rowvar可选的布尔: 如果 rowvar 为真（默认值），则每行代表一个变量，列中包含观测值。否则，关系将被转置：每列表示一个变量，而行包含观测值。
bias_ Novalue，可选: 没有效果，不要使用。

1.10.0 版后已移除.
ddof_ Novalue，可选: 没有效果，不要使用。

1.10.0 版后已移除.
dtype数据类型，可选: 结果的数据类型。默认情况下，返回数据类型至少有 numpy.float64 精度。

1.20 新版功能.

返回

R恩达雷: 变量的相关系数矩阵。

参见

cov: 协方差矩阵

笔记

由于浮点取整的结果数组可能不是Hermitian，对角线元素可能不是1，并且元素可能不满足不等式abs（a）<=1。实部和虚部被裁剪到区间 [-1, 1] 试图改善这种情况，但在复杂的情况下没有多大帮助。

此函数接受但放弃参数 bias 和 ddof . 这是为了与此函数的早期版本向后兼容。这些参数对函数的返回值没有影响，在这个和以前版本的numpy中可以安全地忽略这些参数。

实例

在这个例子中，我们生成两个随机数组， xarr 和 yarr ，并计算行相关系数和列相关系数， R . 自从 rowvar 默认情况下为true，我们首先找到变量之间的行Pearson相关系数 xarr .

>>> import numpy as np
>>> rng = np.random.default_rng(seed=42)
>>> xarr = rng.random((3, 3))
>>> xarr
array([[0.77395605, 0.43887844, 0.85859792],
       [0.69736803, 0.09417735, 0.97562235],
       [0.7611397 , 0.78606431, 0.12811363]])
>>> R1 = np.corrcoef(xarr)
>>> R1
array([[ 1.        ,  0.99256089, -0.68080986],
       [ 0.99256089,  1.        , -0.76492172],
       [-0.68080986, -0.76492172,  1.        ]])

如果我们再加上一组变量和观察值 yarr ，我们可以计算变量之间的行皮尔逊相关系数 xarr 和 yarr .

>>> yarr = rng.random((3, 3))
>>> yarr
array([[0.45038594, 0.37079802, 0.92676499],
       [0.64386512, 0.82276161, 0.4434142 ],
       [0.22723872, 0.55458479, 0.06381726]])
>>> R2 = np.corrcoef(xarr, yarr)
>>> R2
array([[ 1.        ,  0.99256089, -0.68080986,  0.75008178, -0.934284  ,
        -0.99004057],
       [ 0.99256089,  1.        , -0.76492172,  0.82502011, -0.97074098,
        -0.99981569],
       [-0.68080986, -0.76492172,  1.        , -0.99507202,  0.89721355,
         0.77714685],
       [ 0.75008178,  0.82502011, -0.99507202,  1.        , -0.93657855,
        -0.83571711],
       [-0.934284  , -0.97074098,  0.89721355, -0.93657855,  1.        ,
         0.97517215],
       [-0.99004057, -0.99981569,  0.77714685, -0.83571711,  0.97517215,
         1.        ]])

最后如果我们使用这个选项 rowvar=False ，列现在被视为变量，我们将在 xarr 和 yarr .

>>> R3 = np.corrcoef(xarr, yarr, rowvar=False)
>>> R3
array([[ 1.        ,  0.77598074, -0.47458546, -0.75078643, -0.9665554 ,
         0.22423734],
       [ 0.77598074,  1.        , -0.92346708, -0.99923895, -0.58826587,
        -0.44069024],
       [-0.47458546, -0.92346708,  1.        ,  0.93773029,  0.23297648,
         0.75137473],
       [-0.75078643, -0.99923895,  0.93773029,  1.        ,  0.55627469,
         0.47536961],
       [-0.9665554 , -0.58826587,  0.23297648,  0.55627469,  1.        ,
        -0.46666491],
       [ 0.22423734, -0.44069024,  0.75137473,  0.47536961, -0.46666491,
         1.        ]])

numpy.nanvar numpy.correlate