scipy.stats.mstats.spearmanr

scipy.stats.mstats.spearmanr(x, y=None, use_ties=True, axis=None, nan_policy='propagate', alternative='two-sided')[源代码]

计算Spearman秩相关系数和p值以测试非相关性。

Spearman相关性是两个数据集之间线性关系的非参数度量。与皮尔逊关联不同,Spearman关联不假设两个数据集都是正态分布的。与其他相关系数一样,此系数在-1和+1之间变化,0表示没有相关性。-1或+1的相关性意味着单调关系。正相关意味着AS x 增长,也是如此 y 。负相关意味着AS x 增加, y 减少了。

缺少的值将成对丢弃:如果 x 中的相应值 y 戴着面具。

p值大致表示不相关的系统产生的数据集的概率,该数据集的Spearman相关性至少与根据这些数据集计算的数据集的相关性一样极端。p值并不完全可靠,但对于大于500左右的数据集可能是合理的。

参数
x, y一维或二维ARRAY_LIKE,y是可选的

包含多个变量和观测的一个或两个一维或二维数组。当它们是一维时,每个表示单个变量的观测值的向量。有关2-D情况下的行为,请参见 axis ,见下图。

use_ties布尔值,可选

不要使用。不执行任何操作,关键字仅出于向后兼容的原因保留在原来的位置。

axis整型或无型,可选

如果AXIS=0(默认值),则每列表示一个变量,在行中有观察值。如果AXIS=1,则关系颠倒:每行表示一个变量,而列包含观察值。如果AXIS=NONE,则两个数组都将被分解。

nan_policy{‘Propagate’,‘RAISE’,‘OMIT’},可选

定义输入包含NaN时的处理方式。‘Propagate’返回NaN,‘Raise’抛出错误,‘omit’执行忽略NaN值的计算。默认值为“Propagate”。

alternative{‘双面’,‘少’,‘大’},可选

定义了另一种假设。默认值为“双面”。以下选项可用:

  • ‘Two-Side’:相关性为非零

  • ‘less’:相关性为负(小于零)

  • “较大”:相关性为正(大于零)

1.7.0 新版功能.

退货
correlation浮动

斯皮尔曼相关系数

pvalue浮动

双尾p值。

参考文献

[CRCProbStat2000] 第14.7条