matthews_corrcoef#

sklearn.metrics.matthews_corrcoef(y_true, y_pred, *, sample_weight=None)[源代码]#

计算马修斯相关系数(MCC)。

马修斯相关系数用于机器学习中,作为二进制和多类分类质量的衡量标准。它考虑了真阳性、假阳性和阴性,通常被认为是一种平衡的衡量标准,即使类别的规模差异很大,也可以使用。MCC本质上是-1和+1之间的相关系数值。系数+1代表完美预测,0代表平均随机预测,-1代表逆预测。 该统计数据也称为ph系数。 [source: Wikipedia]

支持二进制和多类标签。 只有在二元情况下,这才与关于真、假阳性和阴性的信息有关。参见以下参考文献。

阅读更多的 User Guide .

参数:
y_true形状类似阵列(n_samples,)

地面真相(正确)目标值。

y_pred形状类似阵列(n_samples,)

分类器返回的估计目标。

sample_weight形状类似数组(n_samples,),默认=无

样本重量。

Added in version 0.18.

返回:
mcc浮子

马修斯相关系数(+1代表完美预测,0代表平均随机预测,-1代表逆预测)。

引用

[2]

Wikipedia entry for the Matthews Correlation Coefficient (phi coefficient) <https://en.wikipedia.org/wiki/Phi_coefficient> _.

[3]

Gorodkin, (2004). Comparing two K-category assignments by a K-category correlation coefficient <https://www.sciencedirect.com/science/article/pii/S1476927104000799> _.

[4]

Jurman, Riccadonna, Furlanello, (2012). A Comparison of MCC and CEN Error Measures in MultiClass Prediction <https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0041882> _.

示例

>>> from sklearn.metrics import matthews_corrcoef
>>> y_true = [+1, +1, +1, -1]
>>> y_pred = [+1, -1, +1, +1]
>>> matthews_corrcoef(y_true, y_pred)
np.float64(-0.33...)