pair_confusion_matrix#

sklearn.metrics.cluster.pair_confusion_matrix(labels_true, labels_pred)[源代码]#

由两个集群产生的配对混淆矩阵。

配对混淆矩阵 \(C\) 通过考虑所有样本对并计数在真实和预测的集群下分配到相同或不同集群的样本对,计算两个集群之间的2 x 2相似性矩阵 [1].

将聚集在一起的一对样本视为正对,那么在二进制分类中,真阴性的计数是 \(C_{00}\) ,假阴性是 \(C_{10}\) ,真正的积极因素是 \(C_{11}\) 假阳性是 \(C_{01}\) .

阅读更多的 User Guide .

参数:
labels_true形状类似阵列(n_samples,),dype =积分

用作参考的地面真相类标签。

labels_pred形状类似阵列(n_samples,),dype =积分

要评估的集群标签。

返回:
Cnd数组形状(2,2),dype =np.int64

应急矩阵。

参见

sklearn.metrics.rand_score

兰德得分。

sklearn.metrics.adjusted_rand_score

调整后的兰德分数。

sklearn.metrics.adjusted_mutual_info_score

调整后的相互信息。

引用

示例

完美匹配的标签在对角线上具有所有非零条目,无论实际标签值如何:

>>> from sklearn.metrics.cluster import pair_confusion_matrix
>>> pair_confusion_matrix([0, 0, 1, 1], [1, 1, 0, 0])
array([[8, 0],
       [0, 4]]...

将所有类成员分配到相同集群的标签是完整的,但可能不总是纯的,因此会受到惩罚,并且有一些非对角线非零条目:

>>> pair_confusion_matrix([0, 0, 1, 2], [0, 0, 1, 1])
array([[8, 2],
       [0, 2]]...

请注意,矩阵并不对称。