completeness_score#

sklearn.metrics.completeness_score(labels_true, labels_pred)[源代码]#

在给定基本事实的情况下计算集群标签的完整性度量。

如果作为给定类成员的所有数据点都是同一集群的元素,则集群结果满足完整性。

该指标与标签的绝对值无关:类或集群标签值的排列不会以任何方式改变得分值。

此指标不对称:切换 label_truelabel_pred 将返回 homogeneity_score 总体上会有所不同。

阅读更多的 User Guide .

参数:
labels_true形状类似阵列(n_samples,)

用作参考的地面真相类标签。

labels_pred形状类似阵列(n_samples,)

要评估的集群标签。

返回:
completeness浮子

评分在0.0和1.0之间。1.0代表完全完整的标签。

参见

homogeneity_score

集群标记的均匀性指标。

v_measure_score

V-测量(具有算术平均值选项的NMI)。

引用

[1]

Andrew Rosenberg and Julia Hirschberg, 2007. V-Measure: A conditional entropy-based external cluster evaluation measure <https://aclweb.org/anthology/D/D07/D07-1043.pdf> _

示例

完美的标签已完整::

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
np.float64(1.0)

将所有类成员分配到相同集群的非完美标签仍然完整::

>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999...

如果班级成员分散在不同的集群中,则作业无法完成::

>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0