completeness_score#

sklearn.metrics.completeness_score(labels_true, labels_pred)[源代码]#

在给定基本事实的情况下计算集群标签的完整性度量。

如果作为给定类成员的所有数据点都是同一集群的元素，则集群结果满足完整性。

该指标与标签的绝对值无关：类或集群标签值的排列不会以任何方式改变得分值。

此指标不对称：切换 label_true 与 label_pred 将返回 homogeneity_score 总体上会有所不同。

阅读更多的 User Guide .

参数:

labels_true形状类似阵列（n_samples，）: 用作参考的地面真相类标签。
labels_pred形状类似阵列（n_samples，）: 要评估的集群标签。

返回:

completeness浮子: 评分在0.0和1.0之间。1.0代表完全完整的标签。

参见

homogeneity_score: 集群标记的均匀性指标。
v_measure_score: V-测量（具有算术平均值选项的NMI）。

引用

[1]

Andrew Rosenberg and Julia Hirschberg, 2007. V-Measure: A conditional entropy-based external cluster evaluation measure <https://aclweb.org/anthology/D/D07/D07-1043.pdf> _

示例

完美的标签已完整：：

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
np.float64(1.0)

将所有类成员分配到相同集群的非完美标签仍然完整：：

>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999...

如果班级成员分散在不同的集群中，则作业无法完成：：

>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0