completeness_score#
- sklearn.metrics.completeness_score(labels_true, labels_pred)[源代码]#
在给定基本事实的情况下计算集群标签的完整性度量。
如果作为给定类成员的所有数据点都是同一集群的元素,则集群结果满足完整性。
该指标与标签的绝对值无关:类或集群标签值的排列不会以任何方式改变得分值。
此指标不对称:切换
label_true
与label_pred
将返回homogeneity_score
总体上会有所不同。阅读更多的 User Guide .
- 参数:
- labels_true形状类似阵列(n_samples,)
用作参考的地面真相类标签。
- labels_pred形状类似阵列(n_samples,)
要评估的集群标签。
- 返回:
- completeness浮子
评分在0.0和1.0之间。1.0代表完全完整的标签。
参见
homogeneity_score
集群标记的均匀性指标。
v_measure_score
V-测量(具有算术平均值选项的NMI)。
引用
[1]Andrew Rosenberg and Julia Hirschberg, 2007. V-Measure: A conditional entropy-based external cluster evaluation measure <https://aclweb.org/anthology/D/D07/D07-1043.pdf>
_示例
完美的标签已完整::
>>> from sklearn.metrics.cluster import completeness_score >>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0]) np.float64(1.0)
将所有类成员分配到相同集群的非完美标签仍然完整::
>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0])) 1.0 >>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1])) 0.999...
如果班级成员分散在不同的集群中,则作业无法完成::
>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1])) 0.0 >>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3])) 0.0