homogeneity_completeness_v_measure#

sklearn.metrics.homogeneity_completeness_v_measure(labels_true, labels_pred, *, beta=1.0)[源代码]#

立即计算均匀性、完整性以及V测量分数。

这些指标基于集群标签的规范化条件熵测量,以在给定相同样本的基本真相类标签的知识的情况下进行评估。

如果集群结果的所有集群仅包含属于单个类别的数据点,则集群结果满足同质性。

如果作为给定类成员的所有数据点都是同一集群的元素,则集群结果满足完整性。

这两个分数的正值都在0.0和1.0之间,最好值更大。

这3个指标独立于标签的绝对值:类或集群标签值的排列不会以任何方式改变得分值。

V-测量是对称的:交换 labels_truelabel_pred 会给出相同的分数。这并不适用于同质性和完整性。V测量与 normalized_mutual_info_score 使用算术平均法。

阅读更多的 User Guide .

参数:
labels_true形状类似阵列(n_samples,)

用作参考的地面真相类标签。

labels_pred形状类似阵列(n_samples,)

要评估的集群标签。

betafloat,默认=1.0

归因于的重量比 homogeneity vs completeness .如果 beta 大于1, completeness 在计算中权重更大。如果 beta 小于1, homogeneity 权重更强。

返回:
homogeneity浮子

Score between 0.0 and 1.0. 1.0 stands for perfectly homogeneous labeling.

completeness浮子

评分在0.0和1.0之间。1.0代表完全完整的标签。

v_measure浮子

前两个的调和平均值。

参见

homogeneity_score

集群标记的均匀性指标。

completeness_score

集群标记的完整性指标。

v_measure_score

V-测量(具有算术平均值选项的NMI)。

示例

>>> from sklearn.metrics import homogeneity_completeness_v_measure
>>> y_true, y_pred = [0, 0, 1, 1, 2, 2], [0, 0, 1, 2, 2, 2]
>>> homogeneity_completeness_v_measure(y_true, y_pred)
(np.float64(0.71...), np.float64(0.77...), np.float64(0.73...))