homogeneity_completeness_v_measure#

sklearn.metrics.homogeneity_completeness_v_measure(labels_true, labels_pred, *, beta=1.0)[源代码]#

立即计算均匀性、完整性以及V测量分数。

这些指标基于集群标签的规范化条件熵测量，以在给定相同样本的基本真相类标签的知识的情况下进行评估。

如果集群结果的所有集群仅包含属于单个类别的数据点，则集群结果满足同质性。

如果作为给定类成员的所有数据点都是同一集群的元素，则集群结果满足完整性。

这两个分数的正值都在0.0和1.0之间，最好值更大。

这3个指标独立于标签的绝对值：类或集群标签值的排列不会以任何方式改变得分值。

V-测量是对称的：交换 labels_true 和 label_pred 会给出相同的分数。这并不适用于同质性和完整性。V测量与 normalized_mutual_info_score 使用算术平均法。

阅读更多的 User Guide .

参数:

labels_true形状类似阵列（n_samples，）: 用作参考的地面真相类标签。
labels_pred形状类似阵列（n_samples，）: 要评估的集群标签。
betafloat，默认=1.0: 归因于的重量比 homogeneity vs completeness .如果 beta 大于1， completeness 在计算中权重更大。如果 beta 小于1， homogeneity 权重更强。

返回:

homogeneity浮子: Score between 0.0 and 1.0. 1.0 stands for perfectly homogeneous labeling.
completeness浮子: 评分在0.0和1.0之间。1.0代表完全完整的标签。
v_measure浮子: 前两个的调和平均值。

参见

homogeneity_score: 集群标记的均匀性指标。
completeness_score: 集群标记的完整性指标。
v_measure_score: V-测量（具有算术平均值选项的NMI）。

示例

>>> from sklearn.metrics import homogeneity_completeness_v_measure
>>> y_true, y_pred = [0, 0, 1, 1, 2, 2], [0, 0, 1, 2, 2, 2]
>>> homogeneity_completeness_v_measure(y_true, y_pred)
(np.float64(0.71...), np.float64(0.77...), np.float64(0.73...))