homogeneity_completeness_v_measure#
- sklearn.metrics.homogeneity_completeness_v_measure(labels_true, labels_pred, *, beta=1.0)[源代码]#
立即计算均匀性、完整性以及V测量分数。
这些指标基于集群标签的规范化条件熵测量,以在给定相同样本的基本真相类标签的知识的情况下进行评估。
如果集群结果的所有集群仅包含属于单个类别的数据点,则集群结果满足同质性。
如果作为给定类成员的所有数据点都是同一集群的元素,则集群结果满足完整性。
这两个分数的正值都在0.0和1.0之间,最好值更大。
这3个指标独立于标签的绝对值:类或集群标签值的排列不会以任何方式改变得分值。
V-测量是对称的:交换
labels_true
和label_pred
会给出相同的分数。这并不适用于同质性和完整性。V测量与normalized_mutual_info_score
使用算术平均法。阅读更多的 User Guide .
- 参数:
- labels_true形状类似阵列(n_samples,)
用作参考的地面真相类标签。
- labels_pred形状类似阵列(n_samples,)
要评估的集群标签。
- betafloat,默认=1.0
归因于的重量比
homogeneity
vscompleteness
.如果beta
大于1,completeness
在计算中权重更大。如果beta
小于1,homogeneity
权重更强。
- 返回:
- homogeneity浮子
Score between 0.0 and 1.0. 1.0 stands for perfectly homogeneous labeling.
- completeness浮子
评分在0.0和1.0之间。1.0代表完全完整的标签。
- v_measure浮子
前两个的调和平均值。
参见
homogeneity_score
集群标记的均匀性指标。
completeness_score
集群标记的完整性指标。
v_measure_score
V-测量(具有算术平均值选项的NMI)。
示例
>>> from sklearn.metrics import homogeneity_completeness_v_measure >>> y_true, y_pred = [0, 0, 1, 1, 2, 2], [0, 0, 1, 2, 2, 2] >>> homogeneity_completeness_v_measure(y_true, y_pred) (np.float64(0.71...), np.float64(0.77...), np.float64(0.73...))