calinski_harabasz_score#
- sklearn.metrics.calinski_harabasz_score(X, labels)[源代码]#
Compute the Calinski and Harabasz score.
它也称为方差比准则。
分数定义为群间分散度和群内分散度之和的比率。
阅读更多的 User Guide .
- 参数:
- X形状类似阵列(n_samples,n_features)
的列表
n_features
- 维度数据点。每一行对应一个数据点。- labels形状类似阵列(n_samples,)
每个样本的预测标签。
- 返回:
- score浮子
由此产生的Calinski-Harabasz分数。
引用
[1]T. Calinski and J. Harabasz, 1974. "A dendrite method for cluster analysis". Communications in Statistics <https://www.tandfonline.com/doi/abs/10.1080/03610927408827101>
_示例
>>> from sklearn.datasets import make_blobs >>> from sklearn.cluster import KMeans >>> from sklearn.metrics import calinski_harabasz_score >>> X, _ = make_blobs(random_state=0) >>> kmeans = KMeans(n_clusters=3, random_state=0,).fit(X) >>> calinski_harabasz_score(X, kmeans.labels_) np.float64(114.8...)