calinski_harabasz_score#

sklearn.metrics.calinski_harabasz_score(X, labels)[源代码]#

Compute the Calinski and Harabasz score.

它也称为方差比准则。

分数定义为群间分散度和群内分散度之和的比率。

阅读更多的 User Guide .

参数:
X形状类似阵列(n_samples,n_features)

的列表 n_features - 维度数据点。每一行对应一个数据点。

labels形状类似阵列(n_samples,)

每个样本的预测标签。

返回:
score浮子

由此产生的Calinski-Harabasz分数。

引用

[1]

T. Calinski and J. Harabasz, 1974. "A dendrite method for cluster analysis". Communications in Statistics <https://www.tandfonline.com/doi/abs/10.1080/03610927408827101> _

示例

>>> from sklearn.datasets import make_blobs
>>> from sklearn.cluster import KMeans
>>> from sklearn.metrics import calinski_harabasz_score
>>> X, _ = make_blobs(random_state=0)
>>> kmeans = KMeans(n_clusters=3, random_state=0,).fit(X)
>>> calinski_harabasz_score(X, kmeans.labels_)
np.float64(114.8...)