estimate_bandwidth#

sklearn.cluster.estimate_bandwidth(X, *, quantile=0.3, n_samples=None, random_state=0, n_jobs=None)[源代码]#

估计均值漂移算法使用的带宽。

此函数至少需要二次的时间 n_samples .对于大型数据集，明智的做法是通过设置 n_samples .或者，参数 bandwidth 可以设置为一个小的值，而无需估计它。

参数:

X形状类似阵列（n_samples，n_features）: 输入点。
quantile浮点数，默认值=0.3: 应为 [0, 1] 0.5意味着使用所有成对距离的中位数。
n_samplesint，默认=无: 要使用的样本数量。如果没有给出，则使用所有样本。
random_stateint，RandomState实例，默认=无: 生成器用于从输入点随机选择样本进行带宽估计。使用int使随机性具有确定性。看到 Glossary .
n_jobsint，默认=无: 为邻居搜索运行的并行作业数。 None 意思是1，除非在a中 joblib.parallel_backend 上下文 -1 意味着使用所有处理器。看到 Glossary 了解更多详细信息。

返回:

bandwidth浮子: 带宽参数。

示例

>>> import numpy as np
>>> from sklearn.cluster import estimate_bandwidth
>>> X = np.array([[1, 1], [2, 1], [1, 0],
...               [4, 7], [3, 5], [3, 6]])
>>> estimate_bandwidth(X, quantile=0.5)
np.float64(1.61...)