estimate_bandwidth#
- sklearn.cluster.estimate_bandwidth(X, *, quantile=0.3, n_samples=None, random_state=0, n_jobs=None)[源代码]#
估计均值漂移算法使用的带宽。
此函数至少需要二次的时间
n_samples
.对于大型数据集,明智的做法是通过设置n_samples
.或者,参数bandwidth
可以设置为一个小的值,而无需估计它。- 参数:
- X形状类似阵列(n_samples,n_features)
输入点。
- quantile浮点数,默认值=0.3
应为 [0, 1] 0.5意味着使用所有成对距离的中位数。
- n_samplesint,默认=无
要使用的样本数量。如果没有给出,则使用所有样本。
- random_stateint,RandomState实例,默认=无
生成器用于从输入点随机选择样本进行带宽估计。使用int使随机性具有确定性。看到 Glossary .
- n_jobsint,默认=无
为邻居搜索运行的并行作业数。
None
意思是1,除非在a中joblib.parallel_backend
上下文-1
意味着使用所有处理器。看到 Glossary 了解更多详细信息。
- 返回:
- bandwidth浮子
带宽参数。
示例
>>> import numpy as np >>> from sklearn.cluster import estimate_bandwidth >>> X = np.array([[1, 1], [2, 1], [1, 0], ... [4, 7], [3, 5], [3, 6]]) >>> estimate_bandwidth(X, quantile=0.5) np.float64(1.61...)