sample_without_replacement#

sklearn.utils.random.sample_without_replacement(n_population, n_samples, method='auto', random_state=None)#

不带替换的示例整数。

从集合[0，n_pullup）中选择n_samples整元，不进行替换。

参数:

n_populationint

要采样的集的大小。

n_samplesint

要采样的整数数。

random_stateint，RandomState实例或无，默认=无

如果是int，则random_State是随机数生成器使用的种子;如果是RandomState实例，则random_State是随机数生成器;如果是无，则随机数生成器是由使用的RandomState实例 np.random .

method{“Auto”，“Tracking_selection”，“storage_sampling”，“pool”}，默认='自动'

如果方法==“Auto”，则使用n_samples / n_pullup的比率来确定使用哪种算法：如果比率在0和0.01之间，则使用跟踪选择。如果比率在0.01和0.99之间，则使用numpy.random. performing。如果比率大于0.99，则使用水库采样。所选择的整数的顺序未定义。如果需要随机顺序，则应对所选子集进行洗牌。

如果方法==“Tracking_selection”，则使用适合于 n_samples <<< n_population .

如果方法==“reservoir_sampling”，则使用适合于高存储器约束或当O (n_samples ）~ O (n_population ).所选择的整数的顺序未定义。如果需要随机顺序，则应对所选子集进行洗牌。

如果方法==“pool”，则基于池的算法特别快，甚至比跟踪选择方法更快。然而，包含整个种群的载体必须被初始化。如果n_samples ~ n_pupe，则水库采样方法更快。

返回:

out形状的nd数组（n_samples，）: 抽样的整元子集。所选整元的子集可能不会随机化，请参阅方法参数。

示例

>>> from sklearn.utils.random import sample_without_replacement
>>> sample_without_replacement(10, 5, random_state=42)
array([8, 1, 5, 0, 7])