make_sparse_uncorrelated#

sklearn.datasets.make_sparse_uncorrelated(n_samples=100, n_features=10, *, random_state=None)[源代码]#

使用稀疏不相关设计生成随机回归问题。

This dataset is described in Celeux et al [1]. as:

X ~ N(0, 1)
y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]

只有前4个功能具有信息性。其余功能都没用了。

阅读更多的 User Guide .

参数:
n_samplesint,默认=100

样本数量。

n_featuresint,默认值=10

功能的数量。

random_stateint,RandomState实例或无,默认=无

确定创建数据集的随机数生成。传递int以获得跨多个函数调用的可重复输出。看到 Glossary .

返回:
X形状的nd数组(n_samples,n_features)

输入样本。

y形状的nd数组(n_samples,)

输出值。

引用

[1]

G.塞勒克斯,M.埃尔安巴里,J. - M. C.马林P. Robert,“回归中的正规化:在信息不足的情况下比较Bayesian和frequentist方法”,2009年。

示例

>>> from sklearn.datasets import make_sparse_uncorrelated
>>> X, y = make_sparse_uncorrelated(random_state=0)
>>> X.shape
(100, 10)
>>> y.shape
(100,)