make_sparse_uncorrelated#
- sklearn.datasets.make_sparse_uncorrelated(n_samples=100, n_features=10, *, random_state=None)[源代码]#
使用稀疏不相关设计生成随机回归问题。
This dataset is described in Celeux et al [1]. as:
X ~ N(0, 1) y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]
只有前4个功能具有信息性。其余功能都没用了。
阅读更多的 User Guide .
- 参数:
- n_samplesint,默认=100
样本数量。
- n_featuresint,默认值=10
功能的数量。
- random_stateint,RandomState实例或无,默认=无
确定创建数据集的随机数生成。传递int以获得跨多个函数调用的可重复输出。看到 Glossary .
- 返回:
- X形状的nd数组(n_samples,n_features)
输入样本。
- y形状的nd数组(n_samples,)
输出值。
引用
[1]G.塞勒克斯,M.埃尔安巴里,J. - M. C.马林P. Robert,“回归中的正规化:在信息不足的情况下比较Bayesian和frequentist方法”,2009年。
示例
>>> from sklearn.datasets import make_sparse_uncorrelated >>> X, y = make_sparse_uncorrelated(random_state=0) >>> X.shape (100, 10) >>> y.shape (100,)