sklearn.datasets#

加载流行数据集和人工数据生成器的实用程序。

User guide. 看到 数据集加载实用程序 部分了解更多详细信息。

装载机#

clear_data_home

删除数据主缓存的所有内容。

dump_svmlight_file

以svmlight / libsvm文件格式转储数据集。

fetch_20newsgroups

从20个新闻组数据集加载文件名和数据(分类)。

fetch_20newsgroups_vectorized

加载并对20个新闻组数据集进行垂直化(分类)。

fetch_california_housing

加载加州住房数据集(回归)。

fetch_covtype

加载coverype数据集(分类)。

fetch_file

如果本地文件夹中尚未存在,请从Web获取该文件。

fetch_kddcup99

加载kddcup 99数据集(分类)。

fetch_lfw_pairs

加载Wild中的标签面孔(LFW)配对数据集(分类)。

fetch_lfw_people

加载野外标签面孔(LFW)人员数据集(分类)。

fetch_olivetti_faces

加载来自AT & T的Olivetti面部数据集(分类)。

fetch_openml

通过名称或数据集id从openml中获取数据集。

fetch_rcv1

加载RCV 1多标签数据集(分类)。

fetch_species_distributions

Phillips et.物种分布数据集的加载器。

get_data_home

返回scikit-learn数据目录的路径。

load_breast_cancer

加载并返回乳腺癌wisspel数据集(分类)。

load_diabetes

加载并返回糖尿病数据集(回归)。

load_digits

加载并返回数字数据集(分类)。

load_files

加载将类别作为子文件夹名称的文本文件。

load_iris

加载并返回虹膜数据集(分类)。

load_linnerud

加载并返回体育锻炼Linnerud数据集。

load_sample_image

加载单个示例图像的numpy数组。

load_sample_images

加载示例图像以进行图像处理。

load_svmlight_file

将svmlight / libsvm格式的数据集加载到稀疏CSR矩阵中。

load_svmlight_files

以SVMlight格式从多个文件加载数据集。

load_wine

Load and return the wine dataset (classification).

样品发生器#

make_biclusters

生成用于双集群的恒定块对角线结构阵列。

make_blobs

生成用于集群的各向同性高斯斑点。

make_checkerboard

生成具有块棋盘结构的数组以进行双集群化。

make_circles

在2D中创建一个包含一个较小圆的大圆。

make_classification

生成随机n级分类问题。

make_friedman1

生成“弗里德曼#1”回归问题。

make_friedman2

生成“弗里德曼#2”回归问题。

make_friedman3

生成“弗里德曼#3”回归问题。

make_gaussian_quantiles

生成各向同性高斯并通过分位数标记样本。

make_hastie_10_2

生成Hastie et al. 2009,Example 10.2中使用的二进制分类数据。

make_low_rank_matrix

生成一个具有钟形奇异值的基本上低阶矩阵。

make_moons

画两个交错的半圆。

make_multilabel_classification

生成随机多标签分类问题。

make_regression

生成随机回归问题。

make_s_curve

生成S曲线数据集。

make_sparse_coded_signal

Generate a signal as a sparse combination of dictionary elements.

make_sparse_spd_matrix

生成稀疏对称定正矩阵。

make_sparse_uncorrelated

使用稀疏不相关设计生成随机回归问题。

make_spd_matrix

生成一个随机对称、正定矩阵。

make_swiss_roll

生成瑞士卷数据集。