fetch_olivetti_faces#

sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[源代码]#

加载来自AT & T的Olivetti面部数据集(分类)。

如有必要,请下载。

40

样本总数

400

维度

4096

特征

真实的,在0和1之间

阅读更多的 User Guide .

参数:
data_home字符串或类似路径,默认值=无

为数据集指定另一个下载和缓存文件夹。默认情况下,所有scikit-learn数据都存储在“~/scikit_learn_data”收件箱中。

shuffle布尔,默认=假

如果为True,数据集的顺序将被洗牌,以避免将同一个人的图像分组。

random_stateint,RandomState实例或无,默认=0

确定数据集洗牌的随机数生成。传递int以获得跨多个函数调用的可重复输出。看到 Glossary .

download_if_missing布尔,默认=True

如果为假,如果数据在本地不可用,则引发OSEross,而不是尝试从源网站下载数据。

return_X_y布尔,默认=假

如果为True,则返回 (data, target) 而不是 Bunch object.有关的更多信息,请参阅下文 datatarget object.

Added in version 0.22.

n_retriesint,默认=3

遇到HTTP错误时的再试次数。

Added in version 1.5.

delayfloat,默认=1.0

再试之间的秒数。

Added in version 1.5.

返回:
data : Bunch

类似字典的对象,具有以下属性。

数据:ndray,shape(400,4096)

每一行对应于原始大小为64 x 64像素的散开面部图像。

图像nd数组,形状(400,64,64)

每一行都是与数据集的40个对象之一相对应的面部图像。

目标nd数组,形状(400,)

与每个面部图像关联的标签。这些标签的范围从0到39,对应于受试者ID。

DESCRstr

修改后的Olivetti Faces Dataset的描述。

(data, target) :tuple if return_X_y=Truetuple if return_X_y=True

datatarget 上面描述的对象。

Added in version 0.22.

示例

>>> from sklearn.datasets import fetch_olivetti_faces
>>> olivetti_faces = fetch_olivetti_faces()
>>> olivetti_faces.data.shape
(400, 4096)
>>> olivetti_faces.target.shape
(400,)
>>> olivetti_faces.images.shape
(400, 64, 64)