fetch_olivetti_faces#

sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[源代码]#

加载来自AT & T的Olivetti面部数据集（分类）。

如有必要，请下载。

类	40
样本总数	400
维度	4096
特征	真实的，在0和1之间

阅读更多的 User Guide .

参数:

data_home字符串或类似路径，默认值=无: 为数据集指定另一个下载和缓存文件夹。默认情况下，所有scikit-learn数据都存储在“~/scikit_learn_data”收件箱中。
shuffle布尔，默认=假: 如果为True，数据集的顺序将被洗牌，以避免将同一个人的图像分组。
random_stateint，RandomState实例或无，默认=0: 确定数据集洗牌的随机数生成。传递int以获得跨多个函数调用的可重复输出。看到 Glossary .
download_if_missing布尔，默认=True: 如果为假，如果数据在本地不可用，则引发OSEross，而不是尝试从源网站下载数据。
return_X_y布尔，默认=假: 如果为True，则返回 (data, target) 而不是 Bunch object.有关的更多信息，请参阅下文 data 和 target object.

Added in version 0.22.
n_retriesint，默认=3: 遇到HTTP错误时的再试次数。

Added in version 1.5.
delayfloat，默认=1.0: 再试之间的秒数。

Added in version 1.5.

返回:

data : Bunch群

类似字典的对象，具有以下属性。

数据：ndray，shape（400，4096）: 每一行对应于原始大小为64 x 64像素的散开面部图像。
图像nd数组，形状（400，64，64）: 每一行都是与数据集的40个对象之一相对应的面部图像。
目标nd数组，形状（400，）: 与每个面部图像关联的标签。这些标签的范围从0到39，对应于受试者ID。
DESCRstr: 修改后的Olivetti Faces Dataset的描述。

(data, target) ：tuple if return_X_y=Truetuple if return_X_y=True

与 data 和 target 上面描述的对象。

Added in version 0.22.

示例

>>> from sklearn.datasets import fetch_olivetti_faces
>>> olivetti_faces = fetch_olivetti_faces()
>>> olivetti_faces.data.shape
(400, 4096)
>>> olivetti_faces.target.shape
(400,)
>>> olivetti_faces.images.shape
(400, 64, 64)