fetch_lfw_people#
- sklearn.datasets.fetch_lfw_people(*, data_home=None, funneled=True, resize=0.5, min_faces_per_person=0, color=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[源代码]#
加载野外标签面孔(LFW)人员数据集(分类)。
如有必要,请下载。
类
5749
样本总数
13233
维度
5828
特征
真实的,在0到255之间
有关此数据集的使用示例,请参阅 使用特征脸和SVM的人脸识别示例 .
阅读更多的 User Guide .
- 参数:
- data_home字符串或类似路径,默认值=无
为数据集指定另一个下载和缓存文件夹。默认情况下,所有scikit-learn数据都存储在“~/scikit_learn_data”收件箱中。
- funneled布尔,默认=True
下载并使用数据集的漏斗变体。
- resize浮动或无,默认=0.5
用于调整每个面部图片的大小的比率。如果
None
,则不执行重复。- min_faces_per_personint,默认=无
提取的数据集将只保留至少具有以下特征的人的照片:
min_faces_per_person
不同的图片。- color布尔,默认=假
保留3个RB通道,而不是将它们平均为单个灰度通道。如果颜色为True,则数据的形状比颜色= False的形状多一个维度。
- slice_切片的字节组,默认=(切片(70,195),切片(78,172))
提供自定义的2D切片(高度、宽度)来提取jpeg文件的“有趣”部分,并避免使用背景的统计相关性。
- download_if_missing布尔,默认=True
如果为假,如果数据在本地不可用,则引发OSEross,而不是尝试从源网站下载数据。
- return_X_y布尔,默认=假
如果为True,则返回
(dataset.data, dataset.target)
而不是Bunch对象。有关的更多信息,请参阅下文dataset.data
和dataset.target
object.Added in version 0.20.
- n_retriesint,默认=3
遇到HTTP错误时的再试次数。
Added in version 1.5.
- delayfloat,默认=1.0
再试之间的秒数。
Added in version 1.5.
- 返回:
- dataset :
Bunch
群 类似字典的对象,具有以下属性。
- 数据麻木的形状阵列(13233,2914)
每一行对应于原始大小为62 x 47像素的散开面部图像。改变
slice_
或调整大小参数将更改输出的形状。- 图像麻木的形状阵列(13233,62,47)
每一行都是对应于数据集中5749人之一的人脸图像。改变
slice_
或调整大小参数将更改输出的形状。- 目标麻木的形状阵列(13233,)
与每个面部图像关联的标签。这些标签的范围从0到5748,并与人员ID相对应。
- target_names麻木的形状数组(5749,)
数据集中所有人员的姓名。数组中的位置对应于目标数组中的人员ID。
- DESCRstr
野外标签面孔(LFW)数据集的描述。
- (data, target) :tuple if
return_X_y
是真tuple ifreturn_X_y
is True 由两个ndray组成的二元组。第一个包含形状的2D数组(n_samples,n_features),每一行代表一个样本,每一列代表特征。包含目标样本的形状(n_samples,)的第二个nd数组。
Added in version 0.20.
- dataset :
示例
>>> from sklearn.datasets import fetch_lfw_people >>> lfw_people = fetch_lfw_people() >>> lfw_people.data.shape (13233, 2914) >>> lfw_people.target.shape (13233,) >>> for name in lfw_people.target_names[:5]: ... print(name) AJ Cook AJ Lamas Aaron Eckhart Aaron Guiel Aaron Patterson