load_digits#
- sklearn.datasets.load_digits(*, n_class=10, return_X_y=False, as_frame=False)[源代码]#
加载并返回数字数据集(分类)。
每个数据点都是一个数字的8x 8图像。
类
10
每类样本
~180
样本总数
1797
维度
64
特征
0-16
这是UCI ML手写数字数据集测试集的副本https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits
阅读更多的 User Guide .
- 参数:
- n_classint,默认值=10
要返回的班级数量。0到10之间。
- return_X_y布尔,默认=假
如果为True,则返回
(data, target)
而不是Bunch对象。有关的更多信息,请参阅下文data
和target
object.Added in version 0.18.
- as_frame布尔,默认=假
如果为True,则数据是pandas DataFrame,包括具有适当数据类型(数字)的列。目标是pandas DataFrame或Series,具体取决于目标列的数量。如果
return_X_y
是真的那 (data
,target
)将是pandas DataFrame或Series,如下所述。Added in version 0.23.
- 返回:
- data :
Bunch
群 类似字典的对象,具有以下属性。
- 数据形状的{ndray,rame}(1797,64)
扁平化的数据矩阵。如果
as_frame=True
,data
将是一个熊猫数据框架。- 目标:{ndray,Series}形状(1797,)
分类目标。如果
as_frame=True
,target
将是一个熊猫系列。- feature_names:list
数据集列的名称。
- 目标名称:列表
目标类的名称。
Added in version 0.20.
- 框架:形状的数据框架(1797,65)
仅在当
as_frame=True
.数据框架data
和target
.Added in version 0.23.
- 图像:形状的{ndray}(1797,8,8)
原始图像数据。
- DESRC:字符串
数据集的完整描述。
- (data, target) :tuple if
return_X_y
是真tuple ifreturn_X_y
is True 默认情况下是两个ndarray的元组。第一个包含形状的2D nd数组(1797,64),每一行代表一个样本,每一列代表特征。形状的第二个nd数组(1797)包含目标样本。 如果
as_frame=True
,这两个数组都是pandas对象,即X
一个摇篮,y
一系列。Added in version 0.18.
- data :
示例
要加载数据并可视化图像::
>>> from sklearn.datasets import load_digits >>> digits = load_digits() >>> print(digits.data.shape) (1797, 64) >>> import matplotlib.pyplot as plt >>> plt.gray() >>> plt.matshow(digits.images[0]) <...> >>> plt.show()