load_wine#

sklearn.datasets.load_wine(*, return_X_y=False, as_frame=False)[源代码]#

Load and return the wine dataset (classification).

Added in version 0.18.

葡萄酒数据集是一个经典且非常简单的多类分类数据集。

3

每类样本

[59,71,48]

样本总数

178

维度

13

特征

真实的、积极的

从https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data下载并修改UCI ML Wine数据集的副本以适应标准格式

阅读更多的 User Guide .

参数:
return_X_y布尔,默认=假

如果为True,则返回 (data, target) 而不是Bunch对象。有关的更多信息,请参阅下文 datatarget object.

as_frame布尔,默认=假

如果为True,则数据是pandas DataFrame,包括具有适当数据类型(数字)的列。目标是pandas DataFrame或Series,具体取决于目标列的数量。如果 return_X_y 是真的那 (data , target )将是pandas DataFrame或Series,如下所述。

Added in version 0.23.

返回:
data : Bunch

类似字典的对象,具有以下属性。

数据形状的{ndray,rame}(178,13)

数据矩阵。如果 as_frame=True , data 将是一个熊猫数据框架。

目标:{ndray,Series}形状(178,)

分类目标。如果 as_frame=True , target 将是一个熊猫系列。

feature_names:list

数据集列的名称。

目标名称:列表

目标类的名称。

框架:形状的数据框架(178,14)

仅在当 as_frame=True .数据框架 datatarget .

Added in version 0.23.

DESRC:字符串

数据集的完整描述。

(data, target) :tuple if return_X_y 是真tuple if return_X_y is True

默认情况下是两个ndarray的元组。第一个包含形状的2D数组(178,13),每一行代表一个样本,每一列代表特征。第二个形状阵列(178,)包含目标样本。

示例

假设您对样本10、80和140感兴趣,并且想知道它们的类名称。

>>> from sklearn.datasets import load_wine
>>> data = load_wine()
>>> data.target[[10, 80, 140]]
array([0, 1, 2])
>>> list(data.target_names)
[np.str_('class_0'), np.str_('class_1'), np.str_('class_2')]