load_wine#

sklearn.datasets.load_wine(*, return_X_y=False, as_frame=False)[源代码]#

Load and return the wine dataset (classification).

Added in version 0.18.

葡萄酒数据集是一个经典且非常简单的多类分类数据集。

类	3
每类样本	[59,71,48]
样本总数	178
维度	13
特征	真实的、积极的

从https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data下载并修改UCI ML Wine数据集的副本以适应标准格式

阅读更多的 User Guide .

参数:

return_X_y布尔，默认=假: 如果为True，则返回 (data, target) 而不是Bunch对象。有关的更多信息，请参阅下文 data 和 target object.
as_frame布尔，默认=假: 如果为True，则数据是pandas DataFrame，包括具有适当数据类型（数字）的列。目标是pandas DataFrame或Series，具体取决于目标列的数量。如果 return_X_y 是真的那 (data , target ）将是pandas DataFrame或Series，如下所述。

Added in version 0.23.

返回:

data : Bunch群

类似字典的对象，具有以下属性。

数据形状的{ndray，rame}（178，13）: 数据矩阵。如果 as_frame=True , data 将是一个熊猫数据框架。
目标：{ndray，Series}形状（178，）: 分类目标。如果 as_frame=True , target 将是一个熊猫系列。
feature_names：list: 数据集列的名称。
目标名称：列表: 目标类的名称。
框架：形状的数据框架（178，14）: 仅在当 as_frame=True .数据框架 data 和 target .

Added in version 0.23.
DESRC：字符串: 数据集的完整描述。

(data, target) ：tuple if return_X_y 是真tuple if return_X_y is True

默认情况下是两个ndarray的元组。第一个包含形状的2D数组（178，13），每一行代表一个样本，每一列代表特征。第二个形状阵列（178，）包含目标样本。

示例

假设您对样本10、80和140感兴趣，并且想知道它们的类名称。

>>> from sklearn.datasets import load_wine
>>> data = load_wine()
>>> data.target[[10, 80, 140]]
array([0, 1, 2])
>>> list(data.target_names)
[np.str_('class_0'), np.str_('class_1'), np.str_('class_2')]