load_diabetes#

sklearn.datasets.load_diabetes(*, return_X_y=False, as_frame=False, scaled=True)[源代码]#

加载并返回糖尿病数据集(回归)。

样本总数

442

维度

10

特征

真实的,-.2 < x < .2

目标

整数25 - 346

备注

每个特征的含义(即 feature_names )可能不清楚(尤其是对于 ltg ),因为原始数据集的文档不明确。我们提供的信息似乎与该研究领域的科学文献有关。

阅读更多的 User Guide .

参数:
return_X_y布尔,默认=假

如果为True,则返回 (data, target) 而不是Bunch对象。有关的更多信息,请参阅下文 datatarget object.

Added in version 0.18.

as_frame布尔,默认=假

如果为True,则数据是pandas DataFrame,包括具有适当数据类型(数字)的列。目标是pandas DataFrame或Series,具体取决于目标列的数量。如果 return_X_y 是真的那 (data , target )将是pandas DataFrame或Series,如下所述。

Added in version 0.23.

scaled布尔,默认=True

如果为True,则要素变量以均值为中心,并按标准差乘以 n_samples .如果为False,则返回特征变量的原始数据。

Added in version 1.1.

返回:
data : Bunch

类似字典的对象,具有以下属性。

数据形状的{ndray,rame}(442,10)

数据矩阵。如果 as_frame=True , data 将是一个熊猫数据框架。

目标:{ndray,Series}形状(442,)

回归目标。如果 as_frame=True , target 将是一个熊猫系列。

feature_names:list

数据集列的名称。

框架:形状的数据框架(442,11)

仅在当 as_frame=True .数据框架 datatarget .

Added in version 0.23.

DESRC:字符串

数据集的完整描述。

data_file:url

数据位置的路径。

target_filename:string

到达目标位置的路径。

(data, target) :tuple if return_X_y 是真tuple if return_X_y is True

Returns a tuple of two ndarray of shape (n_samples, n_features) A 2D array with each row representing one sample and each column representing the features and/or target of a given sample.

Added in version 0.18.

示例

>>> from sklearn.datasets import load_diabetes
>>> diabetes = load_diabetes()
>>> diabetes.target[:3]
array([151.,  75., 141.])
>>> diabetes.data.shape
(442, 10)