load_diabetes#
- sklearn.datasets.load_diabetes(*, return_X_y=False, as_frame=False, scaled=True)[源代码]#
加载并返回糖尿病数据集(回归)。
样本总数
442
维度
10
特征
真实的,-.2 < x < .2
目标
整数25 - 346
备注
每个特征的含义(即
feature_names
)可能不清楚(尤其是对于ltg
),因为原始数据集的文档不明确。我们提供的信息似乎与该研究领域的科学文献有关。阅读更多的 User Guide .
- 参数:
- return_X_y布尔,默认=假
如果为True,则返回
(data, target)
而不是Bunch对象。有关的更多信息,请参阅下文data
和target
object.Added in version 0.18.
- as_frame布尔,默认=假
如果为True,则数据是pandas DataFrame,包括具有适当数据类型(数字)的列。目标是pandas DataFrame或Series,具体取决于目标列的数量。如果
return_X_y
是真的那 (data
,target
)将是pandas DataFrame或Series,如下所述。Added in version 0.23.
- scaled布尔,默认=True
如果为True,则要素变量以均值为中心,并按标准差乘以
n_samples
.如果为False,则返回特征变量的原始数据。Added in version 1.1.
- 返回:
- data :
Bunch
群 类似字典的对象,具有以下属性。
- 数据形状的{ndray,rame}(442,10)
数据矩阵。如果
as_frame=True
,data
将是一个熊猫数据框架。- 目标:{ndray,Series}形状(442,)
回归目标。如果
as_frame=True
,target
将是一个熊猫系列。- feature_names:list
数据集列的名称。
- 框架:形状的数据框架(442,11)
仅在当
as_frame=True
.数据框架data
和target
.Added in version 0.23.
- DESRC:字符串
数据集的完整描述。
- data_file:url
数据位置的路径。
- target_filename:string
到达目标位置的路径。
- (data, target) :tuple if
return_X_y
是真tuple ifreturn_X_y
is True Returns a tuple of two ndarray of shape (n_samples, n_features) A 2D array with each row representing one sample and each column representing the features and/or target of a given sample.
Added in version 0.18.
- data :
示例
>>> from sklearn.datasets import load_diabetes >>> diabetes = load_diabetes() >>> diabetes.target[:3] array([151., 75., 141.]) >>> diabetes.data.shape (442, 10)