fetch_species_distributions#

sklearn.datasets.fetch_species_distributions(*, data_home=None, download_if_missing=True, n_retries=3, delay=1.0)[源代码]#

Phillips et.物种分布数据集的加载器。等人（2006）。

阅读更多的 User Guide .

参数:

data_home字符串或类似路径，默认值=无: 为数据集指定另一个下载和缓存文件夹。默认情况下，所有scikit-learn数据都存储在“~/scikit_learn_data”收件箱中。
download_if_missing布尔，默认=True: 如果为假，如果数据在本地不可用，则引发OSEross，而不是尝试从源网站下载数据。
n_retriesint，默认=3: 遇到HTTP错误时的再试次数。

Added in version 1.5.
delayfloat，默认=1.0: 再试之间的秒数。

Added in version 1.5.

返回:

data : Bunch群

类似字典的对象，具有以下属性。

覆盖率数组，形状= [14, 1592, 1212]

这些代表在地图网格的每个点测量的14个特征。下面讨论网格的纬度/经度值。缺失数据由值-9999表示。

火车记录数组，形状=（1624，）

数据的训练点。每个点都有三个字段：

火车 ['species'] 是物种名称
火车 ['dd long'] 是经度，单位为度
火车 ['dd lat'] 是纬度，单位为度

测试记录数组，形状=（620，）

数据的测试点。格式与训练数据相同。

NX，Ny整数

网格中纬度（x）和纬度（y）的数量

x_left_lower_corner，y_left_lower_corner漂浮

左下角的（x，y）位置，单位为度

grid_size浮子

网格点之间的间隔，以度为单位

注意到

该数据集代表物种的地理分布。该数据集由Phillips et.提供。等人（2006）。

这两个物种是：

"Bradypus variegatus" ，棕喉树懒。
"Microryzomys minutus" ，也被称为森林小稻鼠，是一种生活在秘鲁、哥伦比亚、厄瓜多尔、秘鲁和委内瑞拉的啮齿动物。

引用

"Maximum entropy modeling of species geographic distributions" S. J·菲利普斯，R. P·安德森，R. E. Schapire -生态建模，190：231-259，2006年。

示例

>>> from sklearn.datasets import fetch_species_distributions
>>> species = fetch_species_distributions()
>>> species.train[:5]
array([(b'microryzomys_minutus', -64.7   , -17.85  ),
       (b'microryzomys_minutus', -67.8333, -16.3333),
       (b'microryzomys_minutus', -67.8833, -16.3   ),
       (b'microryzomys_minutus', -67.8   , -16.2667),
       (b'microryzomys_minutus', -67.9833, -15.9   )],
      dtype=[('species', 'S22'), ('dd long', '<f4'), ('dd lat', '<f4')])

有关更扩展的示例，请参阅物种分布建模