fetch_species_distributions#
- sklearn.datasets.fetch_species_distributions(*, data_home=None, download_if_missing=True, n_retries=3, delay=1.0)[源代码]#
Phillips et.物种分布数据集的加载器。等人(2006)。
阅读更多的 User Guide .
- 参数:
- data_home字符串或类似路径,默认值=无
为数据集指定另一个下载和缓存文件夹。默认情况下,所有scikit-learn数据都存储在“~/scikit_learn_data”收件箱中。
- download_if_missing布尔,默认=True
如果为假,如果数据在本地不可用,则引发OSEross,而不是尝试从源网站下载数据。
- n_retriesint,默认=3
遇到HTTP错误时的再试次数。
Added in version 1.5.
- delayfloat,默认=1.0
再试之间的秒数。
Added in version 1.5.
- 返回:
- data :
Bunch
群 类似字典的对象,具有以下属性。
- 覆盖率数组,形状= [14, 1592, 1212]
这些代表在地图网格的每个点测量的14个特征。下面讨论网格的纬度/经度值。缺失数据由值-9999表示。
- 火车记录数组,形状=(1624,)
数据的训练点。 每个点都有三个字段:
火车 ['species'] 是物种名称
火车 ['dd long'] 是经度,单位为度
火车 ['dd lat'] 是纬度,单位为度
- 测试记录数组,形状=(620,)
数据的测试点。 格式与训练数据相同。
- NX,Ny整数
网格中纬度(x)和纬度(y)的数量
- x_left_lower_corner,y_left_lower_corner漂浮
左下角的(x,y)位置,单位为度
- grid_size浮子
网格点之间的间隔,以度为单位
- data :
注意到
该数据集代表物种的地理分布。该数据集由Phillips et.提供。等人(2006)。
这两个物种是:
"Bradypus variegatus" ,棕喉树懒。
"Microryzomys minutus" ,也被称为森林小稻鼠,是一种生活在秘鲁、哥伦比亚、厄瓜多尔、秘鲁和委内瑞拉的啮齿动物。
引用
"Maximum entropy modeling of species geographic distributions" S. J·菲利普斯,R. P·安德森,R. E. Schapire -生态建模,190:231-259,2006年。
示例
>>> from sklearn.datasets import fetch_species_distributions >>> species = fetch_species_distributions() >>> species.train[:5] array([(b'microryzomys_minutus', -64.7 , -17.85 ), (b'microryzomys_minutus', -67.8333, -16.3333), (b'microryzomys_minutus', -67.8833, -16.3 ), (b'microryzomys_minutus', -67.8 , -16.2667), (b'microryzomys_minutus', -67.9833, -15.9 )], dtype=[('species', 'S22'), ('dd long', '<f4'), ('dd lat', '<f4')])
有关更扩展的示例,请参阅 物种分布建模