访问量: 260 次浏览

回归模型中的一些术语:
回归公式:
y = β0 + (β1 × x1 ) + (β2 × x2 ) + … + (βn × xn ) + ε
让我们通过构建栖息地适宜性指数 (HSI), 也称为资源选择函数 (RSF)来实施 ArcGIS 回归工具。 利用308个沼泽鹿的 GPS 定位数据, 研究沼泽鹿与景观的关系。 需要注意的是:这是一个带有虚构数据的假设场景。
需要我们回答的问题如下:
生境适宜性指数:HSI 是一个数值指数, 代表特定生境对选定物种的支持能力。
为什么要创建 HSI?
土地资源经理使用 HSI 来对景观做出更好的决策。 如果 HSI 显示沼泽鹿更喜欢湿地栖息地类型, 土地资源管理者则可以保护这些类型的栖息地。 土地资源管理者可以禁止基础设施的开发, 因 HSI 显示了特定栖息地支持沼泽鹿的能力。 我们可以外推 HSI 来预测其他地区的沼泽鹿。
沼泽鹿的解释变量是什么? 这可能是回归建模最困难的部分。 我们需要调查沼泽鹿的潜在栖息地类型。 这就是专家建议派上用场之处。 以下是研究的发现:

沼泽鹿生活在漫滩、草原和潮湿森林等沼泽栖息地, 它们更喜欢有大量覆盖物作为保护的区域, 例如芦苇床或草丛较高的地方。 该物种主要分布在靠近永久水源的地方。 根据文献,沼泽鹿选择自然植被和水域。 但是有没有什么地貌特征可能会扰乱沼泽鹿呢? 或许可用空间回归分析来探索这些自变量。
我们研究区域的特点是自然植被和开阔水域。 一条道路穿过单元格 A6-F6, 这可能会造成潜在的干扰。 露营地也存在于单元格 B3、C7 和 D7 中。

每个点代表沼泽鹿的 GPS 位置。 从视觉上看, 道路和露营地附近的沼泽鹿似乎更少了。 另一个观察结果是沼泽鹿在存在湿地的单元格 D2 和 D3 中显得更密集。

这张热点图证实, 靠近道路的鹿数量较少, 与平均值的偏差小于 -2 个标准差。 沼泽鹿在单元格 D2 附近更密集。 除了这两个低点和热点之外, 研究区似乎没有更多的空间格局。
我们可以利用回归分析来回答这些类型的问题, 使用空间回归来模拟沼泽鹿和土地特征之间的空间关系。
第一步是对每个网格单元格的自变量和因变量进行分组。 我们不能将沼泽鹿的位置视为点。 该表必须包含每个网格单元的鹿、露营地和湿地的数量。 下表是使用 OLS 预处理表的示例。

使用“空间关系建模”工具包中的“普通最小二乘回归”工具。

运行 OLS 工具后, 预测模型的残差将添加到显示中。 残差本质上是模型中的误差。 在继续之前,让我们仔细看看残差到底是什么。 如果查看单元格 A1(左下角), 在这个网格单元格中发现了 9 只鹿。 OLS 模型根据单元格中的树木、湿地、草地、道路和露营地的数量构建权重。 这些权重是 Beta 系数值。
当我们将权重代入回归公式时, 单元格 A1 中估计有 6.98 只鹿。 当从 9 中减去 6.98 时, 得到的余数为 2.01。 换言之,该模型将实际值低估了 2.01。


可以将露营地的低负 β 系数 (-3.56) 解释为沼泽鹿避开的区域。 道路也有负值 -0.52, 这意味着鹿不会选择这些网格。 沼泽鹿更喜欢湿地作为合适的栖息地。 这个模型证实了这个信念。 我们可以手动将 Beta 系数模型插入回归模型。 结果就是预测值。 在此示例中, 它是网格单元中鹿的预测数量。
Y = β0 +(β1 × x1)+(β2 × x2)+…+(βn × xn)+Ε
A1=5.916744+(-0.524393×0)+(0.056088×30)+(-3.558805×0)
A1=7.59
此 OLS 模型的调整 R 平方值为 0.795。 即可以解释 79.5% 的变化。
另一个有趣的统计数据是方差膨胀因子 (VIF)。 如果 VIF > 7.5, 则表明解释变量之间存在冗余。 我们的 HSI 模型满足了这些标准, VIF < 2.0。
星号 (*) 表示该系数具有统计显着性 (p < 0.05)。 沼泽鹿 HSI 的 p 值 < 0.0001, 这意味着系数具有统计显着性。
当此检验具有统计显着性 (p < 0.05) 时, 模型预测有偏差(残差不呈正态分布)。 Jarque-Bera 统计分数为 0.721。 当 OLS 回归模型工具在报告末尾给出警告 000851 时, 这意味着应处理空间自相关 (Moran's I) 工具以确保残差不在空间上自相关。
空间自相关将告诉我们低、高预测是否是随机的。 没有模型可以完美地预测, 并且总是会高估和低估。 空间自相关调查 OLS 模型是否随机分布。

当单击 “确定” 时, 该工具将生成报告。 双击报告, 并确保结果是随机的。


我们利用空间回归工具在沼泽鹿、露营地、道路和湿地之间建立了空间关系。 回归工具研究了这些因素之间的关系并为每个变量生成权重。 这些权重被代入回归公式以计算和预测鹿的数量。 方差膨胀因子、z 分数、Jarque-Bera 和 Moran's I 确保了空间回归模型的稳健性和统计显着性。 回归模型显示沼泽鹿如何选择湿地作为合适的栖息地。 它还表明沼泽鹿倾向于避开露营地和道路。 这对土地资源管理者很有用, 可以限制露营地和道路的开发以保护此类鹿, 回归模型还可以预测其他地区的沼泽鹿。