如何在 ArcGIS 中构建空间回归模型

空间回归

什么是空间回归模型?

精通技术的 GIS 侦探喜欢空间回归,因为它用于模拟空间关系。回归模型研究哪些变量可以解释它们的位置。

例如:如果您在城市中有犯罪地点,则可以使用空间回归来了解犯罪模式背后的因素。我们可以使用空间回归来了解哪些变量(收入、教育等)可以解释犯罪地点。

然后可以使用空间回归模型进行决策。例如,它可以回答警察局的合适位置。空间回归模型还用于预测未来的犯罪地点,甚至在其他城市。

让我们了解回归模型中的一些术语。

  • 因变量 (Y) :您要预测什么。 (案发地点)
  • 自变量(X) :解释因变量的解释变量。 (收入、教育等)
  • Beta 系数:反映解释变量和因变量之间关系的权重。
  • Residual : 模型没有解释的值

回归公式
y = β 0 + (β 1 × x 1 ) + (β 2 × x 2 ) + … + (β n × x n ) + ε

ArcGIS 中的空间回归分析

让我们通过构建栖息地适宜性指数 (HSI)(也称为资源选择函数 (RSF))来使用 ArcGIS 回归工具。通过沼泽鹿的 308 个 GPS 位置,我们调查了沼泽鹿与其景观之间的关系。

需要注意的重要事项:这是一个包含虚构数据的假设场景。

我们回答如下问题:

  • 沼泽鹿选择或避免哪些资源?
  • 影响沼泽鹿位置的因素有哪些?

栖息地适宜性指数 (HSI)

栖息地适宜性指数 (HSI): HSI 是一个数字指数,表示给定栖息地支持选定物种的能力

为什么要创建恒指?
土地资源经理使用 HSI 对景观做出更好的决策。如果 HSI 显示沼泽鹿更喜欢湿地栖息地类型,土地资源管理者可以保护这些类型的栖息地。

土地资源管理者可以禁止基础设施的开发,因为 HSI 显示了给定栖息地支持沼泽鹿的能力。我们可以推断 HSI 以预测其他位置的沼泽鹿。

解释变量

沼泽鹿的解释变量是什么?这可能是回归建模中最困难的部分。我们需要调查沼泽鹿的潜在栖息地类型。这是专家建议派上用场的地方。这是我们发现的:

沼泽鹿

“沼泽鹿生活在漫滩、草原和潮湿森林等沼泽栖息地,它们更喜欢有大量覆盖物作为保护的区域,例如芦苇床或草丛高的地方。该物种主要发现于永久水源附近。”

根据文献,沼泽鹿选择自然植被和水域。但是有没有可能扰乱沼泽鹿的土地特征?我们使用我们的空间回归分析探索这些自变量。

自变量和因变量

我们研究区域的特点是自然植被和开阔水域。一条道路穿过单元格 A6-F6,这可能会造成潜在的干扰。露营地也存在于单元格 B3、C7 和 D7 中。

沼泽鹿分布和露营地

陆生鹿

每个点代表沼泽鹿的 GPS 位置。从视觉上看,道路和露营地附近的沼泽鹿似乎更少了。另一个观察结果是沼泽鹿在存在湿地的单元格 D2 和 D3 中显得更密集。

热点分析

热点分析

这张热点图证实,靠近道路的鹿数量较少,与平均值的偏差小于 -2 个标准差。沼泽鹿在单元格 D2 附近更密集。除了这两个低点和热点之外,研究区似乎没有更多的空间格局。

  • 为什么这些热点地区有这么多鹿?
  • 造成这些热点的因素有哪些?

我们可以使用回归分析来回答这些类型的问题。让我们使用空间回归来模拟沼泽鹿和土地特征之间的空间关系。

普通最小二乘 (OLS) 回归

第一步是对每个网格单元格的自变量和因变量进行分组。我们不能将沼泽鹿的位置视为点。该表必须包含每个网格单元的鹿、露营地和湿地的数量。下表是使用 OLS 预处理表的示例。

网格单元表回归

我们将使用“空间关系建模”工具包中的“普通最小二乘回归”工具。

普通最小二乘回归工具

普通最小二乘回归模型:
输入要素类:具有聚合数据的网格单元
唯一 ID :唯一 ID 字段(例如,1、2、3 …)
输出要素类:输出的路径和名称
因变量:鹿数
解释变量:露营地、道路和水
输出报告文件:生成报告文件。

运行 OLS 工具后,预测模型的残差将添加到您的显示中。残差本质上是模型中的误差。

在继续之前,让我们仔细看看残差到底是什么。如果我们查看单元格 A1(左下),在这个网格单元格中发现了 9 只鹿。 OLS 模型根据单元格中的树木、湿地、草地、道路和露营地的数量构建权重。这些权重是贝塔系数值。

当我们将权重代入回归公式时,单元格 A1 中估计有 6.98 只鹿。当您从 9 中减去 6.98 时,我们得到的残差为 2.01。换句话说,模型将实际值低估了 2.01。

普通最小二乘回归残差值:

ols回归模型残差结果
多变的 Beta系数 p < 0.05 VIF
截距 β 0 = 5.916744 0.0000001* ————
道路 β 1 = -0.524393 0.0000001* 1.150233
β 2 = 0.056088 0.0000001* 1.139367
β 3 = -3.558805 0.0000001* 1.010354

您可以将露营地的低负 β 系数 (-3.56) 解释为沼泽鹿避开的区域。道路也有负值 -0.52,这意味着鹿不会选择这些网格。沼泽鹿更喜欢湿地作为合适的栖息地。这个模型证实了这个信念。

我们可以手动将 beta 系数模型插入回归模型。结果就是预测值。在我们的例子中,它是网格单元中鹿的预测数量。

y = β 0 + (β 1 × x 1 ) + (β 2 × x 2 ) + … + (β n × x n ) + ε

A1 = 5.916744 + (-0.524393 × 0) + (0.056088 × 30) + (-3.558805 × 0)

A1 = 7.59

此 OLS 模型的调整 R 平方值为 0.795。有了这 3 个因素,我们可以解释 79.5% 的变化。

缺少什么模型?已知天敌、森林时代、湿地类型。

方差膨胀因子 (VIF):

另一个有趣的统计数据是方差膨胀因子 (VIF)。如果 VIF > 7.5,则表明解释变量之间存在冗余。我们的 HSI 模型满足了这些标准,VIF < 2.0。

概率和稳健概率:

星号 (*) 表示该系数具有统计显着性 (p < 0.05)。沼泽鹿 HSI 的 p 值 < 0.0001,这意味着系数具有统计显着性。

雅克-贝拉统计:

当此检验具有统计显着性 (p < 0.05) 时,模型预测有偏差(残差不呈正态分布)。 Jarque-Bera 统计分数为 0.721。当 OLS 回归模型工具在报告末尾给出警告 000851 时,这意味着应处理空间自相关 (Moran's I) 工具以确保残差不在空间上自相关。

Moran's I 空间自相关

空间自相关将告诉我们低/高预测是否是随机的。没有模型可以完美地预测,并且总是会高估和低估。空间自相关调查 OLS 模型是否随机分布。

空间自相关工具

Moran's I 空间自相关:
输入要素类:OLS 输出
输入字段:标准残差 (StdResid)
生成报告:是

当您单击“确定”时,该工具会生成一份报告。双击报告,确保结果是随机的。

阅读更多GIS 中的空间自相关和 Moran's I

moran i 自相关结果

总结:空间回归模型

线性回归

我们使用空间回归工具在沼泽鹿、露营地、道路和湿地之间建立了空间关系。回归工具研究了这些因素之间的关系并为每个变量生成权重。

这些权重被代入回归公式以计算和预测鹿的数量。方差膨胀因子、z 分数、Jarque-Bera 和 Moran's I 确保了空间回归模型的稳健性和统计显着性。

回归模型显示沼泽鹿如何选择湿地作为合适的栖息地。它还表明沼泽鹿倾向于避开露营地和道路。

这对土地资源管理者很有用,可以限制露营地和道路的开发以保护此类鹿。回归模型还可以预测其他地区的沼泽鹿。

You may also like...