克里格插值法–在这一方面的预测很强
目录
如何用地理统计插值
作者:GIS地理 https://gisgeography.com/kriging-interpolation-prediction/
使用Krigings制作有名的的预测模型
现在是时候雕刻自己的年龄预测模型了。该预测在克里金法方面很强。
在创建精细的预测表面的过程中,在进入克里金法之前都需要了解一些关键概念。
这些概念是什么?
阅读以下内容,以获得有关克里金法的逐步核心知识。
让我们从一些基础知识开始
要真正理解克里金法,您必须知道什么是插值法。与所有插值一样,我们正在预测其他位置的未知值。
使用像逆距离加权之类的插值方法,您在进行预测时不会说出自己的确定性。
这是一个例子:
我们通过取最接近的三个输入点(值为12、10和10)的反加权距离来预测紫点。根据距离,我们计算每个输入点的距离,并得到11.1的值。
((12/350)+(10/750)+(10/850))/((1/350)+(1/750)+(1/850))= 11.1
这就是确定性插值的工作原理。简单来说,它使用了预定义的函数,它就是它的本质。
但这并不能告诉您您的确定性。
什么是克里金插值?
如果天气预报员预测明天会下雨,那么您如何确定会下雨呢?
换一种说法:
而不是只说这里有多大的降雨量在特定的位置,也克里金告诉你的概率的多少雨量在特定位置。
您可以使用输入数据来构建具有半变异函数的数学函数,创建预测曲面,然后通过交叉验证来验证模型。
地统计学不仅提供了最佳的预测表面,而且还提供了对预测真实可能性的置信度度量。
同时,克里金法可以生成预测面和描述模型预测效果的面:
预测:此直线曲面可预测要克里金法的变量的值。
预测错误:如果在输入数据较少的情况下,If以较高的错误标准描述标准错误。
概率:概率表面超过阈值时会突出显示。
数量:此表面代表第99个百分位的最佳或最差情况。
克里金法的关键是半变异函数
Kriging依赖于半变异函数。简而言之,半变异函数可以量化自相关,因为它可以根据距离绘制出所有数据对的变异。
更有可能的是,更紧密的事物相关性更高,并且具有较小的半方差。虽然远的东西不太相关,并具有较高的半方差。
但是在一定距离(范围)内,自相关变得独立。在这种变化趋于平稳的地方,称为(窗台)。这意味着数据点的紧密度之间不再存在任何空间自相关或关系。这个概念是托伯勒的《地理第一定律》。
同样,这里的目的是拟合一个表面,例如对整个总体趋势进行建模的多项式。然后,围绕该趋势,克里金法出现的地方会存在残差。
根据半变异函数结果,可以选择球形,圆形,指数,高斯或线性的半变异函数。或者,如果您可以为数学模型提供理智的证明,那么您可以选择一个。
阅读更多: 什么是半变异函数:掘金,射程和底线
在开始之前,请检查您的数据
甚至在开始克里金之前,您的数据都需要在进行普通克里金之前符合此条件。
如果您的数据满足特定条件,则克里金法是最佳的插值技术。但是,如果他们不符合该标准,则可以对其进行按摩或完全选择其他插值技术。
- 您的数据需要正态分布
- 数据需要固定
- 您的数据不能有任何趋势
以下步骤是检查数据以查看它们是否符合此条件的方法。首先,我们建议您列出您的观点,并从低到高对其进行象征。在我们的示例中,我们使用在农业领域中采集的土壤水分样本:
假设1您的数据呈正态分布
虽然我们没有在此测试中探索空间特性,但仅检查值是否呈正态分布。换句话说,您的数据值是否适合钟形曲线形状?
探索这种情况的一种方法是使用直方图。在ArcGIS中,单击 地统计分析>浏览数据>直方图 。
此时,您可以检查直方图上是否有异常值,以及它看起来像一个钟形曲线。在我们的例子中,看起来它具有一个相当好的正态分布。
另外,您也可以使用Normal QQ Plot检查数据。正态QQ图比较了数据与正态分布数据的排列方式。如果所有点都具有完全正态分布,则所有点都将落在45°线上。在我们的情况下,数据遵循一条直线。
如果您的数据没有正态分布怎么办?
在这种情况下,您必须应用对数或反正弦之类的变换,直到它变为正常。除了选择自己的变换之外,您还可以执行普通分数变换,这几乎可以为您完成很多工作。普通分数转换功能如此强大,以至于它现在已成为ArcGIS中简单克里金法的默认方法。我们将在下面更详细地说明这一点。
假设2您的数据是固定的
您的数据必须是固定的意味着什么?
这意味着局部变化在地图的不同区域不会改变。例如,在不同位置相距5米的2个数据点的测量值应该具有相似的差异。在地图的不同区域中,方差相当恒定。克里金法不适用于突然的变化和折线。
您可以使用由熵(邻居之间的差异)或标准偏差表示的voronoi映射来检查数据的平稳性,并寻找随机性。在ArcGIS中,单击 地统计分析>浏览数据> Voronoi地图 。
在我们的案例中,我们确实看到了少量的聚类。总体而言,对于熵和标准偏差,voronoi图显示数据集看起来足够平稳。
如果您的数据不稳定,该怎么办?
假设3您的数据没有趋势
趋势是整个研究区域中数据的系统变化。我们可以使用ESDA工具检查趋势分析。在ArcGIS中,单击 地统计分析>浏览数据>趋势分析 。
绿线表示东西方向的趋势,蓝线表示南北方向的趋势。通常,我们中心的土壤湿度较高。但是,我们的数据中没有足够的趋势需要将其删除。
如果您的数据具有系统趋势,该怎么办?
尽管整个研究区域中的趋势很大,可能是完全切换插值方法的一个原因,但是趋势消除工具可以提供帮助,因此以下分析将不受数据中该趋势的影响。
ArcGIS中的Kriging示例
在按上述条件浏览数据之后,可以单击 Geostatistical Analysis> Geostatistical向导 。
…现在讽刺说,真正的乐趣开始了。
步骤1选择克里金法/共同克里金法
现在,您已经打开了“ 地统计向导”,克里金法就在地统计方法之下。前面提到,这是因为您使用半变异函数构建了最佳的预测表面,并且可以估计该预测为真的置信度。
请注意,如果您选择单个输入,它就是kriging。但是,当您添加第二个变量时,它突然变成了共同克里金法。
如果您有两个或多个相关的变量,例如山区的降水如何变化,则可以将海拔数据作为协变量添加到降雨量中。在这种情况下,您可以使用辅助信息来改善预测。
步骤2选择克里金类型
现在,让我们退后一步来了解所有选项的含义。在这一步中有很多东西需要吸收。
普通克里金法是ArcGIS 10.0中的默认设置。现在,由于正常的分数转换,默认为简单克里金法。特别是,简单的克里金法使用正态分数转换将您的数据转换为标准正态分布。
如前所述,这是执行克里金法的基本标准之一。对于基本用户,最好的选择是采用简单的克里金法。但是还存在其他更复杂的克里金类型:
UNIVERSAL KRIGING通过考虑趋势来将趋势表面分析(漂移)与常规Kriging结合起来
。INDICATOR KRIGING通过对二进制数据(0和1)(例如城市和非城市单元)进行常规Kriging。
概率克里金法使用二进制数据(类似于指标克里金法)并估计一系列截止点的未知点。
最后,您可以在此步骤中手动设置转换类型和趋势删除。例如,如果您想将转换更改为log,则可以进行此更改。
步骤3使用半变异图建立资料模型
在此示例中,我们将普通克里金法用于演示目的。地统计向导会生成带有蓝色叉号的半变异函数图,其中显示了每对点的平均变化。
滞后大小是成对的位置被分组到的距离类别的大小。根据经验,您可以将延迟大小乘以延迟的数量,以等于所有点之间最大距离的一半。如果您的点没有聚类,则可以运行“平均最近邻居”工具,该工具会告诉您点之间的平均距离。
ArcMap已添加了为您优化所有这些参数的功能。当您单击优化按钮时,它将找到导致最小均方根误差的每个参数的值。用户测试每种情况都需要反复试验。最终,通常最好使用软件认为最好的半变异函数模型。
对于我们的研究领域,这是半变异函数的样子:
步骤4使用克里金权重映射模型
对拟合的半变异函数感到满意后,向导将提供带有更多参数的预览图面,以自定义输出。克里金法所做的是使用与最近邻居的加权平均值预测每个位置的响应。但首先,您必须设置要在搜索半径中使用的点数(最大和最小)。
尽管对半变异函数在克里金法中的重要性进行了很多讨论,但此步骤会极大地影响地图的输出。如果更改这些参数中的任何一个,它实际上会改变表面的外观。
如果选择切片扇区类型之一,则可确保在每个切片中都包含要估计的点。例如,如果您使用四个切片的饼图并将您的邻居设置为5,则每个切片将使用5个点(共20个点)进行本地估算。由于没有完美的设置公式,因此关键是平移并检查预测值,以感觉输出的外观。
步骤5检查交叉验证结果
克里金法的交叉验证步骤采用您的输入数据点之一,并将其从数据集中排除。使用所有剩余点,它将预测返回到该位置。同样,您知道真正的价值是什么,此过程将使用所有剩余的价值来预测该价值。
对于交叉验证,它会遍历所有输入点,直到完成为止。然后,它创建此残差汇总表,将实际值与模型的预测值进行比较。该表显示的是您的模型实际的坚固程度。
那么,真实值与预测值有多接近?换句话说,您的模型对数据的拟合程度如何?为了使这一切正确,请检查标准化的均方根,因为它应该接近1。此外,均方根误差应尽可能小。
动态地统计层
因为输出是地统计图层,所以它是动态的,这意味着您可以更改其输出类型为预测,预测误差,概率或分位数。或者,如果您不喜欢优化的输出,甚至可以返回到地统计图层并更改参数。
克里金法是一门科学和艺术。
这不仅是您从半变异函数中选择模型的方式,而且是如何设置垃圾箱数量和其他设置的方式。这是克里金法的艺术。
当您代表克里金表面时,例如选择间隔数,它会给结果带来不同的印象。尽管更多的类提供了更多细节,但是数据分类方法(例如分位数或相等间隔)以不同的方式排列数据。
对克里金的预测很强
空间预测涉及随机性的某些组成部分。在对数据集进行推断时,这对于地统计至关重要。
您的克里金法权重是根据方差图估算的。更具体地说,它源自您选择的模型。估计表面的质量反映在权重的质量中。您需要权重能够给出无偏的预测和最小的方差。
换句话说,克里金法找到了空间格局。然后,它基于该空间模式预测未知值。通过这些预测,克里金法产生了误差或不确定性的量度。这意味着您可以估计在预测表面上的置信度是真实的,而不是因为随机机会。
因为您不仅要自定义数学函数以建立一个,而且还要利用统计分析的力量-即半变异函数。
克里金(Kriging)是一种地理统计方法,可在给定一组度量的情况下预测地理区域中的值。它用于采矿,土壤,地质学和环境科学。
没有一种适合所有人的千篇一律的方法。与数据有关,只有您才能决定这些设置是什么以及如何最好地生成预测面。