白话空间统计番外三:空间统计的基础理论

空间统计学是统计学的一个分支,有很多与统计学相同的地方,也有很多有自身特点的,地方,今天我们就来聊聊空间统计学的四大基础理论:

首先就是空间概率

统计学是一门计算很研究概率的学问,一般的描述方式都是“xx事的发生概率是百分之xx”,因为对于任何事情的预测,都是处于不稳定状态。

那么空间上就更是这样的了,人类绝无可能将地球上任何地方发生的事情都能够完整描述锁着理解,所以只能借助于概率的思考模式来进行理解了。

经典统计学里面,独立事件的联合概率通常都是用各自概率的乘积计算的,比如下面这个比喻:
在一群人里面,高个子(180以上的长腿欧巴)的比例是十分之一,富豪的比例也是十分之一,帅哥的比例是十分之一。那么即是长腿欧巴,有是富豪,还是帅哥三者都具备的概率,就是10% * 10% * 10% = 千分之一……

但是在空间上,并不是这样,空间上的两个点,按照地理学第一定律规则,距离越近的相关性越高,那么按照他们距离来判定,两个点同时发生某件事情的概率,就应该不同于独立事件的概率,如下:

A点与B的滑坡概率如果都是二分之一的话,那么两个点同时发生滑坡的概率,就应该是大于四分之一,且小于等于二分之一。因为任意一点发生滑坡,都有可能影响另外的一个点。

同样的,如果是C点,概率肯定又有不同,而D点的概率,通过空间关系来判定的话,就可以当成独立事件了。这就是空间概率中的一个应用。

其次就是概率密度。

任何事情在任何位置发生都是有一定的概率的,也就是说,带有不确定性。比如我们用GPS进行定位,如果说我们的仪器的误差是5米话,那么测量值的偏差在任意方向都会出现一定的散布,而散布的概率理论上会形成正态分布的对称曲线。在空间上可以把这个分布想象成一个钟形,那么任何一个事件在任意区域发生的概率,就是这个钟表面在这个区域上的所占的体积。

第三是不确定性。
地理信息是现实世界的一个抽象,任何数据都只是一个表达,这样就不可避免的对所要表达的现实世界产生不确定性。而且最关键是这种不确定性是可以传递的,也就说数据的不确定性,最后肯定带来结果的不确定性。

另外不确定性也有可能是测量引起的。还有可能是观察者本身引发,也有可能是数据不完整造成的。所以对于空间分析研究者来说,了解数据中不确定性和研究这些不确定性如何影响分析结果是重中之重。

目前的研究中,不确定性作为很重要的领域,已经有很多成果,比如地统计学,采用随机过程来模拟插值的变异情况,就是不确定性研究的一项成果。


比如“奇峰突起”这种喀斯特地貌的研究中,不确定性就发挥了很大价值。

最后就是统计推断了。
统计推断可以说是科学研究中最重要的工具之一。其通过样本分析推理以求得到关于包括了样本在内的更大群体的结论。

不过在空间分析中,统计推断首先要解决下面这些问题:
样本的选择在何种范围内?有没有可能选择更大范围中的样本?
如何保证选择的样本与其他值之间存在空间相关性?
空间异质性如何保证样本在不同的位置被提取出来的特征?
样本能够代表多大的区域范围?
分析的结果能否推断出关于总体的结论?
对于这些问题的回答,通常都是否定的。因为空间统计与经典统计最大的不同点就在于要素之间的相关性,所以我们在做空间分析的时候,通常是在我们能够获得的所有数据上进行操作,因此很少或者更本没有一个用于提取数据并进行推理的总体概念。而且认为每个样本观测值是独立的观点也是不行的,除非相距很远。
所以空间分析很早就有了现在所谓的大数据分析的思路之一:总体分析,局部验证。



转载自:https://blog.csdn.net/allenlu2008/article/details/52211296

You may also like...