白话空间统计二十三:回归分析(一)
2017年开篇文章,还是继续是虾神我的老本行:白话空间统计。所以虾神准备直接就在一棵树上吊死算哒——将空间统计进行到底。
所以,把虾神daxialu打造成《空间统计》领域的微信第一公众号,就是虾神我的野望所在了。所以在2017年第一篇,再从重申虾神在开写《白话空间统计》时候发下的大宏愿:地狱不空,誓不成佛——额……串了……是:I have a dream,将空间统计拉下神坛,写出一个最接地气的空间统计解释来。
在这里简单做一下今年的更新计划:
1、续写白话空间统计,以及以前的一些文章重写(重写包括订正和内容重新编写),全年在白话空间统计这个系列上,更新的内容和订正的内容,大约是3:1左右。
2、R语言和Python的一些应用、包和Demo的介绍和教程(类似去年Leaflet for R那样的系列文章,全年应该有两至三个系列)。
3、翻译文章,包括教材系列的和国外文章系列的文章。
4、连载或者贴老夫做的一些PPT神马的。
5、贴一些老夫的Demo代码和算法之类的。
那么全年预计更新60-70篇文章左右,每月5-6篇……好吧,写完这句话的时候,虾神就突然觉得背后冷飕飕的,一月都过去一半,就说明已经欠下三篇文章的账了啊……啊啊啊啊……好有危机感啊。
好吧,正式开始今天……今年的内容。
回归分析实际上是统计学里面的一个经典内容,关键是在空间统计里面,有一个巨大的拦路虎就是:地理回归分析,所以要讲地理回归分析,不得不先讲讲回归分析。
对于大部分人来说,回归分析就是这样的:
这应该是对于大部分非统计学背景的同学来说,最形象的说明了……一说回归分析,so,这个东东我知道,不就是一条直线么……至于这个直线是干嘛的——你问我我问谁呢?好吧,今天就让虾神来好好念叨念叨这跟直线是干嘛的。
首先,“回归”这个词,最早是英国地理学家、人类学家、统计学家(还有一堆头衔:数学家、气象学家、心理学家等等……高尔顿爵士与亚历山大 洪堡处于同一时代,所以可以定位为精准科学分科之前的综合性学者,关于这个论点,请查看虾神以前的文章《学科与国家随想》(在公众号回复“学科”就可以找到这篇文章了,或者看《地理学思想史》)Sir Francis Galton(弗朗西斯·高尔顿爵士 :16 February 1822 – 17 January 1911)在19世纪80年代提出来的,就是下面这位:
他用的“回归”这个词,最早是用来研究同一族群中,父辈身高与子代身高之间的关系而提出来的,按照我们一般的遗传学常识,父亲高,儿子自然也高,父亲矮,儿子自然也矮,但是他发现了一个很有意思的现象:
如上图,在同一族群里面,子代的身高,会慢慢的回归族群的平均身高,虽然大方向上,还是高个子父亲生高个子儿子,但是他们与平均身高的距离会越来越小。所以,这个就是在统计学上,回归最早的含义。
当然,到了今天,回归分析已经变成了数据分析领域应用最广泛的分析方法(没有之一——什么?你说专题图是最广泛的?亲,那东西叫做可视化,不是分析方法……)
回归分析主要用来干嘛呢?
首先就是探索自变量和因变量之间的因果关系:
其次还可以通过自变量的取值来预测因变量的结果。比如美元和黄金问题。。。
还有一个最大的优点,就是回归可以用统计手段,排除在干扰因素……这个说起来好像很复杂,暂时挖一坑,回头待填。
好了,第一篇文章暂时就先到这里了,从下一篇文章开始正式讲回归分析……当然,从回归到地理回归,估计中间还有不少内容要讲,就当开了个专题吧。
2017年,一七……一起,我们一起成长。
转载自:https://blog.csdn.net/allenlu2008/article/details/54407710