分享

新版白话空间统计(6):在ArcGIS中实现莫兰指数计算

 godxiasad 2023-04-21 发布于北京

上一篇简单说了一下莫兰指数的计算原理和计算公式,如果是学生或者基础研究者,鼓励好好的学习一下手算或者编程计算,所谓的基础不牢,地动山摇……但是对于工程界和应用人士,特别是非基础学,重复造轮子是没有啥意义的,我们直接使用已有工具来做就行。

今天我们介绍一下,在ArcGIS里面怎么进行莫兰指数的计算。

首先介绍一下实现莫兰指数的话,需要什么样的数据

既然叫做“空间自相关”,那么我们需要的数据肯定是要有空间属性,啥叫空间属性呢?通常说来,就是能够表达位置的数据,狭义说起来,就需要有坐标,比如下面的表格:

拥有经度和纬度,就能在地球上表示一个固定的位置了,就像上面的表格里面,我们可以看见北京的经纬度坐标就是:东经116.3956度,北纬39.92999度

这种由X\Y两个数值所表达的点模型,这是最基础的空间数据,如果你的数据连这种无法获取,那么空间自相关分析就真没法开展了。

如果你需要更精确的研究,那么计量经济学上或者空间计量学上用的截面数据中,行政区划的空间承载模型,应该用是面要素模型——

面要素模型,也称为”多边形“要素,通常是由一系列的封闭的点所组成的多边形,形成的空间数据,比如在ArcGIS里面,中国的行政区划所表达的:

我们看任意一个省,比如山西:

可以看见,山西省的行政区划,是由若干个点组成的封闭的集合

当然,点数据的获取相对来说,还是比较容易的,通过百度坐标拾取就能直接弄到,但是面数据就只能通过专业测绘公司或者单位获取了(当然,你要是能手绘,也行)。不过还好的是,我国对于1:400万以上的数据,都是免费可公开的,也就是说,你可以通过互联网渠道,获取到全国县级以上行政区划的数据,而县级以下的,你就只能去找相关地方的国土测绘部门去获得了。

有了空间数据之后,那么就把你需要分析的属性数据与空间数据进行一对一匹配上面去,比如我要分析2016年的全国各省GDP数据,那么就要有空间数据和属性数据,才能进行分析:

(什么?有问我怎么去做这种数据的?请学习ArcGIS基础数据处理与制图课程……这个不归我管,完全不懂GIS的同学,可以求助旁边会GIS的同学)

数据准备好之后,我们就可以通过工具来进行分析了,这里以ArcGIS为例:

首先打开ArcMap,然后把数据加入进去,找到ArcToolbox——空间统计工具箱——空间模式分析——空间自相关(莫兰指数)工具

打开之后,出现了这样一个窗口,而一般来说,默认只需要关注必选项就行(亮绿灯的东西),可选项可以直接不管,就按默认参数来设置(比如第三项,是否输出分析结果报表),也可以去设置,后面我们还会再说每个参数的意义(特别是后面设置空间权重):

我们要设置的就是输入要素类和输入字段:

然后点击运行即可,如果不出错的话,会得到下面这样的结果:

那么这个表示什么意思呢?

首先,前面两个警告

额……上面那张图片不算,请大家忽略:

(不同的ArcGIS版本提示可能不同,一般来说10.4以上的话,提示应该和我一样的)

第一个警告是说你的数据本身采用的地理坐标系,所以用距离来作为空间关系概念进行分析,会不准确。

第二警告是说,默认设置的临近要素是1106公里(为什么用这个值呢,以后在说空间关系的时候,会进行解释——坑.No.1)。

然后下面就是你这次计算的全局莫兰指数了,莫兰指数的解读,需要反着读,先利用P、Z值来解读分析结果是否可信,然后读莫兰指数的值。关于P\Z值的解读,我们在以后的统计显著性说明里面,进行详细解读,这里大家只要记住P值大于0.1的就不可靠就行(什么?你问我为什么不可信?还是那句话,请听后文——坑.No.2)

——现在,请大家叫我挖坑小能手

为什么会发生这种所谓的不可靠呢?原因太多了,有可能本身数据就不可靠,当然,也有可能你的分析参数设置不正确……

我完全都没有设置参数,全部用的默认,你所谓的分析参数设置不正确是什么鬼??

实际上这个锅必须是让空间关系概念来背的,一般来说,在地理空间分析的时候,距离概念一般会给点要素来用,而以行政区划为空间要素承载的分析来看,通常采用触点连接——也就是我们经常所说的“相邻”或者“接壤”,比如在空间位置上,湖北与陕西、河南、安徽、江西、湖南、重庆四个省(直辖市)直接相邻:

所以,我们可以选择一个比较符合我们思维观念的空间关系方法,比如区域接壤,就算相邻:

在ArcGIS里面,把这种“接壤”的关系,叫做

CONTIGUITY_EDGES_CORNERS”——

即所谓的共有一个公共点,或者共有一条公共边的两个面要素,被视为相邻要素。

设置完成之后,再来执行一次,结果如下:

多出了两个警告,分别说是有两个要素,没有找到临近要素,分别是18号和31号——我们来看看:

18号是海南,31号是台湾,这两个岛屿没有发现与任何省有共点或者共边,被视为无临近要素的独立面,所以这两个数据也不被加入到分析中。(怎么处理这种情况呢?以后再说,继续挖坑——坑.No.3)

然后继续看结果:

Global Moran's I Summary

Moran's Index:   0.259547

Expected Index:  -0.032258

Variance:        0.011107

z-score:         2.768836

p-value:         0.005626

p值,小于0.1,嗯,有效,Z得分,与P值对应阅读,大于1.65,有效……(为什么?参考坑.No.2)

方差:0.011,期望指数-0.032,这里方差和期望指数,都是用于对比莫兰指数和评估PZ值的,下篇文章做解释(——坑.No.4)。

最后看最关键的全局莫兰指数:0.259。

回忆一下,莫兰指数的范围:

0.259代表的是,在给点的样本的情况下,数据呈现了空间正相关的表征:即高值与高值发生聚集低值与低值聚集,空间上呈现正相关模式,倾向于发生了空间聚类现象。

那么白话来解释,就是:有钱的省,通常旁边也都存在有钱的省,没钱的省,旁边通常也都是没钱的省……。

那么这一样个指数,有多大的意义呢?

答案是:统计分析里面,独立的指数并没有太大的意义,所有的意义都要来自于对比,如何进行对比呢?我们下期继续。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多