分享

空间计量经济学

 liyu_sun 2020-05-19

来源:空间计量经济学八部曲视频

视频版本内容详见:《零基础|轻松搞定空间计量:空间计量及GeoDa、Stata应用》

一、空间计量经济学及Stata应用(一)

1、简介  

Jean Paelinck在1974年引入了空间计量经济学这一术语,并将其定义为:经济理论、数学形式化和统计学的结合,空间相互依赖的作用、其他地方因素的重要性、空间的明确建模”。

Luc Anselin(1988)将空间计量经济学定义为:在横截面模型和数据面板中处理空间相互作用和空间结构的计量经济学分支(分离空间依赖性和空间异质性)。

空间分析起源于地理学、空间经济学和相关学科。到目前为止,它被认为是专业的领域,因此不是大多数统计软件的标准部分。

空间效应传统的统计理论是一种建立在独立观测值假定基础上的理论。然而,在现实世界中,特别是遇到空间数据问题时,独立观测值在现实生活中并不是普遍存在的(Getis,1997)。对于具有地理空间属性的数据,一般认为离的近的变量之间比在空间上离的远的变量之间具有更加密切的关系(Anselin&Getis,1992)。正如著名的Tobler地理学第一定律所说:“任何事物之间均相关,而离的较近事物总比离的较远的事物相关性要高。”(Tobler,1979)*地区之间的经济地理行为之间一般都存在一定程度的SpatialInteraction,SpatialEffects):SpatialDependenceandSpatialAutocorrelation)。一般而言,分析中涉及的空间单元越小,离的近的单元越有可能在空间上密切关联(Anselin&Getis,1992)。然而,在现实的经济地理研究中,许多涉及地理空间的数据,由于普遍忽视空间依赖性,其统计与计量分析的结果值得进一步深入探究(Anselin&Griffin,1988)。可喜的是,对于这种地理与经济现象中常常表现出的空间效应(特征)问题的识别估计,空间计量经济学提供了一系列有效的理论和实证分析方法。一般而言,在经济研究中出现不恰当的模型识别和设定所忽略的空间效应主要有两个来源(Anselin,1988):空间依赖性(SpatialDependence)和空间异质性(SpatialHeterogeneity)。

空间效应之依赖性

  • 空间依赖性(也叫空间自相关性)是空间效应识别的第一个来源,它产生于空间组织观测单元之间缺乏依赖性的考察(Cliff&Ord,1973)。

  • Anselin&Rey(1991)区别了真实(Substantial)空间依赖性和干扰(Nuisance)空间依赖性的不同。

  • 真实空间依赖性反映现实中存在的空间交互作用(SpatialInteractionEffects),比如区域经济要素的流动、创新的扩散、技术溢出等, *它们是区域间经济或创新差异演变过程中的真实成分,是确确实实存在的空间交互影响, 如劳动力、资本流动等耦合形成的经济行为在空间上相互影响、相互作用,研发的投入产出行为及政策在地理空间上的示范作用和激励效应。

  • 干扰空间依赖性可能来源于测量问题,比如区域经济发展过程研究中的空间模式与观测单元之间边界的不匹配,造成了相邻地理空间单元出现了测量误差所导致。测量误差是由于在调查过程中,数据的采集与空间中的单位有关,如数据一般是按照省市县等行政区划统计的,这种假设的空间单位与研究问题的实际边界可能不一致,这样就很容易产生测量误差。

  • 空间依赖不仅意味着空间上的观测值缺乏独立性,而且意味着潜在于这种空间相关中的数据结构,也就是说空间相关的强度及模式由绝对位置(格局)和相对位置(距离)共同决定。

  • 空间相关性表现出的空间效应可以用以下两种模型来表征和刻画:当模型的误差项在空间上相关时,即为空间误差模型;当变量间的空间依赖性对模型显得非常关键而导致了空间相关时,即为空间滞后模型 (A nselin,1988)。

空间效应异质性

  • 空间异质性(空间差异性),是空间计量学模型识别的第二个来源。空间异质性或空间差异性,指地理空间上的区域缺乏均质性,存在发达地区和落后地区、中心(核心)和外围(边缘)地区等经济地理结构,从而导致经济社会发展和创新行为存在较大的空间上的差异性。

  • 空间异质性反映了经济实践中的空间观测单元之间经济行为(如增长或创新)关系的一种普遍存在的不稳定性。区域创新的企业、大学、研究机构等主体在研发行为上存在不可忽视的个体差异,譬如研发投入的差异导致产出的技术知识的差异,这种创新主体的异质性与技术知识异质性的耦合将导致创新行为在地理空间上具有显著的异质性差异,进而可能存在创新在地理空间上的相互依赖现象或者创新的局域俱乐部集团。

  • 对于空间异质性,只要将空间单元的特性考虑进去,大多可以用经典的计量经济学方法进行估计。

  • 但是当空间异质性与空间相关性同时存在时,经典的计量经济学估计方法不再有效,而且在这种情况下,问题变得异常复杂,区分空间异质性与空间相关性比较困难。空间变系数的地理加权回归模型(GeographicalWeightedRegression,简记为GWR)是处理空间异质性的一种良好的估计方法。

就stata而言,有许多用户编写的工具可以从ssc服务器或其他来源下载。例如

shp2dta

sppack,使用ssc下载,包含spmat, spreg和spivreg

使用search spatwmat下载spatwmat

使用search……下载spatgsa, spatlsa和spatcorr

使用search… 下载spatdiag和spatreg

注意,还有一些其他的包没有在这里描述。

2、动因

Theory-driven

从个人决策到社会空间互动。常见的冲击。同伴效应,情境效应,邻里效应。

数据驱动:地理坐标信息。

技术:地理信息系统。统计软件能力。

3、空间数据

空间数据有什么特别之处?空间数据可以有多种含义,但它们都有一个共同点,即它们都是关于实体的,这些实体可以通过它们在空间中的位置来描述。大多数社会学家考虑的是地区数据,即关于地区、社区和地区的数据。但实际上,空间数据也可能是关于单点的(事件或对象的位置—点当然是抽象的)。对于这样的数据文件,有一个世界性的事实上的标准,来自ArcGiS软件

该软件提供了一个所谓的shapefile,可以通过shp2dta过程将其读入Stata。另一种格式是MapInfo交换格式,有一个mif2dta过程可以帮助您处理这些数据。

在下面的文章中,我将描述shapefile更常见的情况。

在开始之前,请注意shapefile实际上由多个文件组成,通常具有相同的名称,但是不同的扩展名。三个文件是必需的:mydata。其中mydata.shp包含坐标。mydata.dbf描述对象和mydata.shx带有索引对象。

另外mydata.prj表示使用的投影(或空间参考)系统。

总结:地理参考信息(格点数据)通常存储在shapefiles (至少3个文件): ,分别是.shp、.shx、.dbf。

在 Stata. Shapefiles不能直接阅读

shp2dta 命令可以将 shapefiles文件转换成Stata格式的.

为什么我们需要这么多的文件可以用面积数据来解释:一个区域,比如一个区域,可以用它的边界来描述,从几何上来说,这些边界形成了一个多边形。多边形可以很简单,比如矩形,也可以很复杂。比较美国的一些州,如科罗拉多州或怀俄明州,它们的边界形成简单的直角,而其他一些州,如西弗吉尼亚州,它们的边界形成一个非常不规则的实体。因此,需要不同数量的空间坐标来描述这种异构多边形。

4、空间数据读取

所需命令为:

shp2dta using name-of-shapefile, database(db-new-name) coordinates(co-new-name) genid(id-var)

该命令读取一个名为name-of-shapefile的形状文件,并将其内容写入两个Stata文件(扩展名为.dta),我在这里将其命名为(db-new-name)和(co-new-name)。显然,前者包含对象的描述(主要是在不同位置测量的变量),而后者包含坐标。id-var是要创建的id变量的名称。注意,这两个Stata文件都将保存到当前工作目录的磁盘中。这些新文件可以像任何其他Stata文件一样处理;您可以重命名变量、删除变量或用例、转换变量或将它们与其他文件合并。当然,你会想要小心这样的活动,除非你确定你可以做什么和应该做什么。带有坐标的文件通常最好保持原样!

5、空间权重矩阵

通常,W的构建是研究者的一个特别过程。

共同的标准是:

1、地理:

距离函数:分为逆距离空间权重矩阵、逆与阈值距离空间权重矩阵

邻近空间权重矩阵:分为车相邻、后相邻

K近邻空间权重矩阵

2、社会经济:

经济维度(或社会网络)的相似度。

3、两个标准之间的组合。

在Stata中(至少)有三个命令生成W:

spatwmat: 距离标准。用于空间单变量分析。

生成的文件与spmat不兼容

spwmatrix: 使用地理标准生成W(无地理邻近)。

在社会经济条件下产生W。

从Geo Da导入、导出和操作。

生成文件与 spatwmat格式兼容

spmat:

使用地理条件生成W (k近邻权重矩阵下没有)。

从Geo Da导入、导出和读取矩阵。

生成文件与 spatwmat格式不兼容

6、空间权重矩阵spatwmat

Spatwmat

Spatwmat 这个程序由Maurizio Pisati编写,创建Stata矩阵。它将以两种方式创建邻接矩阵(或空间权值):它可以读取包含权值的外部文件,也可以从指定纬度和经度的当前数据集中的变量(列)创建权值。

通常,后一种信息来自数据库文件,因为该文件每个case包含一行。请注意,经纬度将表示区域的中心;因此,在这种情况下,只能计算基于距离的权重(但不能计算基于邻居关系的权重)。

1、语法格式为:

spatwmat using 'myweights.dta', name(name-of-matrix) eigenval(name-e-matrix) stand

表示:读取外部矩阵myweights.dta。并将其存储为标准化的,即矩阵名称中的行标准化矩阵;此外,特征值向量存储在name-e-matrix中。

2、Creating weight matrices from latitude and longitude

spatwmat, stand name(name-of-matrix) xcoord(lat) ycoord(long) band(0 10)

这将从存储在变量lat和long中的坐标创建(标准化的)矩阵名。选项范围(0 10)表示对象将被视为仅在指定范围内的邻居。

请注意,“x坐标和y坐标都必须以投影单位表示,例如米、公里、英里或任意数字化单位”,如帮助文件所述。

空间数据分析的主要特点之一是,它考虑了观测单元的空间排列,我们称之为位置(Anselin 1992a)。这种空间布局由空间权矩阵W表示,其元素wij表示存在或不存在(二元权矩阵)或每个可能位置对之间的潜在空间相互作用的程度(非二元权矩阵)。

spatwmat的主要目的是生成spatgsa, spatlsa, spatdiag, 和 spatreg等命令所需要的N*N空间权重矩阵。

为了说明spatwmat的实际应用,以及本文中讨论的其他命令,我将使用俄亥俄州哥伦布市(Anselin 1988) 49个相邻规划社区的数据。

# 计量经济学服务中心空间计量课程
use columbusdata.dta, clear
describe   //描述查看

结果为:

#  导入数据,查看数据类型

. **计量经济学服务中心空间计量课程
. use columbusdata.dta, clear

. describe   //描述查看

Contains data from columbusdata.dta
obs:           49                          
vars:             6                         13 Feb 2013 20:08
size:         1,029                          
------------------------------------------------------------------------------------------------------
            storage   display   value
variable name   type   format     label     variable label
------------------------------------------------------------------------------------------------------
id             byte   %8.0g                 Neighborhood id value
hoval           float   %9.0g                 Housing value (in $1,000)
income         float   %9.0g                 Household income (in $1,000)
crime           float   %9.0g                 Residential burglaries & vehicle thefts per 1,000
                                              households
x               float   %9.0g                 x coordinate of centroid (in arbitrary digitizing units)
y               float   %9.0g                 y coordinate of centroid (in arbitrary digitizing units)
------------------------------------------------------------------------------------------------------
Sorted by: id

.
end of do-file.

在使用这些数据进行兴趣分析之前,我们必须生成适当的空间权值矩阵。如前所述,完成此任务的方法包括导入存储在外部Stata数据文件中的用户定义矩阵。

# 计量经济学服务中心空间计量课程
spatwmat using columbusswm.dta, name(W)  //计量经济学服务中心

结果为:

#  计量经济学服务中心空间计量课程
. spatwmat using columbusswm.dta, name(W)


The following matrix has been created:

1. Imported binary weights matrix W
  Dimension: 49x49

当一切都完成, spatwmat告诉我们 , 一 个 名叫 W,49 * 49 的空间权重 矩阵创建;此外,spatwmat检测到导入的矩阵由二进制权值组成。如果我们愿意只分析前十个社区,我们可以使用option ,drop(数字列表)来进行操作

# 计量经济学服务中心空间计量课程
spatwmat using columbusswm.dta, name(W) drop(11/49) //计量经济学服务中心

结果为:

#  计量经济学服务中心空间计量课程
. spatwmat using columbusswm.dta, name(W) drop(11/49)


The following matrix has been created:

1. Imported binary weights matrix W
  Dimension: 10x10

  Beware! 1 location has no neighbors

最后,spatwmat可以用来生成spatreg需要的特征值矩阵:

# spatwmat可以用来生成spatreg需要的特征值矩阵:
spatwmat using columbusswm.dta, name(W) standardize eigenval(E)

结果为:

#  计量经济学服务中心空间计量课程
. spatwmat using columbusswm.dta, name(W) standardize eigenval(E)


The following matrices have been created:

1. Imported binary weights matrix W (row-standardized)
  Dimension: 49x49

2. Eigenvalues matrix E
  Dimension: 49x1

7、空间权重矩阵Spmat

Spmat

Spmat 创建矩阵

spmat允许创建基于邻近和基于距离的矩阵。就我所知,它们是特殊的物体,不能被交互地看待。然而,它们可能被保存或导出到磁盘

spmat contiguity name-of-matrix using mycoord, id(id-var) norm(row)

它使用坐标文件mycoord来创建行标准化的邻近矩阵名。还有两种其他的命名方法。

spmat idistance name-of-matrix LON LAT , id(id) norm(row)

它使用带有变量LON(表示经度)和LAT(表示纬度)的当前工作文件来创建矩阵的逆距离矩阵名。

8、可视化空间数据:地图

地图为可视化空间数据提供了丰富的可能性。目前本节只讨论简单的等值线图

spmap some-variable using my-coord , id(id-var) fcolor(Blues)

这将绘制变量somevariable的choropleth映射(它是数据库文件的一列;这个文件是当前工作文件)使用坐标文件my-coord (id变量id-var)。用几种深浅不同的蓝色来表示某一变量的不同程度。不出所料,有大量的选项可以根据你的意愿来调整地图。

10、空间自相关的统计

空间自相关简介

空间自相关(spatial autocorrelation)是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性。Tobler(1970)曾指出“地理学第一定律:任何东西与别的东西之间都是相关的,但近处的东西比远处的东西相关性更强”。

当高值与高邻域值相关或低值与低邻域值相关时,空间自相关为正;当高值与低邻近值相关时,存在负空间自相关,反之亦然。

正空间自相关的存在会导致信息的丢失,这与较大的不确定性、较低的精度和较大的标准误差有关。

空间相关系数(相对于时间上的对应系数)不受-1/+1的约束。它们的范围取决于权重矩阵的选择。

空间计量中有很多度量相关的方法指数,但最主要的有两种指数,即Moran的I指数和Geary的C指数。在统计上,透过相关分析(correlation analysis)可以检测两种现象(统计量)的变化是否存在相关性,例如:稻米的产量,往往与其所处的土壤肥沃程度相关。如果这个分析统计量是不同观察对象的同一属性变量,就称之为「自相关」(autocorrelation)。因此,所谓的空间自相关(spatial autocorrelation)就是研究「空间中,某空间单元与其周围单元间,就某种特征值,透过统计方法,进行空间自相关性程度的计算,以分析这些空间单元在空间上分布现象的特性」。

计算方法编辑 有许多种,然最为知名也最为常用的有:Moran’s I、Geary’s C、Getis、Join count等等。但这些方法各有其功用,同时亦有其适用范畴与限制,当然自有其优缺点。一般来说,方法在功用上可大致分为两大类:一为全域型(Global Spatial Autocorrelation),另一则为区域型(Local Spatial Autocorrelation)两种。

全域型的功能在于描述某现象的整体分布状况,判断此现象在空间是否有聚集特性存在,但其并不能确切地指出聚集在哪些地区。且若将全域型不同的空间间隔(spatial lag)的空间自相关统计量依序排列,还可进一步作空间自相关系数图(spatial autocorrelation coefficient correlogram),分析该现象在空间上是否有阶层性分布。

而依据Anselin(1995)提出LISA(Local Indicators of Spatial Association)方法论说法,区域型之所以能够推算出聚集地(spatial hot spot)的范围,主要有两种:一是藉由统计显著性检定的方法,检定聚集空间单元相对於整体研究范围而言,其空间自相关是否够显著,若显著性大,即是该现象空间聚集的地区,如:Getis和Ord(1992)发展的Getis统计方法;另外,则是度量空间单元对整个研究范围空间自相关的影响程度,影响程度大的往往是区域内的「特例」(outliers),也就表示这些「特例」点往往是空间现象的聚集点,例如:Anselin’s Moran Scatterplot。

空间自相关检验命令汇总

主要包括spatgsa、spatlsa、spatcor等命令。

有全局和局部的统计数据。最常见的是Moran's I(同时具有全局和本地版本),但是也可以计算其他一些统计数据。

命令为:

spatgsa y, weights(w-matrix) moran

将计算y的全局莫兰指数。该变量是(空间)数据库文件的一部分(该文件应该是您当前的工作文件或主文件),计算使用spatwmat创建的权值矩阵w-矩阵

如果在被调查的变量中有任何缺失的值,将不计算任何统计数据(没有给出任何理由!)

spatlsa y, weights(w-matrix) moran id(id-var)

将计算y的局部莫兰指数。该变量是(空间)数据库文件的一部分(该文件应该是您当前的工作文件或主文件),计算使用spatwmat创建的权值矩阵w-矩阵。变量id-var(它是观察的唯一特征)用于识别输出中的观察值。选项moran将输出限制为Moran's I.参见其他统计信息的help函数(或者省略此选项,在这种情况下,您将得到几个统计信息)。注意,如果某个变量中有缺失的值,则不会计算任何统计信息。

1、spatgsa

spatgsa计算三个全局空间自相关统计数据:Moran's I, Geary's c, and Getis and Ord's G。spatgsa计算并以表格形式显示统计本身的期望值、全局空间的零假设下的独立零假设,标准差的统计,z值和相应的单尾或者双侧检验。

全局自相关检验用到的命令为spatgsa,语法格式为:spatgsa varlist , weights(matrix) [ moran geary go twotail ]

其中:

weights(matrix)总是需要权值(矩阵)。它指定用于计算请求的全局空间自相关统计信息的空间权重矩阵的名称。这个矩阵一定是由spatwmat生成的。

moran请求计算并显示moran的I和相关的值。

geary请求计算并显示Geary's c统计量。

go请求计算Getis and Ord's G。此选项要求由选项权值(矩阵)指定的空间权值矩阵为非标准化的对称二进制权值矩阵。

twotail请求计算和显示双尾p值,而不是默认的单尾p值。

要运行spatgsa,必须至少指定以下选项之一:moran、geary和go。

案例代码为:

# *全局空间自相关

use columbusdata.dta,clear
spatgsa hoval income crime, weights(W) moran geary go

spatgsa hoval income crime, weights(W) moran geary twotail

结果为:

#  *全局空间自相关
. use columbusdata.dta,clear

. spatgsa hoval income crime, weights(W) moran geary go


Measures of global spatial autocorrelation


Weights matrix
--------------------------------------------------------------
Name: W
Type: Imported (binary)
Row-standardized: No
--------------------------------------------------------------

Moran's I
--------------------------------------------------------------
Variables | I E(I) sd(I) z p-value*
--------------------+-----------------------------------------
hoval | 0.220 -0.021 0.085 2.824 0.002
income | 0.413 -0.021 0.086 5.067 0.000
crime | 0.521 -0.021 0.087 6.212 0.000
--------------------------------------------------------------

Geary's c
--------------------------------------------------------------
Variables | c E(c) sd(c) z p-value*
--------------------+-----------------------------------------
hoval | 0.805 1.000 0.138 -1.411 0.079
income | 0.716 1.000 0.131 -2.165 0.015
crime | 0.584 1.000 0.109 -3.835 0.000
--------------------------------------------------------------

Getis & Ord's G
--------------------------------------------------------------
Variables | G E(G) sd(G) z p-value*
--------------------+-----------------------------------------
hoval | 0.098 0.099 0.006 -0.188 0.425
income | 0.098 0.099 0.005 -0.057 0.477
crime | 0.126 0.099 0.006 4.714 0.000
--------------------------------------------------------------
*1-tail test



. spatgsa hoval income crime, weights(W) moran geary twotail


Measures of global spatial autocorrelation


Weights matrix
--------------------------------------------------------------
Name: W
Type: Imported (binary)
Row-standardized: No
--------------------------------------------------------------

Moran's I
--------------------------------------------------------------
Variables | I E(I) sd(I) z p-value*
--------------------+-----------------------------------------
hoval | 0.220 -0.021 0.085 2.824 0.005
income | 0.413 -0.021 0.086 5.067 0.000
crime | 0.521 -0.021 0.087 6.212 0.000
--------------------------------------------------------------

Geary's c
--------------------------------------------------------------
Variables | c E(c) sd(c) z p-value*
--------------------+-----------------------------------------
hoval | 0.805 1.000 0.138 -1.411 0.158
income | 0.716 1.000 0.131 -2.165 0.030
crime | 0.584 1.000 0.109 -3.835 0.000
--------------------------------------------------------------
*2-tail test

.
end of do-file

2、spatlsa

上述命令spatgsa为全局空间自相关度量提供了感兴趣的变量的空间分布的“平均”图,因此,可能隐藏了正在研究的现象的有趣特征。为了克服这一限制,在过去十年中,人们设计了一些局部空间自相关的测量方法。这些统计数据可以用于不同的目的。

当应用于缺乏全局空间自相关的数据集时,局部统计可能能够揭示一个或多个有限的区域,这些区域与空间随机性有显著的偏差。当应用于存在全局空间自相关的数据集时,**局部统计可能有助于识别对空间聚类的总体模式贡献最大的位置(Sokal等人,1998)。更一般地,使用局部统计来检测个别位置(有时称为热点)周围的显著空间聚类。

spatlsa计算四种局部空间自相关统计:Moran's Ii, Geary's ci, Getis and Ord's G1i, and Getis and Ord's G2i.。对于每个请求的统计量和每个分析的位置对象,spatlsa以表格的形式计算并显示统计量本身、统计量在局部空间独立的原假设下的期望值、统计量的标准差、z值,以及相应的1尾或2尾的p值。作为一个选项,spatlsa还显示一个Moran scatterplot、一个Moran scatterplot值的映射、一个G1i z值的映射或一个G2i z值的映射。

局部自相关检验用到的命令为spatlsa,语法格式为:

spatlsa varname , weights(matrix) [ moran geary go1 go2 id(varname) twotail sort graph(moran|go1|go1) symbol(id|n) map(filename) xcoord(varname) ycoord(varname) savegraph(filename [, replace]) ]

为了说明spatlsa的实际应用,让我们再次考虑哥伦布的数据。对变量 crime进行局部空间自相关检验, 我们必须输入以下commands:

案例代码为:

# 计量经济学服务中心空间计量课程
# 局部空间自相关

use columbusdata.dta,clear
spatlsa crime, weights(W) moran go2

结果为:

#  计量经济学服务中心空间计量课程
# 局部空间自相关

. use columbusdata.dta,clear

.
. spatlsa crime, weights(W) moran go2


Measures of local spatial autocorrelation


Weights matrix
--------------------------------------------------------------
Name: W
Type: Imported (binary)
Row-standardized: No
--------------------------------------------------------------

Moran's Ii (Residential burglaries & vehicle thefts pe)
--------------------------------------------------------------
Location | Ii E(Ii) sd(Ii) z p-value*
--------------------+-----------------------------------------
1 | 1.586 -0.063 1.674 0.985 0.162
2 | 0.019 -0.083 1.912 0.054 0.479
3 | 0.460 -0.125 2.289 0.255 0.399
4 | -7.442 -0.083 1.912 -3.850 0.000
5 | 1.474 -0.042 1.381 1.097 0.136
6 | 0.375 -0.083 1.912 0.240 0.405
7 | 2.429 -0.167 2.581 1.006 0.157
8 | -0.363 -0.042 1.381 -0.233 0.408
9 | 4.409 -0.125 2.289 1.981 0.024
10 | 0.161 -0.083 1.912 0.128 0.449
11 | -0.324 -0.063 1.674 -0.156 0.438
12 | 2.703 -0.063 1.674 1.652 0.049
13 | 4.959 -0.083 1.912 2.638 0.004
14 | 2.495 -0.063 1.674 1.528 0.063
15 | 0.935 -0.042 1.381 0.707 0.240
16 | 4.846 -0.104 2.113 2.342 0.010
17 | 3.414 -0.208 2.815 1.287 0.099
18 | 0.195 -0.146 2.443 0.140 0.444
19 | -0.024 -0.125 2.289 0.044 0.482
20 | 1.180 -0.104 2.113 0.607 0.272
21 | -0.496 -0.083 1.912 -0.216 0.415
22 | 0.214 -0.083 1.912 0.156 0.438
23 | -0.210 -0.146 2.443 -0.026 0.490
24 | 3.465 -0.125 2.289 1.569 0.058
25 | -0.103 -0.104 2.113 0.000 0.500
26 | 1.090 -0.063 1.674 0.689 0.246
27 | 0.814 -0.083 1.912 0.470 0.319
28 | 0.272 -0.083 1.912 0.186 0.426
29 | 0.035 -0.125 2.289 0.070 0.472
30 | 2.539 -0.125 2.289 1.164 0.122
31 | 8.793 -0.188 2.704 3.321 0.000
32 | 11.771 -0.146 2.443 4.877 0.000
33 | 10.351 -0.125 2.289 4.577 0.000
34 | 8.276 -0.104 2.113 3.965 0.000
35 | 1.600 -0.146 2.443 0.714 0.238
36 | 9.910 -0.167 2.581 3.904 0.000
37 | 4.529 -0.146 2.443 1.913 0.028
38 | 7.290 -0.104 2.113 3.498 0.000
39 | 0.501 -0.083 1.912 0.306 0.380
40 | 3.692 -0.125 2.289 1.667 0.048
41 | 2.400 -0.063 1.674 1.471 0.071
42 | 2.763 -0.104 2.113 1.357 0.087
43 | 0.465 -0.063 1.674 0.315 0.376
44 | 2.114 -0.083 1.912 1.149 0.125
45 | 2.035 -0.042 1.381 1.503 0.066
46 | 6.216 -0.104 2.113 2.991 0.001
47 | 2.304 -0.042 1.381 1.698 0.045
48 | 2.499 -0.042 1.381 1.840 0.033
49 | 2.173 -0.042 1.381 1.604 0.054
--------------------------------------------------------------

Getis & Ord's G2i (Residential burglaries & vehicle thefts pe)
--------------------------------------------------------------
Location | G2i E(G2i) sd(G2i) z p-value*
--------------------+-----------------------------------------
1 | 0.057 0.082 0.019 -1.340 0.090
2 | 0.099 0.102 0.021 -0.132 0.448
3 | 0.167 0.143 0.024 1.013 0.156
4 | 0.116 0.102 0.021 0.661 0.254
5 | 0.038 0.061 0.016 -1.433 0.076
6 | 0.086 0.102 0.021 -0.772 0.220
7 | 0.218 0.184 0.026 1.285 0.099
8 | 0.062 0.061 0.016 0.069 0.473
9 | 0.203 0.143 0.024 2.521 0.006
10 | 0.079 0.102 0.021 -1.138 0.128
11 | 0.053 0.082 0.019 -1.540 0.062
12 | 0.044 0.082 0.019 -2.003 0.023
13 | 0.043 0.102 0.021 -2.851 0.002
14 | 0.048 0.082 0.019 -1.821 0.034
15 | 0.037 0.061 0.016 -1.511 0.065
16 | 0.071 0.122 0.022 -2.325 0.010
17 | 0.189 0.224 0.028 -1.263 0.103
18 | 0.154 0.163 0.025 -0.375 0.354
19 | 0.145 0.143 0.024 0.079 0.469
20 | 0.158 0.122 0.022 1.595 0.055
21 | 0.108 0.102 0.021 0.281 0.389
22 | 0.111 0.102 0.021 0.435 0.332
23 | 0.157 0.163 0.025 -0.235 0.407
24 | 0.183 0.143 0.024 1.701 0.044
25 | 0.119 0.122 0.022 -0.158 0.437
26 | 0.061 0.082 0.019 -1.133 0.129
27 | 0.082 0.102 0.021 -0.982 0.163
28 | 0.091 0.102 0.021 -0.517 0.303
29 | 0.147 0.143 0.024 0.189 0.425
30 | 0.202 0.143 0.024 2.501 0.006
31 | 0.281 0.204 0.027 2.806 0.003
32 | 0.250 0.163 0.025 3.454 0.000
33 | 0.222 0.143 0.024 3.328 0.000
34 | 0.181 0.122 0.022 2.630 0.004
35 | 0.246 0.163 0.025 3.271 0.001
36 | 0.275 0.184 0.026 3.475 0.000
37 | 0.209 0.163 0.025 1.828 0.034
38 | 0.181 0.122 0.022 2.625 0.004
39 | 0.116 0.102 0.021 0.661 0.254
40 | 0.182 0.143 0.024 1.661 0.048
41 | 0.113 0.082 0.019 1.663 0.048
42 | 0.177 0.122 0.022 2.464 0.007
43 | 0.099 0.082 0.019 0.958 0.169
44 | 0.065 0.102 0.021 -1.780 0.038
45 | 0.033 0.061 0.016 -1.760 0.039
46 | 0.063 0.122 0.022 -2.675 0.004
47 | 0.029 0.061 0.016 -1.975 0.024
48 | 0.029 0.061 0.016 -1.975 0.024
49 | 0.032 0.061 0.016 -1.803 0.036
--------------------------------------------------------------
*1-tail test
.

有时,按z值的升序显示结果可能会很有用:

案例代码为:

# 计量经济学服务中心空间计量课程

spatlsa crime, weights(W) moran sort

结果为:

#  计量经济学服务中心空间计量课程
. spatlsa crime, weights(W) moran sort


Measures of local spatial autocorrelation


Weights matrix
--------------------------------------------------------------
Name: W
Type: Imported (binary)
Row-standardized: No
--------------------------------------------------------------

Moran's Ii (Residential burglaries & vehicle thefts pe)
--------------------------------------------------------------
Location | Ii E(Ii) sd(Ii) z p-value*
--------------------+-----------------------------------------
4 | -7.442 -0.083 1.912 -3.850 0.000
8 | -0.363 -0.042 1.381 -0.233 0.408
21 | -0.496 -0.083 1.912 -0.216 0.415
11 | -0.324 -0.063 1.674 -0.156 0.438
23 | -0.210 -0.146 2.443 -0.026 0.490
25 | -0.103 -0.104 2.113 0.000 0.500
19 | -0.024 -0.125 2.289 0.044 0.482
2 | 0.019 -0.083 1.912 0.054 0.479
29 | 0.035 -0.125 2.289 0.070 0.472
10 | 0.161 -0.083 1.912 0.128 0.449
18 | 0.195 -0.146 2.443 0.140 0.444
22 | 0.214 -0.083 1.912 0.156 0.438
28 | 0.272 -0.083 1.912 0.186 0.426
6 | 0.375 -0.083 1.912 0.240 0.405
3 | 0.460 -0.125 2.289 0.255 0.399
39 | 0.501 -0.083 1.912 0.306 0.380
43 | 0.465 -0.063 1.674 0.315 0.376
27 | 0.814 -0.083 1.912 0.470 0.319
20 | 1.180 -0.104 2.113 0.607 0.272
26 | 1.090 -0.063 1.674 0.689 0.246
15 | 0.935 -0.042 1.381 0.707 0.240
35 | 1.600 -0.146 2.443 0.714 0.238
1 | 1.586 -0.063 1.674 0.985 0.162
7 | 2.429 -0.167 2.581 1.006 0.157
5 | 1.474 -0.042 1.381 1.097 0.136
44 | 2.114 -0.083 1.912 1.149 0.125
30 | 2.539 -0.125 2.289 1.164 0.122
17 | 3.414 -0.208 2.815 1.287 0.099
42 | 2.763 -0.104 2.113 1.357 0.087
41 | 2.400 -0.063 1.674 1.471 0.071
45 | 2.035 -0.042 1.381 1.503 0.066
14 | 2.495 -0.063 1.674 1.528 0.063
24 | 3.465 -0.125 2.289 1.569 0.058
49 | 2.173 -0.042 1.381 1.604 0.054
12 | 2.703 -0.063 1.674 1.652 0.049
40 | 3.692 -0.125 2.289 1.667 0.048
47 | 2.304 -0.042 1.381 1.698 0.045
48 | 2.499 -0.042 1.381 1.840 0.033
37 | 4.529 -0.146 2.443 1.913 0.028
9 | 4.409 -0.125 2.289 1.981 0.024
16 | 4.846 -0.104 2.113 2.342 0.010
13 | 4.959 -0.083 1.912 2.638 0.004
46 | 6.216 -0.104 2.113 2.991 0.001
31 | 8.793 -0.188 2.704 3.321 0.000
38 | 7.290 -0.104 2.113 3.498 0.000
36 | 9.910 -0.167 2.581 3.904 0.000
34 | 8.276 -0.104 2.113 3.965 0.000
33 | 10.351 -0.125 2.289 4.577 0.000
32 | 11.771 -0.146 2.443 4.877 0.000
--------------------------------------------------------------
*1-tail test

.

作为一个选项,spatlsa计算并显示一个Moran散点图(Anselin 1995)。然而,这个选项要求使用行标准化的权值矩阵

案例代码为:

# 计量经济学服务中心空间计量课程
spatwmat using columbusswm.dta, name(W) standardize

spatlsa crime,weights(W) moran graph(moran) symbol(n)

结果为:

#  计量经济学服务中心空间计量课程

. spatwmat using columbusswm.dta, name(W) standardize


The following matrix has been created:

1. Imported binary weights matrix W (row-standardized)
Dimension: 49x49



.
.
.
. spatlsa crime,weights(W) moran graph(moran) symbol(n)


Measures of local spatial autocorrelation


Weights matrix
--------------------------------------------------------------
Name: W
Type: Imported (binary)
Row-standardized: Yes
--------------------------------------------------------------

Moran's Ii (Residential burglaries & vehicle thefts pe)
--------------------------------------------------------------
Location | Ii E(Ii) sd(Ii) z p-value*
--------------------+-----------------------------------------
1 | 0.529 -0.021 0.558 0.985 0.162
2 | 0.005 -0.021 0.478 0.054 0.479
3 | 0.077 -0.021 0.381 0.255 0.399
4 | -1.861 -0.021 0.478 -3.850 0.000
5 | 0.737 -0.021 0.691 1.097 0.136
6 | 0.094 -0.021 0.478 0.240 0.405
7 | 0.304 -0.021 0.323 1.006 0.157
8 | -0.182 -0.021 0.691 -0.233 0.408
9 | 0.735 -0.021 0.381 1.981 0.024
10 | 0.040 -0.021 0.478 0.128 0.449
11 | -0.108 -0.021 0.558 -0.156 0.438
12 | 0.901 -0.021 0.558 1.652 0.049
13 | 1.240 -0.021 0.478 2.638 0.004
14 | 0.832 -0.021 0.558 1.528 0.063
15 | 0.468 -0.021 0.691 0.707 0.240
16 | 0.969 -0.021 0.423 2.342 0.010
17 | 0.341 -0.021 0.281 1.287 0.099
18 | 0.028 -0.021 0.349 0.140 0.444
19 | -0.004 -0.021 0.381 0.044 0.482
20 | 0.236 -0.021 0.423 0.607 0.272
21 | -0.124 -0.021 0.478 -0.216 0.415
22 | 0.054 -0.021 0.478 0.156 0.438
23 | -0.030 -0.021 0.349 -0.026 0.490
24 | 0.578 -0.021 0.381 1.569 0.058
25 | -0.021 -0.021 0.423 0.000 0.500
26 | 0.363 -0.021 0.558 0.689 0.246
27 | 0.204 -0.021 0.478 0.470 0.319
28 | 0.068 -0.021 0.478 0.186 0.426
29 | 0.006 -0.021 0.381 0.070 0.472
30 | 0.423 -0.021 0.381 1.164 0.122
31 | 0.977 -0.021 0.300 3.321 0.000
32 | 1.682 -0.021 0.349 4.877 0.000
33 | 1.725 -0.021 0.381 4.577 0.000
34 | 1.655 -0.021 0.423 3.965 0.000
35 | 0.229 -0.021 0.349 0.714 0.238
36 | 1.239 -0.021 0.323 3.904 0.000
37 | 0.647 -0.021 0.349 1.913 0.028
38 | 1.458 -0.021 0.423 3.498 0.000
39 | 0.125 -0.021 0.478 0.306 0.380
40 | 0.615 -0.021 0.381 1.667 0.048
41 | 0.800 -0.021 0.558 1.471 0.071
42 | 0.553 -0.021 0.423 1.357 0.087
43 | 0.155 -0.021 0.558 0.315 0.376
44 | 0.528 -0.021 0.478 1.149 0.125
45 | 1.017 -0.021 0.691 1.503 0.066
46 | 1.243 -0.021 0.423 2.991 0.001
47 | 1.152 -0.021 0.691 1.698 0.045
48 | 1.250 -0.021 0.691 1.840 0.033
49 | 1.087 -0.021 0.691 1.604 0.054
--------------------------------------------------------------
*1-tail test
.

3、spatcorr

spatcorr根据两个或多个连续的或累积的距离计算并可选地绘制Moran's I or Geary's空间相关图。spatcorr以表格的形式计算并显示所要求的统计量、在全局空间依赖的零假设下统计量的期望值、统计量的标准差、z值以及相应的单尾或双尾p值。

案例代码为:

# 计量经济学服务中心空间计量课程
use columbusdata.dta,clear
spatcorr crime,bands(0(1)5) xcoord(x) ycoord(y)
默认Moran'sI 统计量;距离范围:0-5,距高带宽:1
spatcorr crime,bands(0(1)5) xcoord(x) ycoord(y) geary
设置为Geary's c统计量
spatcorr crime,bands(0(1)5)xcoord(x) ycoord(y) twotail
设置为双尾检验
spatcorr crime,bands(O(1)5) xcoord(x) ycoord(y) cumulative
设置为累计分段
spatcorr crime, bands(0(1)5) xcoord(x) ycoord(y) graph
//绘制指数图

11、Spatial Modeling

空间计量模型

空间滞后模型

  • 空间滞后模型(SpatialLagModel,SLM)主要是探讨各变量在一地区是否有扩散现象(溢出效应)。其模型表达式为:y=ρWy+Xβ+ε*参数β反映了自变量对因变量的影响,空间滞后因变量Wy是一内生变量,反映了空间距离对区域行为的作用。

  • 区域行为受到文化环境及与空间距离有关的迁移成本的影响,具有很强的地域性(Anselinetal.1996)。

  • 由于SLM模型与时间序列中自回归模型相类似,因此SLM也被称作空间自回归模型(SpatialAutoregressiveModel,SAR)。

空间误差模型

  • 空间误差模型(SpatialErrorModel,SEM)的数学表达式为:y=Xβ+ε,ε=λWε+µ

  • 式中,ε为随机误差项向量,λ为n*1阶的截面因变量向量的空间误差系数,µ为正态分布的随机误差向量。

  • SEM中参数β反映了自变量X对因变量y的影响。参数λ衡量了样本观察值中的空间依赖作用,即相邻地区的观察值y对本地区观察值y的影响方向和程度。

  • 存在于扰动误差项之中的空间依赖作用,度量了邻近地区关于因变量的误差冲击对本地区观察值的影响程度。由于SEM模型与时间序列中的序列相关问题类似,也被称为空间自相关模型(SpatialAutocorrelationModel,SAC)。

估计技术:鉴于空间回归模型由于自变量的内生性,对于上述两种模型的估计如果仍采用OLS,系数估计值会有偏或者无效,需要通过IV、ML或GLS、GMM等其他方法来进行估计。Anselin(1988)建议采用极大似然法估计空间滞后模型(SLM)和空间误差模型(SEM)的参数。

空间模型选择

  • 空间自相关检验与SLM、SEM的选择:判断地区间创新产出行为的空间相关性是否存在,以及SLM和SEM那个模型更恰当,一般可通过包括Moran’s I检验、两个拉格朗日乘数(Lagrange Multiplier)形式LMERR、LMLAG及其稳健(Robust)的R-LMERR、R-LMLAG)等形式来实现。

  • 由于事先无法根据先验经验推断在SLM和SEM模型中是否存在空间依赖性,有必要构建一种判别准则,以决定哪种空间模型更加符合客观实际。

  • Anselin和Florax(1995)提出了如下判别准则:如果在空间依赖性的检验中发现LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间滞后模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型是恰当的模型。

空间计量建模流程图

  • 除了拟合优度R2检验以外,常用的检验准则还有:自然对数似然函数值(Log likelihood,LogL)、似然比率(Likelihood Ratio,LR)、赤池信息准则(Akaike information criterion,AIC)、施瓦茨准则(Schwartz criterion,SC)。对数似然值越大,AIC和SC值越小,模型拟合效果越好。这几个指标也用来比较OLS估计的经典线性回归模型和SLM、SEM,似然值的自然对数最大的模型最好。

12、空间诊断Spatial diagnostics

这个内容主要是关于两类模型:一类是由Maurizio Pisati的spatreg提供的,另一类是由David Drukker及其合作者提供的spreg。下面我们将从Pisati提供的空间诊断开始。

主要包括spatdiag命令。

空间自相关统计给出的重要空间聚类模式的指示,只是空间数据分析的第一步。这些统计数据表明,与随机赋值相比,感兴趣的变量Y在不同位置所取的值在空间上更集中,但它们不能解释为什么会出现这种聚集(Anselin 1992b)。要回答这个问题,可以使用标准的OLS回归模型。

其中,Y 表示 一 个 N 1的的观测向量,即被解释变量Y, X 表示 一 个 N k列矩阵的观测变量,即解释变量X, β表示 k *1列向量系数 。

当观测是空间单元,即地理位置时,由于观测之间存在空间依赖性,标准OLS回归模型可能会被错误指定。在这个情况下中,将考虑两种空间依赖关系。第一个在误差项上采用空间自回归过程的形式,对应如下空间回归模型

我们把这个模型称为空间误差模型。

第二种空间依赖是以混合回归空间自回归过程的形式出现的,对应如下空间回归模型

我们把这个模型称为空间滞后模型。

spatdiag对这两种类型的空间依赖性进行了一些测试。在进行这些测试之前,必须使用回归估计OLS回归模型。

回到哥伦布市的数据,假设我们想把犯罪(每1000户家庭中发生的入室盗窃和车辆盗窃)表示为被解释变量,解释变量为hoval(房屋价值以美元计,数千美元)和收入income(家庭收入以美元计,数千美元)的线性和附加函数:

案例代码为:

#  计量经济学服务中心空间计量课程
use columbusdata.dta,clear
spatwmat using columbusswm.dta, name(W) standardize
regress crime hoval income
spatdiag, weights(W)

结果为:

# 计量经济学服务中心空间计量课程
. use columbusdata.dta,clear

.
. spatwmat using columbusswm.dta, name(W) standardize


The following matrix has been created:

1. Imported binary weights matrix W (row-standardized)
Dimension: 49x49



.
. regress crime hoval income

Source | SS df MS Number of obs = 49
-------------+---------------------------------- F(2, 46) = 28.39
Model | 7423.32674 2 3711.66337 Prob > F = 0.0000
Residual | 6014.89281 46 130.758539 R-squared = 0.5524
-------------+---------------------------------- Adj R-squared = 0.5329
Total | 13438.2195 48 279.962907 Root MSE = 11.435

------------------------------------------------------------------------------
crime | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hoval | -.2739315 .1031987 -2.65 0.011 -.4816597 -.0662033
income | -1.597311 .3341308 -4.78 0.000 -2.269881 -.9247405
_cons | 68.61896 4.735486 14.49 0.000 59.08692 78.151
------------------------------------------------------------------------------

.
. spatdiag, weights(W)


Diagnostic tests for spatial dependence in OLS regression


Fitted model
------------------------------------------------------------
crime = hoval + income
------------------------------------------------------------

Weights matrix
------------------------------------------------------------
Name: W
Type: Imported (binary)
Row-standardized: Yes
------------------------------------------------------------

Diagnostics
------------------------------------------------------------
Test | Statistic df p-value
-------------------------------+----------------------------
Spatial error: |
Moran's I | 2.955 1 0.003
Lagrange multiplier | 5.723 1 0.017
Robust Lagrange multiplier | 0.079 1 0.778
|
Spatial lag: |
Lagrange multiplier | 9.364 1 0.002
Robust Lagrange multiplier | 3.720 1 0.054
------------------------------------------------------------

.

我们可以看到从spatdiag执行三个空间误差依赖的统计量 (Moran’s I 、Lagrange multiplier、Robust Lagrange multiplier) 和两个测试空间 滞后依赖的统计量 (simple Lagrange multiplier LM、and robust Lagrange multiplier LM)

13、空间计量主要命令

spmat 生成空间权重矩阵

spatwmat 用于定义空间权重矩阵

spatgsa 用于全局空间自相关检验

gsa表示global spatial autocorrelation

spatlsa 进行局部空间自相关检验

lsa表示local spatial autocorrelation

spatcorr 考察空间自相关指标对距离临界值d的依赖性

spatdiag 针对ols回归结果,考察是否存在空间效应

spatreg 估计空间滞后与空间误差模型

14、横截面空间回归命令Spatreg

spatreg过程需要一个空间权矩阵加上一个与此矩阵相关的特征值向量;这两者都可以由Pisani的spatwmat计算(如果您的数据允许的话)。spatreg可以估计空间滞后和空间误差模型。基本的命令是:

spatreg depvar indepvars, weights(w-matrix) eigenval(e-vector) model(lag)

或者

spatreg depvar indepvars, weights(w-matrix) eigenval(e-vector) model(error)

主要包括spatreg命令。

spatreg使用Stata的最大似然估计空间误差和空间滞后回归模型。

空间误差回归模型操作

案例代码为:

#  计量经济学服务中心空间计量课程
use columbusdata.dta, clear
spatwmat using columbusswm.dta, name(W) eigenval(E) standardize
spatreg crime hoval income, weights(W) eigenval(E) model(error)

结果为:

# 计量经济学服务中心空间计量课程
. use columbusdata.dta, clear

. spatwmat using columbusswm.dta, name(W) eigenval(E) standardize


The following matrices have been created:

1. Imported binary weights matrix W (row-standardized)
Dimension: 49x49

2. Eigenvalues matrix E
Dimension: 49x1



. spatreg crime hoval income, weights(W) eigenval(E) model(error)

initial: log likelihood = -187.42512
rescale: log likelihood = -187.42512
rescale eq: log likelihood = -187.42512
Iteration 0: log likelihood = -187.42512
Iteration 1: log likelihood = -183.49132
Iteration 2: log likelihood = -183.38161
Iteration 3: log likelihood = -183.38047
Iteration 4: log likelihood = -183.38047


Weights matrix
Name: W
Type: Imported (binary)
Row-standardized: Yes


Spatial error model Number of obs = 49
Variance ratio = 0.321
Squared corr. = 0.536
Log likelihood = -183.38047 Sigma = 9.78

------------------------------------------------------------------------------
crime | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
crime |
hoval | -.3022502 .0905532 -3.34 0.001 -.4797312 -.1247692
income | -.941312 .3702766 -2.54 0.011 -1.667041 -.2155832
_cons | 59.89322 5.883702 10.18 0.000 48.36137 71.42506
-------------+----------------------------------------------------------------
lambda | .5617903 .1524222 3.69 0.000 .2630482 .8605323
------------------------------------------------------------------------------
Wald test of lambda=0: chi2(1) = 13.585 (0.000)
Likelihood ratio test of lambda=0: chi2(1) = 7.994 (0.005)
Lagrange multiplier test of lambda=0: chi2(1) = 5.723 (0.017)

Acceptable range for lambda: -1.536 < lambda < 1.000



.
end of do-file

.

除了通常的统计之外,spatreg为空间误差模型生成的输出还报告了以下信息:

Sigma这是最大似然根MSE。

三 个测试结果假设是 (Wald, likelihood-ratio, LM).虽然这三种检验是渐近等价的,但它们在有限样本中往往产生不同的结果。在大多数情况下,测试统计数据的顺序,他们大小是W> LR> LM (Anselin 1988 ).只有在未指定选项稳健性robust的情况下才进行概率比检验。

空间滞后回归模型操作

spatreg对空间滞后模型产生的输出与对空间误差模型产生的输出完全相同

案例代码为:

#  计量经济学服务中心空间计量课程

use columbusdata.dta, clear
spatwmat using columbusswm.dta, name(W) eigenval(E) standardize

*计量经济学服务中心推文之空间滞后回归模型
spatreg crime hoval income, weights(W) eigenval(E) model(lag)

结果为:

# 计量经济学服务中心空间计量课程
. use columbusdata.dta, clear

. spatwmat using columbusswm.dta, name(W) eigenval(E) standardize


The following matrices have been created:

1. Imported binary weights matrix W (row-standardized)
Dimension: 49x49

2. Eigenvalues matrix E
Dimension: 49x1



.
. spatreg crime hoval income, weights(W) eigenval(E) model(lag)

initial: log likelihood = -187.42512
rescale: log likelihood = -187.42512
rescale eq: log likelihood = -187.42512
Iteration 0: log likelihood = -187.42512
Iteration 1: log likelihood = -182.65034
Iteration 2: log likelihood = -182.39202
Iteration 3: log likelihood = -182.39043
Iteration 4: log likelihood = -182.39043


Weights matrix
Name: W
Type: Imported (binary)
Row-standardized: Yes


Spatial lag model Number of obs = 49
Variance ratio = 0.615
Squared corr. = 0.652
Log likelihood = -182.39043 Sigma = 9.77

------------------------------------------------------------------------------
crime | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
crime |
hoval | -.2659263 .0882217 -3.01 0.003 -.4388376 -.0930149
income | -1.031616 .3284158 -3.14 0.002 -1.675299 -.3879326
_cons | 45.07925 7.871214 5.73 0.000 29.65195 60.50654
-------------+----------------------------------------------------------------
rho | .4310232 .1236179 3.49 0.000 .1887366 .6733099
------------------------------------------------------------------------------
Wald test of rho=0: chi2(1) = 12.157 (0.000)
Likelihood ratio test of rho=0: chi2(1) = 9.974 (0.002)
Lagrange multiplier test of rho=0: chi2(1) = 9.364 (0.002)

Acceptable range for rho: -1.536 < rho < 1.000



.
end of do-file

.

15、横截面空间回归命令Spreg(选讲)

spreg程序使用空间自回归扰动估计空间自回归模型,提供了两种估计方法。它需要spmat创建的两个矩阵,一个用于空间自回归项,另一个用于空间误差项。两个矩阵可以(通常也会)相同,但必须同时表示两个矩阵。

用于最大似然估计

spreg ml depvar indepvars, id(id-var) dlmat(w-matrix) elmat(w-matrix)

广义空间两阶段最小二乘估计

spreg gs2sls depvar indepvars, id(id-var) dlmat(w-matrix) elmat(w-matrix)

其中

ID -var是spmat创建的ID变量,dlmat和elmat提供的矩阵分别表示空间自回归项和误差项的权值。

16、References

《零基础|轻松搞定空间计量:空间计量及GeoDa、Stata应用》

空间计量第二部:空间计量及Matlab应用课程

空间计量第三部:空间计量及Stata应用课程(SPATIAL AUTOREGRESSIVE MODELS USING STATA)

空间计量第四部:《空间计量及ArcGis应用课程》

二、空间计量经济学及Stata应用(二)

1、空间面板模型命令

空间计量命令介绍

#  **空间计量命令介绍 **
Data management and visualization

shp2dta by K. Crow
spmat by D.M. Drukker et al
spwmatrix by P.W. Jeanty
spmap by M. Pisati
geocode3 by S. Bernhard

Cross sectional data
spreg: SAR, SEM, SAC via ML or GS2SLS by D. M. Drukker et al
spivreg: SAC via GS2SLS by D. M. Drukker et al
spmlreg: SAR, SEM, SDM, SAC via ML by P.W. Jeanty
spatreg: SAR, SEM via ML by M. Pisati
spautoreg: SAR, SEM, SDM, SAC via ML or GS2SLS by E.A. Shehata

Panel data
spreg*xt suite SAR, SEM, SDM, SAC via LS, GLS, GMM or GS2SLS by E.A. Shehata (Lee,
2002)

空间面板主要命令为:help xsmle

help xsmle

net install xsmle,all from ()

Requirements:Stata Version 10Data must be tsset or xtset

空间计量命令介绍

# # **空间计量命令介绍 **


Spatial Autoregressive (SAR) model

xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) model(sar) [SAR_options]



Spatial Durbin (SDM) model

xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) model(sdm) [SDM_options]



Spatial Autocorrelation (SAC) model

xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) emat(name) model(sac) [SAC_options]



Spatial Error (SEM) model

xsmle depvar [indepvars] [if] [in] [weight] , emat(name) model(sem) [SEM_options]



Generalized Spatial Panel Random Effects (GSPRE) model

xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) model(gspre) [emat(name) GSPRE_options]

SAR model

#  #  **空间计量命令介绍 **
use http://www./stata/data/xsmle/product.dta, clear

spmat use usaww using http://www./stata/data/xsmle/usaww.spmat

gen lngsp = log(gsp)

gen lnpcap = log(pcap)

gen lnpc = log(pc)

gen lnemp = log(emp)

xsmle lngsp lnpcap lnpc lnemp unemp, wmat(usaww)

SDM model with selected spatially lagged regressors and direct+indirect effect SDM空间杜宾模型

xsmle lngsp lnpcap lnpc lnemp, re model(sdm) wmat(usaww) durbin(lnpcap lnpc)

SAC model空间自相关模型

xsmle lngsp lnpcap lnpc lnemp, fe model(sac) wmat(usaww) emat(usaww)

SEM model SEM空间误差模型

xsmle lngsp lnpcap lnpc lnemp, re model(sem) emat(usaww)

GSPRE model

xsmle lngsp lnpcap lnpc lnemp, model(gspre) error(1) wmat(usaww) emat(usaww)

语法格式

# # 语法格式**


help xsmle

xsmle y x1 x2 x3 , wmat(name) emat(name) dmat(name) durbin(varlist) model(sar) model(sac) model(sem) re fe robust dlag type(ind) type(time) type(both) noeffects

选择项

wmat(name)表示生成空间权重矩阵W

emat(name)表示扰动项空间权重矩阵M

dmat(name)表示解释变量的空间权重举证D,默认使用选择项wmat(name)

durbin(varlist)用于指定空间滞后的解释变量,默认为所有解释变量model(sar)表示估计SAR模型,默认选择

model(sac) 表示估计SAC模型,默认选择

model(sem) 表示估计SEM模型,默认选择

re 表示估计随机效应模型,默认选择

fe表示估计固定效应模型

robust表示使用聚类稳健的标准误

dlag 表示加入被解释变量的滞后一期滞后作为解释变量,动态面板,默认为静态面板

type(ind) 表示只有个体效应

type(time) 表示只有时间效应

type(both) 表示既有个体效应,也有时间效应

noeffects 表示不显示直接效应、间接效应与总效应

2、空间面板模型操作及应用

相关操作案例代码为:**

#  计量经济学服务中心空间计量课程
cd E:\stata\data //设置工作路径,调用数据
use product.dta, clear

该数据为包含美国1970-1974年48个州的如下变量,gsp州产出,pcap公共资本,pc民营资本,emp就业量,unemp失业率。

Gsp州产出 (gross state product)

pcap公共资本(public captial)

pc民营资本(private captial)

emp就业量(employment)

unemp失业率(unemployment rate)

由于产出、资本和就业量存在指数增长趋势,故需要对这些变量取对数

相关操作案例代码为:

# 计量经济学服务中心空间计量课程
gen lngsp = log(gsp)

gen lnpcap = log(pcap)

gen lnpc = log(pc)

gen lnemp = log(emp)

spmat use usaww using usaww.spmat

表示根据文件usaww.spmat来生成空间权重矩阵usaww,参见help spmat

使用聚类稳健标准误估计来估计随机效应的SDM模型(空间杜宾模型)

xsmle lngsp lnpcap lnpc lnemp unemp, wmat(usaww) model(sdm) robust nolag

从上表可知,空间自回归系数rho在1%水平上显著为正,数值为0.4873,但是变量lnpcap,lnpc与unemp的空间滞后项并不显著,使用选择项durbin(varlist)将这三个变量去掉,上表底部还显示了各变量的直接、间接与总效应。

xsmle lngsp lnpcap lnpc lnemp unemp, wmat(usaww) model(sdm) durbin(lnemp) robust nolog noeffects

SDM model with selected spatially lagged regressors and direct+indirect effect

xsmle lngsp lnpcap lnpc lnemp, re model(sdm) wmat(usaww) durbin(lnpcap lnpc)

固定效应的估计

xsmle lngsp lnpcap lnpc lnemp unemp, wmat(usaww) model(sdm) durbin(lnemp) robust nolog noeffects fe

选择固定效应还是随机效应模型,需要进行豪斯曼检验,存储未使用稳健标准误的随机效应和固定效应估计结果。

相关操作案例代码为:**

#  计量经济学服务中心空间计量课程
qui xsmle lngsp lnpcap lnpc lnemp unemp, wmat(usaww) model(sdm) durbin(lnemp) nolog noeffects

est store re

qui xsmle lngsp lnpcap lnpc lnemp unemp, wmat(usaww) model(sdm) durbin(lnemp) nolog noeffects fe

est store fe

hausman fe re

◆◆◆◆

精彩回顾

点击上图查看:

《零基础|轻松搞定空间计量:空间计量及GeoDa、Stata应用》

点击上图查看:

空间计量第二部:空间计量及Matlab应用课程

点击上图查看:

空间计量第三部:空间计量及Stata应用课程(SPATIAL AUTOREGRESSIVE MODELS USING STATA)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多