经济学中的序列相关（自相关）

医学数据科学 2019-03-25

展开全文

序列相关性

异方差性表现于模型的随机误差项。我们将讨论模型的随机误差项违背了互相独立的基本假设的情况，称为序列相关性。序列相关性同样表现于模型的随机误差项。

一、序列相关性(Serial Correlation )

对于模型

i=1,2,…,n

随机误差项互相独立的基本假设表现为：

i≠j，i,j=1,2,…,n

如果出现

i≠j，i,j=1,2,…,n

即对于不同的样本点，随机误差项之间不再是完全互相独立，而是存在某种相关性，则认为出现了序列相关性。由于随机误差项都服从均值为0的正态分布，所以序列相关性可以表示为：

i≠j，i,j=1,2,…,n

如果仅存在

i=1,2,…,n-1

称为一阶序列相关，或自相关。这是最常见的一种序列相关问题。

二、实际经济问题中的序列相关性

在实际经济问题中，为什么会出现序列相关性？下面仍通过两个例子加以说明。

例如，我们建立一个行业生产函数模型，以产出量为被解释变量，选择资本、劳动、技术等投入要素为解释变量，根据样本与母体一致性的要求，只能选择时间序列数据作为样本观测值。于是有：

t=1,2,…,n

在该模型中，资本、劳动、技术之外的因素，例如政策因素等，没有包括在解释变量中，但它们对产出量是有影响的，该影响则被包含在随机误差项中。如果该项影响构成随机误差项的主要部分，则可能出现序列相关性。为什么？对于不同的样本点，即对于不同的年份，由于政策等因素的连续性，它们对产出量的影响也是有内在联系的。前一年是正的影响，后一年往往也是正的影响。于是在不同的样本点之间，随机误差项出现了相关性，这就产生了序列相关性。更进一步分析，在这个例子中，随机误差项之间表现为正相关。

再例如，以绝对收入假设为理论假设、以时间序列数据作样本建立居民总消费函数模型：

t=1,2,…,n

我们知道，一般情况下居民总消费除受总收入影响外，还受其它因素影响，例如消费习惯等，但这些因素没有包括在解释变量中，它们对消费量的影响则被包含在随机误差项中。如果该项影响构成随机误差项的主要部分，也可能出现序列相关性。为什么？对于不同的样本点，即对于不同的年份，由于消费习惯等因素的连续性，它们对消费量的影响也是具有内在联系的。前一年是正的影响，后一年往往也是正的影响。于是在不同的样本点之间，随机误差项出现了相关性，这就产生了序列相关性。更进一步分析，在这个例子中，随机误差项之间也表现为正相关。

在以上例子中，随机误差项之间的相关性主要表现为一阶序列相关。但是，连续的一阶序列相关实际上构成了多阶序列相关。负相关的情况也是有的。例如建立粮食生产模型，如果把自然条件排除在解释变量之外，那么由于它们的周期性变化，以及对粮食生产的实际影响，造成随机误差项之间出现负相关。

一般经验告诉我们，对于采用时间序列数据作样本的计量经济学问题，由于在不同样本点上解释变量以外的其它因素在时间上的连续性，带来它们对被解释变量的影响的连续性，所以往往存在序列相关性。

三、序列相关性的后果

计量经济学模型一旦出现序列相关性，如果仍采用普通最小二乘法估计模型参数，会产生下列不良后果：

⒈ 参数估计量非有效

根据参数估计量的无偏性和有效性的证明过程，可以看出，当计量经济学模型出现序列相关性，其普通最小二乘法参数估计量仍然具有无偏性，但不具有有效性。因为在有效性证明中利用了

即同方差性和互相独立性条件。而且，在大样本情况下，参数估计量仍然不具有渐近有效性，这就是说参数估计量不具有一致性。

⒉ 变量的显著性检验失去意义

在第三章中关于变量的显著性检验中，构造了统计量，以及该统计量服从自由度为的分布。这些只有当随机误差项具有同方差性和互相独立性时才能成立。如果出现了序列相关性，检验就失去意义。采用其它检验也是如此。

⒊ 模型的预测失效

由于上述后果，使得模型不具有良好的统计性质。所以，当模型出现序列相关性时，它的预测功能失效。

四、序列相关性的检验

关于序列相关性的检验方法，在一些计量经济学教科书和文献中，也可以见到多种。例如冯诺曼比检验法、回归检验法、D.W.检验等。这些检验方法的共同思路是，首先采用普通最小二乘法估计模型，以求得随机误差项的“近似估计量”，用表示：

然后通过分析这些“近似估计量”之间的相关性以达到判断随机误差项是否具有序列相关性的目的。

例如回归检验法，即是以为被解释变量，以各种可能的相关量，诸如以、、等为解释变量，建立各种方程：

i=2,…,n

i=3,…,n

…

对方程进行估计并进行显著性检验，如果存在某一种函数形式，使得方程显著成立，则说明原模型存在序列相关性。具体应用时需要反复试算。回归检验法的优点是一旦确定了模型存在序列相关性，也就同时知道了相关的形式，而且它适用于任何类型的序列相关性问题的检验。

冯诺曼比检验法在于构造统计量

该统计量被称为冯诺曼比，其中为的平均值。当样本容量足够大时（大于30），该统计量近似服从正态分布。计算该统计量的值，将它与具有正态分布的理论分布值进行比较，如果大于临界值，表示不存在序列相关，如果小于临界值，表示存在序列相关。

最具有应用价值的是D.W.检验，但是它仅适用于一阶自相关的检验。构造统计量：

(4.2.1)

计算该统计量的值，根据样本容量和解释变量数目查D.W.分布表，得到临界值和，然后按照下列准则考察计算得到的D.W.值，以判断模型的自相关状态。

若 0<D.W.< 则存在正自相关

<D.W.< 不能确定

<D.W.<4－无自相关

4－<D.W.<4－不能确定

4－<D.W.<4 存在负自相关

也就是说，当D.W.值为2左右时，模型不存在一阶自相关。

为什么可以通过D.W.值检验自相关的存在呢？从直观上看，如果模型存在正自相关，即对于相邻的样本点，都较大或较小，此时，较小，D.W.统计量的分子较小，D.W.值较小；如果模型存在负自相关，即对于相邻的样本点，若较大则较小，若较小则较大，此时，较大，D.W.统计量的分子较大，D.W.值也较大；如果模型不存在自相关，则与呈随机关系，此时，较为适中，则D.W.统计量取一个适中值。从数学上也容易证明，展开D.W.统计量：

(4.2.2)

当n较大时，大致相等，则(4.2.2)可以化简为：

如果存在完全一阶正相关，即

如果存在完全一阶负相关，即

如果完全不相关，即

从判断准则中看到，存在一个不能确定的D.W.值区域，这是这种检验方法的一大缺陷。D.W.检验虽然只能检验一阶自相关，但在实际计量经济学问题中，一阶自相关是出现最多的一类序列相关，而且经验表明，如果不存在一阶自相关，一般也不存在高阶序列相关。所以在实际应用中，对于序列相关问题一般只进行D.W.检验。

五、广义最小二乘法(GLS)

如果模型被检验证明存在序列相关性，则需要发展新的方法估计模型，最常用的方法是广义最小二乘法和差分法。

广义最小二乘法，顾名思义，是最具有普遍意义的最小二乘法，普通最小二乘法和加权最小二乘法是它的特例。

对于模型

(4.2.3)

如果存在序列相关，同时存在异方差，即有

设

用左乘(4.2.3)两边，得到一个新的模型：

(4.2.4)

即

该模型具有同方差性和随机误差项互相独立性。因为

于是，可以用普通最小二乘法估计模型(4.2.4)，得到参数估计量为：

(4.2.5)

这就是原模型(4.2.3)的广义最小二乘估计量，是无偏的、有效的估计量。

如何得到矩阵？仍然是对原模型(4.2.3)首先采用普通最小二乘法，得到随机误差项的近似估计量，以此构成矩阵的估计量，即

六、差分法

差分法是一类克服序列相关性的有效的方法，被广泛地采用。差分法是将原模型变换为差分模型，分为一阶差分法和广义差分法。

⒈ 一阶差分法

一阶差分法是将原模型

i=1,2,…,n

变换为

i=2,…,n (4.2.6)

其中

如果原模型存在完全一阶正相关，即

其中不存在序列相关。那么对于差分模型(4.2.6),则满足应用普通最小二乘法的基本假设，用普通最小二乘法估计差分模型(4.2.6)得到的参数估计量，即为原模型参数的无偏的、有效的估计量。

实际的计量经济学问题中，完全一阶正相关的情况并不多见。但人们还是经常直接差分模型，因为即使对于非完全一阶正相关的情况，只要存在一定程度的一阶正相关，差分模型就可以有效地加以克服。当然也可以采用下面的广义差分法，但估计过程将变得较为复杂。

⒉ 广义差分法

广义差分法可以克服所有类型的序列相关带来的问题，一阶差分法是它的一个特例。如果原模型存在：

(4.2.7)

可以将原模型变换为；

(4.2.8)

模型(4.2.8)为广义差分模型，该模型不存在序列相关问题。采用普通最小二乘法估计该模型得到的参数估计量，即为原模型参数的无偏的、有效的估计量。关于广义差分法的实际应用，读者可参阅本章§2.10中的发电量模型。

⒊ 随机误差项相关系数的估计

应用广义差分法，必须已知不同样本点之间随机误差项的相关系数。实际上，人们并不知道它们的具体数值，所以必须首先对它们进行估计。于是发展了许多估计方法，诸如迭代法、杜宾两步法等。其基本思路是采用普通最小二乘法估计原模型，得到随机误差项的“近似估计值”，然后利用该“近似估计值”求得随机误差项相关系数的估计量。不同的方法旨在力图使得这些估计量更加逼近实际。

例如杜宾两步法就是一种常用的方法。以采用普通最小二乘法估计原模型得到的随机误差项的“近似估计值”作为方程(4.2.7)的样本观测值，采用普通最小二乘法估计该方程，得到，作为随机误差项的相关系数的第一步估计值。变换方程(4.2.8)为下列形式：

(4.2.9)

即将的第一步估计值用于这一中间过程方程样本观测值的计算中，然后再采用普通最小二乘法估计该方程，目的不是为了得到原模型参数的估计量，而是为了得到的第二步估计值。这就是求得随机误差项的相关系数估计值的“两步法”。将第二步估计值用于方程(4.2.8)的样本观测值的计算中，然后再采用普通最小二乘法估计方程，得到原模型参数的估计量。

在TSP6.5计量经济学软件包中，可以采用很简单的方法实现广义差分法参数估计。(4.2.8)式可以改写为

即

(4.2.10)

当选择普通最小二乘法估计参数时，如果同时选择常数项、，作为解释变量，即可眼得到(4.2.10)中参数的估计值。其中表示随机误差项的阶自回归。在估计过程中自动完成了的迭代，并显示总迭代次数。

至于选择几阶随机误差项的自回归项作为解释变量，主要判断依据是D.W.统计量。所以，一般是先不引入自回归项，采用普通最小二乘法估计参数；根据显示的D.W.统计量，逐次引入，直到满意为止。

---------------------

作者：quant_zhang

来源：CSDN

原文：https://blog.csdn.net/QUANT_zhang/article/details/6722802