分享

经济学中的序列相关(自相关)

 脑系科数据科学 2019-03-25

序列相关性

    异方差性表现于模型的随机误差项。我们将讨论模型的随机误差项违背了互相独立的基本假设的情况,称为序列相关性。序列相关性同样表现于模型的随机误差项。

一、序列相关性(Serial Correlation )

对于模型

            i=1,2,…,n

随机误差项互相独立的基本假设表现为:

             i≠j,i,j=1,2,…,n

如果出现

             i≠j,i,j=1,2,…,n

即对于不同的样本点,随机误差项之间不再是完全互相独立,而是存在某种相关性,则认为出现了序列相关性。由于随机误差项都服从均值为0的正态分布,所以序列相关性可以表示为:

                 i≠j,i,j=1,2,…,n

如果仅存在

                i=1,2,…,n-1

称为一阶序列相关,或自相关。这是最常见的一种序列相关问题。

二、实际经济问题中的序列相关性

在实际经济问题中,为什么会出现序列相关性?下面仍通过两个例子加以说明。

例如,我们建立一个行业生产函数模型,以产出量为被解释变量,选择资本、劳动、技术等投入要素为解释变量,根据样本与母体一致性的要求,只能选择时间序列数据作为样本观测值。于是有:

          t=1,2,…,n

在该模型中,资本、劳动、技术之外的因素,例如政策因素等,没有包括在解释变量中,但它们对产出量是有影响的,该影响则被包含在随机误差项中。如果该项影响构成随机误差项的主要部分,则可能出现序列相关性。为什么?对于不同的样本点,即对于不同的年份,由于政策等因素的连续性,它们对产出量的影响也是有内在联系的。前一年是正的影响,后一年往往也是正的影响。于是在不同的样本点之间,随机误差项出现了相关性,这就产生了序列相关性。更进一步分析,在这个例子中,随机误差项之间表现为正相关。

再例如,以绝对收入假设为理论假设、以时间序列数据作样本建立居民总消费函数模型:

            t=1,2,…,n

我们知道,一般情况下居民总消费除受总收入影响外,还受其它因素影响,例如消费习惯等,但这些因素没有包括在解释变量中,它们对消费量的影响则被包含在随机误差项中。如果该项影响构成随机误差项的主要部分,也可能出现序列相关性。为什么?对于不同的样本点,即对于不同的年份,由于消费习惯等因素的连续性,它们对消费量的影响也是具有内在联系的。前一年是正的影响,后一年往往也是正的影响。于是在不同的样本点之间,随机误差项出现了相关性,这就产生了序列相关性。更进一步分析,在这个例子中,随机误差项之间也表现为正相关。

在以上例子中,随机误差项之间的相关性主要表现为一阶序列相关。但是,连续的一阶序列相关实际上构成了多阶序列相关。负相关的情况也是有的。例如建立粮食生产模型,如果把自然条件排除在解释变量之外,那么由于它们的周期性变化,以及对粮食生产的实际影响,造成随机误差项之间出现负相关。

一般经验告诉我们,对于采用时间序列数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的其它因素在时间上的连续性,带来它们对被解释变量的影响的连续性,所以往往存在序列相关性。

三、序列相关性的后果

计量经济学模型一旦出现序列相关性,如果仍采用普通最小二乘法估计模型参数,会产生下列不良后果:

⒈  参数估计量非有效

根据参数估计量的无偏性和有效性的证明过程,可以看出,当计量经济学模型出现序列相关性,其普通最小二乘法参数估计量仍然具有无偏性,但不具有有效性。因为在有效性证明中利用了

即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量仍然不具有渐近有效性,这就是说参数估计量不具有一致性。

⒉  变量的显著性检验失去意义

在第三章中关于变量的显著性检验中,构造了统计量,以及该统计量服从自由度为的分布。这些只有当随机误差项具有同方差性和互相独立性时才能成立。如果出现了序列相关性,检验就失去意义。采用其它检验也是如此。

⒊  模型的预测失效

由于上述后果,使得模型不具有良好的统计性质。所以,当模型出现序列相关性时,它的预测功能失效。

四、序列相关性的检验

关于序列相关性的检验方法,在一些计量经济学教科书和文献中,也可以见到多种。例如冯诺曼比检验法、回归检验法、D.W.检验等。这些检验方法的共同思路是,首先采用普通最小二乘法估计模型,以求得随机误差项的“近似估计量”,用表示:

然后通过分析这些“近似估计量”之间的相关性以达到判断随机误差项是否具有序列相关性的目的。

例如回归检验法,即是以为被解释变量,以各种可能的相关量,诸如以、、等为解释变量,建立各种方程:

              i=2,…,n

      i=3,…,n

  …

对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。具体应用时需要反复试算。回归检验法的优点是一旦确定了模型存在序列相关性,也就同时知道了相关的形式,而且它适用于任何类型的序列相关性问题的检验。

冯诺曼比检验法在于构造统计量

该统计量被称为冯诺曼比,其中为的平均值。当样本容量足够大时(大于30),该统计量近似服从正态分布。计算该统计量的值,将它与具有正态分布的理论分布值进行比较,如果大于临界值,表示不存在序列相关,如果小于临界值,表示存在序列相关。

最具有应用价值的是D.W.检验,但是它仅适用于一阶自相关的检验。构造统计量:

                                           (4.2.1)

计算该统计量的值,根据样本容量和解释变量数目查D.W.分布表,得到临界值和,然后按照下列准则考察计算得到的D.W.值,以判断模型的自相关状态。

若   0<D.W.<            则存在正自相关

     <D.W.<          不能确定

     <D.W.<4-      无自相关

     4-<D.W.<4-   不能确定

     4-<D.W.<4        存在负自相关

也就是说,当D.W.值为2左右时,模型不存在一阶自相关。

为什么可以通过D.W.值检验自相关的存在呢?从直观上看,如果模型存在正自相关,即对于相邻的样本点,都较大或较小,此时,较小,D.W.统计量的分子较小,D.W.值较小;如果模型存在负自相关,即对于相邻的样本点,若较大则较小,若较小则较大,此时,较大,D.W.统计量的分子较大,D.W.值也较大;如果模型不存在自相关,则与呈随机关系,此时,较为适中,则D.W.统计量取一个适中值。从数学上也容易证明,展开D.W.统计量:

                                (4.2.2)

当n较大时,大致相等,则(4.2.2)可以化简为:

如果存在完全一阶正相关,即

如果存在完全一阶负相关,即

如果完全不相关,即

    从判断准则中看到,存在一个不能确定的D.W.值区域,这是这种检验方法的一大缺陷。D.W.检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关,而且经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关。所以在实际应用中,对于序列相关问题一般只进行D.W.检验。

五、广义最小二乘法(GLS)

如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型,最常用的方法是广义最小二乘法和差分法。

广义最小二乘法,顾名思义,是最具有普遍意义的最小二乘法,普通最小二乘法和加权最小二乘法是它的特例。

对于模型

                                                   (4.2.3)

如果存在序列相关,同时存在异方差,即有

用左乘(4.2.3)两边,得到一个新的模型:

                                               (4.2.4)

该模型具有同方差性和随机误差项互相独立性。因为

于是,可以用普通最小二乘法估计模型(4.2.4),得到参数估计量为:

                                       (4.2.5)

这就是原模型(4.2.3)的广义最小二乘估计量,是无偏的、有效的估计量。

如何得到矩阵?仍然是对原模型(4.2.3)首先采用普通最小二乘法,得到随机误差项的近似估计量,以此构成矩阵的估计量,即

六、差分法

差分法是一类克服序列相关性的有效的方法,被广泛地采用。差分法是将原模型变换为差分模型,分为一阶差分法和广义差分法。

⒈  一阶差分法

一阶差分法是将原模型

                 i=1,2,…,n

变换为

                 i=2,…,n    (4.2.6)

其中

如果原模型存在完全一阶正相关,即

其中不存在序列相关。那么对于差分模型(4.2.6),则满足应用普通最小二乘法的基本假设,用普通最小二乘法估计差分模型(4.2.6)得到的参数估计量,即为原模型参数的无偏的、有效的估计量。

    实际的计量经济学问题中,完全一阶正相关的情况并不多见。但人们还是经常直接差分模型,因为即使对于非完全一阶正相关的情况,只要存在一定程度的一阶正相关,差分模型就可以有效地加以克服。当然也可以采用下面的广义差分法,但估计过程将变得较为复杂。

⒉  广义差分法

广义差分法可以克服所有类型的序列相关带来的问题,一阶差分法是它的一个特例。如果原模型存在:

                               (4.2.7)

可以将原模型变换为;

                                                  (4.2.8)

模型(4.2.8)为广义差分模型,该模型不存在序列相关问题。采用普通最小二乘法估计该模型得到的参数估计量,即为原模型参数的无偏的、有效的估计量。关于广义差分法的实际应用,读者可参阅本章§2.10中的发电量模型。

⒊  随机误差项相关系数的估计

应用广义差分法,必须已知不同样本点之间随机误差项的相关系数。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。于是发展了许多估计方法,诸如迭代法、杜宾两步法等。其基本思路是采用普通最小二乘法估计原模型,得到随机误差项的“近似估计值”,然后利用该“近似估计值”求得随机误差项相关系数的估计量。不同的方法旨在力图使得这些估计量更加逼近实际。

例如杜宾两步法就是一种常用的方法。以采用普通最小二乘法估计原模型得到的随机误差项的“近似估计值”作为方程(4.2.7)的样本观测值,采用普通最小二乘法估计该方程,得到,作为随机误差项的相关系数的第一步估计值。变换方程(4.2.8)为下列形式:

                                              (4.2.9)

即将的第一步估计值用于这一中间过程方程样本观测值的计算中,然后再采用普通最小二乘法估计该方程,目的不是为了得到原模型参数的估计量,而是为了得到的第二步估计值。这就是求得随机误差项的相关系数估计值的“两步法”。将第二步估计值用于方程(4.2.8)的样本观测值的计算中,然后再采用普通最小二乘法估计方程,得到原模型参数的估计量。

在TSP6.5计量经济学软件包中,可以采用很简单的方法实现广义差分法参数估计。(4.2.8)式可以改写为

                                                 (4.2.10)

当选择普通最小二乘法估计参数时,如果同时选择常数项、,作为解释变量,即可眼得到(4.2.10)中参数的估计值。其中表示随机误差项的阶自回归。在估计过程中自动完成了的迭代,并显示总迭代次数。

至于选择几阶随机误差项的自回归项作为解释变量,主要判断依据是D.W.统计量。所以,一般是先不引入自回归项,采用普通最小二乘法估计参数;根据显示的D.W.统计量,逐次引入,直到满意为止。

--------------------- 

作者:quant_zhang 

来源:CSDN 

原文:https://blog.csdn.net/QUANT_zhang/article/details/6722802 

版权声明:本文为博主原创文章,转载请附上博文链接!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多