分享

我所了解的计量经济学

 联合参谋学院 2015-04-20

写在前面

本科水平的理解,希望写些东西对得起自己所喜爱的东西。希望能在这块能继续加强统计和计量的学习,在以后的工作中能运用到,提高工作中专业素质。我不想谈理论的,主要的原因是我不懂,其次是不感兴趣。但应用计量也不是这么好学,免得理论计量学者都去弄应用的了。

计量其实就是个工具,其实但凡涉及到应用的,核心的不是技术,而是思想。有了计算机后,不怕不能实现,只怕你没想到该怎么做。所以加强对自己学科问题的理解,提出一个好问题永远比用了一个好技术重要的多,起码我是这样评价的。在技术运用中思想也是很重要的,比如计量中变量的选取就不在于技术在于思想。

一、回归的细节

1.为什么选择回归

其实如果一上来就用计量经济学或者用回归,是会让人有些摸不着头脑。但如果从期望函数入手去理解回归,或许回归是有些意义的。不敢说计量能在多大程度上解释因果性(个人觉得这涉及到统计学科的哲学讨论了),这点仁者见仁智者见智,但是对于预测,我们如果有涉猎统计的话,那么期望无疑是对预测未来最好的术语了。

如果我们把一个未知的模式看成一个函数,那么预测未来我们需要一个期望函数(如果你i认为它还具有因果性的话,那么这个期望函数应用则更广)。而回归是什么呢?

我看到一个比较好的说法是:如果那个期望函数是线性的,那么回归后得到的函数就是期望函数;如果那个函数不是线性的,那么回归提供了最好的线性估计。

所以,回归的作用在于,拟合期望函数。

(至于那些为发论文而用回归的,或许他们有他们的理由吧)

不难发现,用回归模型的例子很多,其实计量教科书上也介绍了很多模型,比如Probit,Tobit之类的,为什么对于一些特殊的数据还要推荐用回归,虽然那些模型能更好的拟合期望函数,其实用其他模型估计的值和回归估计的值相差不多(这才是我们的目的);另外碰到运用工具变量和面板数据时,这类模型问题更多。特别是异方差问题,而在回归模型中,这些都有公认的很好的解决方法。

2.学习应用计量中的回归,需要注意什么(*只代表个人观点)

我们很多教科书都是从经典假设入手,伍德里奇的书做了一些改进(他的书起码让我明白这些假设有什么用)。但真正从实际研究中,个人觉得只要有能保证估计的一致性的假设就很好了(夸张一点。保证了是随机得到就够了)。回想一下,同方差一般很难保证的,而保证无偏性貌似意义不大。这就涉及到什么是一致性,什么是无偏性了?个人浅显的理解,一致性能让我们意识到如果样本量不断增加的话,我们的估计总是不断趋近于真值的。而无偏性的,其实只是个期望,这意味着如果我们通过样本得到足够多的估计,然后再取平均,应该就是真值了。但是很少有人去做这样的事,除非你的样本集很多,可以分别去估计出很多值。如果你只是估计出一个值,那么无偏性好像是没有太大用处的。

简而言之,如果你的数据是随机得到的,那么你不用担心太多,直接开始计量回归问题是可以的,掠过一些假设问题不大(如果觉得有问题的话,你可以去仔细学,别忘了你学完那些假设后,你记得每次做回归时,检验你的数据是否满足就才行,免得你的这个学习是没意义的)

3.在回归中一些实用的命令(基于stata)

对于经典假设的检验(异方差,函数误设,自相关,正态性,异常观测点等)

(待续.......)

 其实下面说的,stata手册都有。但回想起当初本科的时候,有很多东西老师都没教,故分享下。虽然这些检验就是一个命令的事。(在WORD弄的图片复制不上来,丫的)

 

个人觉得比较重要的检验就是函数形式误设检验和异常观测点的排除以及变量内生性检验(这涉及到工具变量法)。由于对经典假设不感冒,对检验的喜好仅代表个人。

 

  1. 残差图绘制(想起老师教的方法觉得很无语,stata的编写人员早考虑到了,其实就是一个命令的事)

(回归后)rvfplot,就可以了。

例:

 

可以从残差图可以看出很多东西,一般教科书都有教,这里就不废话了。

 

  1. 异方差和正态性的检验

一般教科书的异方差LM检验(想当初我们老师教的异方差LM检验,操作比较麻烦,其实人家编写人员早考虑到了)也就是estat hettest一个命令的事。

(回归后)estat hottest

例:

 

 

如果是高次的异方差检验的话(如WHITE检验)

(回归后)estat imtest即可

 

如果需要WHITE检验的,可以imtest white,这两个对异方差的检验是相似的。

 

第二项 Skewness就是正态性的检验。

 

这里要说一些个人觉得比较重要的题外话,就如前面说的,那些比较多的假设其实就多保证了无偏性,还有一个重要作用就是样本方差公式在小样本下也是成立的。但相比于那些假设,个人更愿意单纯使用大样本的渐进性质就得到有效的推断。(对于小样本,可以使用bootstrap,这个后面说),这样正态性检验就不是必须的了。

而对于异方差,个人更倾向于只要报告稳健标准误即可,所谓异方差的加权修正模型,相比于其对标准误的改进,如果在加权修正模型中存在着残差的估计偏误和期望函数非线性带来的误差更大,建议不要随意使用。就像不要盲目使用Probit之类的非线性函数的原则一样。——The principle of Occam’s razor所以异方差的检验个人觉得也不是必须的了,即无论是否有异方差报告稳健标准误总是没错的。

(在期望函数的非线性导致异方差不只是像一般教科书说的异方差这么简单,这当中涉及到一些数学推导,就不细说了)

 

  1. 多重共线性

其实STATA是可以报告共线性导致膨胀系数的——VIF(反正以前上课就见书上有,老师没教我们如何实现)

可以认为多重共线性会导致危害的判别标准:

最大的VIF大于10(或者30);MEAN VIF大于1

例:(回归后)estate vif

 

然后用correlate命令找出相关性大的变量,删除就可以了。

多重共线性和遗漏变量的取舍,伍德里奇的书有详细说明了,简而言之就是还是以不遗漏变量为准,多重共线性可以用大样本解决,因为它只是影响了标准误。

 

  1. 如果是时间序列的数据,可能还要涉及自相关检验。

其实没必要用杜宾检验的(限制太多),直接用LM检验即可。当初我们老师教的那个方法的麻烦呀,现在想想都烦。

(回归后)estat bgodfrey, lags(1/2) ——lag(1/n)指的是滞后n期,你可以检验n期滞后的情况。

例:

 

 

  1. 函数误设检验(RESET检验)——这个检验主要针对是否遗漏已添加变量的高次项(不要滥用)

(回归后)estat ovtest

例:

 

如开头所言,还可以用图片来观测函数误设。

(回归后) cprplot XXX, mspline msopts(bands(10)) ——(XXX为怀疑存在高次项的变量名称)

例:

 

如果两条线重合度不高,就是存在高次项的证据。

 

  1. 异常观测点

异常点是个比较复杂的问题。这样说吧,可以把回归看成一种加权平均,权重就是方差。异常点会有较大的方差,对估计带来偏误。它的侦查也比较复杂。换个角度,可以求出某个观测值对估计值的影响,然后以一定准则排除掉较大影响的观测值即可(因为如果不是异常观测点,那正常点对估计的影响应该是差不多的)

这样针对不同标准,会有不同的结果。STATA可以提供Leverage statistics,DFITS, Cook’s Distance, and Welsch Distance,COVRATIO,DFBETAs(DFBETAs可能是最直接衡量影响的变量指标,只有它是可以针对每个变量的系数,其他的都是针对整体的),回归后,可以用predict来获得这些指标,然后根据相关标准,列出异常观测点。如:predict leverage, hat

上面说到的列表检验方法技术性比较强,应该稍微看下理论再应用。想简单的可采用图示法。

(回归后)lvr2plot或者avplots

例:

 

 

通过这些图应该可以很容易观测出异常点了。编号后用mlabel(XXX)就可以显示出异常点是哪个点(如下图)

 

 

一般来说还应该涉及变量内生性的检验,但不懂应该把这个检验属于回归还是工具变量法,就不妄加议论了。

当然以上检验不能很好完全满足各种数据的检验,对于时间序列数据我也不是很清楚哪些是必须的,还得多看看书。不过现在一般论文中出现的单位根、协整检验、稳定性检验、格兰杰检验这些都是在STATA中可以很容易实现的。

 

一些后话

1.关于回归结果的讨论

我们需要点估计还是区间估计?

记得当初学习统计的时候,我对点估计就不怎么感兴趣,因为毕竟是样本推断总体,区间估计似乎更具有说服力。但是到计量这边好像很多分析都立足于点估计的结果,可能是源于对于标准误的不相信吧,呵呵。

 

BETA系数

当我们想比较各个解释变量对被解释变量的影响时,一个比较好的方法就是将系数转化为BETA系数,在STATA中实现方法是,(回归后) regress, beta

 

小样本问题

不得不说小样本是我最不愿看到的,因为前面的推断和估计都是建立在大样本的渐进性质上的。对于小样本我的说法一般是,为什么不能多找些样本呢?有这么难吗,哎……

不过bootstrap还是能在一定程度上缓解一些小样本问题的(关键还是多找好样本,bootstrap是治标不治本的办法)

它是针对各种检验中出现的小样本导致的不一致所设计的,但不意味着你拿着两个样本,然后用bootstrap命令就可以解决所有问题。它的思想在于在你获得的样本中不断反复重新抽样,形成一个大样本。一般来说,rep(重复) 50-250次就能保证标准误了,而1000次就能有好的区间估计了。在均值比较和回归中等涉及到检验时都可以运用。

 

2.关于学习计量的探讨

对于应用计量来说,只看理论不用软件(这是多数的)或者只重视软件不重视理论这都是不足的。

如果只重视理论,你可以学到很多东西,但如果在实际中实现不了,那我就觉得是白学了,回归的经典假设学习就是一例,如果你只是会背,而不会在实践中检验,那有什么意思。其实现在软件已经很强大了,我都怀疑还需要不需要学习编程,因为编出来的东西可能不是大家公认的,公认的方法软件的貌似差不多都能实现了,而且是很容易的实现。

如果只重视软件,你发现你可能是有很多都没学会,甚至出现的一些问题你可能都没意识到或者没法解决,特别是模型的假设,不重视假设你所用的方法可能从一开始就是错误的。毕竟软件中实现的过程和原理都来自于理论。一个例子就是在RE中的hauman检验中出现负值的情况和原因。

我的一个建议是,拿一本好书来学,然后把书中涉及到的理论在STATA手册搜索出相关内容自己实践一遍。往往在软件上一个复杂过程只是一个命令就解决了,理论上你得大概明白这个结果是怎样来的(呵呵,对于大概的理解智者见智吧,看你是偏哪方面的)。反复看看伍德里奇的那本神书也是不错的选择。

 

3.有计量就够了吗?

答案显然是否定的,我一直认为计量只是一个工具,不应该滥用。但是在中国问题不仅仅是这么简单,在中国商界对于统计和计量的认识和运用是不足的(这有点类似于金融创新)。

对你所运用的学科的理解决定了你使用工具所能达到的高度。举例来说,比如变量的选取(reset检验不能解决所有问题),假设A引致B,B引致C,你想探究A对C的影响,模型中应该包括B吗?建议采用的原则是:我们感兴趣的变量产生之前就决定的变量都是好的控制变量。另外工具变量法也涉及变量的选取,而这些都需要对相关学科加深理解。另外模型的解释也是很关键的。计算机把分析过程变简单了,那么在解释分析结果就应该给予更多的重视。计量只是告诉我们是不是有影响的问题,而为什么影响、怎么样影响的问题还得用学科的理论来进行解释。

所以重视学科的学习和理解总是对于更好的运用计量工具是有好处的。

 

最后推荐一本虽然还没来得及看的好书Baum, C. F. 2006. An Introduction to Modern Econometrics Using Stata.College Station,TX: Stata Press.

在STATA手册中的References上很多好书也是值得一看的。

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多