分享

面板数据

 求是1025 2023-04-01 发布于山东

词源

面板数据是统计学和经济学中的重要概念。一般认为,面板数据综合了时间序列数据和截面数据在时间维度和指标维度的优点。从20世纪五六十年代开始,面板数据在经济学、社会学等领域的研究和应用逐渐开始并快速发展。20世纪六七十年代,有学者利用消费者购物数据,研究消费者的购物习惯及偏好问题。20世纪80年代,有学者利用婴儿出生数据研究了计划生育相关问题。20世纪90年代,美国经济学家利用北卡罗来纳州各个县20年内的经济社会数据,研究劳动力市场变化和刑事司法策略对于犯罪率的影响。中国许多学者利用中国省市经济社会数据研究城乡发展差异、产业聚集等问题。

基本内容

面板数据反映多个事物随时间变化的情况。例如:2011~2019年中国各个省份的国内生产总值、2006~2015年100个家庭的年收入情况等。部分省份2011~2019年GDP的面板数据见表1。

表 1 部分省份2011~2019年GDP数据表

单位:亿元

年份

北京

天津

...

河北

山西

2011

16 251

11 307

...

24 515

11 237

2012

17 879

12 893

...

26 575

12 112

2013

19 800

14 442

...

28 442

12 665

2014

21 330

15 726

...

29 421

12 761

2015

23 014

16 538

...

29 806

12 766

2016

25 669

17 885

...

32 070

13 050

2017

28 015

18 549

...

34 016

15 528

2018

33 106

13 363

...

32 495

15 958

2019

35 371

14 104

...

35 105

17 027

面板数据分为平衡面板数据和非平衡面板数据。6个家庭2014~2016年的家庭年收入数据见表2。其中,2A是平衡面板数据,2B是非平衡面板数据。对于平衡面板数据(2A),每个家庭在每个年份都有收入观测。对于非平衡面板数据(2B),家庭4在2016年的数据缺失,家庭5在2015年的数据缺失,家庭6在2014年、2015年的数据缺失。

表2 平衡和非平衡面板数据表

平衡面板数据(2A)

非平衡面板数据(2B)

家庭

年份

年收入/元

家庭

年份

年收入/元

1

2014

80 000

4

2014

45 000

1

2015

95 000

4

2015

48 000

1

2016

120 000

4

2016

NA

2

2014

60 000

5

2014

90 000

2

2015

70 000

5

2015

NA

2

2016

78 000

5

2016

96 000

3

2014

100 000

6

2014

NA

3

2015

135 000

6

2015

NA

3

2016

203 000

6

2016

130 000

对于面板数据,如果只考虑某一时期或时点的情况,就是截面数据。例如:2019年中国各个省份的国内生产总值(GDP)。如果只考虑某一截面个体的随时间变化的情况,就是时序数据。例如,1949年至2019年北京市的国内生产总值(GDP)。

应用

针对面板数据,常用的统计分析方法是固定效应模型、随机效应模型、混合效应模型等。对于固定效应模型,又进一步细分为个体固定效应、时点固定效应和时点个体固定效应。个体固定效应认为不同个体在时间序列当中,只有个体间差异(仅截距不同);时点固定效应则认为,不同时点间有差异(截距不同),但不同个体之间没有差异(截距相同);时间个体固定效应则同时包含上述两种情况。随机效应模型是将固定效应的回归系数看作随机变量,而混合效应模型则对二者进行了综合。

扩展阅读

  • 伍德里奇 J M.计量经济学导论现代观点.北京:清华大学出版社,2003.
  • 李子奈,叶阿忠.高等计量经济学.北京:清华大学出版社,2003.
  • CORNWELL C,TRUMBULL W N.Estimating the Economic Model of Crime with Panel Data.The Economic Journal,1994,76(2):360-366.
  • TELSER L G.The Demand for Branded Goods as Estimated From Consumer Panel Data.The Review of Economics and Statistics,1962,44(3):300-324.
  • MOFFITT R.The Estimation of Fertility Equations on Panel Data.The Journal of Human Resources,1984,19(1):22-34.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多