词源面板数据是统计学和经济学中的重要概念。一般认为,面板数据综合了时间序列数据和截面数据在时间维度和指标维度的优点。从20世纪五六十年代开始,面板数据在经济学、社会学等领域的研究和应用逐渐开始并快速发展。20世纪六七十年代,有学者利用消费者购物数据,研究消费者的购物习惯及偏好问题。20世纪80年代,有学者利用婴儿出生数据研究了计划生育相关问题。20世纪90年代,美国经济学家利用北卡罗来纳州各个县20年内的经济社会数据,研究劳动力市场变化和刑事司法策略对于犯罪率的影响。中国许多学者利用中国省市经济社会数据研究城乡发展差异、产业聚集等问题。 基本内容面板数据反映多个事物随时间变化的情况。例如:2011~2019年中国各个省份的国内生产总值、2006~2015年100个家庭的年收入情况等。部分省份2011~2019年GDP的面板数据见表1。
面板数据分为平衡面板数据和非平衡面板数据。6个家庭2014~2016年的家庭年收入数据见表2。其中,2A是平衡面板数据,2B是非平衡面板数据。对于平衡面板数据(2A),每个家庭在每个年份都有收入观测。对于非平衡面板数据(2B),家庭4在2016年的数据缺失,家庭5在2015年的数据缺失,家庭6在2014年、2015年的数据缺失。
对于面板数据,如果只考虑某一时期或时点的情况,就是截面数据。例如:2019年中国各个省份的国内生产总值(GDP)。如果只考虑某一截面个体的随时间变化的情况,就是时序数据。例如,1949年至2019年北京市的国内生产总值(GDP)。 应用针对面板数据,常用的统计分析方法是固定效应模型、随机效应模型、混合效应模型等。对于固定效应模型,又进一步细分为个体固定效应、时点固定效应和时点个体固定效应。个体固定效应认为不同个体在时间序列当中,只有个体间差异(仅截距不同);时点固定效应则认为,不同时点间有差异(截距不同),但不同个体之间没有差异(截距相同);时间个体固定效应则同时包含上述两种情况。随机效应模型是将固定效应的回归系数看作随机变量,而混合效应模型则对二者进行了综合。 扩展阅读
|
|
来自: 求是1025 > 《162大数据与人工智能》