分享

互助问答第136期:关于工具变量的问题

 新用户68639482 2020-04-07

尊敬的老师您好!

问题一:在选择工具变量时,是选择组内均值较好还是组内中位数?

问题二:总数据量为4000多,当选择组内均值或组内中位数作为工具变量时,大约分多少组以及分组的数据量为多少算作合适?按我现在的情况,一共分了134组,数据量最小的组有7个数据,最大的为80个数据,这样是不是缺乏说服力?

谢谢老师!

回答一:不管组内均值还是组内中位数,都需满足工具变量与误差项和无关且与内生变量高度相关。在满足这两条假设前提下,二者并无明显优劣。但不论是谁做工具变量,最好都将当前观测值剔除——即剔除当前观测值之后计算组内均值或中位数,以降低工具变量的内生性疑虑。

回答二:分多少组以及每组多少观测值并无确定标准。至少每组的观测值个数需要足够多,使得组内均值或中位数有统计意义。如果某组只有7个观测值,可能就有问题,需要将其并到其他组中,形成规模稍大的组。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多