分享

互助问答第112期:有关HLM跨层分析的问题

 新用户68639482 2020-04-07
 

尊敬的老师们,你们好!今天想请教一个HLM跨层分析的问题:我研究的是宏观因素对微观企业行为的影响,比如研究地级市市委书记的贫困经历对企业慈善捐赠的影响。首先是官员对企业的影响,然后是企业对捐赠的影响,所以“可能”会需要用到跨层分析(不管需不需要,还是希望老师解答一下,这样的情况如果需要做,如何做跨层分析)。主要是,关于跨层分析的命令 mixed 不太了解,不知道设计的2类变量分别是哪些!我主回归的命令是:reg  donation(捐赠) poor(贫困经历) size leverage ....market(市场化程度),robust cluster(id),这里涉及到市级层面的变量就只有market(市场化程度)一个。请问如果做跨层分析,运用mixed/xtmixed命令应该如何写呢?希望老师可以赐教,谢谢!【附件是我下载的一份跟我研究接近的研究,其中用到了零模型、随机系数模型、截距模型、斜率模型等】

▲滑动查看

按照提问人的要求,此处只回答如何做跨层分析,而不讨论是否应该用跨层分析。根据提问人的描述,我猜测数据结构是企业层面的面板数据,donation,size,leverage等变量是企业层面的变量,且取值可随时间变化,分别表示慈善捐赠、企业规模、企业杠杆率(后两个变量的含义是我的猜测)等;poor,market等变量是城市层面的变量(我不理解提问人为何说城市层面的变量只有market,请提问人确认),且取值可随时间变化,分别表示市委书记的贫困经历、城市市场化程度等含义。假设一个企业始终坐落于一个固定的城市,不会搬迁(提问人没有说明数据结构,所以姑且这样认为),那么企业就是嵌在城市里的;用分层的语言说,就是企业是较低层的主体,城市是较高层的主体。

分层线性模型(HLM)是一个庞大的体系,需要提问人系统学习教科书(有许多教科书整本都在讲分层模型)等相关资料,本回答不可能帮助提问人精通此方法,但可以通过一个例子使提问人对相关做法有基本概念。例子如下:首先,进行分层。第一层就是初始的企业-时间层面,第二层就是企业层面,第三层就是城市层面,低层均嵌在高层里面。其次,思考第二、三层模型的截距和斜率的结构,也即是否是随机截距或/和随机斜率——这涉及到模型筛选,可以通过运行不同模型,然后利用似然比检验判断模型好坏。假如我们最终选定的模型是第二、三层都有随机截距(也即截距的水平随不同层组会发生变化),且 size 和 leverage 等变量的系数有随机斜率结构,且随机的层次是城市层面(这些变量对 donation 的影响在不同城市中是不一样的),那么Stata命令可以写成如下形式:

mixed donation size leverage poor market || cityid: size leverage || firmid:

其中,cityid 和 firmid 分别表示城市和企业的识别变量。运行后,Stata会汇报各变量的确定性的系数估计、城市和企业层面随机截距的方差、size 和 leverage 在城市层面随机斜率的方差等信息。如果假设城市层面随机截距和随机斜率不相互独立,可在城市层面加入cov(un)选项计算它们的协方差。

最后需要强调的是,上面只是一个例子,提问人需要比较不同模型,通过似然比检验等工具筛选出最优模型进行分析

    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多