分享

Mplus数据分析:分段潜增长模型,看jama如何玩转纵向数据的轨迹

 CodewarCodewar 2022-03-20

今天给大家介绍分段潜增长模型的原理和做法,之前我有给大家写增长混合和潜增长,它们的主要的局限在于轨迹都是连续的不能分段,在于对phasic的现象把握其实还是不够的,比如儿童认知的发展,按照理论,它是可以明显分段的,如果这个时候我们非要给人家拟合一个连续曲线?万一人家发展就是分了两个阶段线性发展的呢?所以这些方法还是不太好,今天给大家介绍分段潜增长模型,专门解决这个问题。

理论铺垫

增长混合模型之前有给大家写,其优点在于可以看轨迹,局限性在于趋势不好解释。什么意思呢,其实很多时候我们拟合不出来一组十分有意义的轨迹的,这个时候我们可以转而看轨迹内部发展的情况,往往可以挽救一个课题。

就是说我们将纵向轨迹分段解释,像下图有可能就有意思了,或者是自己本来就是一个很长时间随访的数据,比如从6岁随访到18岁,有可能12岁是一个转折点,这个时候我们以12岁为界拟合两段斜率,有可能更加符合实际。或者是理论告诉我,我研究的特质本来在6到18岁本来就应该是2个发展阶段,这个时候我们也应该用分段增长模型来拟合特质的发展情况:

Piecewise growth curve model (PGCM) is often used when the underlying growth process is hypothesized to consist of phasic developments connected by turning points (or knots or change points)

the piecewise growth model is quite flexible and can accommodate a variety of modeling scenarios that are not adequately captured by mathematical functions for single-stage change processes and/or often yield parameters with more meaningful and substantive interpretations.

不止如此,更重要的是我们可以同时做两个变量的分段增长模型,此时有助于我们回答一些诸如:两个变量的Codevelopment是怎样的?一个变量的发展快慢对另外一个变量的发展快慢是不是有影响?一个变量的初始水平是不是对另外一个变量的发展有影响?等等。这些都是很有意思的课题凝练方法,有长期随访数据的同学们都可以考虑一下哈。

分段增长曲线的内在思想大部分和增长曲线模型是一样的,不同之处在于我们会在一个轨迹中拟合两个斜率出来,如下图:

图中就显示我们对学生的数学成绩随访6次,此时我们形成3个潜变量,一个截距,2个斜率,斜率s1代表了8,9,10三波成绩的斜率,而斜率s2代表了以10波为起点的11,12波的斜率。这样子一拟合我们就可以得知以10波为界,不同阶段的数学成绩是如何变化的了。

文献实例

今天我们看的文献是来自jamapsychiatry上的一篇文章,作者利用分段增长曲线模型探讨了BMI和内化症状的共同发展情况,叫做Codevelopment,就是说我BMI发展的快是不是也使得内化问题发展的严重,或者相反;是不是基础的BMI或BMI不同阶段发展的快慢对不同阶段内化症状发展的也有预测作用,或者相反

上面问题的回答都是通过对BMI和内化症状同时做分段增长曲线,然后探讨曲线的斜率截距之间的关系实现的,原文献贴在下面感兴趣的同学可以去读一读:

Patalay P, Hardman CA. Comorbidity, Codevelopment, and Temporal Associations Between Body Mass Index and Internalizing Symptoms From Early Childhood to Adolescence. JAMA Psychiatry. 2019;76(7):721–729. doi:10.1001/jamapsychiatry.2019.0169

文章有两个表值得给大家分享下:

第一个是一个曲线参数相关系数的表格,如下:

作者做了两个变量共6个轨迹参数之间的两两相关,作者通过看斜率的相关,就解答了codevelopment这个问题,比如3岁到7岁之间两个斜率的相关系数为0.01且不显著,作者得到说其实在3到7岁这个时期,BMI和内化症状是没有共同发展的。相应地,7到14岁这个时期两个斜率的相关系数为0.23且显著,所以这个时期BMI和内化症状其实是共同发展的

要分享的第二个表格是回归的表格,如下:

作者想看一看相应症状发展的斜率(速率)是如何被相应轨迹参数预测的,因为从表3可以看出各自变量的截距对各自变量变化的斜率都是有显著预测作用的,而相互之间,即BMI的截距对内化问题的斜率与内化问题的截距对BMI的斜率都没有影响,所以作者就得到了:BMI发展和内化症状发展之间并没有交叉预测作用:

initial levels in each domain predicted the slopes in the same domain.However,there were no cross-domain predictions from the initial level or the rate of change (slopes) and the rate of development in the other domain

实例操练

比如我现在有某个变量的5次随访,我想对这5次随访做一个分段增长模型以第3波为截断点,我就可以写出如下代码

可以看到在代码中,有拟合两个斜率s1和s2,s1是以y1为起点,一直到y3,而s2是以y3为起点一直到y5,运行代码即可出图并得到轨迹参数:

分段增长曲线的模型如下:

今天给大家写了分段增长模型的mplus做法,R语言的BayesianPGMM包也是专门用来做分段增长模型的,以后有机会给大家写做法。当然啦,大家也可以像刚刚分享的jamapsychiatry那篇文章一样,拟合两个分段增长模型去探讨变量间的纵向共变关系,得到意想不到的结论。

小结

    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多