原文链接:http:///?p=26105潜类别轨迹建模 (LCTM) 是流行病学中一种相对较新的方法,用于描述生命过程中的暴露,它将异质人群简化为同质模式或类别。然而,对于给定的数据集,可以根据类的数量、模型结构和轨迹属性得出不同模型的分数。 本文说明了LCTM的基本用法,用于汇总拟合的潜在类轨迹模型对象的输出。 例子_目的_:通过将 BMI 建模为年龄函数,识别具有不同轨迹的参与者亚组。根据迄今为止可用的文献,我们假设初始 K=5 类 BMI 轨迹。 我们使用体重指数 (BMI) 重复测量 10,000 个样本的长格式数据框(查看文末了解数据获取方式)。 提供了一个示例(模拟)数据集 bmi 来描述整个步骤。 包含的变量有: id - 个人 ID 加载数据绘制数据 潜在类轨迹建模的八步示例为了对纵向结果 yijk 进行建模,对于 k=1:K,类,对于个体 i,在时间点 j,tj可以使用许多建模选择。我们在这里给出方程来说明这些,并按照复杂度增加的顺序将它们命名为模型 A 到 G。 模型 A:无随机效应模型 | 固定效应同方差 | - 解释个人轨迹与其平均类轨迹的任何偏差仅是由于随机误差 其中假设所有类的残差方差相等, 模型 B:具有特定类别残差的固定效应模型 | 异方差 | 与模型 A 相同的解释,随机误差在不同的类别中可能更大或更小。 其中假设残差方差不同 模型 C:随机截距 解释是允许个体的初始体重不同,但假设每个班级成员遵循平均轨迹的相同形状和大小 对于 k=1:K, classes, 对于个体 i, 在时间点 j, tj, 其中随机效应分布 模型 D:随机斜率 允许个体在初始权重和平均轨迹的斜率上有所不同 对于 k=1:K,类,对于个体 i,在时间点 j , tj, 其中假设随机效应分布为 模型 E:随机二次 - 跨类的共同方差结构 允许个体在类内通过初始权重变化,但是假设每个类具有相同的变异量。对于 k=1:K, 类, 对于个体 i, 在时间点 j, tj, 其中假设随机效应分布为 模型 F 和 G:随机二次 - 允许方差结构跨类变化的比例约束 ,增加模型 E 的灵活性,因为允许方差结构相差一个乘法因子,以允许某些类具有更大或更小的类内方差。该模型可以被认为是模型 G 的更简洁版本(将要估计的方差-协方差参数的数量从 6xK 参数减少到 6+(K-1)个参数。 对于 k=1:K, classes, 对于个体 i, 在时间点 j, tj, 其中假设随机效应分布为 第一步:选择随机效应结构的形式为了确定随机效应的初始工作模型结构,可以遵循 Verbeke 和 Molenbergh 的基本原理来检查没有随机效应的模型中每个 K 类的标准化残差图的形状。 如果残差轮廓可以近似为平坦、直线或曲线,则分别考虑随机截距、斜率或二次项。 为了拟合没有随机效应的潜在类模型。 hlmfixed(bmig) 然后,我们将拟合模型输入 LCTM中的 step1 函数,以检查特定类别的残差。 第2步优化步骤 1 中的初步工作模型以确定最佳类数,测试 K=1,...7。可以根据最低贝叶斯信息标准 (BIC) 来选择所选类别的数量。 set.seed(100) 第 3 步使用步骤 2 中推导出的偏好 K 进一步细化模型,测试最优模型结构。我们测试了七个模型,从简单的固定效应模型(模型 A)到允许残差在类别之间变化的基本方法(模型 B)到一组具有不同方差结构的五个随机效应模型(模型 CG)。
调用 source() 命令。 mmldata = bmi_l01 # model_b$BIC
moe <- hlmfixed = bmi ~1+ age + I(age^2), me$BIC
fixed = bmi ~1+ age + I(age^2), mod$BIC
第四步执行一些模型充分性评估。首先,对于每个参与者,计算被分配到每个轨迹类的后验概率,并将个体分配到概率最高的类。在所有类别中,这些最大后验分配概率 (APPA) 的平均值高于 70% 被认为是可以接受的。使用正确分类、不匹配的几率进一步评估模型的充分性。 LCTMdel_f 第 5 步
plotpred <- predictY
ggplot(bm, aes(x = age, y = bmi)) + geom_line ggplot(bmong) + geom_line |
|