分享

导师:CHARLS研究还只会用旧方法?你还搞什么科研!(附新方法解读

 公共数据库统计 2025-06-23 发布于浙江

  引言

创新发文还得看中国学者!今天这篇文章,研究团队没有运用常规思路探索CHARLS数据,而是采用一种很新的方法——纵向目标最大似然估计(一种先进的因果推理技术)
ps:文末附方法解读,学会了它,绝对能成为你文章的一大亮点!
抑郁症作为重要的公共健康问题,对中老年人的影响尤为严重。虽然睡眠不足(通常定义为每日少于6-7h)已被众多横断面研究证实与抑郁症状升高相关,但关于慢性睡眠不足对抑郁症状的长期因果效应的研究仍然有限。

2025年5月29日,中国学者用CHARLS数据库,期刊Journal of Affective Disorders(医学二区Top,IF=4.9)发表了一篇题为:“Estimating the longitudinal causal effect of insufficient sleep on depressive symptoms: Evidence from the CHARLS study究论文

本研究利用中国本土的纵向数据,采用先进的因果推理技术估计持续睡眠不足(定义为总睡眠时间<6h/天)对抑郁症状(CESD-10量表测量)长期因果效应(2-9年)同时考虑了时不变和时变混杂因素。


本公众号回复“ 原文”即可获得文献PDF等资料,如需CHARLS等老年健康数据库挖掘请联系郑老师团队,微信号:aq566665

研究团队使用了中国健康与退休纵向研究(CHARLS)数据库2011-2020年的数据过纳排,最终纳入了4362名拥有完整睡眠和抑郁数据、基线混杂因素信息且BMI合理的参与者平均年龄为55.90岁,50.8%为女性,基线924人报告睡眠不足。
本研究的核心方法是纵向目标最大似然估计(LTMLE,一种适用于处理纵向数据中的时变混杂问题的因果推断方法),基于此,建立了包含5个时间点的因果网络模型,假设前期暴露、混杂因素和结局会影响后续的暴露、混杂因素和结局。
  • 混杂因素包括时不变的(性别、教育、婚姻、职业、基线BMI、炎症标志物hsCRP、共病等)和时变的(年龄、体力活动量PAV、认知功能、家庭支出等)。

图1 假设的因果网络,其中A代表暴露变量;L代表协变量;Y代表结果


主要研究结果

研究结果显示,睡眠不足与更高的抑郁评分相关。

并且在9年的随访期间,参与者抑郁症状评分的平均因果效应(ATE)随着随访时间的延长先上升后略降,在7年时达到3.75分的峰值,在9年时略降至3.66分。
这表明睡眠不足对抑郁症的影响可能随着时间的推移而累积,但在长时间的睡眠剥夺后趋于稳定。

表1 使用ATE评估睡眠不足对抑郁症状的影响

Model1:调整了年龄、性别;

Model2:调整了Model1+户籍、婚姻状况、教育水平、饮酒习惯和吸烟情况;

Model3:调整了Model2+职业、每周支出、体力活动量(PAV)、认知功能。

Model full:调整了Model3+BMI、hsCRP和共病情况(包括高血压、血脂异常、糖尿病、癌症、肺部疾病、肝脏疾病、心脏疾病、中风、肾脏疾病、胃部疾病、精神疾病、记忆问题、关节炎和哮喘)

并且,女性对睡眠不足的抑郁效应更敏感,在9年随访中,其ATE(4.57)显著高于男性(2.80);而60岁以下人群的ATE(3.48)则高于60岁及以上人群(2.90)

图2 按性别对睡眠不足对抑郁症状影响的亚组分析

此外,研究还探讨了午睡对抑郁症状的潜在调节作用。
与先前的研究一致,结果表明,在夜间睡眠不足(<6h)的个体中,较长的午睡时间>30分钟)能够降低抑郁评分。具体来说,与午睡≤30分钟者相比,午睡>30分钟的个体的抑郁评分低1.37分。
这意味着午睡可以作为睡眠不足的补偿机制,并减少睡眠不足的负面影响。
图3 睡眠不足对抑郁症状影响的ATE

表2 各组别中午睡>30分钟的影响

综上本研究为我国中老年人群中睡眠不足(<6h/天)对抑郁症状的纵向因果影响提供了强有力的证据。并且,这种效应随时间累积并在7年后趋于稳定。此外,午睡(>30分钟)可作为一种补偿机制,减轻夜间睡眠不足个体的抑郁症状

统计知识点汇总

一、 数据来源
中国健康与养老追踪调查(CHARLS)数据库:
CHARLS数据库是一项持续的纵向调查,旨在调查中国45岁及以上中老年人社会、经济和健康状况。
二、研究设计思路:

P(Population)参与者:从CHARLS数据库2011-2020年的数据中,纳入的4362名参与者;

E(exposure)暴露因素:主要暴露变量是总睡眠持续时间,计算为夜间睡眠和午睡持续时间的总和;

O(outcome)结局:抑郁症状

S(Study design)研究类型:队列研究。

三、统计方法
√纵向目标最大似然估计(LTMLE)
目标最大似然估计(TMLE)是一种双重稳健的方法,旨在以更高的精度估计因果效应。它的扩展——纵向TMLE(LTMLE),使TMLE原则适应纵向研究的复杂性,如时变治疗和混杂因素。
LTMLE 是一种双重稳健的方法,它将结果模型与基于倾向评分(PS)的治疗模型相结合,有效减少了潜在模型错误说明造成的偏差。
文章采用纵向目标最大似然估计 (LTMLE)来评估睡眠不足对抑郁症状的因果影响。这个双重稳健的框架确保了有效和一致的因果效应估计,前提是结果模型或治疗模型被正确指定。
LTMLE 程序包括三个关键步骤:
  •  使用治疗和混杂变量估计初始预期结果;
  •  计算倾向评分,它反映了根据观察到的协变量接受治疗的可能性;
  •  通过整合来自倾向评分的信息来完善初始结果模型。

➡️LTMLE 框架的优势:

  • 处理时变暴露:LTMLE可以有效地管理时变暴露,而传统方法往往无法解决这些问题;

  • 解决时变混杂因素:该方法旨在处理时变协变量。这种能力使LTMLE成为纵向研究中因果推断的强大工具,克服了Cox回归和线性混合模型等传统方法的局限性,这些方法很难充分解释时变混杂因素;

  • 双重稳健性:LTMLE具有双重稳健性,这意味着如果结果模型或治疗机制被正确指定,它会产生一致的估计值。这一特性将LTMLE与混合模型等方法区分开来,混合模型通常依赖于结果模型的正确规范。双重稳健性增强了因果效应估计的可靠性和准确性,即使在模型错误指定的情况下也是如此。

√敏感性分析
(1)带有协变量的模型变化:开发了四个模型,每个模型都包含不同的时不变和时变协变量集。
  • 模型1:调整了年龄和性别;
  • 模型2:额外调整了居住地(户口)、教育水平、婚姻状况、吸烟和饮酒状况;
  • 模型3:模型2+调整了职业、每周支出、身体活动量 (PAV) 和认知功能等因素;
  • 模型4:模型3+调整了合并症(例如高血压、血脂异常、糖尿病和肾脏疾病)和其他健康指标,例如 BMI 和 hsCRP。
(2)不同的暴露定义:应用不同的阈值(6h和7h)来定义睡眠不足,并比较这些阈值的结果;
(3)不同的结果定义:分析了连续和二元结果,特别是抑郁症状评分和临床抑郁 (临界值=10),以检查不同结果测量结果的一致性。
√亚组分析
文章按性别进行了亚组分析,以比较睡眠不足对女性和男性抑郁症状的影响大小。另外,本文还根据年龄进行了亚组分析。

CHARLS数据库一对一指导

想get同款研究思路或者选题的朋友,郑老师团队的CHARLS一对一指导课程最大程度减轻你的发文压力,需要的变量数据我们帮你提取!

发文最难的部分都已经解决了,你还在等什么?!

记得点个小小的关注👇

我们将为您分享更多公共数据库的高分发文思路和统计小技巧!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多