分享

真不错!基于中国两大公共数据库构建预测模型,分别进行训练与验证!

 妙趣横生统计学 2023-03-01 发布于江苏

欢迎报名2023年郑老师团队科研培训课程!

9门科研统计课程:多次直播,课题报销可先开发票


20231月,宁夏医科大学在《Asian journal of psychiatry发表了题为:A predictive model for the risk of cognitive impairment in community middle-aged and older adults(Q1,,IF=13.890的研究论文。

该研究旨在开发和验证社区中老年人认知障碍的预测模型。开发了一个使用年龄、性别、教育、居住、运动、午睡和抑郁的预测模型来帮助衡量中老年人的认知障碍风险。

摘要与主要结果

一、摘要
背景
识别认知障碍高风险个体对于治疗和预防策略至关重要。我们旨在开发和验证用于评估认知障碍风险的预测模型。
方法
使用来自中国家庭追踪调查(CFPS)和中国健康养老追踪调查(CHARLS)的数据进行预测模型的开发、内部验证和外部验证。
结果
共有14,265名受试者被选中进行模型开发。训练集、内部验证集和外部验证集的曲线下面积 (AUC) 分别为 0.775、0.920 和 0.727。
结论
该模型可用于识别45岁及以上认知障碍高风险的中老年人。

二、研究结果
1. 人群分布:训练集和验证集的总体特征如下表所示
2. LASSO 预测因子的选择过程:模型中包括七个预测变量:年龄、性别、居住地、教育、运动、午睡和抑
 3.曲线下面积(AUC):开发、内部验证和外部验证数据的AUC分别为0.775、0.920和0.727
4.列线图:列线图表明,年龄对认知障碍的预测贡献最大,其次是教育和抑郁症。

设计与统计学方法

一、研究设计

这是一项进行了开发、内部验证和外部验证的预测模型

开发:2016年中国家庭追踪调查(CFPS)数据库中≥45岁的人

内部验证:2014年中国家庭追踪调查(CFPS)数据库中≥45岁的人

外部验证: 2018年中国健康与养老追踪调查(CHARLS)数据库中≥45岁的人

二、统计方法

1. 使用R统计软件4.2版进行统计分析
2.分类变量表示为数字和比例,而连续变量表示为平均值(M)±标准差(SD)
3.我们执行了LASSO技术来选择重要的预测因子,并使用曲线下面积(AUC)来评估模型的判别能力。
4.使用校准曲线检查校准
5.根据Logistic回归的结果制定列线图,供实际使用。P值<0.05表示统计学意义。
三、统计方法小结
现在公共数据库是发文的利器,预测模型很多时候是多个公共数据库的结合,比如用的比较的是seer数据库,往往很多人与国内数据集结合起来。不过直接利用国内两个数据建库构建预测模型, 并进行验证,还是第一回看到(俺孤落寡闻)
这是很好的一种论文写作范式。希望对你们有借鉴意义。

更多实战课程

2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS临床试验数据分析、重复测量资料分析结构方程模型等9门课。如果您有需求,不妨点击查看:

9门科研与统计课程介绍:不限次直播,每周答疑!配纸质版讲义

2023年统计服务

2023年,我们将开展从科研设计、数据分析、统计学报告等医学科研研究方法咨询与服务多项服务,若您有课题经费可以支持,欢迎您提前和我们联系,2022底前采用预付方式与我们开展合作。

2023年统计服务开启!欢迎提前洽谈数据分析、科研合作服务

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多