搜索

分享

QQ空间 QQ好友新浪微博微信

【原】真不错！基于中国两大公共数据库构建预测模型，分别进行训练与验证！

妙趣横生统计学 2023-03-01 发布于江苏

展开全文

欢迎报名2023年郑老师团队科研培训课程！

9门科研统计课程：多次直播，课题报销可先开发票

2023年1月，宁夏医科大学在《Asian journal of psychiatry》发表了题为：A predictive model for the risk of cognitive impairment in community middle-aged and older adults（Q1,，IF=13.890）的研究论文。

该研究旨在开发和验证社区中老年人认知障碍的预测模型。开发了一个使用年龄、性别、教育、居住、运动、午睡和抑郁的预测模型来帮助衡量中老年人的认知障碍风险。

摘要与主要结果

一、摘要

背景

识别认知障碍高风险个体对于治疗和预防策略至关重要。我们旨在开发和验证用于评估认知障碍风险的预测模型。

方法

使用来自中国家庭追踪调查（CFPS）和中国健康养老追踪调查（CHARLS）的数据进行预测模型的开发、内部验证和外部验证。

结果

共有14，265名受试者被选中进行模型开发。训练集、内部验证集和外部验证集的曲线下面积（AUC）分别为 0.775、0.920 和 0.727。

结论

该模型可用于识别45岁及以上认知障碍高风险的中老年人。

二、研究结果

1. 人群分布：训练集和验证集的总体特征如下表所示

2. LASSO 预测因子的选择过程：最终模型中包括七个预测变量：年龄、性别、居住地、教育、运动、午睡和抑郁

3.曲线下面积（AUC）:开发、内部验证和外部验证数据的AUC分别为0.775、0.920和0.727

4.列线图：列线图表明，年龄对认知障碍的预测贡献最大，其次是教育和抑郁症。

设计与统计学方法

一、研究设计

这是一项进行了开发、内部验证和外部验证的预测模型

开发：2016年中国家庭追踪调查（CFPS）数据库中≥45岁的人

内部验证:2014年中国家庭追踪调查（CFPS）数据库中≥45岁的人

外部验证: 2018年中国健康与养老追踪调查（CHARLS）数据库中≥45岁的人

二、统计方法

1. 使用R统计软件4.2版进行统计分析

2.分类变量表示为数字和比例，而连续变量表示为平均值（M）±标准差（SD）

3.我们执行了LASSO技术来选择重要的预测因子，并使用曲线下面积（AUC）来评估模型的判别能力。

4.使用校准曲线检查校准

5.根据Logistic回归的结果制定列线图，供实际使用。P值<0.05表示统计学意义。

三、统计方法小结

现在公共数据库是发文的利器，预测模型很多时候是多个公共数据库的结合，比如用的比较的是seer数据库，往往很多人与国内数据集结合起来。不过直接利用国内两个数据建库构建预测模型，并进行验证，还是第一回看到（俺孤落寡闻）。

这是很好的一种论文写作范式。希望对你们有借鉴意义。

更多实战课程

2022年以来，我们召集了一批富有经验的高校专业队伍，着手举行短期统计课程培训班，包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、结构方程模型等9门课。如果您有需求，不妨点击查看：

9门科研与统计课程介绍：不限次直播，每周答疑！配纸质版讲义

2023年统计服务

2023年，我们将开展从科研设计、数据分析、统计学报告等医学科研研究方法咨询与服务多项服务，若您有课题经费可以支持，欢迎您提前和我们联系，2022底前采用预付方式与我们开展合作。

2023年统计服务开启！欢迎提前洽谈数据分析、科研合作服务

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：妙趣横生统计学 > 《待分类》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

妙趣横生统计学

关注对话

TA的最新馆藏

全球疾病负担(GBD)数据分析哪些疾病？临床医生、护士可以写吗？
临床预测模型如何开展外部验证分析？傻瓜式全套教程来了
什么是全球疾病负担数据（GBD)！最新版2021年数据，我们可以拿来发SCI论文吗？
版面费2万元！本科生在“排名第一”的二区发表论文，值吗？
学到了！还可以联合5个公共数据库发文章，别老盯着国内的！
哈哈！奖励式的减肥更有效！这个减肥实验把文章发在JAMA杂志

喜欢该文的人也喜欢更多

热门阅读换一换