分享

关联分析(危险因素研究)的分析思路+自测实战

 国熙台 2022-04-08

思路决定出路

方向比努力更重要

图片

虽然临床数据分析的目的有很多种,如分析疾病危险因素、构建疾病风险预测模型、评估诊断试验等,但最常见的还是关于某因素与疾病的关联分析。关联分析是其它一切分析的基础,掌握了这一类分析的原理、思路与方法,其它类型的分析也能迎刃而解。

所谓关联分析,即研究某一个因素与某种结局间是否有关联及关联程度大小的分析方法。关联分析中首先要明确因素(或称暴露)是什么?疾病(或称结局)是什么? 体现在数据分析中就是自变量X是哪些变量?因变量Y是哪些变量? 

研究假设可以是当初研究设计中的假设,也可以通过对数据中各种关联关系的挖掘产生。但无论如何,首先要有明确的假设,并且在分析过程中始终围绕该假设进行分析。

在数据分析过程中常有人问下一步还要做什么分析?这时候只要重新审视一下当初的假设,并对照下文介绍的分析思路,答案自然就清楚了。

1

第一步:明确研究假设

一个X对一个Y,一篇文章只说一件事

研究手术治疗、放疗、化疗对预后的影响

研究假设不明确

研究是否手术治疗对预后的影响

考虑到放化疗和年龄等影响因素后进行分析

研究假设明确

2

第二步:掌握分析思路

一篇典型的流行病学研究论文,分析思路一般是围绕下面这些问题来展开的:

图片

关联分析的分析思路是回答三个问题

第一个问题:X与Y有没有关系?是什么样的关系?

第二个问题:什么因素修饰X对Y的作用?

第三个问题:X对Y有没有独立作用?独立作用大小是多少?

3

第三步:真正理解每个表因何而存在

表1研究人群描述:目的是展示收集了哪些混杂,如果有关键混杂因素没收集,文章一枪毙命。需要包括三大类指标:人口学指标(年龄、性别、种族等)、可能与X有关的变量、可能与Y有关的变量。关于表1详细内容请见:临床型论文表1(研究人群描述)的鉴赏和制作方法

平滑曲线拟合图:目的是看X和Y是什么样的关系,是直线还是曲线关系?(回答第一个问题)详细内容请见:一篇文章的亮点:曲线拟合 | 剂量反应关系、量变到质变、量效关系

表2单因素分析:目的是看哪些因素与Y有关。关于表2详细内容请见:临床型论文表2(单因素分析)的鉴赏和制作方法

表3分层分析:目的是看哪些因素修饰X对Y的作用,即找交互作用(回答第二个问题)关于表3详细内容请见:临床型论文表3(分层分析)的鉴赏和制作方法

表4多个多元回归方程:目的是得出X对Y的独立作用(回答第三个问题),通常包括三个模型:

  • Model1未调整模型:可以只调整性别年龄这样的人口学指标,未调整其它混杂因素

  • Model2精简的模型:在模型1基础上加混杂因素。混杂因素是指同时与X、Y有关并且影响X对Y作用的变量。

图片
图片

1. 找与X有关的变量,可以看表1:表1如果按X分组,可以得出与X有关的变量

2. 找与Y有关的变量,可以看表2

3. 找同时与X、Y有关的变量:上面两步变量取交集

4. 确定混杂:同时与X、Y有关并且影响X对Y作用(看是否调整变量Z,对X回归系数的影响)的变量

图片
  • Model3充分调整的模型:在模型1基础上加混杂因素或加与Y有关的变量。

关于表4详细内容请见:临床型论文表4(多个回归方程)的鉴赏和制作方法

秘诀:循环往复

上述过程需要在分析思路的指导下循环往复进行。调整混杂后,X和Y的关系可能会变化(曲线或直线),可能会发现新的交互,需要重新分析混杂。通常一篇SCI论文投稿前,高手会进行20次左右的分析循环,直到结果稳定,各个混杂和交互都可以基于临床现象进行合理解释。

有了好的思路,还要有好的工具实现思路

易侕软件是在分析大量的SCI论文的基础上,把流行病学思维方法、原则,把不同类型的SCI论文写作指南,把不同类型的图表形式,进行系统的总结归纳,形成的分析工具。易侕模块里透现着流行病学分析思路。很多人用它分析数据发文章,反过来又增加对流行病学分析思路的理解,走上了学统计做科研的正循环。

图片


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多