分享

P for interaction是干啥滴?

 松哥精鼎统计 2020-10-23
导读

     有数据会统计,你的人生很得意;

有数据却不懂统计,守着金矿要饭滴

懂统计没数据,空有一身傻武艺。

高校内学了多年统计,一到应用,却发现和书上讲的完全不是一样的,国内教科书那本说过P for trend,Per 1 sd。而这些洽洽是发文章所用到的。

今天松哥再给大家贡献一个,P for interaction。先看两张图,注意右侧红框中的P值。

for interaction

交互作用P值

顾名思义,for interaction就是交互作用的P值,反映是否发生交互作用的。

看了两张图之后,有没有大概搞明白P for interaction的意图。

松哥先问两个问题哈:

  1. P for interaction在何时用呢?

  2. P for interaction如何计算的呢?

何时用呢?

当您想研究交互作用的时候【简直是废话】,科研过程中常见组合之一是分层分析或亚组分组之后,紧跟着就进行一个P for interaction。我们以上图2为例简单讲解一下:

该例研究的是饮酒(x1)与房颤(y)的关系。作者根据饮酒情况分为4组,以不饮酒为参照。可是我们也知道,房颤肯定不全部是由饮酒导致的,还受年龄、BMI等有影响。

于是作者根据专业,讲年龄分为>60y与≤60y两个亚组,分别在各自亚组研究饮酒(x1)与房颤(y)的关系。结果发现,只有在>60y组,每天饮酒>2drinks/d相对于不饮酒的人群而言,发生房颤的风险为OR:1.91[1.22,2.97]。

然后,作者有做了一个P for interaction。研究年龄(X2)和饮酒(x1)之间对房颤(y)的发生有没有交互作用。

如果没有,那ok,上面的解释没有问题。年龄与饮酒之间无交互作用,只有在>60y组,每天饮酒>2drinks/d相对于不饮酒的人群而言,发生房颤的风险OR:1.91[1.22,2.97]。分析思路顺畅,结果良好。

如果有,若数据没问题,分析没问题,那么恭喜你,你发现了一个很好的亮点,或者简单的说,你发现了一种特定的人群,该人群的发病风险很高或者很低(看你的研究了)。

也许您会说,怎么可能就研究这两个因素呢,还有其他好多因素呢。呵呵,是的,那些因素你依然可以放入模型进行控制,都不影响的。

如何算呢?

目前计算P for interaction两种方法:

1.对于数值与等级或二分类,可以直接模型中增加相乘项【如x1×X2】,然后看交互项有无意义。

2.而对于多项分类【如血型】,产生哑变量后,相乘则会产生多个交互项,此时不能整体判断交互作用是否有意义。我们可以先构建一个无交互作用项的模型,再构建一个有交互作用项的模型。然后采用似然比检验(likelihood ratio test)进行比较有个模型差异,则可以判定交互项整体是否有意义。

统计学研究,单因素是研究基础,多因素是规定套路,交互作用是研究亮点。

统计根据建模目的,可分为3类模型,第一种为找风险,建模寻找各种风险因子;第二种为验证风险,即为了证明X和Y有关;第三种为预测,如近年流行的临床预测模型。今天所讲的属于验证风险模型。


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多