【原】P for interaction是干啥滴？

松哥精鼎统计 2020-10-23

展开全文

导读

有数据会统计，你的人生很得意；

有数据却不懂统计，守着金矿要饭滴

懂统计没数据，空有一身傻武艺。

高校内学了多年统计，一到应用，却发现和书上讲的完全不是一样的，国内教科书那本说过P for trend，Per 1 sd。而这些洽洽是发文章所用到的。

今天松哥再给大家贡献一个，P for interaction。先看两张图，注意右侧红框中的P值。

P for interaction

交互作用P值

顾名思义，P for interaction就是交互作用的P值，反映是否发生交互作用的。

看了两张图之后，有没有大概搞明白P for interaction的意图。

松哥先问两个问题哈：

何时用呢？

当您想研究交互作用的时候【简直是废话】，科研过程中常见组合之一是分层分析或亚组分组之后，紧跟着就进行一个P for interaction。我们以上图2为例简单讲解一下：

该例研究的是饮酒（x1）与房颤（y）的关系。作者根据饮酒情况分为4组，以不饮酒为参照。可是我们也知道，房颤肯定不全部是由饮酒导致的，还受年龄、BMI等有影响。

于是作者根据专业，讲年龄分为>60y与≤60y两个亚组，分别在各自亚组研究饮酒（x1）与房颤（y）的关系。结果发现，只有在>60y组，每天饮酒>2drinks/d相对于不饮酒的人群而言，发生房颤的风险为OR：1.91[1.22,2.97]。

然后，作者有做了一个P for interaction。研究年龄（X2）和饮酒（x1）之间对房颤（y）的发生有没有交互作用。

如果没有，那ok，上面的解释没有问题。年龄与饮酒之间无交互作用，只有在>60y组，每天饮酒>2drinks/d相对于不饮酒的人群而言，发生房颤的风险OR：1.91[1.22,2.97]。分析思路顺畅，结果良好。

如果有，若数据没问题，分析没问题，那么恭喜你，你发现了一个很好的亮点，或者简单的说，你发现了一种特定的人群，该人群的发病风险很高或者很低（看你的研究了）。

也许您会说，怎么可能就研究这两个因素呢，还有其他好多因素呢。呵呵，是的，那些因素你依然可以放入模型进行控制，都不影响的。

如何算呢？

目前计算P for interaction两种方法：

1.对于数值与等级或二分类，可以直接模型中增加相乘项【如x1×X2】，然后看交互项有无意义。

2.而对于多项分类【如血型】，产生哑变量后，相乘则会产生多个交互项，此时不能整体判断交互作用是否有意义。我们可以先构建一个无交互作用项的模型，再构建一个有交互作用项的模型。然后采用似然比检验（likelihood ratio test）进行比较有个模型差异，则可以判定交互项整体是否有意义。

统计学研究，单因素是研究基础，多因素是规定套路，交互作用是研究亮点。

统计根据建模目的，可分为3类模型，第一种为找风险，建模寻找各种风险因子；第二种为验证风险，即为了证明X和Y有关；第三种为预测，如近年流行的临床预测模型。今天所讲的属于验证风险模型。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：松哥精鼎统计 > 《待分类》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

松哥精鼎统计

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换