P值和她的小伙伴们

豆包规划 2016-01-18

展开全文

为什么是P值和“她”的小伙伴，却不是“他”的小伙伴？

大概用一句话就能解释通吧：女人心，海底针！

Wiki上有幅图，本号之前群发过，您还记得吗？

P值：在0假设满足的前提下，出现观察相（以及更极端情况）的概率。

所以，这幅图上半部分的important就很值得回味。仔细体会下吧。^_^

简单设想一下，哪怕是一模一样的人群或样本，就是说，H0，零假设绝对满足，那么多次抽样，也会有p值很小的情况出现。对吧？小概率事件，也是概率嘛。何况还是大到5%的概率。

一旦出现了，那就是假阳性出现！这也是我们α值（一类错误）的意义：对假阳性情况发生的容忍情况。

——这一段不能再讲太深，后面就是假设检验，Power和样本量的问题了。暂且搁置。我们聊正题，P的小伙伴们。

P值的小伙伴们

昨天听了微信群里的一个统计讲座，讲者将OR、HR列为了P值的小伙伴。

小编不认可这样的归类。

P值的小伙伴，最起码也应该是置信区间！如果非要跟OR，HR扯上关系，那也是跟OR和HR的置信区间有关系！

那么，P值都有哪些小伙伴？

——这一段也可以换成，

“如何给论文数据造假而不被识破？” ，或者，

“如何识破论文数据造假？” ，或者，

“如何hold住P值的小伙伴们？”，

^_^

下面的论述不经考证了哈，乱弹。

读者如果有更详细全面客观的见解，可以在文末留言，我会显示出来。

第一阶段，只报告P值是否小于0.05。

最开始，我们写论文，直接汇报一个“P＜0.05”，或者“P＜0.01”就好了，然后解释成“差异有统计学意义”，“差异有显著的统计学意义”。

这个阶段，大把造假文章哦。很多作者根本就不会用软件，不会求P值，觉得差的挺大，写吧！“P＜0.05”，或者“P＜0.01”就堂而皇之的上了论文。

第二阶段，增加假设检验统计量。

后来，学者们慢慢觉得这样太简单粗暴，信息量也不够了。所以，有增加了新的信息量，t值，F值，卡方值，等等；P，也不能只说小于多少了，而要表明它具体值是多少。

所以后来我们写论文列表，就单独给假设检验统计量留出了一行或者一列，报告t值，F值，卡方值！后面再跟一排P值，等于零点零几几。（其实这些也不够，不报告自由度，这些值也无从验证啊。当然，根据表格上下文信息，自由度也可以推算出来。）

很奇葩啊，小编就审过一篇稿件，还是小编师姐的一篇文章，做表没问题，t值，P值。问题是，t值等于1.6吧假如（t = 1.60），后面也写P小于0.05！姐姐！这种行为非常危险啊！这是自掘坟墓啊！

虽说t界值与自由度有关，但是，哪怕样本量/自由度特别大，t值至少也要达到1.96，P值才可能小于0.05。当n=3时，基本上t值要超过2点几，P值才能显著！所以，出现上述情况，有经验的审稿人都不用查表或者重运算，直接就可以给你拒稿了！

所以，这一段的结论是：

t值，F值，Chi2值等等，都是P值的小伙伴。
给定自由度下，几者与P值孟不离焦，焦不离孟！
果真要编数据，先要hold住P值的这几个小伙伴。

第三阶段，置信区间崇拜。

置信区间的广泛使用，应该是一个很大的进步了。

前面两个阶段，都是用P来展示结果，最后报告差异有没有统计学意义。但是，差异都到底多大呢？不知道！

做了研究，不知道差异多大，那可不行啊。

我们说，一个药物可以降血压，确实可以降，真的。平均每人降1mmHg，有意思吗？虽然大样本情况下，降1mmHg也可以获得很小的P值啊，但是，这个药物没啥意思嘛！你会用吗？

为了展示这种差异，我们经常使用点估计。就像上段，1mmHg，这样一个数据值，就是点估计。

但我们统计学是一门表达不确定性的科学啊。这个血压降低的范围是多大呢？

为了展示这个，我们就有了标准误（SE），置信区间（95% CI）的使用。理想情况下（正态or大样本，等等），两者可以互相转换。

而这个95%CI，就是我们这段的主题，她，也是P值的小伙伴！

如果我们在做两种药效的比较，那么两种药效差异的95%CI，如果跨越0，就是说差异没有统计学意义，P大于0.05。如果排除了0，那这个差异就有统计学意义。

而对于OR，RR，HR，因为她们都是比值，所以她们是以1作为参考，跨越了1，就没有统计学意义；上下界都大于1，或者都小于1，就有统计学意义。

所以，想编数据的小朋友们注意啦！审稿抓捏造的老朋友们也注意啦！

置信区间，也是P值的小伙伴。
SE、CI、P值相互依存。
想捏造P值，还要调整好SE、CI！

当然，如前所说，我们论文中会同时报告点估计值和区间估计值的。那么就提供了效应量的信息。但这不是本文的重点，暂且搁置。

通过“瞪”图片，来预测P值！

上面，我们了解了P值的几个小伙伴，再教大家一个目视法做统计的小技巧。

试验狗们作图，很喜欢用Bar，用折线，特别喜欢在上面补充一个errorbar。就是加一个标准误大小的指示了。如图：

图中芒刺，就是上下各一个标准误（SE）。

那么我们如何通过“瞪”图片，来预测P值呢？

其实很简单，上图中，就看两个组的errorbar是否重叠！粗估：

有重叠，差异没有统计学意义。
没有重叠，差异有统计学意义。

为什么是粗估呢？因为，1，我们这里是使用了两组的SE，现实中，我们要使用两组合并的SE，是一个类似均数的调和值；2，我们在两组均值之内，使用了两组SE，实际上是SE*2，实际上，根据自由度，界值应该以SE*1.96或者稍大一点点为准。

Anyway，据图，我们可以大概推测一下P值是否显著，而不用非得动手去实现。这一段，大概也说明了：

SE，也是P值的小伙伴！

今天闲话就到这里吧，希望对大家有用。

感谢转发推荐！感谢赞赏！

PS：回头小编有空了，给大家介绍下伪造数据的常用方法和高阶方法，供大家引以为戒。当然，如果本文收的赞赏很少，或许也就说明大家没兴趣抓“伪造”吧。因为小编认为：

赞赏数，是大家兴趣值的小伙伴！

医学统计分析精粹

实用靠谱统计学，关注小号！

长按识别二维码→马上关注

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：豆包规划 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

豆包规划

关注对话

TA的最新馆藏

一张图搞明白分类资料的组间比较方法
统计学常用概念：T检验、F检验、卡方检验、P值、自由度(统计学,方差,自由度,卡方检验)
[转]t检验、u检验、卡方检验、F检验、方差分析_xinyan
方差分析(方差分析,总体均数,变异,样本均数)
通俗理解T检验与F检验的区别_一抹新绿
P值和她的小伙伴们

喜欢该文的人也喜欢更多

热门阅读换一换