一张神图，解决科研统计80%的问题。

生物_医药_科研 2019-08-05

展开全文

我的统计学一直就是稀里糊涂的状态。
大部分情况都是用的t检验，
所有分析都只看得懂p值。

所以，我买了很多统计学的书籍，一本接一本，有很多都没拆封，看不下去。
而我，则没有任何焦虑，静静等待神奇时刻的出现。

这种神奇时刻，曾经在我的生命中，出现多次。
比如，大学看到了这一句

人与人之间的相处，本质上是资源的互换。

从那之后，我做的所有事情，都是在积累资源，我要成为一个能跟别人互换资源的人。这种资源，可以是一个技能，也可以是一件物品，或者是钱财。

又比如，财务思维课里的这句：

花出去的钱，如果能赚钱，那就不叫消费，属于资产。

那以后，买书简直如山倒，因为我不再追求看完，而是对自己说：

如果一本50块钱的书，里面的任何一句话，让我赚回了50块钱，那么这本书就是白捡的。

买其他东西的时候也是一样，如果是刚需，再贵也得买。

学习R语言也是一样，徘徊两三年没有学会，但是因为要去培训，一个月每天10小时，最终入门了，这其中，tidyverse这个包起到了很大作用，所以我称他为神包。

而对于让人懵圈的统计，我也是在等待，终于，这一周让我碰到了一张神图，他的出现让我觉得，统计学可以入门了。

这张图的原始链接在这里
http://blog.sciencenet.cn/blog-651374-985834.html

我在科研中用到统计学，80%的情况都是比较差异。而这张图中给出了多组数据求差异的流程图，我看过后，那些以前的只言片语，零星记忆都串联在了一起。
1.我们手上的数据，要首先判断是否是正态分布，方差齐不齐
2.假如是正态分布，而且方差齐，就用参数检验，此时要看究竟有几组数据
3.如果是两组，这种情况很常见，就用t检验
4.如果多组，比如基因在癌症中四个亚型中表达，要用方差分析
5.如果没有差异就算了，如果有差异，还要进行事后检验( post-hoc test )
6.事后检验有多种需求，如果是4组，理论上两两比较需要6次，假如我以其中一个作为对照只要3次，这两种情况用的统计方法也不一样。
7.假如一开始数据不是正态分布，或者方差不齐，那么可以用数据变换的方式把数据变成正态方差齐性数据，也可以用非参数检验。
8.如果数据只有两组，用Mann-Whitney U test，这个才文章中比较常见。
9.如果是多组，要用到Kruskal-walls检验，如果有差异，也需要进行事后检验( post-hoc test )，而且也有一系列方法可供选择。

这样，框架就搭建起来了，这张图里面，看不懂的检验名称去检索一下就可以。
要理解这个框架，我有一个教程推荐，是协和八公众号出的，60篇帖子，写了三年，十分适合此刻的我，虽然我已经看了四年，但是都抵不上看了神图后理解的快。
链接在这里：
说人话的统计学——终点·起点 | 协和八

接下来，我要做的事情，就是用R语言完成里面提到的所有统计分析，而统计是R语言的看家本领啊。
在这方面，我有两本参考书籍，都是用R语言帮助科研工作者理解统计学的免费教程。
An R Companion for the Handbook of Biological Statistics
https:///rcompanion/index.html
还有一本
Learning statistics with R
https:///book/

要强调一句的是，每个人的学习习惯都不一样，如果你觉得这个图平淡无奇