我的统计学一直就是稀里糊涂的状态。 大部分情况都是用的t检验, 所有分析都只看得懂p值。
所以,我买了很多统计学的书籍,一本接一本,有很多都没拆封,看不下去。 而我,则没有任何焦虑,静静等待神奇时刻的出现。
这种神奇时刻,曾经在我的生命中,出现多次。 比如,大学看到了这一句
人与人之间的相处,本质上是资源的互换。
从那之后,我做的所有事情,都是在积累资源,我要成为一个能跟别人互换资源的人。这种资源,可以是一个技能,也可以是一件物品,或者是钱财。
又比如,财务思维课里的这句:
花出去的钱,如果能赚钱,那就不叫消费,属于资产。
那以后,买书简直如山倒,因为我不再追求看完,而是对自己说:
如果一本50块钱的书,里面的任何一句话,让我赚回了50块钱,那么这本书就是白捡的。
买其他东西的时候也是一样,如果是刚需,再贵也得买。
学习R语言也是一样,徘徊两三年没有学会,但是因为要去培训,一个月每天10小时,最终入门了,这其中,tidyverse
这个包 起到了很大作用,所以我称他为神包。
而对于让人懵圈的统计,我也是在等待,终于,这一周让我碰到了一张神图,他的出现让我觉得,统计学可以入门了。
这张图的原始链接在这里 http://blog.sciencenet.cn/blog-651374-985834.html
我在科研中用到统计学,80%的情况都是比较差异。而这张图中给出了多组数据求差异的流程图,我看过后,那些以前的只言片语,零星记忆都串联在了一起。1. 我们手上的数据,要首先判断是否是正态分布,方差齐不齐2. 假如是正态分布,而且方差齐,就用参数检验,此时要看究竟有几组数据3. 如果是两组,这种情况很常见,就用t检验4. 如果多组,比如基因在癌症中四个亚型中表达,要用方差分析5. 如果没有差异就算了,如果有差异,还要进行事后检验 ( post-hoc test )6. 事后检验有多种需求,如果是4组,理论上两两比较需要6次,假如我以其中一个作为对照只要3次,这两种情况用的统计方法也不一样。7. 假如一开始数据不是正态分布,或者方差不齐,那么可以用数据变换的方式把数据变成正态方差齐性数据,也可以用非参数检验。8. 如果数据只有两组,用Mann-Whitney U test,这个才文章中比较常见。9. 如果是多组,要用到Kruskal-walls检验,如果有差异,也需要进行事后检验 ( post-hoc test ),而且也有一系列方法可供选择。
这样,框架就搭建起来了,这张图里面,看不懂的检验名称去检索一下就可以。 要理解这个框架,我有一个教程推荐,是协和八公众号出的,60篇帖子,写了三年,十分适合此刻的我,虽然我已经看了四年,但是都抵不上看了神图后理解的快。 链接在这里:说人话的统计学——终点·起点 | 协和八
接下来,我要做的事情,就是用R语言完成里面提到的所有统计分析,而统计是R语言的看家本领啊。 在这方面,我有两本参考书籍,都是用R语言帮助科研工作者理解统计学的免费教程。An R Companion for the Handbook of Biological Statistics https:///rcompanion/index.html 还有一本Learning statistics with R https:///book/
要强调一句的是,每个人的学习习惯都不一样,如果你觉得这个图平淡无奇