分享

松哥带你打通统计任督二脉

 松哥精鼎统计 2020-10-23

精鼎48期SPSS统计软件实战训练营开班啦!

缘起

  学习最怕思路不清,当思路理清楚了,学习才是有效的学习,不然越努力,越失败。学到最后一脑子糊涂酱。

统计更是这样子的一门课程。很多人拼搏到感动自己,努力到最终放弃!松哥今天给大家理理思路!

松哥统计说

松哥带着大家从最简单的谈起,所讲的就是如下菜单几种分析的关系哦!

一、t检验

(1)2组数值变量之间比较,应该首选两独立样本t检验,这个大家应该都没问题对吧!

二、F检验

(2)相互独立3组数值变量之间比较,应该优先考虑单因素方差分析(ANOVA),这个也OK对吧!

(3)其实,第一步的两独立样本t检验,也可以用方差分析,只不过杀鸡不用牛刀,因此一般我们还是用方差分析,但如果有人用方差分析,你别一棒子把别人打死,说不对哦!

三、一般线性模型


(4)其实上面的t和F,都属于一般线性模型,因此也可以用一般线性模型去分析上述t和F的数据,一般线性模型是利用线性回归的原理,用回归解释的变异来解释干预措施的作用。

(5)一般线性模型条件为LINE,即线性、独立、正态和方差齐。其目标变量只能是数值变量。

(6)常见一般线性模型方法包括多种方差分析,随机区组F,析因设计F、正交F、协方差等等。

四、广义线性模型


(5)一般线性模型只能数值变量,我们科学研究的结局变量计数变量、等级变量、多分类和二分类。这几类变量原型是不符合线性的,因此不能直接运用一般线性模型。

(6)如果对上述变量进行变换,是变换后的形式符合正态分布,那么也可以进行线性模型,那么这种变量变换后进行线性模型就叫做广义线性模型。

(7)对于计数变量,一般取log变换;二分类变量、多分类、等级变量logit变换。

(8)条件:变换后数据符合上述LINE。

五、广义可加模型

(9)上述的所有,我们都还在围绕一根线打转转。很多变量之间的关系并不是线性关系那么简单,当我们走出线性的困扰,所谓的模型就叫做“广义可加模型”。至此似乎是统计的大道,但是这条道上发生了一个分支。

--------------------------------------------------------------------

六、广义估计方程

(10)前面广义线性模型,条件为LINE,I为independent,独立性,可是我们很多数据是不独立的,比如重复测量的数据,多次测量时间点之间是有相关性的。此时可以采用广义估计方程(GEE)。

(11)你会说,不是应该用重复测量数据方差分析嘛?是的,你如果知道这个说明你还有一定的基础。可是重复测量数据方差分析要求方差齐、不能有缺失值。可是这两点经常不满足。于是就可以采用广义估计方程。

(12)而且重复测量数据方差分析只能处理数值变量,我们研究结局还包括二分类、等级等等呢,方差分析是搞不定的。

(13)以后大家注意,方式方法上加上广义的,一般是指能够同时处理数值、计数、分类和等级各种资料。

七、多水平模型(MLM)

(14)多水平模型的称谓非常多,混合线性模型、分层线性模型,多水平线性模型等等。

(15)线性模型要求LINE,上述GEE只能解决重复测量的不独立,还有一种不独立是嵌套数据,或者叫分层数据。比如比较不同学校大学生的心理健康状况。那么大学生心理健康测量值(SCL-90评分)就是效应指标。但是此处有个问题。

每个学生都属于各自的班级,而每个班级有从属于某个学校。每个学校有每个学校的特色,每个班级也有班级的特色。如果我们直接以每个学生进入模型进行分析,那么就忽视了班级与学校的影响。

同一个班级学生是有相关性的,不独立。同理每一个学校的班级也是有相关性的,也不独立。OK啦。看来每个学生进入模型而忽视班级与学校的影响是不合适的。因为数据是相互分层的,因此叫做多水平模型。

(16)多水平模型可以处理各种资料,数值、分类、等级。


(17)上面的GEE只能处理重复测量资料;而多水平模型既可以处理重复测量资料、也可以处理分层嵌套数据。因此MLM比GEE强大。为什么MLM可以处理重复,因为对一个人的多次重复测量结果,其实就是嵌套在这个人的数据之下的。

其他

你也许又会问,那啥叫路径分析,结构方程模型,主成分与因子分析,聚类。那就是上述主线的一些研究目的的分支啦。愿意听的留言,松哥下期在唠叨唠叨!

松哥统计,武松是也

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多