分享

3000字统计学入门——假装懂教育统计学

 赵数理 2023-04-13 发布于上海

教育学专业的孩子大多是文科生,数学知识略少一点,但教育实践和研究中经常会用到一些统计学知识。

就像我们要学会开车,但不需要弄懂汽车内部的原理一样,我们不需要把统计的数学原理搞清楚,只需要明白基本概念和统计软件的操作与结果解释就可以了。

太复杂的统计,学懂了很难,而且没有必要,但有些数学好的人用复杂的统计模型研究教育问题,“显得很厉害”,这种炫技其实大可不必。我的原则是,能用简单方法解决的问题,就不用复杂方法;能用一句话解释清楚的问题,绝不多说一个字。

大学时赵老师学过《概率论与数理统计》,但考完了就全忘了。最近几天回顾了一些统计基础,在此略做梳理。

一、基本概念

1.算数平均数

2.加权平均数

3.几何平均数

4.中位数

5.百分位数

6.众数

7.全距(极差)-四分位距-百分位距

8.方差-标准差

9.差异系数:标准差除以平均数

10.频数与频率及概率

11.样本的数据特征叫统计量

12.对统计量进行分析叫描述统计

13.总体的数据特征叫参数

14.由样本的统计量推断总体参数叫推断统计

15.概率抽样方法:完全随机抽样、系统抽样、分层抽样、整群抽样等

16.非概率抽样方法:滚雪球抽样、定额抽样、方便抽样、立意抽样、空间抽样等

17.其他(正态分布、偏度、峰度等)

以上有不清楚的,百度或查书皆可

二、抽样分布与推断基础

1.抽样分布是推断统计的理论基础,一个最有名的公式叫“中心极限定理”:一切可能样本的平均数之平均数等于总体的平均数。

有点绕,我卖个关子,作为课后题,希望有课代表在文末留言区举例解释一下。

2.点估计:用样本统计量的值来估计总体参数的值叫做总体参数的点估计,但很难说点估计是准确的

3.区间估计:以样本统计量的抽样分布为理论依据,按一定的概率要求,由样本统计量的值估计总体参数值得所在范围,成为总体参数的区间估计。

大概长得这个样子:随机抽取某学校30名初二学生物理考试成绩,算出平均分92,如果知道全校所有人的方差就好了(不知道也没关系)……最后经过计算得出结论:有95%的把握认为全校平均分在89.5-93.7分之间,89.5和93.7分别叫95%的置信区间的置信下限和置信上限。(数是我瞎编的)

4.假设检验:通过例子来说,比如全省高三学生平均身高172cm,现在某市随机抽取200名高三学生,测得平均身高173.2cm,这200个样本的平均身高统计量比全省的参数高一些,但能否就此说明该市所有高三学生平均身高比全省高呢?

虽然是随机抽样,但难免有抽样造成的误差。这个时候就可以假设该市所有高三学生平均身高也是172cm,然后利用统计分析。

具体数学过程不需要懂,因为用软件操作即可,但基本思路要了解:如果统计分析发现,按照假设,从平均身高172的全市总体中随机抽200个样本,这些样本的平均数是173.2的概率小于1%(或5%),我们就认为,一次事件中小概率事件是不可能发生的,因此就可以认为原假设是错误的,我们有99%的把握认为,该市高三学生的平均身高比全身水平要高一点。(同上,数是瞎编的,以下的数也都是瞎编的)

三、t检验与方差分析

这两个方法一般用于连续变量的推断,常用于比较均值。

1.单样本t检验

一个样本,利用它的平均数,比如74,和另一个假设的数比如76,进行推断。假设该样本所属的总体的平均数也是76,看看这个概率在不在99%的置信区间。

2.独立样本t检验

两个独立的样本,通过这两个样本的平均数,来推断他们所来自的总体的平均数是否相同。

3.配对样本t检验

在医学中用的多,10个病人吃药以前测一些指标,吃药一个月后再测相同的指标,两次测量的数据构成一一对应的配对样本,统计后就知道这个药是否显著奏效。

4.方差分析

如果组数超过2组,t检验不好用了,就用方差分析。

比如四个农田,控制其他变量,施4种不同化肥,最后根据产量看看四种化肥是否有显著差异。只有化肥一个自变量,叫单因素方差分析。如果有两个自变量就叫双因素方差分析。

其他复杂的方差分析我没记住,需要的时候现查吧。

5.方差齐性:两个样本来自两个总体,这两个总体的方差没有显著差异就叫方差齐性,是以上推断的一个前提条件。但样本数很多的时候,往往默认方差齐性。

四、卡方检验

卡方检验的一般定义:通过样本的频数分布来推断总体分布是否满足某种假设的检验。

比如随机从某大学抽取50名男生和50名女生,发现男生中高数考试优秀率40%,女生中优秀率30%。

那么全校男生和女生的高数优秀率有多大可能相同呢?我们假设全校男生、女生优秀率相同,然后操作……最后给你个结果,其实就是假设成立的概率,如果小于1%,就可以果断拒绝原假设,全校男生优秀率有99%以上的可能要高于女生。

这个时候可能有同学问了,全校成绩这个东西,直接全都算进来不就OK了吗?

是的!统计推断肯定不如普查。

普查:所有研究对象都调查到,所得即所求。

但现实中,很多情况无法普查,需要人力物力时间太多,有时候也不可能。

比如想看看某手机屏幕抗压情况,从本次出厂的一万部手机中随机抽取7部,进行屏幕抗压实验,就可以大致了解了。你能把一万部手机都拿锤子砸了吗?

五、相关分析与回归分析

1.相关:两变量之间的不精确、不稳定的变化关系,且两变量地位相同。

相关系数为0是毫无关系,1是完全正相关,-1是完全负相关。

2.回归:一个自变量,一个因变量,表示因变量随自变量变化的关系。一般认为,回归比相关的准确性和稳定性高一些,但也不是精确的。

3.最小二乘法OLS,是常用的线性回归方法,就是让离差平方和最小。

4.相关,哪怕是回归方程,都不能表明因果关系,只是你的样本数据恰好符合该数学模型。判断因果需要用到对应领域的专业知识。

比如某同学物理成绩持续进步,同时他最近掉头发比较多,于是物理成绩和掉头发根数构成了正向相关,那么,我们能说这两件事有因果关系吗?可能需要物理老师和皮肤科的医生会诊一下。

六、主成分分析和因子分析

两者理念相似——降维。如果你一共测了十几个变量,分析起来太乱了,需要把十几个变量整合成几个综合指标。这两个方法在数学上有很多区别,但软件操作步骤基本相同。

比如你测量影响幸福感的因素有:身高、体重、年龄、学历、性别、健康情况、婚否、有无子女、职业、工资水平、家庭住址、宗教信仰、运动频率等,到底哪些因素影响幸福感呢,十几个变量太乱了……

经过一番整理,可能得出几个综合性指标将它们包含进去:身体特征(身高、体重、年龄、性别、健康、运动);家庭特征(婚否、子女、住址);社会角色(职业、工资、宗教信仰)。然后分析起来就方便了。

看这部分时经常看到“矩阵”、“特征值”这些词,我想起了将近十年前学的线性代数,都是泪啊。

七、信度和效度

信度:一致性、可靠性、稳定性。

你买个电子秤,第一次称120斤,第二次123斤,第三次118斤……这就叫没信度,没谱儿。

效果:有效性,测的是你想测的。

你退货又重新买了一个称,这次好了,连续称好几次都是120斤,这叫有信度。但是,你的真实体重其实是123斤。此时,我们说这个称信度很高但效度较低。

可见,信度是效度的必要非充分条件。

以上就是赵老师总结的教育统计学入门的概要。

难免有一些错误,欢迎留言指正。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多