分享

连续变量假设检验 之 两独立样本t检验

 taotao_2016 2020-12-07

统计概述

前面一节讲到的是单样本t检验是针对一个样本与已知总体样本均值之间的检验,但在实际工作中,我们会遇到两个样本之间的均值检验,这个如何解决呢?我们有法宝,SPSS提供的两独立样本t检验。

两独立样本t检验的目的:两个样本在相互独立的前提下,检验两个样本的总体均数是否存在显著性差异。尤其当两组样本量相等时,两个样本均数之差的抽样误差最小,检验效能最高。需满足条件:

  • 独立性:各观察值之间是相互独立的,不能相互影响
  • 正态性:各个样本均来自于正态分布的总体
  • 方差齐性:各个样本所在总体方差相等

在实际应用中,独立性对结果影响较大,但检验数据独立性的方法较复杂,一般都是根据资料的性质加以判断,如遗传性基本、传染病数据可能存在非独立的问题。如果从专业背景上可以肯定数据不存在这些问题,则一般独立性总是能够满足的

由上描述可见,两独立样本t检验所需的是两组样本,这两组样本获取有两种可能:

  • 第一:随机分组,如60只SD大鼠,随机分为2组,每组30只,分别接受不同的处理,然后比较不同指标差异
  • 第二:按照某种属性特征进行分组,如班级可分为男性与女性,然后比较男女之间的成绩差异

SPSS实现

示例:采用完全随机设计的方法,将19只体重、出生日期等相仿的小白鼠随机分为两组,其中一组喂养高蛋白饲料,另一组喂养低蛋白饲料,然后观察喂养8周后各小白鼠所增体重(mg)情况,问两组膳食对小白鼠增加体重是否相同?

连续变量假设检验 之 两独立样本t检验

1. 建立假设:建立检验假设,确定检验水准 α

  • H0: μ1= μ2,即高蛋白组与低蛋白组所增体重的总体均数相同
  • H1: μ1 ≠ μ2 ,即高蛋白组与低蛋白组所增体重的总体均数不同
  • α = 0.05,即置信区间为95%

2. 检验数据是否符合 正态分布

  • 打开 分析—描述统计—探索
  • 输出结果与说明
连续变量假设检验 之 两独立样本t检验

从上表可看出,高蛋白组和低蛋白组的P均大于0.05,说明两组数据呈正态分布

3. 独立样本t检验

(1) 打开 分析—比较平均值—独立样本t检验

连续变量假设检验 之 两独立样本t检验

(2) 参数说明

  • 检验变量:进行t检验的目标变量,变量值为数值型
  • 分组变量:用于对检验变量进行分组,为分类变量
  • 定义组---使用指定值:在组1、组2中输入分组变量值
  • 定义组---分割点:通过分割点将分组变量分为两组,一组大于等于分割点数量,一组小于分割点数量
  • 选项:设定置信区间和缺失值处理方式
连续变量假设检验 之 两独立样本t检验

(3) 输出结果与说明

  • 基本统计量:在下表中列出了样本量、平均值、标准差和标准误。
连续变量假设检验 之 两独立样本t检验
  • 两独立样本t检验

在独立样本检验表格中,前两列是Levenes方法对两组数据进行方差齐性检验的结果,可看出F=0.035,p=0.853>0.05,所以显示两组数据的方差齐

后面7列是对两组数据均数比较t检验的结果,分为两行,第一行对应的是方差齐的结果,下面一行对应的是方差不齐的结果。

本次数据是方差齐,所以查看第一行结果,t=2.045,df=17,显著性p=0.057>0.05,所以可认为高蛋白组和低蛋白组小白鼠之间体重增加量的差别无统计意义

高蛋白组和低蛋白组的平均值差值为19.6,标准为9.58;两总体均数差值的95%置信区间[-0.61748, 39.81748]。在默认状态下,SPSS计算的是95%置信区间。

连续变量假设检验 之 两独立样本t检验

4. 语法

T-TEST GROUPS=group(1 2)  /MISSING=ANALYSIS  /VARIABLES=weight  /CRITERIA=CI(.95).

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多