一、10名15岁中学生身高体重数据如下:(1.sav) 编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 性别 | 男 | 男 | 男 | 男 | 男 | 女 | 女 | 女 | 女 | 女 | 身高(cm) | 166.0 | 169.0 | 170.0 | 165.1 | 172.0 | 159.4 | 161.3 | 158.0 | 158.6 | 169.0 | 体重(kg) | 57.0 | 58.5 | 51.0 | 58.0 | 55.0 | 44.7 | 45.4 | 44.3 | 42.8 | 51.5 |
体重指数(BMI)=体重(kg) / 身高(m)2,即体重(kg)除以身高(m)的平方。回答下列问题: (1)男生体重指数的均数为 19.74 (kg/m2) ;标准差为: 1.54 (kg/m2) (2)女生体重指数的均数为 17.57 (kg/m2) ;标准差为: 0.38 (kg/m2) 参考:用Compute过程 bmi = kg /(cm / 100) ** 2 ; Mean,性别为分组变量 二、将126例十二指肠球部溃疡病人随机分为两组。甲药组治疗62人,54人有效;乙药组治疗64人,44人有效。问两种药物的治疗效果有无差别?(2.sav) 1. 选用SPSS过程:Weight cases, AnalyzeèDescriptive StatisticsèCrosstabs 。 2. SPSS的结果与解释(包括检验方法、统计量、P值和统计推断): 经c2检验,c2=6.13,P = 0.013。 可认为两种药物的治疗效果有差别, 即甲药疗效(90.0%)优于乙药(68.8%)。 三、为研究口服二号避孕药对血液凝固的影响,随机抽取服药组10例,对照组10例,分别测定其抗凝血酶活力(u)如下。问服用二号避孕药对抗凝血酶活力是否有影响?(3.sav) 口服二号避孕药对血液凝固的影响 服药组 | 126 | 135 | 136 | 143 | 141 | 138 | 142 | 116 | 110 | 108 | 对照组 | 150 | 140 | 135 | 138 | 150 | 138 | 150 | 160 | 140 | 150 |
1. 选用SPSS过程:AnalyzeèCompare meansèIndependent-Sample T test 。 2. SPSS的结果与解释(包括H0、H1、α、检验方法、检验统计量、P值和统计推断): H0 :m1=m2 H1 : m1≠m2 a=0.05 (如果是配对t检验 H0 :md=0) 服药组和对照组的抗凝血酶活力均数分别为129.5(u)和145.1(u)。经成组t检验,t = 3.14,P = 0.007。按a=0.05水准,拒绝H0 , 可认为服用二号避孕药对抗凝血酶活力有影响。该药使抗凝血酶活力降低。两总体均数之差的95%可信区间为(-26.23,4.97)(u) 四、某单位欲研究3种药物对小白鼠肉瘤的抑制作用,将性别相同、体重相近的同一配伍组的3只小白鼠分别用3种药物抑癌,共5个配伍组。实验结果得瘤重(克)如下。试比较3种药物的抑癌作用有无差别? 三种药物的抑癌作用(瘤重:克) 配伍组 | A | B | C | 1 | 0.80 | 0.36 | 0.28 | 2 | 0.74 | 0.50 | 0.36 | 3 | 0.31 | 0.20 | 0.25 | 4 | 0.48 | 0.18 | 0.22 | 5 | 0.76 | 0.26 | 0.30 |
1. 选用SPSS过程:Analyzeè General Linear Modelè Univariate 2. SPSS的结果与解释(包括检验方法、统计量、P值和统计推断): A、B、C三种药物的瘤重均数(克)分别为: 0.62, 0.30和0.28。经随机区组设计资料的方差分析,F = 16.43,P = 0.001。可认为3种药物的抑癌作用有差别。 经多个样本均数间每两个均数的比较的q检验,按a=0.05水准,可认为B和C药的抑抑癌作用大于A药,但还不能认为B和C药的抑癌作用有差别(P=0.79)。 五、某医院用A、B两种配方治疗慢性阑尾炎,治疗结果如下。试分析两种配方治疗慢性阑尾炎的疗效有无差别? 两种配方治疗慢性阑尾炎疗效 组别 | 无效 | 好转 | 显效 | 治愈 | 合计 | A配方 | 8 | 23 | 28 | 33 | 92 | B配方 | 12 | 26 | 16 | 24 | 78 |
1. 选用SPSS过程:AnalyzeèNonparametric Test è2 Independent Samples。 2. SPSS的结果与解释(包括检验方法、统计量、P值和统计推断): 经成组设计两样本比较的秩和检验,Z=1.63, P=0.102。尚不能认为两种配方治疗慢性阑尾炎的疗效有差别。 六、两组儿童横纹肌肉瘤治疗后复发时间(月数)如下。对照组为“摘除+放疗”,处理组为“摘除+放疗+化疗”。试进行生存分析:(1)分别计算两组的生存率;(2)比较两组生存率曲线有无差别? 对照组 | 2 | 3 | 9 | 10 | 10 | 12 | 15 | 15 | 16+ | 18 | 24 | 30 | 36+ | 40+ | 45+ | 处理组 | 9 | 12+ | 16 | 18 | 19+ | 20 | 20+ | 24 | 24+ | 30+ | 31+ | 34+ | 42+ | 44+ | 53+ |
1. 选用SPSS过程: AnalyzeèSurvival è Kaplan-Meier 。 2. SPSS的结果与解释 (1)24个月时的生存率:对照组为 31.11% ;处理组为 62.19% 。 (2)两条生存率曲线 无 交叉,经 Log-rank 检验,c2= 5.26 ,P= 0.022 , 说明处理组缓解率高于对照组。 七、10名不同年龄妇女(岁)的收缩压测定值(kPa)如下,试进行回归分析。 妇女号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 7 | 9 | 10 | 年龄Xi | 56 | 42 | 72 | 36 | 63 | 47 | 55 | 49 | 38 | 42 | 收缩压Yi | 19.6 | 16.7 | 21.3 | 15.7 | 19.8 | 17.1 | 20.0 | 19.3 | 15.3 | 18.7 |
1. 选用SPSS过程: AnalyzeèLinear 。 2. SPSS的结果与解释 (1)以收缩压为应变量Y,年龄为自变量X建立直线回归方程: 。 (2)计算回归系数b,并进行假设检验:b = 0.156 ,t = 5.55 , P = 0.001 。 (3)相关系数r = 0.891 ;确定系数 = 0.794 。 (4)总体回归系数的95%可信区间:0.091~0.221 (5)当X=55时, = 19.13 ,个体Y值的95%容许区间为(16.76,21.51)(kPa)。
SPSS问卷分析---编码录入及描述统计详解(转)问卷调查的方法用得很广泛,对于没有接触过spss的人第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS的同学也能做简单的分析。后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。自己写的,错误之处请指正,
调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一 区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal是指定类;二 注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 1 单选题:答案只能有一个选项 例一 当前贵组织机构是否设有面向组织的职业生涯规划系统? A有 B 正在开创 C没有 D曾经有过但已中断 编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。 录入:录入选项对应值,如选C则录入3 2 多选题:答案可以有多个选项,其中又有项数不定多选和项数定多选。 (1)方法一(二分法): 例二 贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把所有提示 考虑在内。 A月薪员工 B日薪员工 C钟点工 编码:把每一个相应选项定义为一个变量,每一个变量Value值均如下定义:“0” 未选,“1” 选。 录入:被调查者选了的选项录入1、没选录入0,如选择被调查者选AC,则三个变量分别录入为1、0、1。 (2)方法二: 例三 你认为开展保持党员先进性教育活动的最重要的目标是那三项: 1( ) 2 ( ) 3( ) A、提高党员素质 B、加强基层组织 C、坚持发扬民主 D、激发创业热情 E、服务人民群众 F、促进各项工作 编码:定义三个变量分别代表题目中的1、2、3三个括号,三个变量Value值均同样的以对应的选项定义,即:“1” A,“2” B,“3” C,“4” D,“5” E,“6” F 录入:录入的数值1、2、3、4、5、6分别代表选项ABCDEF,相应录入到每个括号对应的变量下。如被调查者三个括号分别选ACF,则在三个变量下分别录入1、3、6。 注:能用方法二编码的多选题也能用方法编码,但是项数不定的多选只能用二分法,即方法一是多选题一般处理方法。 3 排序题: 对选项重要性进行排序 例四 您购买商品时在 ①品牌 ②流行 ③质量 ④实用 ⑤价格 中对它们的关注程度先后顺序是(请填代号重新排列) 第一位 第二位 第三位 第四位 第五位 二、编码:定义五个变量,分别可以代表第一位 第五位,每个变量的Value都做如下定义:“1” 品牌,“2” 流行,“3” 质量,“4” 实用,“5” 价格 录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。 4 选择排序题: 例五 把例三中的问题改为“你认为开展保持党员先进性教育活动的最重 的目标是那三项,并按重要性从高到低排序”,选项不变。 编码:以ABCDEF6个选项分别对应定义6个变量,每个变量的Value都做同样的如下定义:“1” 未选,“2” 排第一,“3” 排第二,“4” 排第三。 录入:以变量的Value值录入。比如三个括号里分别选的是 ECF,则该题的6个变量的值应该分别录入:1(代表A选项未选)、1、 3(代表C选项排在第二)、1、2、4。 注:该方法是对多选题和排序题的方法结合的一种方法,对一般排序题(例四)也同样适用,只是两者用的分析方法不同(例四用频数分析、例五用描述分析),输出结果从不同的侧面反映问题的重要性(前一种方法从位次从变量的频数看排序,后一种方法从变量出发看排序)。 5 开放性数值题和量表题:这类题目要求被调查者自己填入数值,或者打分 例六 你的年龄(实岁):______ 编码:一个变量,不定义Value值 录入:即录入被调查者实际填入的数值。 6开放性文字题: 如果可能的话可以按照含义相似的答案进行编码,转换成为封闭式选项进行分析。如果答案内容较为丰富、不容易归类的,应对这类问题直接做定性分析。
三 问卷一般性分析 下面具体介绍SPSS中问卷的一般处理方法,操作以版本spss13.0为例 ,以下提到的菜单项均在Analyze主菜单下 1频数分析:Frequencies过程可以做单变量的频数分布表;显示数据文件中由用户指定的变量的特定值发生的频数;获得某些描述统计量和描述数值范围的统计量。 适用范围:单选题(例一),排序题(例四),多选题的方法二(例三) 频数分析也是问卷分析中最常用的方法。 实现: Descriptive statistics……Frequencies 2 描述分析:Descriptives:过程可以计算单变量的描述统计量。这些述统计量有平均值、算术和、标准差,最大值、最小值、方差、范围和平均数标准误等。 适用范围:选择并排序题(例五)、开放性数值题(例六)。 实现: Descriptive statistics……Descriptives,需要的统计量点击按钮Statistics…中选择 3 多重反应下的频次分析: 适用范围:多选题的二分法(例二) 实现:第一步在Multiple Response……Define Sets把一道多选问题中定义了的所有变量集合在一起,给新的集合变量取名,在Dichotomies Counted value中输入1。第二步在Multiple Response……Frequencies中做频数分析。 4 交叉频数分析:解决对多变量的各水平组合的频数分析的问题 适用范围:,适用于由两个或两个以上变量进行交叉分类形成的列联表,对变量之间的关联性进行分析。比如要知道不同工作性质的人上班使用交通工具的情况,可以通过交叉分析得到一个二维频数表则一目了然。 实现:第一步根据分析的目的来确定交叉分析的选项,确定控制变量和解释变量(如上例中不同工作性质的人是控制变量,使用交通工具是解释变量)。第二步选择Descriptive statistics……Crosstabs
四 简单图形描述介绍 在做上述频数分析、描述分析等分析时就可以直接做出图形,简单方便,同时也可以另外作图。SPSS的作图功能在菜单Graphs下,功能强大,图形清晰优美。现在把常用图简单介绍如下 1饼图:又称圆图,是以圆的面积代表被研究对象的总体,按各构成部分占总体比重的大小把圆面积分割成若干扇形,用以表示现象的部分对总体的比例关系的统计图。频数分析的结果宜用饼图表示。 2曲线图:是用线段的升降来说明数据变动情况的一种统计图。它主要表示现象在时间上的变化趋势、现象的分配情况和2个现象的依存关系等。 3面积图:用线段下的阴影面积来强调现象变化的统计图。 4条形图:利用相同宽度条形的长短或高低表现统计数据大小及变化的统计图。
五 问卷深入分析 除了以上简单的分析,spss强大的功能还可以对问卷进行深入分析,比如常用的有聚类分析、交叉分析、因子分析、均值比分析(参数检验)、相关分析、回归分析等。因为涉及到很专业的统计知识,下面只将个人觉得比较有用的方法的适用范围和分析目的简单做介绍: 1聚类分析 样本聚类,可以将被调查者分类,并按照这些属性计算各类的比例,以便明确研究所关心的群体。比如按消费特征对被调查者的进行聚类。 2 相关分析 相关分析是针对两变量或者多变量之间是否存在相关关系的分析方法,要根据变量不同特征选择不同的相关性的度量方式。问卷分析中的多数用的变量都属于分类变量,要采用斯皮尔曼相关系数。 其中可以用卡方检验,其是对两变量之间是否具有显著性影响的分析方法 3均值的比较与检验 (1)Means过程:对指定变量综合描述分析,分组计算计算均值再比较。比如可以按性别变量分为男和女来研究二者收入是否存在差距。 (2)T 检验: 独立样本t检验用于不相关的样本是否开来自具有相同均值的总体的检验。比如,研究购买该产品的顾客和不购买的顾客的收入是否有明显差异。 如果样本不独立则要用配对t检验。比如研究参加职业培训后 工作效率是否提高。 4 回归分析 问卷分析中的回归分析常采用的是用离散回归模型,一般是逻辑斯蒂模型,解释一个变量对另一变量的影响具体有多大。比如,研究对某商品的消费受收入的影响程度。
|