分享

远程教育研究中的数据分析与SPSS的运用上

 niuyanying 2006-11-16

    一、介绍

    无论是质的研究,还是量的研究,对研究获取的资料

进行分析都是不可缺少的一环。质的研究收集的是定性

资料,量的研究收集的资料主要是量化数据。尽管所有数

据分析的基本目的都是相同的,但是,定性资料与量化数

据的分析方法却很不相同。对定性资料的分析是进行逻

辑归纳,是一个对观察记录所得资料进行逻辑分析的思

考过程;对量化数据则是采用数学方法,进行统计分析,

以统计术语呈现分析结果 

我们可以将计算全部交给计算机代劳,稍许等待,计算机就会按你的指

令输出结果。目前,电脑在教育、社会科学研究中的应用

仍在呈不断扩大之势。例如,利用计算机网络对学习者网

上学习动态进行跟踪和统计,可以研究学习者学习行为、

特征。也可以动态统计网上学习材料使用情况,实时了解

学生对学习材料的选择倾向等等,这样,远程教育研究的

实效性将得到很大提高。

    量化数据分析在远程教育研究中占有十分重要的地

位,无论是采用问卷调查,还是实验研究,收集到大量的

数据看起来可能杂乱无章,若不掌握相应的数据统计分

析技术,就很难对其总体做出评价判断,也就难以得出科

学的结论,在某种意义上说,数据统计水平直接影响量的

研究水平由于不少远程教育实践者和研究者对数据定

量分析技术缺乏足够了解,在研究设计和数据分析时,往

往只是考虑平均值、百分比等,难以对研究资料进行深度

挖掘,严重制约着远程教育研究的开展和研究水平的提

高,进而影响我国远程教育的实践。

    在定量研究中,计算机具有非常重要的作用,就好比

显微镜之于生物学,望远镜之于天文学一样。计算机技术

的普及,特别是一些统计软件,如SPSS,SAS的不断完善,

使数据统计分析不再让人望而生畏,枯燥、繁琐的数据计

    二、数据统计的类型

    量化数据统计分析的主要用处是:描述数据中什么

是典型的,什么不是;显示两个或多个变量间的差异和相

;确定样本中得出的结果不是由于偶然因素造成的,而

确实是反映了总体情况的可能性。

    为了进行量的研究设计和数据统计,我们需要了解

数据统计的类型,然后学习具体的统计技术。统计学

( Statistics)是描述、组织、综合、分析、以及解释量的资料

的方法或程序。通过统计处理可以将个别观察而得的数

据,整合成为团体的特征,形成原理、原则。数据统计技术

分为描述统计(Descriptive Statistics)和推论统计(Inferential

Statistics)两类。

    ()描述统计

    描述统计方法是将搜集来的大量资料数据,加以整

理、归纳和分组,简缩成易于处理和便于理解的形式,并

计算所得数据的各种统计量,如平均数、标准差、以及描

述有关事物或现象的分布情况、波动范围和相关程度等,

以揭示其特点和规律。

    描述统计至少具有以下特点:将资料转化为可统计

的数据,并呈现数据的分布、分类、图表;就事论事,不做

推论;描述统计是数据分析的基本形式,是解释量的研究

结果不可或缺的;描述统计也有其局限性,由描述统计获

得的结果只能解释说观察到的样本(团体)本身,不能推 

论到其他团体。

    ()推论统计

    推论统计是通过分析总体中部分样本的数据,达到

推测或预测总体性质的目的。由于许多研究问题,需要从

样本中获取的数据来预估总体的特征,因此,在这类研究

中常采用推论统计。推论统计至少具有以下特点:目的是

了解总体性质;已知推论未知,由部分推论到全体、或者

说由样本推论到总体。

    三、如何将资料转换成计算机能处理的格式

    无论是描述统计,还是推论统计,为了让电脑施展它

神奇的魔力,首先得让它读懂你所搜集的资料,而从不同

提问方式得到的资料,数据性质可能不同,因此,你可能

需要将所搜集的资料转换为统计软件能够读取和分析的

形式。将受访者的回答进行转换,以便电脑能够读懂的过

程就是“编码”。

    ()测量的量尺类型与编码

    搜集数据的一个步骤是测量(measurement ),通过测

量,将观察转化为数值,量化的数值用于计算机处理。测

量的量尺分为类别量尺、顺序量尺、等距量尺和等比量尺

四种类型。量尺性质不同,统计分析力一法上也有不同。

    I.类别量尺(nominal scale ):例如,将注册学生的学

历分为高中、专科、本科、硕士四类;将远程学习者就业状

况分为全职工作、临时工作和无工作等。类别量尺表示的

数字不可进行加、减、乘、除运算。

    类别量尺分为二分量尺、三分量尺和多分量尺。二分

量尺又分为真正二分量尺和人为二分量尺。真正二分量尺

如性别分为“男和女”,学习状况分为“在学和退学”,婚

姻状况分为“已婚和未婚”等等;人为二分量尺是将连续

自变量以人为方式分成二类,例如,将智力高低分为“智

能正常和智能不足”,成绩高低分为“合格和不合格”。

    2.顺序量尺(ordinal scale ):用以表示测量对象之间

的相对位置,相邻各等级间间隔不等。顺序量尺不能标示

对象之间的距离。最常用的是来克特(Liken)的等级法,

如,将学生身高分为5个等级,将辅导教师对某种教学活

动的态度分为“非常同意、同意、中立、不同意、非常不同

意”5个等级等。

    3.等距量尺(interval scale ):相邻各等级间的间隔相

等,但没有绝对零。例如,将学生年龄或者成绩分成若干

相等距离的若干段。

    4.等比量尺(ratio scale ):测量的结果以比例或百分

比表示,既有相对单位又有绝对零,具有可加性、可乘性。

例如,学习者用于上网学习时间占每周学习时间的比例

分为1/2, 1/3,1/4,1/5等。

    在使用SPSS进行数据分析中,需要定义变量的数据

性质是属于类别、顺序、还是等距、等比量尺,见图la

              1 SPSS数据编挥窗口中的变1毅据性质定又

      ()编码方法

    以上量尺在远程教育研究中经常用到,有些量尺获

取的数据电脑可以读懂,直接录人SPSS的数据表格中就

可以了,有些则不能。有的问题编码很容易,如受访者的

性别、学历、就业状况、所学专业等等,只需赋以不同的数

值即可,有的则需要根据研究的需要进行斟酌。

    以下是一项调查远程辅导教师的两个问卷题目,很

显然,对问题的很多回答电脑是不能直接读懂的。

    1,只要具备必要的软硬件条件,您会根据教学的

需要,在辅导活动中运用信息工具吗?

    A.肯定会B.

    C.中立D.不会E.肯定不会

    2,您认为将信息技术应用于远程辅导的主要障碍

(可多选题):

    A.工作任务繁重,时间和精力不够

    B.信息技术对教学的实质性帮助不大

    C.学校可用于教学的计算机、网络等设施不足

    D.学校缺少合适的课件和资料

    E.不知道如何找到合适的课件和资料

    F.不善于将教学意图用计算机来实现

    G,不会排除使用过程中遇到的软硬件故障

    H.其他

    I所示的问卷形式我们经常用到,通常这种问卷的

答案属于顺序资料,即数据表现为次序性,“非常同意”

反映出比“同意”更高层次的认同,“肯定会”比“会”反

映出更高层次的认同。如果你分别把数值‘`5,4,3,2,1"

分别编给5个答案选项,很明显,这就是按顺序量尺进行

编码了。

    但是,在判别资料数值量尺时,我们经常要面对答案

是属于顺序特性,还是差距特性的问题。实际上,对于问

卷的答案是“非常同意、同意、中立、不同意和非常不同

意”,或者“肯定会、会、中立、不会、肯定不会”,有时可定

义为顺序量尺,有时可根据研究的需要定义为等距量尺,

即把这些资料视为等距资料。如果受访者就20句相关的

句子或问题表示其同意程度,我们可以视这些评价为等

距量尺,把受访者对问题所圈选的数值相加,以作进一步

的资料分析。

 

 2所示的多选母项目如何编码呢?这样的间题的确

让不少人措手无策,或改用手工统计。实际上,SPSS

"Multiple response‘’分析功能能很好地解决这一间题。你

可以将每一个回答作为一个变量,回答“是”的定义为

..1 n,回答“否”定义为“0’,并将数据输入SPSS的“数据

编辑窗口”,见图2,然后,使用‘`Multiple iesponse‘’分析功

能,得出统计数据。

    SPSS为例,数据编辑窗口(SPSS Data Editor)就是

数据输人的表格,SPSS的数据编辑窗口又有数据界面(

3)和变量界面(4),数据界面和变金界面的菜单是一

致的。在数据界面,横向的每一栏是变量,纵向表示的是

样本(例如.调查的受访者,即本例中的每位受访的教师,

对应的是SPSS的一个Case )。你可以指定相应的变量名

(如图3中的“教龄”、“年龄”等),并输入每个样本对应

的数据〔见图3)

3 SPSS窗口的Data View界面

          2多选趁的偏玛及在SYSS数拓编样窗口中呈现的位

    此外,虽然编码方案必须配合研究的特别需要,但其

中有一个总的原则是:尽量把资料分得很细。一旦不再需

要这么细的分类时,我们仍然可以把这些资料进行重新

的归并(这一点SPSS很容易做到),也许一种新的合并会

带来新的发现。但若资料一开始便被粗略地编人少数的

类别中,那么,分析时有很多细节性的信息将因此而完全

丧失。例如,接受远程培训的教师所执教的年级,是让受

访者直接填写执教年级的数值好呢,还是分为“小学”和

“中学”两个选项让受访者圈选好呢?再如,学生的工龄,

是分成若干等级让受访者圈选呢,还是让受访者直接填

写数值呢?

    作者2002年对电大学生的调查中.统计发现三种视

听材料中,电视直播课的利用率最高,其次是VCD教材,录

像教材的利用率最低。是不是所有专业的学生都倾向于

选用电视直播课呢?后来,将学生总体分四个专业统计,.

结果发现,不同专业学生对三种视听材料的选择倾向不

同,小学教育专业学生倾向选用的视听媒体是VCD,“愿

意和非常愿意”选用的占64.39‘0,而非电视直播课。细分的

结果是将原来淹没的信息呈现出来了,获得新的发现,如

果当初没有将对专业作细致的划分,就不可能有这一新

的发现。总之,建议你在设计问卷或编码过程中,最好将

资料分得详细一点。

    四、数据的抽人与整理

    编码解决了计算机识别数据的问题,为进行统计分

析,接下来要做的是将数据输人计算机,并对翰人的数据

进行整理。不同的电脑程序有不同的资料建构方式。在大

多数的情况下,你可以直接使用分析程序来输人资料,如

果数据量大,可以考虑用读卡机输人数据。

                  4数据编挥窗口的Variable View界面

    SPSS的数据编辑窗口。功能:SPSS的数据进行定

义、录人、修改、管理等基本操作的窗口;组成:窗口主菜单

( Data,Transform,Analyze,Graphs )、工具栏、数据编辑区、

状态显示区;SPSS运行过程中自动打开,且只能打开一个

窗口,运行过程中无法关闭;SPSS中各统计分析功能都是

针对该窗口中的数据进行的,本窗口中的数据以.,文件

格式存盘。

    此外,你也可以用其他的方式来创建自己的资料文

(例如,Excel),然后再将资料导入SPSS分析程序中。在

其它的资料分析程序中,也都有相似的方法可供选择。

    ()数据的整理

    不论人工输人数据,还是机器读人数据,下一个重要

步骤就是要清除资料中的错误,也就是资料的“净化”。

因为,人工输人数据时,不管你如何小心冀翼,错误总是

难免的;如果是读卡机读入数据,可能发生的错误包括编

码错误、读错编码、感应错误等等。以下的两种资料整理

步骤是必须完成的,一种是可能编码整理.另一种是列联

式整理。

    1.可能编码整理

    任何变量都有一组特殊的属性,而这些属性可以被

转换成一组对应的编码。例如,在性别变量中,只有三个
 

可能的编码:1.男性,2.女性,3.无答案。如果在某个样本中

改变量的编码为‘`5的话,则很明显就是一个错误。

    可能编码是整理方法有两种。第一种,如我们前面所

看到的,电脑资料输人时检查是否有错误发生。例如,如

果你在性别项目输人‘`5",电脑便会“哗哗”地叫,并拒

绝输人这一错误号码,而不是在资料输人以后再进行检

查。如果你没有这些电脑程序的话,可以利用每个项目答

案的频次分布来达到可能编码式整理的效果。例如,在你

的资料中,有sso个人在性别一项的编码为“1"(女性)

630个人为“2"(男性),1个人为‘`5",那么你就会怀疑

"5这个是个错误。一旦发现错误,接下来就要找到相应

的文件(如问卷),查出到底错误出现在哪里,然后作必

要的更正。

    2.列联式整理

    列联式整理较为复杂。由于资料本身的逻辑结构会

给某些受访者的回答造成限制,因此很容易发生资料的

误读而导致错误。例如,如果问卷中的题目是问受访者每

周平均上网学习多少小时,所有“上网学习的受访者”的

回答都该有个代码,而“从不上网学习的受访者”则不会

有任何回答记录(或用某一特别码指明该题不适用),假

使某位“从不上网学习的受访者”的答案代码显示为

+3?,表示他“每周平均上网学习6-12小时”,这样的错

误若不纠正,其统计结果将十分滑稽。

    虽然资料的整理是资料处理的过程中一个基本的步

骤,但是在某些特定的情况下,你可以安全跳过而不用做

这项工作。也许你觉得可以剔除在某个项目上出错的少

数几个样本,而不会出现任何问题,但这种情况只有在你

排除这些样本,且研究结果并不会因那次错误而受到任

何显著影响才行得通。假如一些男士在问卷上圈选了“生

过小孩”,那么在这个变量上,你可以只限于分析女性的

答卷,而把男性的排除在外。不过,你并不能以这些原因

在为借口来掩饰一个很糟糕的研究。记住,“烂”资料永

远只会误导研究的结论。

(资料来源:C.M.C1url。著,张莉莉张学丈子译,教育研究导论,2003)

    选择何种数据分析方法,要由研究的目标和数据的

性质决定。如果你对你的研究目标和数据的性质十分明

了,刀a么,选择何种数据分析方法就是一件很容易的事

了,你可以很方便地在SPSSAnalyze菜单选择相应的分

析程序(5)

         

    有时候,同一项研究中既有定性资料的分析,又有量

化数据的处理。在选择统计分析方法时,应先仔细考虑数

据的种类、使用的研究设计或统计检验的假设,这有助你

选取最合适的统计分析去处理所收集的数据资料。

    本文按照数据分析的先后顺序,结合远程教育研究

中可能遇到的问题,初步介绍了如何将资料转换成计算

机能处理的格式,如何将数据输入SPSS的数据表格,如何

进行数据整理和“净化”,以及如何按数据的性质和研究

设计去选择合适的统计分析技术,希望能对你的研究有

所帮助。如果你对教育统计和SPSS缺乏了解,还应参考有

关书籍。

    五、如何选择数据分析方法

    整理资料后,研究者便可以准备分析数据了。一般而

言,研究的假设决定研究的设计,研究设计决定统计分析

方法,数据分析的性质与研究的类型密切关联,见表20

2各类研究最常用到的数据分析的类型

 

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多