分享

数据处理如何做?请收好这份实用指南

 Mark_killua 2021-04-12

总会有小伙伴问起“数据是都收集好了,可是应该怎么处理呢?”

“对数据中的重复值、异常值有什么好的处理方法?”

“我的问卷里既有多选题、填空题,也有量表数据。这些题目都应该怎么处理数据,怎么分析?”

不用慌!关于数据处理的各种疑问都可以在这篇文章里找到答案。

01 数据处理思路

数据格式

首先,正确的数据格式是让我们可以开始处理和分析数据的第一步。不论是什么类型的数据均需要按照数据分析的规范格式进行整理。

常见的数据格式通常就是一行代表一个样本,如果有100个样本即为100行;一列代表一个属性。

除此之外,针对不同的分析方法,所需的数据格式也有所不同,这里就不再展开说明。

多份问卷如何放在一起分析?

当有多份数据想要一起进行分析,比如给两个班级做了同一份考题,2个班的测试结果分别记录在不同的表格里,如果想要进行比较分析,那么就需要将数据合并整理在一个EXCEL工作表里面。

解决方法:数据合并有两种合并方式,第一种是按行叠加;第二种是按列叠加。

  • 按行叠加

如果有两份数据'按行叠加’,此时需要'新增加列’,用于标识到底是哪一份数据。

比如,分别对两组研究对象进行相同的测试,然后想使用t检验对比两次结果的差异。

“按行叠加”通常在做'方差分析’、't检验’或'交叉卡方分析’时会使用到。

  • 按列叠加

如果有两份数据'按列叠加’,也就是直接将两份数据的列数合并。此时,需要注意一定要有个唯一标识的号码,比如姓名、编号、身份证号等。

数据标签、数据编码和生成变量

在整理好数据后,即可上传数据。接下来就可以对数据进行一些基本处理,包括设置数据标签、调整数据编码和生成变量等。

  • 设置数据标签

数据标签是用来标识数值的具体含义。如上图中,明显不知道1.0、2.0这具体是什么意思。只有设置了标签后,才会展示出选项的具体含义。

  • 数据编码

除了数据标签外,有时候还可能需要进行数据编码处理,比如希望对年龄分成3个组别,分别是20以下,20~30,30以上。此时就需要使用数据编码处理,如下图:

操作路径:[数据处理]—[数据编码]功能

  • 生成变量

很多时候还需要对数据生成变量处理,比如说对体重或身高求对数处理,或者对数据开根号,取绝对值,求和,求平均值处理等,那么可使用SPSSAU生成变量功能。

操作路径:[数据处理]—[生成变量]功能

异常值、缺失值问题

在完成了基本的数据处理后,针对数据中的异常值、缺失值等问题也应及时进行处理。

  • 异常值处理

在分析数据时,如果发现一个值与其他值相差甚远,这类值称为 “异常值”。

比如,正常男性成年人的身高是介于1.5~2米之间,但是如果出现一个数据为1.2米。这种数据在分析之前需要进行处理,如把该值设置为null值。

操作路径:[数据处理]—[异常值]功能

  • 缺失值处理

有时候因填写人疏忽少填了几道题,或者题目设置产生了缺失值,此时需要对缺失值进行处理。

  • 对于某一个问题或题目,如果缺失值不多不影响结果可以不处理

  • 如果某个问题出现较多缺失值,可使用填补功能,代替缺失值

操作路径:[数据处理]—[异常值]功能

  • 无效样本处理

同时一份问卷中,如果填写者填写的都是完全相同的答案,说明该样本没有认真填写,此时可将该样本设置为无效样本。

操作路径:[数据处理]—[无效样本]功能

完成以上的数据处理工作,基本上就可以开始分析了。如果在分析的过程中,又发现什么其他问题,可以随时使用[数据处理]模块的处理功能进行调整。

02 量表题处理

针对量表题数据的处理,还有以下几个常见问题:

反向题如何处理?

在量表题设计时,有时会插入一些反向题,针对这些反向设计的题目,需要先进行反向编码处理才可以分析。

如五级量表,则可编码处理为:1->5,2->4,3->3,4->2,5->1。

操作路径:[数据处理]—[数据编码]功能

不同尺度的量表数据如何统一?

一般情况下不同尺度的量表,不需要特别处理。比如设计了四个维度的量表,而各维度使用的量表尺度不一致其实也不受影响,如做信度效度按每个维度分别进行分析即可。

如果涉及数值上的比较,像是对同一组对象前后两年进行测量,去年使用了1-5分的量表,而今年改用1-7分量表收集数据。想要比较两年数据的结果,这直接比较数值显然不太对,此时可以考虑对数据做区间化处理,把1-5分数据转换成1-7分。

操作步骤:选择[生成变量]—[区间化],将区间最小值设置1,区间最大值设为7,点击[确认处理],即可将所有数据转化成1-7分。

03 非量表题处理

非量表题有很多种,针对每种类型的题目所需的数据格式、数据处理方式也不太一样。之前SPSSAU已推送过详细的文字教程,这里就不再展开说明,大家可以点击下方链接,查看视频教程及往期文章。

①  多选题

②  排序题

③  非规则化数据如何整理?

以上就是本次分享的内容啦。如果你还有什么数据处理上的疑难问题没有解决,可以在评论区告诉我们。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多