分享

SPSS中的三种变量测量类型详解

 昵称64362630 2020-01-18
这些变量类型的划分,通常在交互作图时需要特别指明,在没有特别要求时,定义变量类型使用系统默认的等距或比例变量(scale)。这是因为等距或比例变量型变量在分析过程中不会受到限制,其他类型的变量,在很多统计分析中会受到限制而不能使用。
a、名义测量(normial measurement)是最低的一种测量等级,也称定名测度。其数值仅代表某些分类或属性。比如,用来表示性别(1或2)、民族(1、2、3…)等。这类变量一般不做高低大小区分。
对这种类别的处理常用的方法是卡方分析,主要用于度量不同分类间的关联程度。与此模型息息相关的是对数线性模型,它主要是通过线性方程来对已经进行对数转换后的联合概率进行回归,不过对数线性模型只在分类水平或分类特别庞大的时候其价值才能淋漓精致的发挥出来,否则我们一般常用logistic回归分析。在此模型后,更进一步的是潜在类别分析,其基本的原理是对概率和对数均参数化进行估计。
其他相关性的度量可以使用名义相关性指标,诸如常用的是相依系数、不确定系数。
对应分析也是常用的分类变量间的分析技术,主要以图形来呈现结果。很清晰,很难提供相关关系的假设检验。
该变量取值有明显的类别,但无顺序或等级,可以是字符型变量,也可是数值型变量。这类变量的取值范围通常是有限的,而且每个数值都代表特定的类别。如在进行销售数据分析时,将服装产品分为男装和女装两大类。在实际分析中,类别变量的主要用途是进行数据分组(group)或分类。
b、次序测量(ordinal measurement)的量化水平高于名义测度,用于的测量的数值代表了一些有序分类。例如用于表示受教育程度高低的数字(1,2,3…),具有一定的顺序性。
对这种类别的处理常用的方法是方差分析及其均值趋势、非参检验、有序相关性指标(gamma系数、kendall系数)。其中最常用是非参检验的方法,这是一个大类的方法群,里面很多的算法都可以用,以秩和检验为代表。
( [该变量取值有明显的顺序或等级,可以是字符型变量,也可是数值型变量。这类变量的取值范围通常是有限的,而且每个数值都有特定的含义。如给某一品牌满意度进行平价,用1、2、3、4、5分别表示非常满意、满意、一般、不满意、非常不满意。在数据分析中,一些主观的测量,如态度测量、评分中使用最多,有些时候,这类变量也可作为分组或分类变量,进行数据分析,如收入类别。等距或比例变量也可转换为顺序变量,如对销售额排名,形成名次变量。
c、间距测量(interval measurement)的量化程度更高一些,它的取值不再是类的编码,而是采用一定单位的实际测量值。可以进行加减运算,但不能进行乘除运算,因为测度等级的变量所取的0值不是物理上的绝对0。比如考试成绩的0。
d、比率测量(ratio measurement)是最高级的测量等级,他除了具有间距测度等级的所有性质外,其0值具有物理上的绝对意义,而且可以进行加减乘除运算。例如增长率。(本期-前期)/前期。
  由于c、d这两种测度在spss或其他统计软件里均不做细致的区分,大部分的模型均适用,他们使用的方法也基本相同,只是在很特殊的情况下,才做区分。例如在使用一些交互模型或高阶模型时需要考虑一下所得样本数据的测量等级,因为统计模型里一般是用变量的相加来表示线性,用相乘或高次来表示非线性。
属于最高级别的测量尺度,数值可以进行等距离划分或进行比率计算,它可以是数值型变量、货币型变量,但不能是字符型变量。这类变量往往是连续的或是等距离的,数值的范围无限。在数据分析中,这类数据有两种表现形式:一是连续的数据,如销售数据。二是分组数据,如将个人收入水平分成若干组,而不用连续数据表达。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多