配色: 字号:
SPSS 数据格式
2020-09-30 | 阅:  转:  |  分享 
  
2020-09-30演讲人SPSS数据格式目录变量属性1调查问卷2(转换)变量级别3(数据)文件级别401变量属性变量属性P6P5值P4标
签P3小位数P2宽度P1类型名称变量属性P5P4角色P3测量P2列P1对齐缺失变量属性类型数值型定类尺度(名义)变量属性测量定序尺
度(序号)02调查问卷0102名称指定类型调查问卷开放题录入0304宽度小数字符串代码+值标签开放题录入基础上录入“值”B调查
问卷单选题录入A含有“其他,请指出”单项的单选题01第二个变量,讲没有选择该项的被访问者作为缺失值处理使用两个变量对其进行定义调
查问卷0502半开放0403第二个变量,“其他,请指出”的具体内容第一个变量,“其他,请指出”,作为一个可选择项多选题(多重相应
)多重二分法1:对应每一个选项都要定义一个变量2:均为二分类,选中与未选中3:拒绝回答都被视为未选中4:变量值标签的定义应该一致
,避免混乱多重分类法1:对于选项数量较多,二分法录入会导致很多录入“未选中”2:利用多个变量对一个多选题的答案进行定义3:有多少
个变量由被访者实际可能给出的最多答案数而定4:数据缺失在多重分类法中最为常见的情况调查问卷011:SPSS对于录入的多选题,SPS
S认为是若干分散的变量,并不认为是多选题设定多选题变量集022:Tables模块可以保存定义的多选题变量及033:多重相应可以定
义多选题变量集信息但是不能再SPSS数据文件中保存03(转换)变量级别(转换)变量级别AC连续性变量离散化排序:转换-个案排秩查找
与计数:转换-对个案内的值计数分组DB等级变量/等级合并(连续)计算变量(非连续值)B(转换)变量级别分组A分组1:定义新变量计
算变量(非连续值)2:定义筛选条件等级变量/等级合并(连续)数值类型(水平、分类、分组)1:连续变量转换为离散2:例如年龄3:定
义输出变量名4:旧值为变量的条件5:新值表示定义新变量名的值字符串类型需要在新旧计算筛选过程中,勾选【输出变量为字符串】4:时间
序列模型3:将字符与数值变量转化2:有规律的分组(等距分组、等样本量分组)1:重编码过程是通过定义筛选条件精确分组(转换)变量
级别连续性变量离散化1:重编码过程是通过定义筛选条件精确分组连续性变量离散化2:有规律的分组(等距分组、等样本量分组)1:转换-&
gt;可视离散化(分箱)2:设定被离散后的新变量3:生成分割点,依据最小值和最大值,选择合理的等距4:等间距=全距÷
组数最优离散化过程1:对于可视离散构成进一步自动化2:将原有的一个或多个连续变量按照该分类变量间差异最大化的优化原则离散化分类3
:用于建模中因变量为分类变量,需要对自变量进行离散化(分类化)连续性变量离散化3:将字符与数值变量转化1:自动重新编码个案需要
按照时间序列排序分析中可能需要相应的变量值前移或后移转换-转换值(变动值)连续性变量离散化4:时间序列模型(转换)变量级别排
序的依据排序的分组排序:转换-个案排秩排序:转换-个案排秩排序的依据排序的分组04(数据)文件级别(数据)文件级别个案排序:排序依
据选择个案:对全部数据取出一部分数据汇总:根据分类变量对个案进行分组数据文件的重构与转置长型数据格式:每次测量都为一个CAS
E记录宽型数据格式:每次一测量分别使用变量进行记录1:重构是将长型数据转宽型数据2:是将某行转为使用变量记录3:或者将多个变量依据个案的标识转为一个测量值感谢聆听
献花(0)
+1
(本文系职场细细品原创)