先说format。format影响到SAS的数据输出格式,这个我们举了个例子,输出当前时间:
data time;
x=date();
format x yymmdd8.2;
put x=;
run;
如果没有format那行,那么SAS系统就会把当前时间输出为一个数字(因为SAS就是用数字存储日期的),format就是指定x的输出格式,以便于我们阅读。
format是改变输出格式,而informat则是关于SAS的读入格式。举个例子,假如你的D盘有个文本数据文件informat.txt,存的是一个时间变量time,有两个观测值:
time
1998-7-10
1998-7-11
你要是这么读入它,就会出错:
data a;
infile "d:\informat.txt" firstobs=2;
input time;
run;
先解释一下这段。这是一个标准的读入数据的程序,infile "d:\informat.txt"指明文件路径,后面的firstobs=2表明数据从第二行开始读入(因为第一行是变量名time)。如果是数值型的变量,这一定没问题,但这个time的格式是1998-7-11,SAS就读不了,如果不指定time的读入格式。
规定读入格式,就要用到informat了,下面的程序就能正确读入informat.txt了:
data aa;
infile "d:\informat.txt" firstobs=2;
input time;
informat time yymmdd10.;
run;
informat time yymmdd10.就规定了time的读入格式,SAS系统就知道它存的是时间,就读进来了。读是读进来了,但这是SAS显示的却也是数字。为了让输出我们能明白,就要用到format,改变输出格式,完整的程序如下:
data aaa;
infile "d:\informat.txt" firstobs=2;
input time;
informat time yymmdd10.;
format time yymmdd10.;
run;