读《Stata统计分析:社会科学应用指南》第二章,stata简介。摘录(略有修改)一些精彩的句子,如下。根据统计软件的不同,命令也被称作代码、脚本或语法。 使用stata有三种方式:1是下拉菜单,2是输入命令,3是do文件。该书认为do文件是“更为便捷的”。我们需要事先知道命令的名称,如果你不知道具体的命令,可使用关键词进行查找。比如search regression。语法命令/菜单中的if,in,if表示条件选择,in表示观测选择。输入数据的最简单方法,其实是直接复制粘贴数据到stata。不太或完全不需要语法命令导入。建议不用recode,建议联合使用recode与gen,来完成分类重新编码为新变量比起gen,更要掌握的是egen,但二者有区别,比如我在知乎看到一个案例(摘自知乎):gen主要进行加减乘除、幂次等基本运算,而egen使用函数(mean, max等)来为新变量取值,egen命令无法使用任何运算符生成变量值。drop:删除某些不想要的变量,也可以和in联用删除观测uniform(x) 生成(0,1)内均匀分布的伪随机数substr(s,n1,n2) 获得从S的n1个字符开始的n2个字符组成的字符串
|