分享

Stata常规数据管理命令

 数据小兵 2023-06-23 发布于陕西
读《Stata统计分析:社会科学应用指南》第二章,stata简介。摘录(略有修改)一些精彩的句子,如下。
===
根据统计软件的不同,命令也被称作代码、脚本或语法。
使用stata有三种方式:1是下拉菜单,2是输入命令,3是do文件。该书认为do文件是“更为便捷的”。
我们需要事先知道命令的名称,如果你不知道具体的命令,可使用关键词进行查找。比如search regression。
语法命令/菜单中的if,in,if表示条件选择,in表示观测选择。
===
文本数据在编辑器中是红色的,数值数据是黑色的。
默认数值型数据是浮点数float。
输入数据的最简单方法,其实是直接复制粘贴数据到stata。不太或完全不需要语法命令导入。
===
clear:清理/清除当前正在使用的数据集
codebook:查看分类变量的水平、标签值
misstable sum:数据集的缺失情况汇总
双==:表示等于,单=:表示赋值
建议不用recode,建议联合使用recode与gen,来完成分类重新编码为新变量
比起gen,更要掌握的是egen,但二者有区别,比如我在知乎看到一个案例(摘自知乎):
gen主要进行加减乘除、幂次等基本运算,而egen使用函数(mean, max等)来为新变量取值,egen命令无法使用任何运算符生成变量值。
encode:将字符串转换为数值型变量
decode:将数值型变量转换为字符串
===
keep:在一个大数据集里面,仅想保留少数变量
drop:删除某些不想要的变量,也可以和in联用删除观测
===
stata常用函数:
abs(x) 绝对值
exp(x) 指数函数
log(x) 自然对数
log10(x) 常用对数
sqrt(x) 平方根
uniform(x) 生成(0,1)内均匀分布的伪随机数
length(x) 计算长度
substr(s,n1,n2) 获得从S的n1个字符开始的n2个字符组成的字符串
real(x) 将字符串s转换为数值函数
trim(x) 去除字符串前面和后面的空格
int(x) 去掉x的小数部分,得到整数
sum(X) 求和
max(x) min(x) 最大值最小值
_n 当前观察值的位置
_N 观察值的总个数
===
===

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多