在前两期我们介绍了Stata软件及数据导入,本期将介绍Stata最常用的数据管理方法。Stata数据管理是调查数据前期处理的必要环节,也比较体现研究者功底。其中涉及很多函数和命令,初学者只需要掌握最为常用的一些功能即可。以下红色加粗命令希望能烂熟于心!sysuseauto.dta 调入auto.dta数据集,为Stata内置数据集。 summarize 描述统计分析(直接呈现变量均值、标准差、极值等信息) asdoc summarize 将描述统计分析结果导入word。 generate y=log(price) | 生成price的自然对数变量y | rename mpg jingdingtongji | 对mpg变量重新命名为jingdingtongji | label variableprice jiage | 将price标签定义为jiage | sortprice | 对price进行排序 | orderprice make rep783 | 按顺序调整变量排列次序 |
list in1/20 | 列出第1条到前20条数据 | list in-4/1 | 列出倒数第1条到倒数第4条数据 | dropif year<2004 | 删除year小于2004年的数据 | keepif year<2004 | 只保留year小于2004年的数据 |
条件语句常用: = = 等于 | != 不等于 | > 大于 | < 小于 | >= 大于等于 | <= 小于等于 | & 和 | | 或 |
+ 加 | - 减 | * 乘 | / 除 | ^ 乘方 | abs(x ) 取x的绝对值 | ceil(x) 大于等于x的最小整数 | floor(x) 小于等于x的最小整数 | trunc(x) 截取x的整数部分 | ln(x) 以e为底的自然对数 | max(x1,x2) x1和x2中的最大值 | min(x1,x2) x1和x2中的最小值 | log(x) 同上 | round(x) x的四舍五入整数 | sqrt(x) x的平方根,即开方 | total(x) x的移动合计 | uniform() 生成随机数 | group(x) 等分变量为x份 |
encode name, gen(id) | 将字符name转换为对应整数数值 | decode id, gen(name) | 将整数数值转换为对应字符name | destring name, replace | 当name为数字且为字符串时使用 | gen id=real(name) | 同上,但没上述命令强大 |
pwcorr x1 x2 x3 x4 , sig star(5) | 计算相关系数 | reg y x1 x2 x3, robust | 稳健OLS回归估计 |
regress price mpg 第一组回归方程 est store m1 将第一次回归储存为 m1 regress price mpg weight length 第二组回归方程 est store m2 将第二次回归储存为 m2 esttab m1 m2 using reg1.rtf, scalars(F) b(%8.4f) r2(%8.4f) ar2(%8.4f) se(%8.4f) star(* 0.1 ** 0.05 *** 0.01) replace nogap 这个命令也可以实现: outreg2 using m1,word replace outreg2 using m1,word e(all) replace outreg2 using m1,word e(r2_p chi2 p) replace ssc install outreg2 | 从外部安装命令outreg2(如果提示不存在该命令时使用) | Stata的数据管理功能非常强大,除了上述介绍的基础性命令外,还提供了许多其他的命令。研究者掌握的函数种类越多,实战中进行数据管理就会越得心应手。很多时候,一条简单的小命令,可以为我们节省十几分钟甚至几十分钟的时间。因此,我们平时就应该随时收集和记录这些外挂命令,关键时刻能起到事半功倍的效果!整理不易,欢迎点亮再看!
|