【原】Stata常规数据管理命令

数据小兵 2023-06-23 发布于陕西

展开全文

读《Stata统计分析：社会科学应用指南》第二章，stata简介。摘录（略有修改）一些精彩的句子，如下。

===

根据统计软件的不同，命令也被称作代码、脚本或语法。

使用stata有三种方式：1是下拉菜单，2是输入命令，3是do文件。该书认为do文件是“更为便捷的”。

我们需要事先知道命令的名称，如果你不知道具体的命令，可使用关键词进行查找。比如search regression。

语法命令/菜单中的if，in，if表示条件选择，in表示观测选择。

===

文本数据在编辑器中是红色的，数值数据是黑色的。

默认数值型数据是浮点数float。

输入数据的最简单方法，其实是直接复制粘贴数据到stata。不太或完全不需要语法命令导入。

===

clear：清理/清除当前正在使用的数据集

codebook：查看分类变量的水平、标签值

misstable sum：数据集的缺失情况汇总

双==：表示等于，单=：表示赋值

建议不用recode，建议联合使用recode与gen，来完成分类重新编码为新变量

比起gen，更要掌握的是egen，但二者有区别，比如我在知乎看到一个案例（摘自知乎）：

gen主要进行加减乘除、幂次等基本运算，而egen使用函数（mean, max等）来为新变量取值，egen命令无法使用任何运算符生成变量值。

encode：将字符串转换为数值型变量

decode：将数值型变量转换为字符串

===

keep：在一个大数据集里面，仅想保留少数变量

drop：删除某些不想要的变量，也可以和in联用删除观测

===

stata常用函数：

abs(x) 绝对值

exp(x) 指数函数

log(x) 自然对数

log10(x) 常用对数

sqrt(x) 平方根

uniform(x) 生成（0,1）内均匀分布的伪随机数

length(x) 计算长度

substr(s,n1,n2) 获得从S的n1个字符开始的n2个字符组成的字符串

real(x) 将字符串s转换为数值函数

trim(x) 去除字符串前面和后面的空格

int(x) 去掉x的小数部分，得到整数

sum(X) 求和

max(x) min(x) 最大值最小值

_n 当前观察值的位置

_N 观察值的总个数

===

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：数据小兵 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

数据小兵

关注对话

TA的最新馆藏

测试使用JASP做多项Logistic回归，结果解释分析需谨慎
AI让“数据分析”知识付费更难做了吗？
小兵给大家测试使用SPSSAU做Deming回归，小案例适合入门学习
练习R：用plotRCS包rcsplot()函数进行rcs限制性立方样条分析
小兵给大家测试使用JASP做重复测量方差分析，小案例适合入门学习
科研必备技能：卡方检验、T检验和F检验的通俗解读

喜欢该文的人也喜欢更多

热门阅读换一换