读《Stata统计分析:社会科学应用指南》第一章,研究与统计学。摘录一些精彩的句子,如下。作者穆罕默德的座右铭是:万物皆回归,将线性回归模型作为统计建模和解释的首要框架,在这本书里面体现的淋漓尽致。根据King等(1994),科学研究的目的是得到可扩展至已有数据集之外的结论。研究人员应用统计的目标是基于已有数据得到外推结论。根据抽样理论,样本量的大小在很大程度上影响我们将结果推广到总体的能力。 上表是我在知乎上找到一个表格,我描红的一行就是在给定不同的总体规模下,得到95%置信区间所需要的样本量。随着总体规模的增加,给定置信区间所需的因变量也会增加,知道样本量大于380时开始相对稳定(Kreijcie and Morgan,1970)。中心极限定理概言之,它认为当样本量N增大时,均值的抽样分布趋近于正态分布。回归分析的结果本质上只提供我们变量之间的相关关系。即使我们分析的是整个样本,置信区间和显著性水平也是有意义的。学术期刊要求统计论文的作者提交数据集和命令文档已成为趋势。
|