【原】我导: 连这几个基本计量概念都不懂, 就不要给我搞实证了! 不要了！

计量经济圈 2023-11-10 发布于浙江

展开全文

邮件：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

接着“审稿人: 你这个文章实证结构已经过时了！过时了！”，今天分享社群群友通过QA方式讨论的几个计量经济学基本问题。这些问题对许多中青年学者来说具有极大的参考和启发意义。

可以总结如下：

标准差与标准误的区别
误差与残差的区别
标准误与误差的区别

在整理群友分享的解答基础上，再引进了几个例子对其具体化，如下：

①标准差、标准误

一句话总结：标准差是样本数据点离均值的差距，标准误是样本均值离总体均值的差距。
标准差（Standard Deviation）是用来衡量一组数据的离散程度或分散程度的统计量。它表示数据集中各个数据点与平均值之间的平均偏差。标准差越大，表示数据点相对于平均值的分散程度越大，而标准差越小则表示数据点相对于平均值的分散程度越小。
标准误（Standard Error）是一个统计量，用于估计样本统计量与总体参数之间的误差。它表示在多次重复抽样的情况下，样本统计量的变动范围。标准误的计算通常涉及到样本大小和样本标准差等参数。
简而言之，标准差是描述数据集内部的变异程度，而标准误则是用来估计样本统计量与总体参数之间的误差范围。
网上有个例子，我们整理一下：
举个例子，假设你有一个样本数据集，你可以计算它的平均值和标准差来了解数据的分布情况。然后，如果你想估计这个样本平均值的误差范围，你可以使用标准误来进行估计。标准误越小，表示样本平均值的估计越准确。
总的来说，标准差和标准误都是在统计学中用于描述数据分布和进行估计的重要指标。

②误差、残差

误差项（error terms）：误差项指的是回归模型中因变量的观测值与真实值（通常未观测到）之间的差异。这些项是理论上的，代表影响因变量的因素，但未包括在模型中。可以将它们看作是模型的“真实”随机偏差。实际上，我们无法直接观测到误差项，因为它们是不可观测的。相反，我们通过残差间接估计它们。
残差项（residual terms）：残差是指因变量的观测值与回归模型预测值之间的差异。它们被计算为实际观测值减去回归方程产生的预测值。残差是使用样本数据计算的，并且特定于特定的样本。
概括一下：
误差项是理论上的、不可观测的。它们用于描述变量之间的真实关系，并通常假定符合某些统计性质（例如，正态分布，均值为零）。
残差项是从观测数据中计算得到的，代表了观测值与回归模型预测值之间的差异。残差用于评估模型的拟合程度，并进行关于回归系数的推断。
网上有一些例子，我们整理了一下：
在统计学和优化中，误差和残差是两个密切相关且容易混淆的衡量标准，它们用于衡量统计样本中某个元素的观测值与其“真值”（不一定可观察）的偏差。观测值的误差是指观测值与感兴趣量的真值之间的偏差（例如，总体均值）。残差是指观测值与感兴趣量的估计值之间的差异（例如，样本均值）。这种区别在回归分析中最为重要，其中的概念有时被称为回归误差和回归残差，并由此引出了学生化残差的概念。在计量经济学中，“误差”也被称为干扰项。
在统计学和回归分析中，“误差项”和“残差项”是相关但略有不同的概念：
假设有一系列来自单变量分布的观测值，我们想要估计该分布的均值（即所谓的位置模型)）。在这种情况下，误差是观测值与总体均值之间的偏差，而残差是观测值与样本均值之间的偏差。
统计误差（或扰动）是观测值与其期望值之间的差异，后者基于随机选择统计单位的整个总体。例如，如果21岁男性人群的平均身高为1.75米，随机选择的一个男性身高为1.80米，则“误差”为0.05米；如果随机选择的男性身高为1.70米，则“误差”为-0.05米。期望值是整个总体的平均值，通常是不可观察的，因此统计误差也无法观察到。
另一方面，残差（或拟合偏差）是不可观察的统计误差的可观测估计值。考虑先前男性身高的例子，假设我们有一个n人的随机样本。样本均值可以作为总体均值的良好估计值。然后我们有：
样本中每个男性的身高与不可观察的总体均值之间的差异是统计误差，而
样本中每个男性的身高与可观测的样本均值之间的差异是残差。
请注意，由于样本均值的定义，随机样本中残差的总和必然为零，因此残差必然不是独立的。另一方面，统计误差是独立的，它们在随机样本中的总和几乎肯定不为零。
可以将统计误差（特别是正态分布的误差）标准化为z分数（或“标准分数”），并将残差标准化为t统计量，或更一般地，学生化残差。

③标准误、误差项

标准误是样本均值的标准差，是对总体均值的估计。它测量了从一个样本到另一个样本的样本均值的变异性。标准误差用于计算置信区间并检验有关总体均值的假设。
另一方面，误差项是回归模型中观测值和预测值之间的差异。它们代表了因模型中的自变量未能解释的因变量中未解释的变异性。误差项被假定为具有零均值和恒定方差的正态分布。

一些社群学术讨论：1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”，2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”，3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”，4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?，5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢？6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗？7.回归中常数项显著说明模型中有遗漏变量问题？8.审稿人有义务告诉你回归中可能的遗漏变量么？9.针对很多实证问题的讨论, 随手保存的部分内容以飨学者，１０.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性，11.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论，12.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器，13.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等，14.针对经济学领域中介效应模型问题的回应和理性讨论，15.讨论a(b)对b(a)的新方向论文, 经济学期刊分区问题, 3个机制存在时计量模型设计问题,16.如果解决了内生性, 那么是否意味着证实了变量之间的因果关系呢？17.解释变量提升一个标准差，被解释变量提升几个百分比呢？18.关于DID中对照组与处理组的比例问题？19.双重差分法和事件研究法的区别主要在哪里？20.双重差分法和事件研究法的区别主要在哪里？21.统计上不显著的变量表明该变量对结果变量没有影响吗？22.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事？23.Heckman模型和工具变量IV之间的差异？24.被质疑: X与Y相关系数与回归系数截然相反, 你咋想的？25.审稿人质问: 通篇都基于OLS估计, 却把它放到稳健性检验或进一步讨论中！26.异质性和机制检验都用交互项做会被审稿人质疑么? 27.所有控制变量都不显著行不行呢？审稿人啥看法，28.审稿人: 实证论文必须先提出假说, 再依次进行实证检验么？