搜索

分享

QQ空间 QQ好友新浪微博微信

如何理解无偏估计量？

waston 2020-04-16

展开全文

现实中常常有这样的问题，比如，想知道全体女性的身高均值 $\mu$ ，但是没有办法把每个女性都进行测量，只有抽样一些女性来估计全体女性的身高：

那么根据抽样数据怎么进行推断？什么样的推断方法可以称为“好”？

1 无偏性

比如说我们采样到的女性身高分别为：

$\{x_1,x_2,\cdots,x_n\}$

那么：

$\overline{X}=\frac{x_1+x_2+\cdots+x_n}{n}$

是对 $\mu$ 不错的一个估计，为什么？因为它是无偏估计。

首先，真正的全体女性的身高均值，我们是不知道，只有上帝才知道，在图中就画为虚线：

我们通过采样计算出 $\overline{X}$ ：

会发现，不同采样得到的 $\bar{X}$ 是围绕 $\mu$ 左右波动的：

这有点像打靶，只要命中在靶心周围，还算不错的成绩：

如果用以下式子去估计方差 $\sigma^2$ ：

$\displaystyle S^2=\frac{1}{n}\sum_{i=1}^{n}(X_i-\overline{X})^2$

根据“为什么样本方差的分母是 n-1？”的解释，就会产生偏差：

这个偏差经过计算，就是：

$\frac{1}{n}\sigma^2$

这种偏差就好像瞄准镜歪了，是系统性的：

就此而言，无偏估计要好于有偏估计。

2 有效性

打靶的时候，右边的成绩肯定更优秀：

进行估计的时候也是，估计量越靠近目标，效果越“好”。这个“靠近”可以用方差来衡量。

比如，仍然对 $\mu$ 进行估计，方差越小，估计量的分布越接近 $\mu$ ：

有效估计和无偏估计是不相关的：

举个例子，从 $N(\mu,\sigma^2)$ 中抽出10个样本：

$\{x_1,x_2,\cdots,x_n\}$

下面两个都是无偏估计量：

$\displaystyle T_1=\frac{x_1+x_3+2x_{10}}{4}\quad T_2=\frac{1}{10}\sum^{10}_{i=1}x_i$

但是后者比前者方差小，后者更有效。

并且在现实中不一定非要选无偏估计量，比如：

如果能接受点误差，我倒觉得选择右边这个估计量更好。

3 一致性

之前说了，如果用以下式子去估计方差 $\sigma^2$ ：

$\displaystyle S^2=\frac{1}{n}\sum_{i=1}^{n}(X_i-\overline{X})^2$

会有一个偏差：

$\frac{1}{n}\sigma^2$

可以看到，随着采样个数的增加，这个偏差会越来越小。那么这个估计就是“一致”的。

如果样本数够多，其实这种有偏但是一致的估计量也是可以选的。

4 总结

判断一个估计量“好坏”，至少可以从以下三个方面来考虑：

无偏
有效
一致

实际操作中，要找到满足三个方面的量有时候并不容易，可以根据情况进行取舍。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： waston > 《math》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

waston

关注对话

TA的最新馆藏

GCC内联汇编
ARMv8-A编程指导之内存序
ARMv8-A编程指导之MMU
ARMv8-A编程指导之Caches
Arm V8内存管理架构.学习笔记
虚拟化技术 — 硬件辅助的虚拟化技术

喜欢该文的人也喜欢更多

热门阅读换一换