本文对抽样分布的概念、无偏差和最小偏差等性质,以及中心极限定理和样本比例的抽样分布进行总结。 1 抽样分布基本概念参数(parameter):参数是对总体的数值描述,因为是总体,所以值经常是未知的。 样本统计量(sample statistics):样本的数值描述,利用样本计算而来。
常见的参数和样本统计量如下表所示。
| 总体参数 | 样本统计量 |
---|
均值 | μμ | x¯x¯ | 中位数 | ηη | mm | 方差 | σ2σ2 | s2s2 | 标注差 | σσ | ss | 二项比率 | pp | p^p^ |
抽样分布(sampling distribution):统计量的概率分布,根据n个测量值的样本计算得到。
2 抽样分布的性质性质一:无偏性 无偏估计(unbisaed estimate):样本统计量的抽样分布均值和要估计的总体参数相等,就认为这个统计量是参数的无偏估计。 有偏估计(biased estimate):抽样分布的均值和要顾及的参数不相等,就认为这个统计量是参数的有偏估计。
性质二:最小方差 如果两组统计量的抽样分部都无偏,我们更加倾向选择标注差最小的,抽样分部的标准差也被成为统计量的标准误(standard error of the statistic)。
3 样本均值的抽样分布和中心极限定理3.1 x¯x¯的抽样分部的性质:x¯x¯的抽样分布的性质: 1.抽样分部的均值等于抽样总体的均值,即μx¯=E(x¯)=μμx¯=E(x¯)=μ。 2.抽样分部的标准差等于: 抽样总体的标注差样本量的平方根,即σx¯=σn√抽样总体的标注差样本量的平方根,即σx¯=σn。(标准差σx¯σx¯一般被称为均值的标准误(standard error of the mean)。 3.正态分布的抽样分布:如果从一个服从正态分布的总体中选取一个有n个观测值的随机样本,那么x¯x¯的抽样分布也是一个正态分布。
3.2 中心极限定理从一个均值为 μμ 、标准差为σσ的总体中选取一个有nn个观测值的随机样本。那么当nn足够大时,x¯x¯的抽样分布将近似服从均值μx¯=μμx¯=μ 、标准差σx¯=σ/n−−√σx¯=σ/n的正态分布。并且样本量越大,对x¯x¯ 的抽样分布的正太近似越好。 4 样本比例的抽样分布和样本均值是总体均值的良好估计一样,样本比例(记为p^p^),是总体比例pp的良好估计。和样本均值的抽样分布有着类似的性质。 p^p^的抽样分布性质: 1. 抽样分布的均值等于二项比例pp,也就是E(p^)=pE(p^)=p。因此,p^是pp^是p的无偏估计。 2. 抽样分布的标准差等于p(1−p)/n−−−−−−−−−√p(1−p)/n,即σp^=p(1−p)/n−−−−−−−−−√σp^=p(1−p)/n。 对于大样本,抽样分布近似于正太。
|