分享

样本和总体的概念

 医学数据科学 2019-03-26

本文对抽样分布的概念、无偏差和最小偏差等性质,以及中心极限定理和样本比例的抽样分布进行总结。

1 抽样分布基本概念

参数(parameter):参数是对总体的数值描述,因为是总体,所以值经常是未知的。 
样本统计量(sample statistics):样本的数值描述,利用样本计算而来。

常见的参数和样本统计量如下表所示。


总体参数样本统计量
均值μμx¯
中位数ηηmm
方差σ2σ2s2s2
标注差σσss
二项比率ppp^p^

抽样分布(sampling distribution):统计量的概率分布,根据n个测量值的样本计算得到。

2 抽样分布的性质

性质一:无偏性

无偏估计(unbisaed estimate):样本统计量的抽样分布均值和要估计的总体参数相等,就认为这个统计量是参数的无偏估计。 
有偏估计(biased estimate):抽样分布的均值和要顾及的参数不相等,就认为这个统计量是参数的有偏估计。

性质二:最小方差

如果两组统计量的抽样分部都无偏,我们更加倾向选择标注差最小的,抽样分部的标准差也被成为统计量的标准误(standard error of the statistic)

3 样本均值的抽样分布和中心极限定理

3.1 x¯的抽样分部的性质:

x¯的抽样分布的性质: 
1.抽样分部的均值等于抽样总体的均值,即μx¯=E(x¯)=μμx¯=E(x¯)=μ。 
2.抽样分部的标准差等于: 
σx¯=σn抽样总体的标注差样本量的平方根,即σx¯=σn。(标准差σx¯σx¯一般被称为均值的标准误(standard error of the mean)。 
3.正态分布的抽样分布:如果从一个服从正态分布的总体中选取一个有n个观测值的随机样本,那么x¯的抽样分布也是一个正态分布。

3.2 中心极限定理

从一个均值为 μμ 、标准差为σσ的总体中选取一个有nn个观测值的随机样本。那么当nn足够大时,x¯的抽样分布将近似服从均值μx¯=μμx¯=μ 、标准差σx¯=σ/nσx¯=σ/n的正态分布。并且样本量越大,对x¯ 的抽样分布的正太近似越好。

4 样本比例的抽样分布

和样本均值是总体均值的良好估计一样,样本比例(记为p^p^),是总体比例pp的良好估计。和样本均值的抽样分布有着类似的性质。

p^p^的抽样分布性质: 
1. 抽样分布的均值等于二项比例pp,也就是E(p^)=pE(p^)=p。因此,p^pp^是p的无偏估计。 
2. 抽样分布的标准差等于p(1p)/np(1−p)/n,即σp^=p(1p)/nσp^=p(1−p)/n。 
对于大样本,抽样分布近似于正太。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多