第一期:什么是抽样?1抽样的定义 从欲研究的全部样品中抽取一部分样品单位。其基本要求是要保证所抽取的样品单位对全部样品具有充分的代表性。 2抽样的目的 抽样的目的是从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验普遍采用的一种经济有效的工作和研究方法。 关于抽样的这些基本概念你需要知道! 3基本概念 所考察对象的某一数值指标的全体构成的集合看作总体,构成总体的每一个元素作为个体,从总体中抽取一部分的个体所组成的集合叫做样本,样本中的个体数目叫做样本数量。 总体或抽样总体:(population) 总体(population)通常与构成它的元素共同定义:总体是指构成它的所有元素的集合,而元素则是构成总体的最基本单位。 比如,当我们开展对某批发市场蔬菜农产品质量安全监测时,该批发市场的某一车普通白菜就是我们研究的总体,而该车上的每一颗普通白菜便是构成总体的元素。 样本(sample):样本与总体相对应,是指用来代表总体的单位,样本实际上是总体中某些单位的子集。样本不是总体,但它应代表总体,以抽样的标准就是让所选择的样本最大程度地代表总体。 抽样单位或抽样元素(sampling unit/element): 抽样单位或抽样元素是指收集信息的基本单位和进行分析的元素。在农产品质量安全监测中,常用的抽样单位是个体的植株或果实,它也可以是一定类型的群体。抽样单位与抽样元素有时是一致的,有时是不一致的。如在简单抽样中,它们是一致的,但在整群或多阶段抽样中,抽样单位是群体,而每个群体单位中又包含许多抽样元素。 参数值与统计值 参数值(parameter)也称总体值,是指反映总体中某变量的特征值。例如某蔬菜大棚中所有番茄果实的三唑酮平均含量。但参数值多是理论值,难以具体确定。通常是根据样本的统计值来推论总体的参数值。 统计值(statistic)也称样本值,是指对样本中某变量特征的描述。它通常是实际统计分析的数值。例如,根据某一样本资料可计算其三唑酮含量等。用样本统计值去推论参数值时,二者是一一对应的。 常见的一些特征值 抽样误差(sampling error) 样本统计值与所要推论的总体参数值之间的均差值就称为抽样误差。这是由抽样本身产生的误差,它反映的是样本对总体的表性程度,故又称代表性误差。 置信水平与置信区间(confidence level and interval) 置信水平和置信区间是与抽样误差密切相关的两个概念。 置信水平,又称置信度,是指总体参数值落在某一区间内的概率。 而置信区间是指在某一置信水平下,用样本统计值推论总体参数值的范围。其大小与误差密切相关,置信区间越大,误差也越大。 抽样的基本程序包括:界定总体、样本设计。 界定总体包括明确总体的范围、内容和时间。实际调查的总体与理论上设定的总体会有所不同,总体越复杂,二者的差别越大。抽样总体有时不等于理论上的研究总体,样本所代表的也只是明确界定的抽样总体。 样本设计包括确定样本规模和选择抽样的具体方式。抽样的目的是用样本来代表总体,自然样本数越大,其代表性越高。但样本数越大,调查研究的成本也越大。因此,确定合适的样本规模和抽样方式是抽样设计中的一项重要内容。 样本规模的确定: 确定样本量的大小是比较复杂的问题,既要有定性的考虑也要有定量的考虑。 (1)定性方面的考虑 其考虑因素有:决策的重要性,调研的性质,变量个数,数据分析的性质,同类研究中所用的样本量,发生率,完成率,资源限制等。具体地说,更重要的决策,需要更多的信息和更准确的信息,这就需要较大的样本;探索性研究,样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本;收集有关许多变量的数据,样本量就要大一些。 (2)定量方面的考虑 有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 在无放回简单随机抽样情况下,总体均值估计量的标准误差的表达式: 其中,σ是总体的标准差。如果误差界限设为e,那么: 这里Z是对应于某一置信水平的标准正态分布的分位点值。 为确定n,需要知道:期望的误差界限e;置信水平;对应的标准正态分布的分位点值 Z;总体规模 N;总体方差σ2 ;其中,总体方差σ2是最不容易得到的,通常需要根据过去对类似总体所做的研究作近似计算。 常用的z值: 对于 90% 的置信度,对应的z值为 1.64; 对于 95% 的置信度,对应的z值为 1.96; 对于 99% 的置信度,对应的z值为 2.56。 示例: |
|
来自: 昵称18013950 > 《检验检测技术》