第一章假设检验假设检验是统计推断的一类重要问题,在总体的分布函数未知或只知其形式,但不知其参数的情况下, 为了推断总体的某些特征,而提出关于总体的假设。§1.1抽样分布一、定义1、总体:根据试验目的确定的研究对象的全体。( 包括有限总体和无限总体)其中一个研究对象称为个体。参数:根据总体全部观测值计算处理的某性状的特征数。2、样本: 从总体中抽取的一部分供观察测定的个体组成的集合。容量的样本称为大样本,的样本称 为小样本统计数:根据样本观测值计算出来的某性状的特征数。二、资料的描述1、资料的集中性描述——平均数 平均数,用来描述资料的集中性,即观察值以某一数值为中心而分布的性质;并以平均数作为资料的代表进行资料间的相互比较。 算术平均数:①计算方法②算术平均数的基本性质性质1离均差之和为零。性质2离均差平方和最小2 、资料的离散性描述——变异数变异数是表示观测值变异程度大小的特征数标准差的意义:平方和,离均差的 平方和的简称总体样本方差,用平方和除以观察值数目总 体方差样本方差(均方)标准差,方差的正平方根总体标准差 样本标准差自由度(DF),记作指样本内独立而能自由变动的离均差个数。三、抽样分布1、单样本平均数抽 样分布设母总体的均值为,方差为,容量为;现从这个总体中随机抽取容量为 的样本,则可抽出个样本,每个样本的平均数记为由样本平均数构成的总体称为样本平均数抽样总体,其平 均数和方差分别为它所服从的分布称为样本平均数的抽样分布。2、两样本均值相比较时的抽样分布设母总体 的均值分别为,方差分别为,容量分别为;现从总体中随机抽取容 量为的样本,则可抽出个样本,样本的平均数记为;从总体中随机抽取容量为的样本,则可 抽出个样本,样本的平均数记为由样本平均数差数构成的总体称为两样本平均数相 比较时的抽样总体,且抽样总体容量为,其平均数和方差分别为: ,它所服从的分布称为两样本均值之差的抽样分布。§1.2假设检验的基本原理一、定义1、无效假 设:假设两个总体间无效应差异,或它们的差异是由误差造成的。备择假设(或对应假设):与无效假设相对应的一 个统计假设。例:①单个平均数:一个样本所属的总体是否是已知总体(是否是从已知总体中抽出) (为已知总体均值)②两个平均数:两个样本是否是从两个具有相等参数的总 体中抽出2、显著水平:是用来判断是否成立的概 率标准3、接受区:在假设条件下,接受假设的区域否定区:在假设条件下,否定假设的区域二、假设检验的 步骤举例说明:设某地区的当地小麦品种一般每产300kg,即当地品种总体数,并且可获得 。现有某新品种通过25个小区试验,得其平均产量为每330kg,即 。问:新品种所属总体与当地品种总体之间是否有显著差异。(1)提出假设:(2)数据分析:(计算否定区与接受区) 由题可知:构造统计量当时,查表得则 落入否定区内(3)拒绝,即新品种所属总体与当地品种总体之间存在显著差异。三、一尾检验与两尾检验 两尾检验: 拒绝无效假设一尾检验:(右尾检验) 拒绝无效假设 (左尾检验)拒绝无效假设四、假设检验的两类错误第I类 错误:第II类错误:§1.3平均数的假设检验一、两种常见的检验方法1、-检验适用范围:总体方差已知,或大样 本时总体方差未知构造统计量判别标准:① 拒绝无效假设② (右尾检验) 拒绝无效假设③(左尾检验) 拒绝无效假设2、-检验适用范围:总体方差未知且小样本时构造统计量 其中判别标准:① 拒绝无效假设② (右尾检验)拒绝无效假设③ (左尾检验) 拒绝无效假设二、样本平均数的假设检验(一)、单个样本平均数的假设检验目的:检验某一样本均值所属总体平均数是否 和某一指定的总体平均数相同例1.1某春小麦良种的千粒重,现自外地引入一高产品种,在 8个小区种植,得其千粒重为:35.6、37.6、33.4、35.1、32.7、36.835.9、34.6(g)。问新引进品种 的千粒重与当地良种有无显著差异。解:提出假设由题可知:由 查表得:由得,接受,即新引进品种的千粒重与当地良种无显著差 异。(二)、两个样本平均数的假设检验目的:检验两样本所属总体平均数间有无显著性差异1、成组数据的 平均数比较如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两处理的样本容量是否相同,所得数据皆称 成组数据,以组(处理)平均数作为相互比较的标准。①、两样本总体方差已知:统计量:例1.2.据以往资料 ,已知某小麦品种每平方米产量的。今在该品种的一块地上用A、B两法取样,A法取12个样点,得每平 方米产量;B法取8个样点,得。比较A、B两法的每平方米产量是否 有显著差异?解:总体方差已知且相等,由接受,即A、B两法的每平方米 产量无显著差异。2、两样本总体方差未知时,但,样本为小样本时构造合并均方:标准误: 统计量:例1.3研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株,对照区玉米9株,其结果如表所示,试 作假设检验。解:(代表喷矮壮素的总体均值,代表对照区的总体均值)一尾检验,故有: 查表得:左尾检验,,拒绝 ,即喷矮壮素后,玉米株高显著地矮于对照区玉米。2、成对数据的假设检验若试验设计是将性质相同的两个供试单位 配成一对,并设有多个配对,然后每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。假设两样本观察 值,配成对,各差数提出假设:统计量: 其中例1.4选生长期、发育进度、植株大小和其他方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一 株接种B处理病毒,以研究不同处理方法的钝化病毒效果,表中结果为病毒在番茄上产生的病痕数目,试检验两种处理方法的差异显著性。 解:提出假设由题可知:于是:,拒绝即A、B两种方法 对钝化病毒有极显著差异§1.4参数的区间估计一、区间估计在一定的概率保证下,估计出一个范围或区间使其能够覆盖参 数,这样的区间称为置信区间,区间的上下限称为置信限,区间长度称为置信距,而表示的是该区间能覆盖参数的概率,称 为置信系数或置信度。二、常用参数的置信限1、总体平均数的置信限①已知时②未知时2、两总体平 均数差数的置信限①两总体方差已知,或未知大样本时②两总体方差未知且小样本时③成对数据 总体参数的置信限练习1调查某农场每30万苗和35万苗的稻田各 5块,得产量如表所示,试检验两种密度产量的差异显著性。练习2选面积为 的玉米小区各10个,各分成两半,一半去雄一半不去雄,得产量为:去雄:2830313 5303430283432未去雄:252829293125282732 27用成对比较方法检验的假设。-121867-727206-71 255-121534-61483112132-1525101(B法)(A法)组别42042544546044543544042045040035万苗30万苗170230210270150290170270200250160180200270160170160(对照)(喷矮壮素) |
|