配色: 字号:
《统计基础项目化教程》PPT 第7章
2022-10-26 | 阅:  转:  |  分享 
  
统计基础统计基础目录 contents认识统计相关与回归统计整理综合指标统计调查 抽样推断统计指数动态数列抽样推断
任务1 认识抽样推断任务2 计算抽样误差任务3 抽样估计任务4 确定必要样本容量 一、抽样推
断的概念、特点 抽样推断是建立在随机抽样原则基础上的。 抽样推断是运用概率论的理论与方法,用样本指标去估计和推断总体指标。
抽样推断中的抽样误差是不可避免的,但在事先是可以计算并加以控制的。 抽样推断按照随机原则,从总体中抽取
部分单位作为样本进行实际调查,并依据调查所得的样本数据,对总体的特征值做出具有一定可靠程度的估计与推断。 抽样推断——特点任务1
认识相关关系二、抽样推断的组织形式(1) 纯随机抽样(也称简单抽样)(2) 等距抽样(也称机械抽样或系统抽样)(3) 类型抽样
(也称分层抽样)(4) 整群抽样如:从仓库中存放的所有同类产品中,随机选出若干产品进行质量检查。如:从仓库中存放的所有同类产品中,
顺序排队编号,再按相等距离或计算间隔抽取。如:从仓库中存放的同类产品中,按厂商分类或型号分类,在各类型中分别随机抽取。
如:主要用于质量控制,流水线每隔2小时抽取5分钟的样品进行检验。 1. 抽样调查具有破坏性,为了测算全面资料,必须
采用抽样推断的方法。某些理论上可以进行全面调查的,采用抽样推断可以达到事半功倍的效果。 3. 抽样推断可以用
于工业生产过程中的质量控制。三、抽样推断的作用如:电视机的寿命 、 手表的抗震能力等如:调查大学生平均每天上网时间;居民对社会公
共事务满意度等如:批量生产、流水线上的生产过程的质量控制四、抽样推断中常见的几个基本概念所研究对象的全体叫做全及总体,简称总体。全
及总体包括的单位数一般以 N 表示。按随机抽样方法从全及总体中抽出的部分单位所组成的集合体,称作样本总体简称样本。用 n 表示
。全及总体——样本总体——n≥ 30 大样本﹤ 30 小样本总体指标样本指标(1)总体平均数 (2)总体成数
P(3)总体标准差 (1)样本平均数 (2)样本成数 p(3)样本标准差 s样本推断总体图解 重复抽样——
从总体 N 个单位中,随机抽取 n 个单位,每次都是从N 个数目中抽取。不重复抽样—— 从总体N 个单位中,随机不重复抽取 n 个
单位构成一个样本,则每次抽取的总体数目依次为N、(N -1 )、(N -2)、(N -3)… …(N -n+1)个。先后抽出来的各
个单位被抽中机会是不相等的。 在实际工作中一般多采用不重复抽样。一、抽样误差抽样平均误差——是所有可能出现的样本指标的标准差,是
由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。任务2 计算抽样误差二、抽样平均误差抽样平均误差分两种A公司从生产的
100,000只电子元件中,随机抽取100只进行耐用时间检测,假如该电子元件以往抽样中平均使用寿命的标准差为100小时,
试计算:该企业电子元件平均使用寿命的抽样平均误差。举例 财经学院想要估计学生午餐在学校食堂的平均花费金额,在为期 4
周的时间里选了64 名学生组成了一个简单随机样本,得出64名学生平均每人午餐消费16元,假定总体标准差为 10元,计算平均午餐花
费金额的抽样误差。练一练举例 某种电子元件,按正常生产经验,产品的一级品率一般为70%,现在从10000件产品中随机抽取100件进
行检验,试计算根据抽样检验结果推断该批产品一级品率的抽样平均误差。练一练 某一养殖场共养家禽5000只,为了解家禽感染某种
疾病情况,不重复抽取100只家禽进行检查,发现有7只感染某种疾病,计算家禽感染某种疾病的抽样误差。某电子产品使用寿命在3000小时
以下为不合格产品,现随机从10000件产品中抽取1%,对其使用寿命进行检验,结果如表:举例:试根据资料计算平均寿命和合格率的抽样误
差。 100个电子元件使用寿命测试检验表影响抽样平均误差大小的因素1. 总体单位标志值的差异程度2. 样本单位数的多少3. 抽样方
法4. 抽样调查的组织形式(重复抽样和不重复抽样)(简单抽样、机械抽样、类型抽样和整群抽样)作业一批货物10,000件运抵仓库,随
机抽取1%检验其质量,调查得出这1%货物平均每件重量 320克 ,标准差为20克,计算该批货物重量的抽样平均误差。 2.
一批货物30,000箱(24件/箱)运抵仓库,随机抽取10箱检验其质量,发现其中有6件不合格,计算该批货物合格率的的抽样平均
误差。 三、抽样极限误差1. 什么是抽样极限误差 —— 也称允许误差, 是抽样指标与总体指标之间,在
一定概率保证程度下的抽样误差的最大可能范围。用△表示。△——表示样本平均数的抽样极限误差则:——表示样本成数的抽样极限误差则:2.
抽样平均误差与抽样极限误差的区别3. 抽样极限误差(允许误差)的计算抽样极限误差是人为规定的,需要以一定的概率作保证,概率保证程
度对应一个系数,即:概率度。即:抽样极限误差 =概率度 t × 抽样平均误差 概率度——扩大或缩小抽样平均误差的
倍数,用 t 表示。△ 常用概率度 t 与对应概率保证程度 F(t ) 数值概率度误差范围概率保证程度Δ F(t )1.00
1.645 1.96 2.00 3.00 数理统计证明: 极限误差△ 的变化范围和把握程度之间有密切关系。即:扩大抽样误
差的范围能够提高推断的把握程度; 缩小抽样误差的范围能够降低推断的把握程度。概率度 t 越大,概率保证程度也越大(1)
平均指标的抽样极限误差 采用重复抽样: 采用不重复抽样 (2)成数的抽样极限误差 采用重复抽样:
采用不重复抽样 抽样极限误差抽样极限误差 的计算公式△ 任务3 抽样估计 由于总体
指标是未知的,需要用样本数据进行估计和计算;抽样估计就是根据样本计算的样本指标数据对总体指标作出数量上的判断和估计。一、点估计点估
计不足之处在于没有说明估计的概率保证程度有多大,是一种粗略的估计。 二、区间估计首先,分析以下三种情况:区间估计,就是根据样本指标
和抽样平均误差,在一定的概率保证程度下推断总体指标的可能范围。包括两部分内容:一是这一可能范围的大小;二是总体指标落在这个可能范围
内的概率;区间估计既表明估计结果的准确程度,同时也表明这个估计结果的可靠程度。所以区间估计是比较科学的,数理统计证明: 极限
误差△ 的变化范围和把握程度之间有密切关系。即: 扩大抽样误差的范围能够提高推断的把握程度;缩小抽样误差的范围能够降低推断的
把握程度。因此,计算极限误差 △(△=t ) 的目的,就是进行区间估计。就是在一定的概率保证程度下,对总体指标作出一个区间估计,
也称置信区间。 总体指标的具体区间范围可表示为:估计值 概率度×抽样平均误差估计值 抽样误差范围1. 总
体平均指标的区间估计方法:2. 总体成数的区间估计方法: A公司对所生产的一批电子元件进行耐用时数检查,按随机重复抽样方
法抽取100个作了耐用测试,所得结果如表所示: 100个电子元件耐用时数的测试数据表要求: (1)在95.45%的概率保证程度下
对该批电子元件的平均耐用时数做出区间估计; (2)对耐用时数在1000小时以上的电子元件进行区间估计。 举例:
举例: 某厂生产一批汽车用火花塞10,000个,规定火花塞的使用寿命不低于3万公里,随机抽取1%检查其使用寿命,检查结果是:
1%的火花塞的平均寿命是3.6公里/个,标准差是0.45公里/个, 在1%的火花塞中,寿命低于3万公里的共10个。要求: (1)
试以95%的概率保证程度推断该批火花塞平均使用寿命的置信区间; (2)同时估计这批火花塞合格率的置信区间作业某自行车轮胎厂从生产
的一批10 000条轮胎中。随机抽取1%进行质量检查。调查结果:轮胎的平均寿命为5000公里。 要求:试以95%的把握程
度对该批轮胎的的平均寿命作出估计。 (据长期生产这种类型轮胎的数据可知,总体标准差是400公里)
2. 某县随机抽取100户农户,调查农民家庭年收入情况,发现年收入在50 000元以上的农户有
65户。 要求:试以95.45 %的把握程度对全县年收入在50 000元以上的农户数所占比重作出估计。
所谓必要的样本容量——是指既能满足抽样推断精确性和可靠性的要求,
又不会造成过于 浪费的样本单位数目。因此,必
要样本容量就是在保证误差不超过规定范围的条件下,尽可能节省人、财、物。一、必要样本容量的计算公式任务4 确定必要样本容量1.
总体平均指标的必要样本容量(1)重复抽样条件下由于 所以 (2)不重复抽样条件下 由于 所以 举例: 吉林市拟对职
工家庭收入状况进行抽样调查,根据历史资料已知本市职工家庭平均每人每月生活费收入的标准差为120.00元,若要求推断的可靠程度为0.
95,允许误差范围为10元,则需抽取多少户家庭样本单位数进行调查?2. 总体成数的必要样本容量(1)重复抽样条件下由于 所以
(2)不重复抽样条件下 由于 所以 某公司欲对一批产品抽样检验其合格率,已知其过去的合格品率曾有
过99%、97%、95%三种情况,现在要求推断的极限误差不超过1%, 把握程度为95.45%,则需要抽检的产品数量为
:举例: 某企业收到供货单位发运来的一批零配件共5000个,按以往零配件的合格率不低于95% 就接受该批零件,过去
抽检的合格率曾有过97%、95%、94%三种情况。现要求抽样合格率的极限误差不超过1%,概率保证程度为95.45%,试问采用不重复
抽样方式应该抽取多少个零件调查其质量。练一练二、影响必要样本容量的因素1. 总体中各单位标志变异的程度,即总体方差
的大小2. 允许的误差范围,即3. 概率保证程度的大小4. 抽样方法和抽样组织方式值的大小三、 确定样本容量应注意的问题必要
的样本容量 受允许误差范围 的制约, 越小,则样本容量 n 就越大, 但两者并不是保持等比
例的变化。 以重复抽样来说,在其他条件不变的情况下: 误差范围 缩小一半,则样本容量必须
扩大到原来的4倍; 而误差范围 扩大一倍,则样本容量只需要原来的1/4。 所以,在抽样方案
设计中对抽样误差的允许范围必须要十分谨慎的抉择。n 2. 有时需要对一个总体的平均数和成数同时做出推断,但由于它们的方差和
允许 的误差范围或要求的可靠性不同,因此需要的样本容量也可能不同。平均数推断成数推断和为了满足的共同需要,必须要按较大
的样本容量来抽取样本。 对某企业生产的某种型号的电池进行电流强度检验,根据以往正常的生产经验,该电池电流强度的标准差0.4安
培,合格率一般在90%左右。 现在拟采用纯随机重复抽样的方式进行抽样检验,要求在95%的概率保证程度下,平均电流强度推断的极限误差不超过0.06安培,产品合格率推断的极限误差不超过5%。 试确定必要的样本容量应为多少?举例:抽 样 推 断抽样极限误差必要样本容量 本章知识点作业为了解财经学院学生每月生活费支出情况,随机抽取了100名大学生进行调查,调查结果如表:要求: (1)在95.45%的置信概率下,对财经学院所有大学生平均每月生活费用支出情况进行区间估计; (2)如果其他条件不变,允许误差缩小为原来的1/2,那么应抽取多少个大学生进行调查; (3)在同样概率条件下,对月消费支出在2000元以上的大学生进行区间估计。
献花(0)
+1
(本文系籽油荃面原创)