(2)据报道,某公司33名职工的月工资(单位:元)如下据报道,某公司33名职工的月工资(单位:元)如下练习3.特征值估计1.聚中(稳定)性特征值估计2.离散(波动)性特征值估计3.结构性特征值估计众数,平均数中位数,方差,极差,标准差频率,3δ原则练习3.特征值估计1.聚中(稳定)性特征值估计众数,平均数中位数,(4)《固学案》P:29Ex4(1)求该公司职员月工资的平均数,中位数,众数(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合问题谈一谈你的看法150020002500300035005000550020351211职员管理员经理总经理董事副董事长董事长(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数,中位数,众数又是什么§81特征值估计法一、特征值的求法二、特征值估计1.定义法:2.图表法:1.聚中(稳定)性特征值:2.离散(波动)性特征值:3.结构性特征值:众数,平均数中位数,方差,极差,标准差频率,3δ原则统计概述总体样本抽样估计推断估计推断(预测)④①②③①②数估:图估:式估:频率(概率),平均数(期望)…频率表,分布列…频率图,频率折线图,条形图,直方图,茎叶图相关:2x2列联表…③分布列:线性相关,回归方程…独立性检验:将事件及其结果数化…表估:平均数,中数,众数,极差,方差,标准差扇形图,密度曲线,正态曲线…密度函数解析式…等可能抽样非等可能抽样放回抽样不放回抽样简单随机抽样分层抽样系统抽样抽签法随机数表法注1:是在整个抽样过程中,每一个个体被抽到的机会相等等可能抽样中的“等可能”的含义:其概率为样本个体数总体个体数即在整个抽样过程中,每一个个体被抽到的概率相等抽样方法注2:简单随机抽样的概念:参课本P:56等可能抽样非等可能抽样放回抽样不放回抽样简单随机抽样分层抽样系统抽样抽签法随机数表法抽样方法注3:相同点①等可能总体个数较少时,用简单随机抽样法用途不同个体差异较大时一般的是多法并用步骤不同简单随机抽样,分层抽样与系统抽样的关联:不同点反之用系统抽样法,用分层抽样法,②不放回③随机(即概率为)样本个体数总体个体数等可能抽样非等可能抽样放回抽样不放回抽样简单随机抽样分层抽样系统抽样抽签法随机数表法抽样方法与现实生活中的抓阄比较,最大的不同是要“编号”编号制签搅匀抽签成样抽签法注4:一般的,抽签法的编号是以01(001…)开头①②步骤:参课本P:56③等可能抽样非等可能抽样放回抽样不放回抽样简单随机抽样分层抽样系统抽样抽签法随机数表法抽样方法要明确随机数表表中“列”的含义编号选头三读号常走”S”重大舍随机数表法注5:一般的,随机数表法的编号是以00(000…)开头①②步骤:参课本P:57③等可能抽样非等可能抽样放回抽样不放回抽样简单随机抽样分层抽样系统抽样抽签法随机数表法抽样方法分层抽样每层“名额”按比例不整不等暂忽略第一层被抽取的个体数第一层的个体数第二层被抽取的个体数第二层的个体数第三层被抽取的个体数第三层的个体数样本容量总体个数总体明显有差异按质分组称分层====…1.何时用2.如何用注:系统抽样(分组、等段、机械抽样法)抽样法编号分组三选号抽几分几要均匀每组“1人”是规律不整剔除要随机头组随机选“1人”其他各组套公式不作说明是等差法1法2实际生产流水线按数分组称系统系统抽样,类似于:要从N=k×n个人中,抽取n个人…………先将N=k×n个人排成一列然后等距离抽取n个人故系统抽样又名等段抽样系统抽样抽取的个体的编号构成了一个等差数列…………………………先将N=k×n个人排成k×n的方阵然后抽取一列(即分段间隔为k)n行(即分成n个组)k列故系统抽样又名机械抽样§81特征值估计法一、特征值的求法二、特征值估计1.定义法:2.图表法:1.聚中(稳定)性特征值:2.离散(波动)性特征值:3.结构性特征值:众数,平均数中位数,方差,极差,标准差频率,3δ原则一、特征值的求法1.定义法:2.图表法:一般的为准确值一般的为近似值练习1.求众数,中位数,平均数众数、中位数、平均数的概念(2)中位数:将一组数据按大小依次排列,把处在最中间(1)众数:在一组数据中,出现次数最多的数据叫做(3)平均数:一组数据的算术平均数,即这组数据的众数位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数一、特征值的求法1.定义法:2.图表法:一般的为准确值一般的为近似值练习1.求众数,中位数,平均数(1)《固学案》P:29Ex4乙队……变式参《导学案》P:64预学1~预学3参《导学案》P:65预学4150020002500300035005000550020351211职员管理员经理总经理董事副董事长董事长(1)求该公司职员月工资的平均数,中位数,众数(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数,中位数,众数又是什么解:(1)平均数为2091元,中位数为1500元,众数为1500元解:(2)平均数为3288元,中位数为1500元,众数为1500元一、特征值的求法1.定义法:2.图表法:一般的为准确值一般的为近似值注:利用频率直方图求特征值的近似值方法参课本P:72或参《导学案》P:65预学4练习1.求平均数,中位数,众数(1)定义法:(2)图表法:频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)直方图中最高矩形的中点的横坐标利用频率直方图求众数的近似值2.250.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.022.02利用频率直方图求中位数的近似值直方图中位数左右两边的面积和要相等面积和为0.5面积和为0.5课本P:72思考因为直方图只是比较直观地表明了分布的形状但是从直方图本身得不到原始的数据内容直方图已经损失了一些样本信息故由直方图得到的中位数与其实际值往往不一致2.02这个中位数的估计值,与样本的中位数值2.0不一样你能解释其中原因吗?利用频率直方图求平均数的近似值图中每个小矩形的面积乘以小矩形底边中点的横坐标之和=2.02方差是各个数据与平均数之差的平方的和的平均数标准差是方差的算术平方根1.定义法:练习2.求方差,标准差,极差极差是一组数据中最大值与最小值的差方差常见的性质:1.数据x,x,x,…,x的平均值来乃为x,方差为O2.若数据的平均值为,方差为则数据平均值为,的方差为练习2.求方差,标准差,极差1.定义法:(3)《固学案》P:29Ex4甲队……变式2.图表法:到了高二,主要是利用正态曲线,求方差,标准差……§81特征值估计法一、特征值的求法二、特征值估计1.聚中(稳定)性特征值:2.离散(波动)性特征值:3.结构性特征值:众数,平均数中位数,方差,极差,标准差频率,3δ原则二、特征值估计1.聚中(稳定)性特征值与每一个数据有关众数平均数中位数特征总体水平对半水平多数水平重心点中心点最大集中点不受极端情况的影响掩盖了极端情况无法反映总体水平只反映多数水平二、特征值估计1.聚中(稳定)性特征值2.离散(波动)性特征值方差极差标准差只能反映一组数据中两个极值之间的大小情况方差越大,说明数据的波动越大,越不稳定标准差是方差的变形,只是方差的单位是原数据故标准差的作用与方差的相同单位的平方,而标准差的单位与原数据单位相同而对其他数据的波动情况不敏感特征二、特征值估计1.聚中(稳定)性特征值2.离散(波动)性特征值3.结构性特征值①②频率3δ原则:课本P:79~80数据Yi的取值几乎全部集中在区间(μ-3σ,μ+3σ)内①数值Yi分布在区间(μ-σ,μ+σ)内的概率为0.6826②数值Yi分布在区间(μ-2σ,μ+2σ)内的概率为0.9544③数值Yi分布在区间(μ-3σ,μ+3σ)内的概率为0.9974即在正常状态下,可以认为:而落在该区间之外的可能性不到3‰已知某组数据Y1,Y2,Y3,……的平均值为μ,标准差为σ则在正常状态下,可以认为:这在统计学上称为3σ准则(三倍标准差原则),也称3σ原则,或3σ规则,3σ原理3δ原则:课本P:79~80Sheet3
Sheet2
12
Chart4
组距
频率/组距
范围
频数
频率
.00
.00
.00
00.00
.00
.00
.00
.00
.00
00.00
.00
.00
.00
0.00
.00
00.00
.00
.00
.00
0.00
.00
00.00
.00
.00
.00
0.00
.00
00.00
.00
.00
.00
0.00
.00
00.00
.00
.00
.00
.00
.00
00.00
.00
.00
.00
.00
.00
00.00
.00
.00
.00
.00
.00
00.00
.00
.00
月均用水量/t
频率分布直方图
月均用水量/t
.00
.00
.00
.00
.00
.00
.00
.00
.00
.00
.00
.00
.00
.00
.00
.00
.00
.00
|
|