|
§111 样本...估计...总体 |
|
|
一、特征值估计:1.定义:2.求法:3.估计:<1>聚中(稳定)性特征值:与每一个数据有关众数平均数中位数特征总体水 平对半水平多数水平重心点中心点最大集中点不受极端情况的影响掩盖了极端情况无法反映总体水平只反映多数水平一、特 征值估计:1.定义:2.求法:3.估计:<1>聚中(稳定)性特征值:<2>离散(波动)性特征值:众数,平均数中位数 ,方差极差标准差只能反映一组数据中两个极值之间的大小情况方差越大,说明数据的波动越大,越不稳定标准差是方差的变形,只是 方差的单位是原数据故标准差的作用与方差的相同单位的平方,而标准差的单位与原数据单位相同而对其他数据的波动情况不敏感特 征3.特征值估计:<1>聚中(稳定)性特征值:<2>离散(波动)性特征值:众数,平均数中位数,方差 ,极差,标准差注:常见的三类估计问题:,如何估计……①已知,②已知,,如何估计… …③已知,,如何估计……3.特征值估计:<1>聚中(稳定)性特征值:<2>离散(波动)性特征值: <3>结构性特征值:众数,平均数中位数,方差,极差,标准差①频率:……②3δ原则:参《选修2-3》P:79 ~80数据Yi的取值几乎全部集中在区间(μ-3σ,μ+3σ)内①数值Yi分布在区间(μ-σ,μ+σ)内的概率为0.6826 ②数值Yi分布在区间(μ-2σ,μ+2σ)内的概率为0.9544③数值Yi分布在区间(μ-3σ,μ+3σ)内的概率为0. 9974即在正常状态下,可以认为:而落在该区间之外的可能性不到3‰已知某组数据Y1,Y2,Y3,……的平均值为μ,标准差为 σ则在正常状态下,可以认为:二、图估计1.条形图:2.直方图:是用一个单位长度表示一定的数量,根据数量的多少画成长短 不同的直条,然后把这些直条按一定的顺序排列起来。注:频率条形图中,纵坐标是频率S2.确定组距与组数:S1.求极差: S3.将数据分组:S4.列频率分布表:S5.画频率分布直方图:①制作步骤:②频率直方图中,面积是频率(1)《必修3 》P:65~66探究3.12.52.02.01.51.01.61.81.91.63.4 2.62.22.21.51.20.20.40.30.43.22.72.32.1 1.61.23.71.50.53.83.32.82.32.21.71.33.61 .70.64.13.22.92.42.31.81.43.51.90.84.33.0 2.92.42.41.91.31.41.80.72.02.52.82.32.3 1.81.31.31.60.92.32.62.72.42.11.71.41.2 1.50.52.42.52.62.32.11.61.01.01.70.82.42. 82.52.22.01.51.01.21.80.62.2我国是世界上严重缺水的国家之一,城市 缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):若希望大部分居 民的日常生活不受影响,a定为多少较为合理?我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划 在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查 ,获得100位居民2007年的月均用水量如下表(单位:t):3.12.52.02.01.51.01.6 1.81.91.63.42.62.22.21.51.20.20.40.30.43 .22.72.32.11.61.23.71.50.53.83.32.82.32. 21.71.33.61.70.64.13.22.92.42.31.81.43.5 1.90.84.33.02.92.42.41.91.31.41.80.72.0 2.52.82.32.31.81.31.31.60.92.32.62.72.42 .11.71.41.21.50.52.42.52.62.32.11.61.01. 01.70.82.42.82.52.22.01.51.01.21.80.62.2 S1.求极差:4.3-0.2=4.10.24.3S2.确定组距与组数:一般的,当样本容量不超过100时,常分 成5~12组S1.求极差:4.3-0.2=4.1组距极差组数==4.1=0.58.2,取整后组数为 9S3.将数据分组:S4.列频率分布表:横轴上的数据区间,整个区间是闭区间子区间是左闭右开(最右端的子区间是闭区间) [0,0.5),[0.5,1),[1,1.5),…,[4,4.5]分组频数累计频数频率 [0,0.5)40.04[0.5,1)正8 0.08[1,1.5)正正正150.15[1.5,2)正正正正 220.22[2,2.5)正正正正正250.25[2.5,3)正正 140.14[3,3.5)正一60.06[3.5,4) 40.04[4,4.5]20.02 合计1001.00S4.列频率分布表:月均用水量/t频率组距 0.50.40.30.20.10.511.522.533.544.5OS2.确定组距与组数: S1.求极差:S3.将数据分组:S4.列频率分布表:S5.画频率分布直方图:由直方图可以看出:88%的居民每月用 水量在3t以下故a=3t是一个可以考虑的标准一、特征值估计二、图估计1.条形图:2.直方图:3.频率折线图: 4.密度曲线:5.茎叶图:6.扇形图:频率条形图中,纵坐标是频率频率直方图中,面积是频率7.雷达图……3. 频率折线图频率分布直方图中各个小长方形上端的中点的连线已知某数据的频率分布直方图如下,月均用水量/t频率组距 0.100.200.300.400.500.511.522.533.544.5则其频率折线图是:x y04.密度曲线随着样本容量的无限增大直方图的组距无限减小频率折线图就会无限接近于接近于一条光滑曲线注 :正态曲线4.密度曲线随着样本容量的无限增大.直方图的组距无限减小频率折线图就会无限接近于接近于一条光滑曲线正常状态下 的密度曲线,或可理解成密度曲线的特例频率折线图正态曲线密度曲线直方图二、图估计1.条形图:2.直方图:3.频率折线 图:4.密度曲线:5.茎叶图:频率条形图中,纵坐标是频率频率直方图中,面积是频率(1)制作:(2)特点:(3)估 计:先茎后叶,大小顺序,重复记录,个数作叶因保留了原始数据,故可随时增减数据,但数据较多时,操作量过大①数估:中位数;均 值;极差;标准差……②形估:将其旋转900,可近似地看成直方图,密度曲线二、图估计1.条形图:2.直方图:3.频率折线 图:4.正态曲线:直方面积条形高左开右闭和为1正态曲线是细化茎叶折线扇形图5.茎叶图:6.扇形图:频率条形图中 ,纵坐标是频率频率直方图中,面积是频率是用整个圆的面积表示总数(单位1)用扇形的面积表示各部分在总体中所占的百分比(2 ).(2012年安徽)甲,乙两人在一次射击比赛中各射靶5次两人成绩的条形统计图如图所示,则A.甲的成绩的平均数小于乙 的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极 差次数环数0341325678次数环数03413256789甲 乙4,5,6,7,85,5,5,6,9S甲2=,S乙2=【C】(3).(2008年新课标)从甲,乙两品种的棉花中各抽 测了25根棉花的纤维长度(单位:mm),结果如下:由以上数据设计了如下茎叶图:根据以上茎叶图,对甲乙两品种棉花的纤维长 度作比较写出两个统计结论:①____________②___________(3).(2008年新课标)……茎叶图:根据以 上茎叶图,对甲乙两品种棉花的纤维长度作比较,写出两个统计结论:①_______________②_____________ _____法1:求出:中位数,均值,方差……等具体值,……法2:利用茎叶图:估计……①乙品种棉花的纤维平均长度大于甲品种棉花 的纤维平均长度②甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度③甲品种 棉花的纤维长度的中位数为307mm,乙品种棉花的纤维长度的中位数为318mm.乙品种棉花的纤维长度较甲品种棉花的纤维长度更 集中(稳定)④乙品种棉花的纤维长度基本上是关于均值对称的甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均 匀.而且大多集中在中间(均值)附近某高校调查了200名学生每周的自习时间(单位:小时)制成了如图所示的频率分布直方图,其中 自习时间的范围是[17.5,30],样本数据分组为[17.5,20)[20,22.5),[22.5,25),[25,27. 5),[27.5,30]根据直方图,这200名学生中,每周的自习时间不少于22.5小时的人数是A.56 B.6 0 C.120 D.140析:由图可知,所求人数为[(0.16+0.08+0.04)×2.5]200× =200×0.7=140【D】(4)《新考案》P:141Ex4(2016年山东)估计§1 11样本总体一、特征值估计二、图估计三、表,式及其他估计1.定义:2.求法:3.估 计:1.条形图:2.直方图:3.频率折线图:4.密度曲线:直方面积条形高左开右闭和为1正态曲线是细化茎叶折线扇形 图5.茎叶图:6.扇形图:概率与统计简述总体样本抽样估计推断回归分析相关分析分布列及期望概率 计数计数问题总述复杂的计数问题简单的计数问题排列组合型计数原理型十大题型两理两数四原则十大题型递推法复杂 的计数问题简单的计数问题排列组合型计数原理型十大题型计数问题与二项式定理组合数的性质及证法二项式定理通项公式展开 式两理两数四原则十大题型递推法通项公式是重点前项为1赋值法一、求指定项:三、整除:二、求系数:1.要灵活选用展 开式与通项公式:四、证明等式(不等式):五、近似计算:2.要灵活选用先变形后展开:1.求指定项的系数:2.求系数和( 差):赋值法、导数法……等同于求指定项……二项式定理的应用欲证An能被x整除然后将(kx±b)n展开整 理成,先构造:An=(kx±b)n(kx±b)n=x(……)+x0的形式即可1
11递推法构造杨辉三角形1 46411211331………………………………………… 15101051161520156 1172135352171每行除两端1以外的每一个数都 等于它肩上的两个数的和中的上下标,类似于点的坐标……横看,斜看……通项公式法构造杨辉三角形杨辉三角形与组合数的 性质1.对称性2.增减性3.拆并性4.可和性左右对称抛物线左增右减中间大拆并要连同上大下+1②①系 数求和赋值法方法要熟正负1②① 15 51 1 11 1 21 1331 161561 11………………………………1520101064①对称性 114②增减性11左右对称抛物线左增右减中间大 1 551 1 11 121 1331 16 156111…………………………… …1520101064①对称性114②增减性11③拆并性拆并要连同上大下+1③拆并性 1551 1 11 121 1331 16 156111 ………………………………152010106411411拆并性的推广: 1
11121 133114641 15101051161520156 11721353521711828 567056288119368412612684 3691………………………………++++++④可和性 如图,纵横各分别为m、n条路AB杨辉三角与纵横图从A走到B的最短不同路径(只能由左到右,由上向下行走 )有条等可能抽样非等可能抽样放回抽样不放回抽样简单随机抽样分层抽样系统 抽样抽签法随机数表法注1:是在整个抽样过程中,每一个个体被抽到的机会相等等可能抽样中的“等可能”的含义 :其概率为样本个体数总体个体数即在整个抽样过程中,每一个个 体被抽到的概率相等抽样方法等可能抽样非等可能抽样放回抽样不放回抽样简单随机抽样分层抽样系统抽样抽 签法随机数表法注2:简单随机抽样的概念:参《必修3》P:56抽样方法等可能抽样非等可能抽样放回抽样不放回 抽样简单随机抽样分层抽样系统抽样抽签法随机数表法与现实生活中的抓阄比较,最大的不同是要“编号”编号制签搅匀 抽签成样抽签法注3:一般的,抽签法的编号是以01(001…)开头①②步骤:参《必修3》P:56③抽样方法 等可能抽样非等可能抽样放回抽样不放回抽样简单随机抽样分层抽样系统抽样抽签法随机数表法要明确随机数表表中“列 ”的含义编号选头三读号常走”S”重大舍一般的,随机数表法的编号是以00(000…)开头①②步骤:参《必修 3》P:57③注4:随机数表法抽样方法注4:分层抽样每层“名额”按比例不整不等暂忽略第一层被抽取 的个体数第一层的个体数第二层被抽取的个体数第二层的个体数第三层被抽取的个体数第三层的个体数样本容量总体个数总体明显 有差异按质分组称分层====…1.何时用2.如何用注:比例不整时,不是简单的四舍五入,是个很复杂的问 题阿罗不可能定理:没有最公平,只有更公平1952年,美国经济学家阿罗提出此定理为此,1972年阿罗获得了诺贝尔经 济奖编号分组三选号抽几分几要均匀每组“1人”是规律不整剔除要随机头组随机选“1人”其他各组套公式 不作说明是等差法1法2实际生产流水线按数分组称系统注5:系统抽样(分组,等段,机械抽样法)抽样法具体步 骤:参《必修3》P:58等可能抽样非等可能抽样放回抽样不放回抽样简单随机抽样分层抽样系统抽样抽签法随机数表法注 6:相同点①等可能总体个数较少时,用简单随机抽样法用途不同个体差异较大时一般的是多法并用操作的步骤不同简单随机抽 样,分层抽样与系统抽样的关联:不同点反之用系统抽样法,用分层抽样法,②不放回③随机(即概率为 )样本个体数总体个体数抽样方法估计§111样本总体一、 特征值估计二、图估计三、表,式及其他估计1.定义:2.求法:3.估计:1.条形图:2.直方图:3.频率折线图:4 .密度曲线:直方面积条形高左开右闭和为1正态曲线是细化茎叶折线扇形图5.茎叶图:6.扇形图:②众数:①中位 数:③频数:④频率在一组数据中出现次数最多的数据,叫做这组数据的众数将一组数据按大小依次排列,把处 在最中间位置的一个数据(或最中间两个数据的平均数),叫做这组数据的中位数将总数据按照某种标准分成若干个组每组 内含有个体的数目叫做频数,也称“次数”(概率):某个组的频数与样本容量的比值叫做该组的频率一 、特征值估计1.定义:⑦方差:⑧极差:⑥标准差:⑤均值一组数据的算术平均数②众数:……①中位数:……③频数 :……④频率(概率):……一、特征值估计1.定义:各数据与平均数差的平方和的平均数叫做方差方差的算术平方根叫做标 准差一组数据中最大数与最小数的差(期望):一、特征值估计1.定义:……2.求法:②公式法:①定义法:一般为 准确值一般为近似值③图表法:方差是各个数据与平均数之差的平方的和的平均数标准差是方差的算术平方根①定义法: ……2.特征值的求法:②公式法:①定义法:……<1>.数据x,x,x,…,x的平均值为x,方差为O<2>.若数据的平均值为,方差为则数据的平均值为,方差为<3>.若数据的平均值为,方差为数据的平均值为则2.特征值的求法:②公式法:……①定义法:……③图表法:注1:在频率分布直方图中<1>众数:最高矩形的中点的横坐标<2>中位数:左右两边直方图的面积和各为0.5的点的横坐标<3>平均数:每个小矩形面积乘以小矩形底边中点的横坐标之和2.特征值的求法:②公式法:……①定义法:……③图表法:注2:在茎叶图中如何看数据的稳定性<1>单峰的稳定性大于多峰的稳定性<2>越对称稳定性越好<3>峰越瘦越尖,数据更集中,更稳定峰越矮越胖,数据越分散,不稳定一、特征值估计:1.定义:2.求法:3.估计:中位数众数频数频率均值标准差极差方差作用特征值对半水平个体位置百分比平均水平稳定性稳定性稳定性平均水平<1>聚中(稳定)性特征值:<2>离散(波动)性特征值:<3>结构性特征值:众数,平均数中位数,方差,极差,标准差频率,3δ原则 |
|
|
|
|
|
|
|
|
|
|