配色: 字号:
04-参数估计(2015研)
2016-05-25 | 阅:  转:  |  分享 
  
35Noticethattheintervalwidthisdeterminedby1-?inthesamplingdistribution.33下面分别介绍:举例:测得某地11名20岁男大学生身高=172.25cm,S=3.31cm,估计该地20岁男大学生身高均数的95%的可信区间。答:即:该地20岁男大学生身高均数的95%可信区间为170.03cm~174.47cm1.明确条件2.用t分布法求可信区间n=11,=172.73cm,S=4.19cm,双侧t0.05=2.228【实验】:从前面某年某地所有女学生所构成的正态总体N(155.4,5.32),抽到100份随机样本,计算每份样本的95%可信区间。1-α可信度的含义:表6.1从正态总体N(155.4,5.32)抽到的100份随机样本的可信区间(n=30)样本号均数标准误95%可信区间样本号均数标准误95%可信区间1156.70.91154.8158.654155.60.92153.7157.52158.10.95156.2160.155154.80.83153.1156.53155.61.6153.5158.156155.60.96153.6157.64155.21.03153.1157.357158.20.97156.2160.25155.01.01152.9157.058154.91.06152.7157.16156.41.08154.2158.659153.40.91151.5155.37154.91.12152.6157.1……………8156.50.74154.9158.091155.10.90153.2156.99155.01.09152.8157.292156.61.03154.5158.710155.90.98153.9157.993156.01.08153.8158.211156.90.98155.0158.994155.80.93153.9157.7……………95156.10.83154.4157.849156.10.81154.5157.896152.70.75151.1154.250154.71.04152.6156.897155.10.93153.2157.051155.70.97153.7157.798155.30.90153.5157.252153.70.80152.1155.399154.60.71153.2156.153154.80.89153.0156.6100156.61.16154.2159.01-5%可信度实际含义:从总体中进行随机抽样,共作100次抽样,每个样本可算得一个可信区间,得100个可信区间:平均有95个可信区间包括μ(估计正确),只有5个可信区间不包括μ(估计错误)。(1-?)%概率包含了?;?%的概率未包含?1-aa/2a/2可信区间概念:总体均数的1-α可信区间指一个范围,指该范围包含μ在内的可能性为1-α,不包含μ在内的可能性为α;常用1-α为95%和99%,又称置信区间。可信限的概念:指可信区间的下限和上限,即两个端点值。可信区间是指以上、下可信限为界的一个范围,但不包含上下限两个值,故用()表示,其为开区间。下可信限上可信限95%可信区间99%可信区间公式区间范围窄宽估计错误概率大(0.05)小(0.01)区间的精确性小大()()99%可信区间95%可信区间正态总体均数μ的区间估计方法:t分布法总体方差σ2未知,样本n较小时(n≤30)时:依据于t分布可信区间t=正态分布法1.总体方差σ2已知:呈标准正态u分布2.总体方差σ2未知,但样本n较大(n>30)时:接近于标准正态u分布。可信区间依据于u分布?X99%样本95%样本xxs96.1-正态分布法:小结⒈从同一总体中,随机抽取相同含量的样本,由重复抽取的每一份样本均可计算一个样本统计量,样本统计量的分布即为抽样分布。2.来自正态分布总体的样本均数仍服从正态分布;即使从偏峰分布总体抽样,只要n够大,样本均数的分布与近似于正态分布。其样本均数的均数为原变量的均数μ;其样本均数的标准差叫标准误,为3.从同一总体中,随机抽取相同含量的若干份样本,各样本统计量之间以及样本统计量与参数之间存在差异,属于抽样误差,反映抽样误差大小的指标叫标准误。若原变量的总体标准差是σ,则均数的标准误是样本估计值是。若原变量的总体概率是π,则频率的标准误是样本估计值是。由于总体中个体变异的客观存在,抽样误差是不可避免的,但可随样本含量的增大而减小。4.当X服从均数为μ的正态分布时,统计量服从自由度为γ=n-1的t分布。t分布只有一个参数γ;γ较小时,分布曲线扁平,尾部较高;当γ趋于∞时,t分布趋附向于标准正态分布。5.参数估计有点估计和区间估计两种,区间估计是按事先给定的置信度(1-α),估计可能包含未知总体参数的一个范围,该范围称为总体参数的(1-α)置信区间。6.总体均数的区间估计有正态分布法和t分布法两种方法。另外,注意可信区间与医学参考值范围的不同案例分析某研究者于某年在某市随机调查了200例正常成人血铅含量(μg/100g),整理成频数表形式,试估计该市正常成人血铅含量的参考值范围及正常成人平均血铅含量的置信区间。由于血铅值高于某上限值才被看作异常,故作者将该数据代入:1.本资料属于正偏态资料,用正态分布法估计参考值不合适;2.应采用中位数或百分为数来描述平均水平;3.并用百分位数法估计正常成年人95%参考值范围上单测,求P95=?4.本例用公式估计95%的置信区间单测是合适的,因为样本量足够大,可用正态近似法估计总体均数的置信区间。参考答案:目的:置信区间求法练习:SPSS操作实验:4-1、4-2、4-3SPSS软件实习【最佳选择题】A.t分布图是一簇曲线 B.t分布图是单峰分布C.当??∞时,t?Z D.t分布图以0为中心,左右对称E.相同?时,越大,P越大1.关于以0为中心的t分布,错误的是()2.某指标的均数为,标准差为S,由公式计算出来的区间称为()。A.99%参考值范围B.95%参考值范围C.99%置信区间D.95%置信区间E.90%置信区间3.在已知均数为μ,标准差为σ的正态总体中随机抽样,()的概率为5%。A:B:C:D:E:A.CVB.SC.D.RE.四分位数间距4.()小,表示用该样本均数估计总体均数的可靠性(或精密度)大。【计算题】1.随机抽取某地25名成年男性的红细胞数均数为5.00×1012/L,标准差为0.60×1012/L,试估计其抽样误差和总体均数的95%置信区间。2.调查某地蛲虫感染情况,随机抽样调查了250人,感染人数为100。试估计该地蛲虫感染率的95%置信区间。【简答题】什么是参数的点估计和区间估计?它们各有哪些优点?标准误与标准差有什么区与联系?对总体均数进行区间估计时,区间的大小取决于什么?置信区间的含义是什么?特别注意:普查的数据和特征对总体来说是直接的,不作统计推断!只有对抽样研究获取的资料,才需要作参数估计或假设检验!由样本统计量推到总体参数的技术叫参数估计,这一种“升华”,是“估计”不是“猜”?=155.4?=5.3X原总体变量的分布样本均数的抽样分布X155.4=xmn=301.7=xs标准误(standarderrorofmean,SME或SE)概念:样本均数的标准差简称标准误(standarderror,SE)是描述均数的抽样误差大小的指标。数理统计研究表明,标准误即抽样误差的大小具有一定的规律性,样本均数μ标准误(standarderror,SE)计算:标准误的理论值标准误的理论值的估计值s↑→抽样误差↑n↑→抽样误差↓前提:无限总体完全随机抽样(1)标准误(standarderror)是描述均数的抽样误差大小的指标,可用来衡量样本均数的可靠性;标准误越小,说明抽样误差越小,样本均数代表总体均数就越可靠。(2)用于参数估计。(3)用于假设检验。标准误的意义:小结:若随机变量X服从X~N(μ,s2)的正态分布,则以之随机抽样计算的样本均数所构成的分布也呈正态分布。1.样本均数的总体均数仍等于原来的总体均数μ。2.样本均数的标准差叫做标准误(standarderrorofmean,SEM),记作,是描述均数的抽样误差大小的指标。中心极限定理【实验二】:非正态分布样本均数的抽样分布图6-2是一个正偏态分布,用电脑从中随机抽取样本含量分别为5、10、30、50的样本各1000次,计算样本均数,绘制直方图,并观察其样本均数的分布。n=5n=10n=30n=50当样本容量足够大时(n?30),样本均数的抽样分布逐渐趋于正态分布偏态分布总体Xmmx=snsx=从偏态总体中抽样,当n足够大时(n大于30),其均数也近似于正态分布。⑴样本均数的总体均数仍等于原来的总体均数μ。⑵样本均数的标准差仍叫做标准误,记作。中心极限定理计算公式仍是:举例:大规模普查得某地健康成年男子血红蛋白总体均数为μ=135g/L,σ=20.5g/L。若在其中进行随机抽样,样本量n=100,样本均数=130g/L,S=23.4g/L,求其理论标准误和样本均数的估计标准误。2.样本均数的估计标准误:1.理论标准误:xsns=10020.5==2.05g/LxSnS=10023.4==2.34g/L解:均数μ;标准差?N(μ,?2)抽出n个的样本随机抽样原总体X1,X2,X3…Xn样本均数X1,X2,X3…Xn正态分布与抽样分布的区别与联系均数μ;标准误N(μ,2)XsXs?=155.4?=5.3X原总体变量的分布样本均数的抽样分布X155.4=xmn=301.7=xs标准差与标准误的区别与联系标准差标准误区别公式与n关系n增大,标准差趋于稳定。n越大,标准误越小概念描述的是样本个体观察值的变异程度大小。描述的是样本均数的变异程度和抽样误差大小。意义小说明变量值围绕均数的波动小,均数对一组变量值的代表性好。小表示样本均数围绕总体均数的波动小,用样本推断总体的可靠性越强。用途与均数结合,描述观察值的分布范围,常用于估计医学参考值范围、计算变异系数、标准误等。均数结合,用于估计总体均数可能出现的范围,即可信区间,并用于假设检验。联系1.都是描述变异程度的指标2.标准误与标准差成正比,n一定时,标准差越大,标准误也越大。4.2t分布均数μ;标准差?N(μ,?2)原总体X1,X2,X3…Xn样本均数X1,X2,X3…Xn抽出n个的样本随机抽样均数μ;标准误N(μ,)?=50?=10X总体分布抽样分布n=16X样本均数50=xm2.5=xs原变量任意正态分布曲线X~N(μ,σ2)标准正态分布曲线X~N(0,1)u变换对于正态变量X标准正态分布对样本均数的正态分布进行标准化→t分布若对抽样分布进行标准化变换,有总体标准误实际工作中,是未知的,所以常需以代替。W.S.Gosett研究它的分布规律,提出它不服从标准正态分布的规律,而服从ν=n-1的t分布,后人用其笔名student命名,称之为student’st-distribution,简称t分布。t分布:1-=nn=S-XmX-XmSnZ分布t分布故:【实验三】:从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样,各取1000份样本,分别得到1000个样本的均数及其标准误,对它们分别作t转换,将t值绘成直方图:。n=3时的t分布n=50时的t分布所以,不同的自由度?(?=n-1)即有不同的t分布【实验三】:从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样,各取1000份样本,分别得到1000个样本的均数及其标准误,对它们分别作t转换,将t值绘成直方图:。n=3时的t分布n=50时的t分布所以,不同的自由度?(?=n-1)即有不同的t分布不同自由度的t分布的曲线t分布图形的特征:1.t分布的密度曲线呈单峰,曲线在t=0处最高,并以t=0为中心左右对称;t值可是正数,也可是负数。2.与标准正态分布相比,曲线最高处较矮,两尾部较高。3.t分布的概率密度曲线是一簇曲线,它只有一个参数自由度?;?一但确定,其曲线形状即也确定。?越小,则t值越分散,曲线越低平,尾部越高;随着?的逐渐增大,t分布曲线逐渐的逼近于标准正态曲线,t分布的极限分布是Z分布。4.t分布的概率密度曲线下面积有一定规律性,可通过查“t分布界值表”得到。t分布图形的特征:t分布曲线下的整个面积为1;t分布曲线下从a到b的面积为t值分布在此范围内的百分比,即t值落在此范围内的概率p。t分布曲线下的面积分布规律:自由度为?的t分布曲线ab0t界值表:以自由度?为横标目,概率P为纵标目,表中数字表示当?和P确定时,对应的是正侧或双侧的t临界值表,记作t(α,?)或t(α/2,?)。包括单侧概率的t临界值,记作t(α,?)双侧概率的t临界值,记作t(α/2,?)自由度?概率,P单侧:0.250.200.100.050.0250.010.0050.00250.0010.0005双侧:0.500.400.200.100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657127.321318.309636.61920.8161.0611.8862.9204.3036.9659.92514.08922.32731.59930.7650.9781.6382.3533.1824.5415.8417.45310.21512.92440.7410.9411.5332.1322.7763.7474.6045.5987.1738.61050.7270.9201.4762.0152.5713.3654.0324.7735.8936.86960.7180.9061.4401.9432.4473.1433.7074.3175.2085.59570.7110.8961.4151.8952.3652.9983.4994.0294.7855.40880.7060.8891.3971.8602.3062.8963.3553.8334.5015.04190.7030.8831.3831.8332.2622.8213.2503.6904.2974.781100.7000.8791.3721.8122.2282.7643.1693.5814.1444.587110.6970.8761.3631.7962.2012.7183.1063.4974.0254.437120.6950.8731.3561.7822.1792.6813.0553.4283.9304.318130.6940.8701.3501.7712.1602.6503.0123.3723.8524.221140.6920.8681.3451.7612.1452.6242.9773.3263.7874.140150.6910.8661.3411.7532.1312.6022.9473.2863.7334.073160.6900.8651.3371.7462.1202.5832.9213.2523.6864.015170.6890.8631.3331.7402.1102.5672.8983.2223.6463.965180.6880.8621.3301.7342.1012.5522.8783.1973.6103.922附表2t界值表例1,求当?=9,单尾概率?=0.05时的t界值表明:按t分布的规律,从正态分布总体中抽取样本含量n=10的样本,则由该样本计算的t值大于等于1.833的概率为0.05,或小于等于-1.833的概率亦为0.05。查表得单尾t0.05,9=1.833,则:P(t≤-1.833)=0.05或:P(t≥1.833)=0.05自由度为9的t分布例1,求当?=9,双尾概率?=0.05时的t界值表明:按t分布的规律,从正态分布总体中抽取样本含量n=10的样本,则由该样本计算的t值大于等于2.262的概率为0.025,小于等于-2.262的概率亦为0.025。查表得单尾t0.05,9=2.262,则:P(t≤-2.228)+P(t≥2.228)=0.05或:P(-2.228
Sheet2

Sheet1

Chart1

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

.00

.00

.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00

.00

0.00

0.00

0.00

0.00

.00

.00

.00

Sheet3

Sheet2

Sheet1

Chart2

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

.00

.00

.00

0.00

0.00

0.00

0.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00

.00

.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00

Sheet3

Sheet2

Sheet1

Chart14

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

.00

.00

.00

0.00

0.00

0.00

0.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

Sheet3

Sheet2

Sheet1

Chart13

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

.00

.00

.00

0.00

0.00

0.00

0.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

0.00

0.00

0.00

.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

Sheet3

Sheet2

Sheet1

Chart9

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

.00

.00

.00

0.00

0.00

0.00

0.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

0.00

0.00

0.00

.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

Sheet3

Sheet2

Sheet1

Chart11

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

.00

.00

.00

0.00

0.00

0.00

0.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00

0.00

0.00

0.00

.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00























Sheet3

Sheet2

Sheet1

Chart1

0.00

0.00

0.00

0.00

0.00

0.00

00.00

00.00

00.00

00.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

00.00

00.00

00.00

00.00

0.00

0.00

0.00

0.00

0.00

Sheet3

Sheet2

Sheet1

Chart2

0.00

00.00

00.00

00.00

00.00

00.00

00.00

0.00

0.00

00.00

00.00

00.00

00.00

00.00

00.00

0.00

Sheet3

Sheet2

Sheet1

Chart1

0.00

0.00

0.00

0.00

0.00

0.00

00.00

00.00

00.00

00.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

00.00

00.00

00.00

00.00

0.00

0.00

0.00

0.00

0.00

Sheet3

Sheet2

Sheet1

Chart2

0.00

00.00

00.00

00.00

00.00

00.00

00.00

0.00

0.00

00.00

00.00

00.00

00.00

00.00

00.00

0.00























献花(0)
+1
(本文系浮云小豆豆首藏)