配色: 字号:
高等数学-概率统计 (2)
2022-06-12 | 阅:  转:  |  分享 
  
随机变量的数字特征数学期望定义:设离散型随机变量X的分布律为:P{X?xk}?pk,k?1,2,? ,若级数?xk
pk绝对收敛,i?1则称级数?xkpk的和为随机变量X的数学期望。i?1记为EX,即EX=?xkpk。k
?1???例12:按规定,火车站每天8:00~9:00,9:00~10:00都恰有一辆客车到站,但到站的时刻是随机的,且
两者到站的时间相互独立,其规律为:到站时间8:10,9:10 8:30,9:30 8:50,9:50概率 1/6 3/6 2/
6旅客8:00到站,求他侯车时间的数学期望。旅客8:20到站,求他侯车时间的数学期望。解:设旅客的候车时间为X(以分记)
(1)X的分布律:XP10 30 501/6 3/6 2/6EX=10(1/6)+30(3/6)+50(2/6)=33
.33(分)(2)旅客8:20分到达X的分布率为X 1030 50 70 90P 3/62/6(1/6)(1/6)(3/
6)(1/6)(2/6)(1/6)EX=10(3/6)+30(2/6)+50(1/36)+70(3/36)+90
(2/36)=27.22(分)8:30,9:303/68:50,9:502/6到站时间8:10,9:10概率1/6设连续型随机
变量X的概率密度为f(x),? ?若积分?xf(x)dx绝对收敛,则称积分?xf(x)dx?? ???的值为
X的数学期望。记为EX=?xf(x)dx,??数学期望也称为均值。数学期望的性质Ec=c,c是常数,若a?X
?b,则a?E(X)?bE(cX)=cE(X),c是常数,n n一般地 E(?aiXi)??aiEXii?
1 i?1若x,y独立,则E(XY)=E(X)E(Y)2) 随机变量函数的数学期望设X是一个随机变量,g(x)是任意
实函数,则Y?g(X)是随机变量X的函数,也是一个随机变量。当X为离散型随机变量,概率分布为P{X ?xk
}?pk(k?1,2,?)? ?若级数?g(xk)pk绝对收敛,则称?g(xk)pk 的i?1 i?
1和为随机变量Y?g(X)的数学期望。当X为连续型随机变量,概率密度为f(x)若广义积分???g(x)f
(x)dx绝对收敛,则称???g(x)f(x)dx的值为随机变量Y?g(X)的数学期望。????例13
:设随机变量X的概率密度为?3x2,0?x?2f(x)??8???0, 其它1求随机变量函数Y=的数学期望
。X3)方差定义:设X是一个随机变量,若E{[X-E(X)]2}<∞,则称D(X)=E{[X-E(X)]2}称 D(X)
为X标准差.为X的方差.X为离散型,P{X=xk}=pk???k?1?x ?E(X)?2pk,kD(X)?
??????x?E(X)?f(x)dx.2??X为连续型,X~f(x)简化公式D(X)=E(X2)-[E(X)]2展
开证:D(X)=E[X-E(X)]2=E{X2-2XE(X)+[E(X)]2}利用期望性质=E(X2)-2[E(X)]2+[E
(X)]2=E(X2)-[E(X)]2例14.要在甲乙两射手之间选送一个人去参加奥运会,已知两人的射击成绩的分布律分别为:XPk
YPk送谁去参加奥运会更合理呢?6 7 8 9100.1 0.2 0.4 0.20.16 7 8 9100.2 0.1 0.4 0
.10.2首先评选的指标是平均成绩X6 97108Pk0.1 0.2 0.4 0.2 0.1E(X)?6?0.1?7
?0.2?8?0.4?9?0.2?10?0.1?8E(Y)?6?0.2?7?0.1?8?0
.4?9?0.1?10?0.2?8Y6 97 108Pk0.2 0.1 0.4 0.1 0.2E(X)?李老
E师(专Y用)X967108Pk0.10.1 0.2 0.4 0.2D(X)=E[X-E(X)]2评选的第二个指标是方差D(X
)?(6?8)2?0.1?(7?8)2?0.2?(8?8)2?0.4?(9?8)2?0.2
?(10?8)2?0.1?1.2D(Y)?(6?8)2?0.2?(7?8)2?0.1?
(8?8)2?0.4?(9?8)2?0.1?(10?8)2?0.2?1.8送甲去参加奥运会更合理
。Y6 97 108Pk0.2 0.1 0.4 0.1 0.2方差的性质设C是常数,则D(C)=0若C是常数,则D(CX)= C2
D(X);若X1与X2独立,则D(X1+X2)=D(X1)+D(X2);可推广为:若X1,X2,…,Xn相互独立,则n nD[
?Xi]??D(Xi)i?1 i?14) 常见分布的数学期望和方差离散型P(X?0)?1?p
,P(X?1)?p两点分布E(X)? p D(X)? p(1?p)二项分布X~B(n,p),其
中0?p?1D(X)?np(1?p)E(X)?np泊松分布X~P(?),其中??0E(X)
??D(X)??连续型若X~U[a,b],即X服从[a,b]上的均匀分布,则(b?a)2E(X)?a?b
D(X)?212若X服从参数为?的指数分布,则D(X)??2E(X)??若X服从N(?,?2),
则E(X)??D(X)??2四数理统计的基本概念1、基本概念(1) 总体和样本总体:研究对象的某项数量指标的值
的全体。个体:总体中的每个元素为个体。容量:总体中所包含的个体的个数。按此分为有限总体和无限总体。例如:某工厂生产的灯泡的寿命
是一个总体,每一个灯泡的寿命是一个个体;某学校男生的身高的全体一个总体,每个男生的身高是一个个体。定义:设X是具有分布函数F的
随机变量,若X1,?Xn是具有同一分布函数F的相互独立的随机变量,则称X1,?Xn为从总体X中得到的容量为n的简单随机样本,
简称为样本,其观察值x1,?xn称为样本值。(2) 统计量定义:设X1,?Xn为来自总体X的一个样本,的函数,若g是
连续函数,且g(X1,?Xn)是X1,?Xng中不含任何未知参数;则称g(X1,?Xn)是一个统计量。设x
1,?xn是相应于样本(X1,?Xn)的样本值。则称g(x1,?xn)是g(X1,?Xn)的观察值。常用的统计量
它反映了总体均值的信息1nn? i样本均值: X ?1Xi?1?i?11n 2n?i?1222样本方差:S ?(X ?X
)?[XnX ]iin?1n?1它反映了总体方差的信息n1n?i?1k样本k阶(原点)矩:Ak ?Xk?1,2,?i
它反映了总体k阶矩的信息n 21?2样本标准差:S? S ?(X ?X)in?1i?1n k1n?i?1样本k阶
中心矩:Bk ?(X ?X)k?1,2,?i它们的观察值分别为: 1n?x?xini?1n 2n11?i?1?i
?1222s ?(x ?x)?[xnx ]iin?1n?1n1n?i?1kak ?x, k?1,2?in 21
?i?1s?(x ?x)in?1n?1?b(x ?x)k,k?1,2?kini?1分别称为样本均值、样本方差
、样本k阶矩、样本标准差、样本k阶中心矩。(3) 抽样分布定义:统计量是样本的函数,它是一个随机变量,统计量的分布称为抽样分布
。2)常用统计量的分布?2?分布设(X1,?Xn)为来自于正态总体N(0,1)的样本?2则称统计量:?X2??
?X21 n所服从的分布为自由度是n的?2分布。记为 ?2 ~?2(n)?2分布的性质10.?2 ~?2
(n ),?2 ~?2(n ),且?2,?2独立,则有1 2 2 1 2? ??1~? (n ?n )2122
21220.E?2 ?n,D?2 ?2nt?分布XX ~N(0,1),Y ~?2(n),X,Y独立,则
称随机变量T?Yn所服从的分布为自由度是n的t?分布,记作T ~t(n).对于给定的?(0???1),称满足条件
:P{t?t?(n)}???的点t?(n)为t分布的上?分位点。t1??(n)t?(n)由概率密度的对称性知:t1
??(n)??t?(n)当n?45时,t (n)?z .? ?3)正态总体的样本均值与样本方差的分布:.设X1
,?,Xn是总体N(?,?2)的样本,X,S2定理分别是样本均值与样本方差,则有:?2(1).X ~N(?,
).n(n?1)S2~?2(n?1)(2).?2(3).X与S2独立。(4)X?? ~t(n?1)
S n五、参数估计设有一个统计总体,总体的分布函数为F(x,?),其中?为未知参数.现从该总体抽样,得样本X1,X2,…,
Xn要依据该样本对参数?作出估计.这类问题称为参数估计.1、点估计设总体X的分布函数F(x;?)的形式为已知,?是待估参
数。X1?Xn是X的一个样本,x1?xn是相应的样本值。构造一个适当的统计量?(X1,?,Xn),用它的观察值??(x
1,?,xn)来估计未知参数?。我们称?(X1,?,Xn)为?的估计量;称??(x1,?,xn)为?估
计值。(1) 矩估计法设X为连续型随机变量,其概率密度为f(x;?1,?,?k),X为离散型随机变量,其分布列为P{X ?x
}?P(x;?1,?,?k),其中?1,?,?k是待估参数,,X1,?,Xn为来自X的样本。设 EXl ??l,
l?1,2,?,k.存在。则 A ?n1?liXlni?1令 Al ??l, l?1,?,k这里是包含k个未知
参数?1,?,?k的联立方程组,从中解出方程组的解??,?,??。1 k用??,?,??分别作为?,?,? 的估计量,这
种求1 k 1k估计量的方法称为矩估李计老师法专用。这种估计量称为矩估计量;矩估计量的观察值称为矩估计值。例15设某炸药厂一
天中发生着火现象的次数X服从参数为?的泊松分布,?未知,有以下样本值;试估计参数?(用矩法)。着火的次数k 0 1 2 3 4 5
622 6 2 1 ??250发生k次着火天数nk 75 90 54n X ?X1n?解:?1 ?EX ?? A ?
1i令 X ??,i?11则???x?(0?75?1?90???6?1)?1.22估计值李老师??专
?用1.22。250所以 X ??,(2) 极大似然估计法(1).若总体X属离散型,其分布律P{X ?x}? p(x;?
),???的形式为已知,?为待估参数,?是?可能取值的范围。设X1,?,Xn是来自X的样本;则X1,?,Xn的联
合分布律:?p(xi;?)i?1又设x1,?,xn是X1,?,Xn的一个样本值,则事件{X1?x1,?,Xn?
xn}发生的概率为L(?)?L(x1,?,xn;?)??p(xi;?),???.i?1L(?)是
?的函数,称为样本的似然函数。nn极大似然估计法:固定x1,?,xn;挑选使概率L(x1,?,xn;?)达到最大的参
数??,作为?的估计值即取??使得:L(x1,?,xn;??)?maxL(x1,?,xn;?)?????与x1
,?,xn有关,记为??(x1,?,xn);称其为参数?的极大似然估计值。??(X1,?,Xn)称为参数?的
极大似然估计量。(2)若总体X属连续型,其概率密度f(x;?),???的形式已知,?为待估参数,称L(?)?L(
x1,?,xn;?)??f(xi;?),i?1为样本的似然函数,若nL(x1,?,xn;??)?max
L(x1,?,xn;?)???则称??(x1,?,xn)为?的极大似然估计值,而??(X1,?,Xn)为?的极大似
然估计量。又因L(?)与lnL(?)在同一?处取到极值,因此?的极大似然估计?也可从下述方程解得:d lnL(?)?
0.d?若母体的分布中包含多个参数,即可令 ?L ?0,i?1,?,k.或?lnL?0,i?1,?,
k.??i ??i解k个方程组求得?1,?,?k的极大似然估计值。X~N(?,? );?,? 为未知参数,2 2例16.
设x,?,x 是来自1 nX的一个样本值,求:?,?2的极大似然估计量。解:X的概率密度为:1 1f(x;?,?
2)?(x??)2}exp{?2?? 2?2似然函数为:nL(?,? )??11222(xi ??) }
exp{?2?2??i?1nn2n21?i?12ln(2?)?ln(?)?(x ??)lnL??i22??
1n???lnLx ?n?]?0[???0i2?? ???i?1令即:???lnLnn1????0??i?12(
x ??)??0i????22 2?-2?2(2? )?n x ?x1n??解得:??ii?1n 21n?i
?12???(X ?X)i(3)估计量的评选标准1) 无偏性:若?????(X1,?,Xn)的数学期望存在,
且E????.则称??是?的无偏估计量。2) 有效性:若?? ???(X ,?,X ),?? ???(X ,?
,X )1 1 1 n 2 2 1 n都是?的无偏估计量;若D(??)?D(??).1 2则称??较??有效。1 2
3) 一致性:若?????(X ,?,X )为参数?的估计量1 1 n若对于任意???,当n ???时????p
??.则称??是?的一致估李老计师专。用2、区间估计譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的极大似然
估计为1000条.实际上,N的真值可能大于1000条,也可能小于1000条.若我们能给出一个区间,在此区间内我们合理地相信
N的真值位于其中.这样对鱼数的估计就有把握多了.也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数
值.湖中鱼数的真值[ ? ]这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平.习惯上把置信水平记作1??
,这里?是一个很小的正数.置信水平的大小是根据实际需要选定的.例如,通常可取置信水平1??=0.95或0.9等.根据一个实际样
本,由给定的置信水平,我们求出一个尽可能小的区间[??,??],使1 2P{?? ?????}?1??1 2
称区间[??,??]为?的置信水平为1??的1 2置信区间.(1) 置信区间与置信度定义:设总体X含一待估参数?;对于样
本x1,?,xn,找出统计量?i ??i(x1,?,xn)(i?1,2),?1??2,使得:P{?1?
???2}?1??, (0???1)称区间[?1,?2]为?的置信区间,1??为该区间的置信度。区间[
?1,?2]是一个随机区间;1??给出该区间含真值?的可靠程度。?表示该区间不包含真值?的可能性。例如:若??5%,
即置信度为1???95%.这时重复抽样100次,则在得到的100个区间中包含?真值的有95个左右,不包含?真值的有5个左右
。通常,采用95%的置信度,有时也取99%或90%(2) 单个正态总体均值和方差的区间估计1)均值的区间估计设x1,?,xn
为总体X ~N(?,?2)的一个样本。在置信度1??下,来确定?的置信区间[?1,?2]。已知方差,估计均值n
1n?设已知方差? ??,且知道x是?的一个2 2x?0ii?1点估计,又知道u?x?? ~N(0,1)
,置信区间为:?/ n? 0 ?[x-z? 0,x?z? 0]n n李老师专2用2例17.已知幼儿身高
服从正态分布,现从5~6岁的幼儿中随机地抽查了9人,其高度分别为:115,120,131,115,109,115,115,1
05,110cm;假设标准差?0 ?7,置信度为95%试求总体均值?的置信区间。解:已知?0?7,n?9,??
0.05.由样本值算得:x?1(115?120???110)?115.9查正态分布表得临界值z? ?1.96,
由此得置信区间?115?1.96?7/ 9,115?1.96?7/ 9? 2 ??110.43,
119.57?未知方差,估计均值由于未知方差?2,这时可用样本方差:n 21?2S ?(x ?x)in?1x??S
/ ni?1而选取样本函数:t?则随机变量t服从n-1个自由度的t分布,置信区间为:[x-t (n?1) S ,x?
t (n?1) S ]?2?2nn2)方差的区间估计设x1,?,xn为总体X ~N(?,?2)的一个样本。n 2
21?2(x ?x) 是? 的一个点估计我们知道S ?in?1i?1(n?1)S2并且知道样本函数:? ?自由度的
?2分布。服从n?1个?2(n?1)S2(n?1)S2推得: ??2??2? (n?1)2(n?1)?1??22这就是说,随机区间:???(n?1)S2(n?1)S2?,?? (n?1)? (n?1)?22????1???2 2以1??的概率包含?2,而随机区间?n?1S, n?1S????2 ?1????以1??的概率包含?.X~N(?,?2),例18.设某机床加工的零件长度今抽查16个零件,测得长度(单位:mm)如下:12.15,12.12,12.01,12.08,12.09,12.16,12.03,12.01,12.06,12.13,12.07,12.11,12.08,12.01,12.03,12.06,在置信度为95%时,试求总体方差?2的置信区间。解:已知n?16,??0.05. 由样本值算得:S2 ?0.00244.查?2(15,0.975)得?1?6.26;查?2(15,0.025)得?2 ?27.5.由此得置信区间:?15?0.00244,15?0.00244???0.0013,0.0058?????27.5李老师6专.2用6
献花(0)
+1
(本文系启智职教的...原创)