定律 ? 1 n ?1 n ?lim P? X ? E(X ) ?? ?1.? ?
i i ?n?? ? n n
i?1? i?1 ?
特殊情形:若 X
1
, X
2
,…具有相同的数学
期望 E( X
I
) =μ,则上式成为
? 1 n ??lim P? X ?? ???
i ?
?1.
n??
? n?
i?1 ?
1
概率论与数理统计 公式(全)
2011-1-1
伯 努 设μ是 n 次独立试验中事件 A 发生的次
利 大 数, p 是事件 A 在每次试验中发生的概率,
数 定 则对于任意的正数ε,有
律 ? ? ??lim P? ? p ??
? ?1.
n??
? n? ?
伯努利大数定律说明,当试验次数 n 很
大时, 事件 A 发生的频率与概率有较大判别
的可能性很小,即
? ? ??lim P? ? p ??
? ? 0.
n??
? n? ?
这就以严格的数学形式描述了频率的稳定
性。
辛 钦 设 X
1
, X
2
,…, X
n
,…是相互独立同分布的
大 数 随机变量序列,且 E( X
n
) =μ,则对于任意
定律 的正数ε有
? 1 n ??lim P? X ?? ???
i ?
?1.
n??
? n?
i?1 ?
1
概率论与数理统计 公式(全)
2011-1-1
( 2) 中心极 列 维
限定理
X ? N(?,
设随机变量 X
1
, X
2
,…相互独立,服从同
- 林 一分布,且具有相同的数学期望和方差:
? 2
n
德 伯)
格 定
理
E(X
k
) ? ?,D(X
k
) ?? 2 ? 0(k ?1,2, ),则随机变量
Y
n
?
? X
k?1
n
k
?n?
n?
的分布函数 Fn(x)对任意的实数 x,有
? n ?X ? n??
k? ? 1?
k?1 ?lim F
n
(x) ? lim P? ? x??
n?? n?? n? 2?? ?
? ?? ?
x ?t
2
2?
??
e dt.
此定理也称为 独立同分布 的中心极限定理。
棣 莫 设随机变量 X
n
为具有参数 n, p(0
弗 - 项分布,则对于任意实数 x,有
拉 普
拉 斯
定理
( 3) 二项定
理
若当 N ??时 , M ? p(n,k不变 ) ,则
N
(N ??).
? ?? X
n
? np ?? lim P? ? x??
n?? ? ?? np(1? p) ?
1
2?
? x
??
e?t
2
2 dt.
k n?kC
M
C
N k k?M ?C
n
p (1? p)n?k
nC
N
超几何分布的极限分布为二项分布。
1
概率论与数理统计 公式(全)
2011-1-1
( 4) 泊松定
理
若当 n??时 ,np ?? ? 0,则
C p (1? p)k
n
k n?k ?
?k
k! e?
? (n??).
其中 k=0, 1, 2,…, n,…。
二项分布的极限分布为泊松分布。
第六章样本及抽样分布
( 1)数 总体
理 统 计
的 基 本
概念
个体
样本
在数理统计中,常把被考察对象的某一个
(或多个)指标的全体称为总体(或母体) 。
我们总是把总体看成一个具有分布的随机
变量(或随机向量) 。
总体中的每一个单元称为样品(或个体) 。
我们把从总体中抽取的部分样品 x
1
, x
2
,?, x
n
称为样本。样本中所含的样品数称为样本容
量,一般用 n 表示。在一般情况下,总是把
样本看成是 n 个相互独立的且与总体有相同
分布的随机变量,这样的样本称为简单随机
样 本 。 在 泛 指 任 一 次 抽 取 的 结 果 时 ,
x
1
, x
2
,?, x
n
表示 n 个随机变量(样本) ;在具
体的一次抽取之后, x
1
, x
2
,?, x
n
表示 n 个具体
的数值(样本值) 。我们称之为样本的两重
性。
1
概率论与数理统计 公式(全)
2011-1-1
样 本 函 设 x
1
, x
2
,?, x
n
为总体的一个样本,称
数 和 统
计量
? ? ? ( x
1
, x
2
,?, x
n
)
为样本函数, 其中 ? 为一个连续函数。 如果 ?
中不包含任何未知参数, 则称 ?( x
1
, x
2
,?, x
n
)
为一个统计量。
常 见 统 样本均值
计 量 及
样本方差
其性质
1 nx ? ? x
i
.n
i?1
n1
2S 2 ? (x ? x) . ?
in ?1
i?1
样本标准差 1 nS ? (x
i
? x)2.?n ?1
i?1
样本 k 阶原点矩
1 n
kM
k
? ?x
i
,k ?1,2,?.n
i?1
样本 k 阶中心矩
1 n? ? ?(x
i
? x)k ,k ? 2,3,?.M
k n
i?1
E(X ) ? ? , D(X) ? ? 2n ,
n ?1
2? ,nE(S 2 ) ?? 2, E(S 2 ) ?
2
1 n其中 S ? ?(X
i
? X)2n
i?1
,为二阶中心矩。
1
概率论与数理统计 公式(全)
2011-1-1
( 2)正 正 态 分 设 x
1
, x
2
,?, x
n
为来自正态总体 N(?,? 2 ) 的一个
态 总 体 布
下 的 四
大分布
t 分布
样本,则样本函数
udef x ???
/ n
~ N(0,1).
设 x
1
, x
2
,?, x
n
为来自正态总体 N(?,? 2 ) 的一个
样本,则样本函数
tdef x ? ?s / n ~ t(n ?1),
其中 t(n-1)表示自由度为 n-1 的 t 分布。
? 2分布 设 x
1
, x
2
,?, x
n
为来自正态总体 N(?,? 2 ) 的一个
样本,则样本函数
wdef (n ?1)S 2?
2
~ ? 2 (n ?1),
其中 ? 2 (n ?1) 表示自由度为 n-1 的 ? 2 分布。
F 分布 设 x
1
, x
2
,?, x
n
为来自正态总体 N(?,?
1
2 ) 的一个
样本,而 y
1
, y
2
,?, y
n
为来自正态总体 N(?,?
2
2 )
的一个样本,则样本函数
F def S12 /?12S /?
2
2
2
2
~ F(n
1
?1,n
2
?1),
其中
1 n1S ? (x
i
? x)2 ,?n
1
?1 i?121
1 n2S ? (y
i
? y)2 ;?n
2
?1 i?122
F(n
1
?1,n
2
?1) 表示第一自由度为 n
1
?1, 第二自
由度为 n
2
1
?1的 F 分布。
概率论与数理统计公式(全)
2011-1-1
(3)正X与S 2独立。
态总体
下分布
的性质
1
第七章参数估计
概率论与数理统计 公式(全)
2011-1-1
( 1) 矩 估 设总体 X 的分布中包含有未知数 ?
1
,?
2
,?,?
m
,则其
点 估 计
计
分布函数可以表成 F(x;?
1
,?
2
,?,?
m
).它的 k阶原点矩
v
k
? E(X k )(k ?1,2,?,m) 中 也 包 含 了 未 知 参 数
?
1
,?
2
,?,?
m
, 即 v
k
? v
k
(?
1
,?
2
,?,?
m
) 。 又设 x
1
, x
2
,?, x
n
为
总体 X 的 n 个样本值,其样本的 k 阶原点矩为
1 n
k (k ?1,2,?,m).? x
i
n i?1
这样,我们按照“当参数等于其估计量时,总体
矩等于相应的样本矩”的原则建立方程,即有
? 1 n? ? ??v
1
(?
1
,?
2
,?,?
m
) ? n?x
i
,
i?1?
?
? ? ? 1 n 2?v
2
(?
1
,?
2
,?,?
m
) ? ?x
i
,? n
i?1? ?
?
??????????
?
?
n? ? ??v (? ,? ,?,? ) ? 1 x
i
m.?
m 1 2 m? n
i?1?
由上面的 m 个方程中,解出的 m 个未知参数
(?
1
,?
2
,?,?
m
) 即为参数( ?
1
,?
2
,?,?
m
)的矩估计量。 ? ? ?
若 ? 为 ? 的矩估计, g(x) 为连续函数, 则 g(? )为 g(? )
的矩估计。
?
1
概率论与数理统计 公式(全)
2011-1-1
极 大 当总体 X 为连续型随机变量时, 设其分布密度
2 2
其中 ?
1
,? ,?,?
m
为未知参数。 又似 然 为 f (x;?
1
,? ,?,?
m
) ,
估计 设 x
1
,x ,?,x
n
为总体的一个样本,称
2
L(?
1
,?
2
,?,?
m
) ?? f (x
i
;?
1
,?
2
,?,?
m
)
i?1
n
为样本的似然函数,简记为 Ln.
当总体 X 为离型随机变量时,设其分布律
为 P{X ? x}? p(x;?
1
,? ,?,?
m
),则称
2
L(x
1
,x
2
,?,x
n
;?
1
,?
2
,?,?
m
) ??p(x
i
;?
1
,?
2
,?,?
m
)
i?1
n
为样本的似然函数。
若 似 然 函 数
? ? ?
2
L(x
1
, x
2
,?, x
n
;?
1
,?
2
,?,?
m
)
? ? ?
2
在
?1,? ,?,? m 处取到最大值,则称 ?1,? ,?,? m 分别为
?
1
,? ,?,?
m
的最大似然估计值,相应的统计量称为
2
最大似然估计量。
?ln L
n?
?
i
? 0,i ?1,2,?,m
?i ??i?
若 ? 为 ? 的极大似然估计, 则 g(? )g(x) 为单调函数,
为 g(? )的极大似然估计。
( 2) 无 偏 设 ? ??(x
1
, x
2
,?, x
n
) 为未知参数 ? 的估计量。若 E
估 计 性
量 的
1
? ?
?
( ?) =?,则称 ?为 ?的无偏估计量。
E( X ) =E( X) , E( S ) =D( X) 2
? ?
概率论与数理统计 公式(全)
2011-1-1
评 选 有 效 设 ?
1 ??1(x1, x,2 ,?, xn )
和 ?
2 ?? 2 (x1, x,2 ,?, xn )
是 未 知
标准 性 参数 ? 的两个无偏估计量。若 D(?
1) ? D(? 2 )
,则称
?1比 ? 2 有效。 ? ?
? ?
? ? ? ?
一 致 设 ?
n
是 ?的一串估计量,如果对于任意的正数 ? ,
性 都有
n??
?
?
lim P(|? n?? |??) ? 0,?
则称 ?
n
为 ?的一致估计量(或相合估计量) 。
若 ? 为 ?的无偏估计,且 D(? ) ? 0(n??),则 ? 为 ?的
一致估计。
只要总体的 E(X)和 D(X)存在, 一切样本矩和样本
矩的连续函数都是相应总体的一致估计量。
( 3) 置 信 设总体 X 含有一个待估的未知参数 ?。 如果我们从
区 间 区 间 样 本 x
1
,x,
2
,?,x
n
? ?
出 发 , 找 出 两 个 统 计 量
估计 和 置 ?
1
??
1
(x
1
, x,
2
,?, x
n
) 与 ?
2
??
2
(x
1
, x,
2
,?, x
n
) (?
1
??
2
) ,使
信度 得区间 [?
1
,?
2
]以 1??(0 ?? ?1)的概率包含这个待估
参数 ?,即
P{?
1
?? ??
2
}?1??,
那么称区间 [?
1
,?
2
]为 ? 的置信区间, 1?? 为该区间
的置信度(或置信水平) 。
1
概率论与数理统计 公式(全)
2011-1-1
单 正 设 x
1
, x,
2
, , x
n
为总体 X ~ N(?,? 2 )的一个样本,在置
态 总 信 度为 1?? 下,我们 来确定 ?和 ? 2 的置信区 间
体 的 [?
1
,?
2
]。具体步骤如下:
期 望 ( i)选择样本函数;
和 方 ( ii)由置信度 1?? ,查表找分位数;
差 的 ( iii)导出置信区间 [?
1
,?
2
]。
区 间 已知方差, 估计均值
估计
( i)选择样本函数
u ? x ? ??
0 / n
~ N(0,1).
(ii) 查表找分位数
? ?x ? ?P?? ? ? ? ?? ?1??.
? ??
0 / n? ?
( iii)导出置信区间
?
0
?
0
??x ? ? , x ? ?
? ?n n??
未知方差, 估计均值 ( i)选择样本函数
t ? x ? ?
S / n
~ t(n ?1).
(ii)查表找分位数
? ?x ? ? ? ?1??.P?? ? ? ? ?? ?
S / n? ?
( iii)导出置信区间
? S S ?x ? ? , x ? ?
? ?n n??
1
概率论与数理统计 公式(全)
2011-1-1
方差的区间估计 ( i)选择样本函数
w ? (n?1)S 2?
2
~ ? 2 (n?1).
( ii)查表找分位数
? ?(n ?1)S 2 ?P?? ? ? ?
2 ?
?1??.
2? 1 ?? ?
( iii)导出 ? 的置信区
间
? n ?1 n ?1 ?S, S
?? ?
1 ??
?
2
第八章假设检验
基本思
想
假设检验的统计思想是,概率很小的事件在一次试
验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设 H
0
是否成立。我们先假定 H
0
是成
立的。如果根据这个假定导致了一个不合理的事件发
生, 那就表明原来的假定 H
0
是不正确的, 我们拒绝接受
H
0
;如果由此没有导出不合理的现象,则不能拒绝接受
H
0
, 我们称 H
0
是相容的。 与 H
0
相对的假设称为备择假设,
用 H
1
表示。
这里所说的小概率事件就是事件 {K ?R
?}
,其概率就
是检验水平α,通常我们取α =0.05,有时也取 0.01 或
0.10。
1
概率论与数理统计 公式(全)
2011-1-1
基本步 假设检验的基本步骤如下:
骤 (i)提出零假设 H
0
;
(ii)选择统计量 K;
(iii)对于检验水平α查表找分位数λ;
(iv)由样本值 x
1
, x
2
, , x
n
计算统计量之值 K;
将 K与 ? 进行比较,作出判断:当 | K |??(或 K ??) 时否定? ? ?
H
0
,否则认为 H
0
相容。
两类错 第一类错误 当 H
0
为真时,而样本值却落入了否定域,
误
按照我们规定的检验法则,应当否定 H
0
。
这时, 我们把客观上 H
0
成立判为 H
0
为不成
立(即否定了真实的假设) ,称这种错误
为“以真当假”的错误或第一类错误,记
?为犯此类错误的概率,即
P{否定 H
0
|H
0
为真 }=?;
此处的α恰好为检验水平。
1
概率论与数理统计 公式(全)
2011-1-1
第二类错误 当 H
1
为真时,而样本值却落入了相容域,
按照我们规定的检验法则,应当接受 H
0
。
这时,我们把客观上 H
0
。不成立判为 H
0
成立(即接受了不真实的假设) ,称这种
错误为 “以假当真” 的错误或第二类错误,
记 ?为犯此类错误的概率,即
P{接受 H
0
|H
1
为真 }=?。
两类错误的
关系
人们当然希望犯两类错误的概率同时
都很小。 但是, 当容量 n 一定时, ?变小,
则 ?变大;相反地, ?变小,则 ?变大。取
定 ?要想使 ?变小, 则必须增加样本容量。
在实际使用时,通常人们只能控制犯
第一类错误的概率,即给定显著性水平
α。α大小的选取应根据实际情况而定。
当我们宁可“以假为真” 、而不愿“以真
当假”时,则应把α取得很小,如 0.01,
甚至 0.001。反之,则应把α取得大些。
单正态总体均值和方差的假设检验
对应样本
条件 零假设 统计量
函数分布
否定域
1
概率论与数理统计 公式(全)
2011-1-1
H
0
:? ? ?
0
|u |?u
U ? x ? ?0
1??2
已知 ? 2 H
0
:? ? ?
0
H
0
:? ? ?
0
H
0
:? ? ?
0
?
0
/ n
N ( 0, 1) u ? u
1??
u ? ?u
1??
|t |?t
T ? x ? ? 0S / n
1??2
(n?1)
未知 ? 2 H
0
:? ? ?
0
H
0
:? ? ?
0
t(n ?1) t ?t
1??
(n ?1)
t ? ?t
1??
(n ?1)
2w ??
?
(n?1)或
H
0
:? 2 ?? 2 2
未知 ? 2 w?
H
0
:? ??2 2
0
(n ?1)S
2?
0
2
w ?? 2
1??2
(n?1)
? (n ?1)2
w ??
1
2
??
(n ?1)
2w ?? ?(n?1)2H
0
:? 2 ??
0
1