概率论与数理统计公式整理(完整版)

来自：昵称69179867 > 馆藏分类

配色：

字号：大中小

概率论与数理统计公式整理(完整版)

2022-11-28 | 阅：转： | 分享

概率论与数理统计公式（全）

2011-1-1

第 1 章随机事件及其概率

nP

m

?

（ 1）排列

组合公式

nC

m

?

m! 从 m 个人中挑出 n 个人进行排列的可能数。

(m?n)!

m! 从 m 个人中挑出 n 个人进行组合的可能数。

n!(m?n)!

（ 2）加法

和乘法原

理

加法原理（两种方法均能完成此事）： m+n

某件事由两种方法来完成，第一种方法可由 m 种方法完成，第二种方法可由 n

种方法来完成，则这件事可由 m+n 种方法来完成。

乘法原理（两个步骤分别不能完成这件事）： m× n

某件事由两个步骤来完成，第一个步骤可由 m 种方法完成，第二个步骤可由 n

种方法来完成，则这件事可由 m× n 种方法来完成。

重复排列和非重复排列（有序）

对立事件（至少有一个）

顺序问题

如果一个试验在相同条件下可以重复进行，而每次试验的可能结果不止一个，

但在进行一次试验之前却不能断言它出现哪个结果，则称这种试验为随机试

验。

试验的可能结果称为随机事件。

在一个试验下，不管事件有多少个，总可以从其中找出这样一组事件，它具有

如下性质：

①每进行一次试验，必须发生且只能发生这一组中的一个事件；

②任何事件，都是由这一组中的部分事件组成的。

这样一组事件中的每一个事件称为基本事件，用 ?来表示。

基本事件的全体，称为试验的样本空间，用 ?表示。

一个事件就是由 ?中的部分点（基本事件 ?）组成的集合。通常用大写字母

A， B， C， …表示事件，它们是 ?的子集。

?为必然事件，? 为不可能事件。

不可能事件（?）的概率为零，而概率为零的事件不一定是不可能事件；同理，

必然事件（Ω）的概率为 1，而概率为 1 的事件也不一定是必然事件。

①关系：

如果事件 A 的组成部分也是事件 B 的组成部分，（ A 发生必有事件 B 发生）：

（ 3）一些

常见排列

（ 4）随机

试验和随

机事件

（ 5）基本

事件、样本

空间和事

件

A? B

（ 6）事件

的关系与

运算

如果同时有 A? B， B? A，则称事件 A 与事件 B 等价，或称 A 等于 B：

A=B。

A、 B 中至少有一个发生的事件： A? B，或者 A+B。

属于 A 而不属于 B 的部分所构成的事件，称为 A 与 B 的差，记为 A-B，也可

表示为 A-AB或者 AB，它表示 A 发生而 B 不发生的事件。

A、 B 同时发生： A?B，或者 AB。 A?B=?，则表示 A 与 B 不可能同时发生，

称事件 A 与事件 B 互不相容或者互斥。基本事件是互不相容的。

1

概率论与数理统计公式（全）

2011-1-1

?-A 称为事件 A 的逆事件，或称 A 的对立事件，记为 A 。它表示 A 不发生

的事件。互斥未必对立。

②运算：

结合率： A(BC)=(AB)C A∪ (B∪ C)=(A∪ B)∪ C

分配率： (AB)∪ C=(A∪ C)∩ (B∪ C) (A∪ B)∩ C=(AC)∪ (BC)

德摩根率： i?1

?A ??A

i

i?1

? ?

i

A?B ? A?B， A?B ? A?B

设 ? 为样本空间， A为事件，对每一个事件 A都有一个实数 P(A)，若满

足下列三个条件：

1° 0≤P(A)≤ 1，

2° P(Ω ) =1

（ 7）概率

的公理化

定义

3° 对于两两互不相容的事件 A1， A2 ，…有

? ? ? ?P?

??Ai?? ??P(Ai)?

i?1 ? i?1

常称为可列（完全）可加性。

则称 P(A)为事件 A的概率。

?

1

,?

2

? ?

n

?， 1° ? ??

2° P(?1) ? P(?2 ) ?? P(?n ) ?

（ 8）古典

概型

1 。

n

设任一事件 A，它是由 ?1,?2 ? ?m 组成的，则有

P(A)=?(?

1

)?(?

2

)?? ?(?

m

)? =P(?

1

) ? P(?

2

) ?? ? P(?

m

)

? m A所包含的基本事件数? 基本事件总数n

（ 9）几何

概型

若随机试验的结果为无限不可数并且每个结果出现的可能性均匀，同时样本空

间中的每一个基本事件可以使用一个有界区域来描述，则称此随机试验为几何

概型。对任一事件 A，

P(A) ?

（ 10）加法

公式

（ 11）减法

公式

L(A) 。其中 L 为几何度量（长度、面积、体积）。

L(?)

P(A+B)=P(A)+P(B)-P(AB)

当 P(AB)＝ 0 时， P(A+B)=P(A)+P(B)

P(A-B)=P(A)-P(AB)

当 B? A 时， P(A-B)=P(A)-P(B)

当 A=Ω时， P(B )=1- P(B)

定义设 A、 B 是两个事件，且 P(A)>0，则称 P(AB) 为事件 A 发生条件下，事P(A)

（ 12）条件

P(AB)概率件 B 发生的条件概率，记为 P(B/ A) ? 。

P(A)

1

概率论与数理统计公式（全）

2011-1-1

（ 13）乘法

公式

条件概率是概率的一种，所有概率的性质都适合于条件概率。

例如 P(Ω /B)=1? P( B /A)=1-P(B/A)

乘法公式： P(AB) ? P(A)P(B/ A)

更一般地，对事件 A1， A2，… An，若 P(A1A2… An-1)>0，则有

P(A1A2 … An) ? P(A1)P(A2 | A1)P(A3 | A1A2)…… P(An | A1A2 …

An ? 1)。

①两个事件的独立性

设事件 A、 B 满足 P(AB) ? P(A)P(B)，则称事件 A、 B 是相互独立的。

若事件 A、 B 相互独立，且 P(A) ? 0 ，则有

P(B | A) ? P(AB) P(A)P(B)? ? P(B)P(A) P(A)

（ 14）独立

性

若事件 A、 B 相互独立，则可得到 A与 B 、 A与 B 、 A与 B 也都相互独

立。

必然事件 ?和不可能事件 ? 与任何事件都相互独立。

? 与任何事件都互斥。

②多个事件的独立性

设 ABC 是三个事件，如果满足两两独立的条件，

P(AB)=P(A)P(B)； P(BC)=P(B)P(C)； P(CA)=P(C)P(A)

并且同时满足 P(ABC)=P(A)P(B)P(C)

那么 A、 B、 C 相互独立。

对于 n 个事件类似。

设事件 B1,B2,? ,Bn 满足

1° B1,B2,? ,Bn 两两互不相容， P(Bi) ? 0(i ?1,2,? ,n) ，

（ 15）全概

公式 2°

则有

A? ? Bi

i?1

n

，

P(A) ? P(B1)P(A | B1)? P(B2)P(A | B2) ?? ? P(Bn)P(A | Bn) 。

设事件 B 1， B2 ，…， Bn 及 A满足

1° B1， B2 ，…， Bn 两两互不相容， P(Bi) >0， i ?1， 2，…， n，

2°

则

（ 16）贝叶

斯公式

nA? ? B

i

i?1 ，

P(A) ? 0 ，

P(B

i

/ A) ? P(Bi )P(A/ Bi )

? P(B )P(A/ B )

j j

j?1

n

， i=1， 2，… n。

此公式即为贝叶斯公式。

P(B

i

) ，（ i ?1， 2 ， …， n），通常叫先验概率。 P(B

i

/ A) ，（ i ?1， 2 ， …，

n），通常称为后验概率。贝叶斯公式反映了“因果”的概率规律，并作出了

（ 17）伯努

利概型

1

“由果朔因”的推断。

我们作了 n次试验，且满足

每次试验只有两种可能结果， A发生或 A不发生；

概率论与数理统计公式（全）

2011-1-1

?n次试验是重复进行的，即 A发生的概率每次均一样；

?每次试验是独立的，即每次试验 A发生与否与其他次试验 A发生与

否是互不影响的。

这种试验称为伯努利概型，或称为 n重伯努利试验。

用 p 表示每次试验 A发生的概率，则 A发生的概率为 1? p ? q ，用 Pn(k) 表

示 n重伯努利试验中 A出现 k(0 ? k ? n) 次的概率，

Pn(k) ? C

n

pkqn?kk ， k ? 0,1,2,?,n 。

第二章随机变量及其分布

（ 1）离散

型随机变

量的分布

律

设离散型随机变量 X 的可能取值为 Xk(k=1,2,… )且取各个值的概率，即事

件 (X=Xk)的概率为

P(X=xk)=pk， k=1,2,…，

则称上式为离散型随机变量 X 的概率分布或分布律。有时也用分布列的形

式给出：

X x1,x2,?,xk,?|

P(X ? xk) p1, p2,?, pk,?。

显然分布律应满足下列条件：

（ 1） pk ? 0 ， k ?1,2,?，（ 2） k?1

（ 2）连续

型随机变

量的分布

密度

? p?

k ?1

。

设 F(x) 是随机变量 X 的分布函数，若存在非负函数 f (x) ，对任意实数 x，有

F(x) ? ?x

??

f (x)dx

，

则称 X 为连续型随机变量。 f (x) 称为 X 的概率密度函数或密度函数，简称概

率密度。

密度函数具有下面 4 个性质：

1° f (x) ? 0。

2°

???

??

f (x)dx ?1

。

（ 3）离散

与连续型

随机变量

的关系

P(X ? x) ? P(x ? X ? x ? dx) ? f (x)dx

积分元 f (x)dx 在连续型随机变量理论中所起的作用与 P(X ? xk) ? pk 在离

散型随机变量理论中所起的作用相类似。

1

概率论与数理统计公式（全）

2011-1-1

（ 4）分布

函数

设 X 为随机变量， x 是任意实数，则函数

F(x) ? P(X ? x)

称为随机变量 X 的分布函数，本质上是一个累积函数。

P(a ? X ? b) ? F(b) ? F(a) 可以得到 X 落入区间 (a,b]的概率。分布

函数 F(x) 表示随机变量落入区间（– ∞， x]内的概率。

分布函数具有如下性质：

1° 0 ? F(x) ?1, ??? x ???；

2° F(x) 是单调不减的函数，即 x1 ? x2时，有 F(x1) ? F(x2)；

3° F(??) ? lim F(x) ? 0， F(??) ? lim F(x) ?1；

x??? x???

4° F(x? 0) ? F(x) ，即 F(x) 是右连续的；

5° P(X ? x) ? F(x) ? F(x?0) 。

对于离散型随机变量， F(x) ?

xk?x

x

? p

k ；

对于连续型随机变量， F(x) ?

（ 5）八大

分布

0-1 分布

二项分布

??

? f (x)dx 。

P(X=1)=p, P(X=0)=q

在 n 重贝努里试验中，设事件 A发生的概率为 p 。事件 A发生

的次数是随机变量，设为 X ，则 X 可能取值为 0,1,2,?,n 。

kP(X ? k) ? Pn(k) ?C

n

pkqn?k ，其中

q ?1? p,0 ? p ?1,k ? 0,1,2,?,n ，

则称随机变量 X 服从参数为 n ， p 的二项分布。记为

X ~ B(n, p) 。

当 n ?1时， P(X ? k) ? p qk 1?k ， k ? 0.1，这就是（ 0-1）分

布，所以（ 0-1）分布是二项分布的特例。

1

概率论与数理统计公式（全）

2011-1-1

泊松分布设随机变量 X 的分布律为

P(X ? k) ? ?kk! e??， ? ? 0， k ? 0,1,2?，

则称随机变量 X 服从参数为 ? 的泊松分布，记为 X ~ ?(?) 或

者 P(? )。

泊松分布为二项分布的极限分布（ np=λ， n→∞）。

超几何分布 k n?k k ? 0,1,2?,lC

M

?C

N?M P(X ? k) ? ,

n l ? min(M,n)C

N

随机变量 X 服从参数为 n,N,M 的超几何分布，记为 H(n,N,M)。

几何分布 P(X ? k) ? qk?1 p,k ?1,2,3,?，其中 p≥ 0， q=1-p。

随机变量 X 服从参数为 p 的几何分布，记为 G(p)。

设随机变量 X 的值只落在 [a， b]内，其密度函数 f (x) 在 [a， b]

上为常数

均匀分布

1 ，即

b ? a

? 1 a≤ x≤ b,?

f (x) ? ?b ? a

其他， ??0,

则称随机变量 X 在 [a， b]上服从均匀分布，记为 X~U(a， b)。

分布函数为

0， x
x ?a ,

b?a a≤ x≤ b

xF(x) ? ? f (x)dx ?

??

1， x>b。

当 a≤ x1
P(x

1

? X ? x

2

) ? x2 ? x1 。 b ? a

1

概率论与数理统计公式（全）

2011-1-1

指数分布

f (x) ?

?e??x , x ? 0,

0, x ? 0,

其中 ? ? 0，则称随机变量 X 服从参数为 ? 的指数分布。

X 的分布函数为

1?e

??x ,

x ? 0,

F(x) ?

0, x<0。

记住积分公式：

n ?xx? e dx ? n!

0

??

正态分布设随机变量 X 的密度函数为

2???

?? ? 0为常数，其中、则称随机变量 X 服从参数为 ? 、

2X ~ N(?,? )。的正态分布或高斯（ Gauss）分布，记为

f (x) ? 1 e?(x??)

2

2? 2 ， ??? x ? ??，

f (x) 具有如下性质：

1° f (x) 的图形是关于 x ? ?对称的；

2° 当 x ? ?时， f (?) ? 12??

2 2X ~ N(?,? ) (t??)X 的分布函数为若

?x，则1

2? 2F(x) ? e dt2

??

?

?? 。。

为最大值；

参数 ? ? 0 、 ? ?1时的正态分布称为标准正态分布，记为

X ~ N(0,1) ，其密度函数记为 x2

?1 2?(x) ? e

2? ， ?? ? x ? ??，

分布函数为

?(x) ? 1 x

2?

???(x) 是不可求积函数，其函数值，已编制成表可供查用。

?e?t22 dt 。

1 。

2X ? ?

2如果 X ~ N(?,? ) ，则 ~ N(0,1) 。 ?

? x ? ?? ? x ? ??P(x

1

? X ? x

2

) ? ?? 2 ???? 1 ?。 ? ?

? ? ? ?

Φ( -x)＝ 1-Φ(x)且 Φ( 0)＝

1

概率论与数理统计公式（全）

2011-1-1

（ 6）分位

数

（ 7）函数

分布

下分位表： P(X ? ?? )＝ ? ；

上分位表： P(X ? ?? )＝ ? 。

离散型已知 X 的分布列为

x1, x2, ? , xn, ?X

， P(X ? x

i) p1, p2, ? , pn, ?Y ? g(X)

的分布列（ yi ? g(xi )互不相等）如下：

g(x1), g(x2), ? , g(xn), ?Y

， P(Y ? y

i

) p

1, p2, ? , pn, ?若有某些 g(x

i)相等，则应将对应的 pi 相加作为 g(xi)的概率。

连续型先利用 X 的概率密度 f

X(x)写出 Y 的分布函数 FY(y)＝ P(g(X)≤

y)，再利用变上下限积分的求导公式求出 fY(y)。

第三章二维随机变量及其分布

（ 1）联合

分布

离散型如果二维随机向量 ? （ X， Y）的所有可能取值为至多可列

个有序对（ x,y），则称 ? 为离散型随机量。

设 ? =（ X， Y）的所有可能取值为 (xi , y j )(i, j ?1,2,? ) ，

且事件 {? =(xi , y j ) }的概率为 pij,,称

P{(X,Y) ? (x

i

, y

j

)}? p

ij

(i, j ?1,2,? )

为 ? =（ X， Y）的分布律或称为 X 和 Y 的联合分布律。联合分

布有时也用下面的概率分布表来表示：

Y

X y1

p11

p21

y

2

p12

p22

…

…

…

…

yj

p1j

p2j

…

…

…

x1

x2

?

xi

?

pi1

?

?

p

ij

?

…

? ? ? ? ?

这里 pij具有下面两个性质：

（ 1） pij≥ 0（ i,j=1,2,…）；

（ 2） ??

i j

p

ij

?1.

1

概率论与数理统计公式（全）

2011-1-1

连续型对于二维随机向量 ? ? (X,Y) ，如果存在非负函数

f (x, y)(?? ? x ? ??,?? ? y ? ??) ，使对任意一个其邻边

分别平行于坐标轴的矩形区域 D，即 D={(X,Y)|a
有

P{(X,Y)?D}? ?? f (x, y)dxdy,

D

则称 ? 为连续型随机向量；并称 f(x,y)为 ? =（ X， Y）的分布

密度或称为 X 和 Y 的联合分布密度。

分布密度 f(x,y)具有下面两个性质：

（ 1） f(x,y)≥ 0;

（ 2）

（ 2）二维

随机变量

的本质

（ 3）联合

分布函数

? ??? ??

?? ??

f (x, y)dxdy ?1.

?(X ? x,Y ? y) ??(X ? x Y ? y)

设（ X， Y）为二维随机变量，对于任意实数 x,y,二元函数

F(x, y) ? P{X ? x,Y ? y}

称为二维随机向量（ X， Y）的分布函数，或称为随机变量 X 和 Y 的联合分布函

数。

分布函数是一个以全平面为其定义域，以事件

{(?

1

,?

2

) |?? ? X(?

1

) ? x,?? ?Y(?

2

) ? y}的概率为函数值的一个实值函

数。分布函数 F(x,y)具有以下的基本性质：

（ 1） 0 ? F(x, y) ?1;

（ 2） F（ x,y）分别对 x 和 y 是非减的，即

当 x2>x1时，有 F（ x2,y）≥ F(x1,y);当 y2>y1时，有 F(x,y2) ≥ F(x,y1);

（ 3） F（ x,y）分别对 x 和 y 是右连续的，即

F(x, y) ? F(x ? 0, y),F(x, y) ? F(x, y ? 0);

（ 4） F(??,??) ? F(??, y) ? F(x,??) ? 0,F(??,??) ?1.

（ 5）对于 x1 ? x2， y1 ? y2，

F(x

2

， y

2

) ? F(x

2

， y

1

) ? F(x

1

， y

2

) ? F(x

1

， y

1

) ? 0 .

（ 4）离散

型与连续

型的关系

P(X ? x， Y ? y) ? P(x ? X ? x ? dx， y ?Y ? y ? dy) ? f (x， y)dxdy

1

概率论与数理统计公式（全）

2011-1-1

（ 5）边缘

分布

离散型 X 的边缘分布为

P

i?

? P(X ? x

i

) ? ? p

ij

(i, j ?1,2,?)；

j

Y 的边缘分布为

P

? j

? P(Y ? y

j

) ? ? p

ij

(i, j ?1,2,?)。

i

连续型 X 的边缘分布密度为

f

X

(x) ? ?

f

Y

(y) ? ?

（ 6）条件

分布

离散型

??

??

f (x, y)dy；

Y 的边缘分布密度为

??

??

f (x, y)dx.

在已知 X=xi的条件下， Y 取值的条件分布为

P(Y ? y

j

| X ? x

i

) ? pijp

i?

p

ij

p

? j

；

在已知 Y=yj的条件下， X 取值的条件分布为

P(X ? x

i

|Y ? y

j

) ?

连续型

,

在已知 Y=y 的条件下， X 的条件分布密度为

f (x | y) ? f (x, y) ； f

Y

(y)

在已知 X=x 的条件下， Y 的条件分布密度为

f (y | x) ?

（ 7）独立

性

一般型

离散型

f (x, y)

f

X

(x)

F(X,Y)=FX(x)FY(y)

p

ij

? p

i?

p

? j

有零不独立

f(x,y)=fX(x)fY(y)

直接判断，充要条件：

①可分离变量

②正概率密度区间为矩形

连续型

二维正态分

布 f (x, y) ? 1

2??

1

?

2

1? ? 2

?e

?? x?? ?2 2?(x?? )( y?? ) ? y??

1 ? 1 2 2?? ???

? ? ? ? ?? ?2(1??2 )? 1 2 2??? 1 ?

1 ??

??

2 ?

?

?? ,

? ＝ 0

1

概率论与数理统计公式（全）

2011-1-1

随机变量的

函数

若 X1,X2,… Xm,Xm+1,… Xn相互独立， h,g 为连续函数，则：

h（ X1， X2,… Xm）和 g（ Xm+1,… Xn）相互独立。

特例：若 X 与 Y 独立，则： h（ X）和 g（ Y）独立。

例如：若 X 与 Y 独立，则： 3X+1 和 5Y-2 独立。

（ 8）二维

均匀分布

设随机向量（ X， Y）的分布密度函数为

? 1

?S

? Df (x, y) ? ?

?0,

??

(x, y)?D

其他

其中 SD为区域 D 的面积，则称（ X， Y）服从 D 上的均匀分布，记为（ X， Y）～

U（ D）。

例如图 3.1、图 3.2 和图 3.3。

y

1

D

1

O 1

图 3.1

x

y

1

O

图 3.2

1

D2

2 x

y

d

D3

c

O a b x

图 3.3

1

概率论与数理统计公式（全）

2011-1-1

（ 9）二维

正态分布

设随机向量（ X， Y）的分布密度函数为

f (x, y) ? 1

2??

1

?

2

1? ?2

e

?? x?? ?2 2?(x?? )(y?? ) ? y??

1 ? 1 2 2??? ???

? ? ? ? ??1?22(1??2 )? 1 2? ? ??

1 ??

??

2 ?

?

?? ,

其中 ?1,?2,?1 ? 0,? 2 ? 0,| ? |?1是 5 个参数，则称（ X， Y）服从二维正态分

布，

2 2记为（ X， Y）～ N（ ?

1

,?

2,

?

1

,?

2

,?).

由边缘密度的计算公式，可以推出二维正态分布的两个边缘分布仍为正态分

布，

2 2即 X～ N（ ?

1

,?

1

),Y ~ N(?

2,

?

2

).

2 2但是若 X～ N（ ?

1

,?

1

),Y ~ N(?

2,

?

2

) ， (X， Y)未必是二维正态分布。

（ 10）函数

分布

Z=X+Y 根据定义计算： F

Z(z) ? P(Z ? z) ? P(X ?Y ? z)

??

对于连续型， fZ(z)＝

??

? f (x,z ? x)dx

2 2两个独立的正态分布的和仍为正态分布（ ?

1

? ?

2

,?

1

??

2 ）。

n 个相互独立的正态分布的线性组合，仍服从正态分布。

? ? ?C

i

?

i ，

? 2 ? ?C

i

2?

i

2

i i

Z=max,min(

X1,X2,… Xn) 若

X

1

, X

2

?X

n 相互独立，其分布函数分别为

F

x1

(x)， F

x2

(x)?F

xn

(x) ，则 Z=max,min(X1,X2,… Xn)的分布

函数为：

F

max

(x) ? F

x1

(x)? F

x2

(x)?F

xn

(x)

F

min

(x) ?1?[1? F

x1

(x)]?[1? F

x2

(x)]?[1? F

xn

(x)]

1

概率论与数理统计公式（全）

2011-1-1

? 2 分布设 n 个随机变量 X

1

, X

2

,?, X

n

相互独立，且服从标准正态分

布，可以证明它们的平方和

W ??X

i

2

i?1

n

的分布密度为

n u?1 ?? 1 u

2 e 2?

n? n?f (u) ? ?2

2 ?

?? ?

? ? 2?

??0,

2

u ? 0,

u ? 0.

2我们称随机变量 W服从自由度为 n的 ? 分布，记为 W～ ? (n) ，

其中

?n? ?? ?1?? ? ? ? x

2 e?xdx.? 2?

0

所谓自由度是指独立正态随机变量的个数，它是随机变量

分布中的一个重要参数。

n

? 2 分布满足可加性：设

Y

i

? ? 2 (n

i

),

则

Z ??Y

i

~ ? 2 (n

1

? n

2

??? n

k

).

i?1

k

1

概率论与数理统计公式（全）

2011-1-1

t 分布设 X， Y 是两个相互独立的随机变量，且

X ~ N(0,1),Y ~ ? 2 (n),

可以证明函数

T ?

的概率密度为

X

Y / n

?n ?1??? ?

t 22? ? ??f (t) ? 1?

?n n? ?

n? ?? ? ?

? 2?

t

1??

(n) ? ?t

?

(n)

F 分布

??

??

?n?12

(?? ? t ? ??).

我们称随机变量 T 服从自由度为 n 的 t 分布，记为 T～ t(n)。

设 X ~ ? (n1 ),Y ~ ? (n2 ) ，且 X 与 Y 独立，可以证明2 2

F ? X / n1 的概率密度函数为 Y / n

2

? ?n

1

? n

2

??? ??

n

1

2? ? ?? ??

f (y) ? ? ? n

1

? ? n

2

? ?? n

2? ?? ? ? ??

? ? 2 ? ? 2 ??

?

??

? y?

n1

2 n1 ?1

2

? n

1

??1? y?

? n

2

?? ?

?n1?n22

, y ? 0

0, y ? 0

我们称随机变量 F 服从第一个自由度为 n1，第二个自由度为 n2

的 F 分布，记为 F～ f(n1, n2).

F

1??

(n

1

,n

2

) ? 1 F

?

(n

2

,n

1

)

第四章随机变量的数字特征

（ 1）离散型连续型

1

概率论与数理统计公式（全）

2011-1-1

一维

随机

变量

的数

字特

征

期望

期望就是平均值

设 X 是离散型随机变量，其分布

律为 P( X ? xk ) ＝ pk ，

k=1,2,… ,n，

设 X 是连续型随机变量，其概率密

度为 f(x)，

??E(X) ?

E(X ) ??x

k

p

k

k?1

n ??

?xf (x)dx

（要求绝对收敛）

（要求绝对收敛）

函数的期望 Y=g(X) Y=g(X)

nE(Y) ??g(x

k

)p

k

k?1

??E(Y) ?

??

?g(x) f (x)dx

??

方差

2D(X)=E[X-E(X)] ，

标准差

D(X ) ??[x

k

? E(X )]2 p

k

k

D(X) ? ?[x? E(X)]2 f (x)dx

??

? (X) ? D(X) ，

矩

①对于正整数 k，称随机变量 X

的 k 次幂的数学期望为 X 的 k

阶原点矩，记为 vk,即

ν k=E(X )=k

①对于正整数 k，称随机变量 X 的

k 次幂的数学期望为 X 的 k 阶原点

矩，记为 vk,即

ν k=E(X )=k?x

i

k

i

p

i , ?

??

??

xk f (x)dx,

k=1,2, … .

②对于正整数 k，称随机变量 X

与 E（ X）差的 k 次幂的数学期

k=1,2, … .

②对于正整数 k，称随机变量 X 与

E（ X）差的 k 次幂的数学期望为 X

望为 X 的 k 阶中心矩，记为 ?k ，的 k 阶中心矩，记为 ?k ，即

即

?

k

? E(X ? E(X ))

.

=

i

k

?

k

? E(X ? E(X ))k

，

.

=

?(x

i

? E(X ))k p

i

? ??

??

(x ? E(X ))k f (x)dx,

k=1,2, … .

k=1,2, … .

1

概率论与数理统计公式（全）

2011-1-1

切比雪夫不等式设随机变量 X 具有数学期望 E（ X） =μ，方差 D（ X） =σ ，则对于

任意正数ε，有下列切比雪夫不等式

2

? 2P( X ? ? ? ?) ?

2

?

切比雪夫不等式给出了在未知 X 的分布的情况下，对概率

P( X ?? ??)

的一种估计，它在理论上有重要意义。

（ 2）

期望

的性

质

（ 1） E(C)=C

（ 2） E(CX)=CE(X)

（ 3） E(X+Y)=E(X)+E(Y)， E(?C Xi

i?1

n

i

) ? ?C

i

E(X

i

)

i?1

n

（ 4） E(XY)=E(X) E(Y)，充分条件： X 和 Y 独立；

充要条件： X 和 Y 不相关。

（ 3）

方差

的性

质

（ 1） D(C)=0； E(C)=C

2（ 2） D(aX)=a D(X)； E(aX)=aE(X)

2（ 3） D(aX+b)= a D(X)； E(aX+b)=aE(X)+b

2 2（ 4） D(X)=E(X )-E (X)

（ 5） D(X± Y)=D(X)+D(Y)，充分条件： X 和 Y 独立；

充要条件： X 和 Y 不相关。

D(X± Y)=D(X)+D(Y) ± 2E[(X-E(X))(Y-E(Y))]，无条件成立。

而 E(X+Y)=E(X)+E(Y)，无条件成立。

0-1 分布 B(1, p)

二项分布 B(n, p)

泊松分布 P(? )

期望方差（ 4）

常见

分布

的期

望和

方差

p

np

p(1? p)

np(1? p)

?

1

p

?

1? p

2p几何分布

G(p)

超几何分布 H(n,M,N) nM N

a ?b

2

1

?

nM

N

? M ?? N ?n??1? ?? ?

N ?? N ?1 ??

均匀分布 U(a,b) (b?a)2 12

指数分布 e(? ) 1?2

1

概率论与数理统计公式（全）

2011-1-1

正态分布 N(?,? ) 2 ?

n

0

? 2

2n? 2分布

t 分布

（ 5）

二维

随机

变量

的数

字特

征

期望 n

n (n>2)

n ? 2

??E(X) ? ? x

i

p

i?

i?1

E(X) ?

??

??

?xf

X

(x)dx

E(Y) ? ? y

j

p

? j

j?1

n E(Y) ?

??

? yf

Y

(y)dy

函数的期望 E[G(X,Y)]＝ E[G(X,Y)]＝

?? G(x , y

i

i j

j

)p

ij ?? ??

－ ? － ?

? ?G(x, y) f (x, y)dxdy

??方差

D(X ) ? ? [x

i

? E(X )]2 p

i?

i

D(X) ? ?[x ? E(X)]2 f

X

(x)dx

??

??D(Y) ??[xj ?E(Y)]2 p? j

j D(Y) ? ?[y ? E(Y)]2 fY (y)dy

??

协方差对于随机变量 X 与 Y，称它们的二阶混合中心矩 ?

11为 X 与 Y 的协方

差或相关矩，记为 ? XY或 cov(X,Y)，即

?

XY

? ?

11

? E[(X ?E(X))(Y ?E(Y))].

与记号 ? XY 相对应， X 与 Y 的方差 D（ X）与 D（ Y）也可分别记为 ? XX

与 ? YY 。

1

概率论与数理统计公式（全）

2011-1-1

相关系数对于随机变量 X 与 Y，如果 D（ X） >0, D(Y)>0，则称

? XY

D(X) D(Y)

为 X 与 Y 的相关系数，记作 ? XY（有时可简记为 ? ）。

| ? |≤ 1，当 | ? |=1 时，称 X 与 Y 完全相关： P(X ? aY ? b) ?1

完全相关 ?

?正相关，当 ? ?1时 (a ? 0)，

?负相关，当 ? ? ?1时 (a ? 0)，

而当 ? ? 0 时，称 X 与 Y 不相关。

以下五个命题是等价的：

① ?XY ? 0；

② cov(X,Y)=0;

③ E(XY)=E(X)E(Y);

④ D(X+Y)=D(X)+D(Y);

⑤ D(X-Y)=D(X)+D(Y).

协方差矩阵 ??

XX???

? YX

?

XY

??

??

YY ?

k l混合矩对于随机变量 X 与 Y，如果有 E(X Y )存在，则称之为 X 与 Y 的

k+l阶混合原点矩，记为 ?

kl ；

k+l阶混合中心矩记为：

u

kl

? E[(X ? E(X ))k (Y ? E(Y))l ].

（ 6）

协方

差的

性质

（ 7）

独立

和不

相关

(i)

(ii)

(iii)

(iv)

（ i）

（ ii）

cov (X, Y)=cov (Y, X);

cov(aX,bY)=ab cov(X,Y);

cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);

cov(X,Y)=E(XY)-E(X)E(Y).

若随机变量 X 与 Y 相互独立，则 ?XY ? 0；反之不真。

若（ X， Y）～ N（ ?1,?2 ,?1 ,? 2 , ? ），

则 X 与 Y 相互独立的充要条件是 X 和 Y 不相关。

2 2

第五章大数定律和中心极限定理

1

概率论与数理统计公式（全）

2011-1-1

（ 1）大数定律

X ? ?

切比雪

夫大数

定律

设随机变量 X1， X2，…相互独立，均具有有限方差，且被同一

常数 C 所界： D（ Xi）
? 1 n ?1 n ?lim P? X ? E(X ) ??? ?

i i ?

?1.

n??

? n n

i?1? i?1 ?

特殊情形：若 X1， X2，…具有相同的数学期望 E（ XI） =μ，

则上式成为

? 1 n ??lim P? X ?? ???

i ?

?1.

n??

? n?

i?1 ?

伯努利

大数定

律

设μ是 n 次独立试验中事件 A 发生的次数， p 是事件 A 在

每次试验中发生的概率，则对于任意的正数ε，有

? ? ??lim P? ? p ??

? ?1.

n??

? n? ?

伯努利大数定律说明，当试验次数 n 很大时，事件 A 发生

的频率与概率有较大判别的可能性很小，即

? ? ??lim P? ? p ??

? ? 0.

n??

? n? ?

这就以严格的数学形式描述了频率的稳定性。

辛钦大设 X1， X2，…， Xn，…是相互独立同分布的随机变量序列，且 E

数定律（ Xn） =μ，则对于任意的正数ε有

? 1 n ??lim P? X ?? ???

i ?

?1.

n??

? n?

i?1 ?

（ 2）中心极限定

理

列维－设随机变量 X1， X2，…相互独立，服从同一分布，且具有

林德伯相同的数学期望和方差：

格定理 E(X

k

) ? ?, D(X

k

) ?? 2 ? 0(k ?1,2, ) ，则随机变量 X ? N(?,? 2

n )

Y

n

?

? X

k?1

n

k

? n?

n?

的分布函数 Fn(x)对任意的实数 x，有

? n ?X ? n??

k? ? 1?

k?1 ?lim F

n

(x) ? lim P? ? x? ?

n?? n?? n? 2?? ?

? ?? ?

此定理也称为独立同分布的中心极限定理。

?x

??

e?t

2

2 dt.

1

概率论与数理统计公式（全）

2011-1-1

棣莫弗

－拉普

拉斯定

理

设随机变量 Xn 为具有参数 n, p(0
任意实数 x,有

? ? 1? X

n

? np ?? lim P? ? x??

n?? 2?? ?? np(1? p) ?

? x

??

e?t

2

2 dt.

（ 3）二项定理若当 N ??时 , M ? p(n,k不变 ) ，则

N

(N ??). k n?kCMCN k k n?k?M ?C p (1? p)

nnC

N

超几何分布的极限分布为二项分布。

（ 4）泊松定理若当 n ??时 ,np ? ? ? 0，则

C p (1? p)k

n

k n?k ?

?k

k! e?? (n ??).

其中 k=0， 1， 2，…， n，…。

二项分布的极限分布为泊松分布。

第六章样本及抽样分布

（ 1）数理

统计的基

本概念

总体在数理统计中，常把被考察对象的某一个（或多个）指标的全

体称为总体（或母体）。我们总是把总体看成一个具有分布的随

机变量（或随机向量）。

总体中的每一个单元称为样品（或个体）。

我们把从总体中抽取的部分样品 x1, x2 ,?, xn 称为样本。样本

中所含的样品数称为样本容量，一般用 n 表示。在一般情况下，

总是把样本看成是 n 个相互独立的且与总体有相同分布的随机

变量，这样的样本称为简单随机样本。在泛指任一次抽取的结

果时， x1, x2 ,?, xn 表示 n 个随机变量（样本）；在具体的一次

抽取之后， x1, x2 ,?, xn 表示 n 个具体的数值（样本值）。我们

称之为样本的两重性。

样本函数和

统计量设

x

1

, x

2

,?, x

n

为总体的一个样本，称

个体

样本

? ? ? （ x

1

, x

2

,?, x

n

）

为样本函数，其中 ?为一个连续函数。如果 ?中不包含任何未

知参数，则称 ? （ x1, x2 ,?, xn ）为一个统计量。

1

概率论与数理统计公式（全）

2011-1-1

常见统计量

及其性质样本均值

样本方差

2

1 nx ? ?xi.n

i?1

1 n

2S ? (x ? x) .

?

in ?1

i?1

样本标准差 1 n 2S ? (x ? x) .? in ?1

i?1

样本 k 阶原点矩

1 n

kM

k

? ?x

i

,k ?1,2,?.n

i?1

样本 k 阶中心矩

1 n? ? ?(x

i

? x)k ,k ? 2,3,?.M

k n

i?1

E(X ) ? ? ， D(X) ? ? 2n ，

E(S 2 ) ?? 2， E(S 2 ) ?

2

n ?1

2? ,n

1 n

2其中 S ? ?(X

i

? X) ，为二阶中心矩。 n

i?1

（ 2）正态

总体下的

四大分布

正态分布设 x

1

, x

2

,?, x

n

为来自正态总体 N(?,? ) 的一个样本，则样

本函数

2

u

t 分布

def x ? ?

? / n ~ N(0,1).

2设 x

1

, x

2

,?, x

n

为来自正态总体 N(?,? ) 的一个样本，则样

本函数

tdef x ? ?s/ n ~ t(n ?1),

其中 t(n-1)表示自由度为 n-1 的 t 分布。

1

概率论与数理统计公式（全）

2011-1-1

? 2分布设 x

1

, x

2

,?, x

n

为来自正态总体 N(?,? ) 的一个样本，则样

本函数

2

w

2

def (n ?1)S 2

? 2 ~ ? 2 (n ?1),

2其中 ? (n ?1) 表示自由度为 n-1 的 ? 分布。

F 分布 2设 x

1

, x

2

,?, x

n

为来自正态总体 N(?,?

1

) 的一个样本，而

2y

1

, y

2

,?, y

n

为来自正态总体 N(?,?

2

) 的一个样本，则样本

函数

F

其中

def S12 /?12

S /?2

2

2

2

~ F(n

1

?1,n

2

?1),

1 n1S ? (x

i

? x)2 ,?n

1

?1 i?121

1 n2S ? (y

i

? y)2;?n

2

?1 i?122

F(n

1

?1,n

2

?1) 表示第一自由度为 n

1

?1，第二自由度为

n

2

?1的 F 分布。

（ 3）正态

总体下分

布的性质

X 与 S 2独立。

第七章参数估计

1

概率论与数理统计公式（全）

2011-1-1

（ 1）点

估计

矩估计设总体 X 的分布中包含有未知数 ?

1

,?

2

,?,?

m

，则其分布函数可以表成

F(x;?

1

,?

2

,?,?

m

).它的 k 阶原点矩 v

k

? E(X k )(k ?1,2,?,m) 中也

包含了未知参数 ?1,?2 ,?,?m ，即 vk ? vk (?1,?2 ,?,?m ) 。又设

x

1

, x

2

,?, x

n

为总体 X 的 n 个样本值，其样本的 k 阶原点矩为

1 n

k? x

i

(k ?1,2,?,m).n

i?1

这样，我们按照“当参数等于其估计量时，总体矩等于相应的样本矩”

的原则建立方程，即有

? 1 n? ? ??v

1

(?

1

,?

2

,?,?

m

) ? n?x

i

,

i?1?

?

? ? ? 1 n 2?v

2

(?

1

,?

2

,?,?

m

) ? ?x

i

,? n

i?1? ?

?

??????????

?

?

n? ? ??v (? ,? ,?,? ) ? 1 x

i

m.?

m 1 2 m? n

i?1?

由上面的 m 个方程中，解出的 m 个未知参数 (?1,?2 ,?,?m ) 即为参数

（ ?1,?2 ,?,?m ）的矩估计量。

? ? ?

) 为 g(? )的矩估计。若 ? 为 ? 的矩估计， g(x) 为连续函数，则 g(??

1

概率论与数理统计公式（全）

2011-1-1

极大似

然估计

当总体 X 为连续型随机变量时，设其分布密度为

f (x;?

1

,?

2

,?,?

m

) ，其中 ?

1

,?

2

,?,?

m

为未知参数。又设

x

1

,x

2

,?,x

n

为总体的一个样本，称

L(?

1

,?

2

,?,?

m

) ?? f (x

i

;?

1

,?

2

,?,?

m

)

i?1

n

为样本的似然函数，简记为 Ln.

当总体 X 为离型随机变量时，设其分布律为

P{X ? x}? p(x;?

1

,?

2

,?,?

m

)，则称

L(x

1

,x

2

,?,x

n

;?

1

,?

2

,?,?

m

) ??p(x

i

;?

1

,?

2

,?,?

m

)

i?1

n

为样本的似然函数。

若似然函数 L(x1,x

2

,?,x

n

;?

1

,?

2

,?,?

m

) 在 ?1,? ,?,? m 处取2? ? ?

到最大值，则称 ?1,? ,?,? m 分别为 ?1,?

2

,?,?

m

的最大似然估计值，2? ? ?

相应的统计量称为最大似然估计量。

?ln L

n?

?

i

?

? 0,i ?1,2,?,m

?i??i?

)为 g(? )的极大若 ? 为 ? 的极大似然估计， g(x) 为单调函数，则 g(?

似然估计。

（ 2）估

计量的

评选标

准

无偏性

设 ? ??(x1, x2 ,?, xn ) 为未知参数 ? 的估计量。若 E （ ? ） =? ，则称 ? ? ?

? 为 ? 的无偏估计量。

E（ X ） =E（ X）， E（ S ） =D（ X） 2

?

有效性

设 ?1 ??1(x1, x,2 ,?, xn ) 和 ? 2 ?? 2 (x1, x,2 ,?, xn ) 是未知参数 ?

的两个无偏估计量。若 D(?1) ? D(? 2 )，则称 ?1比 ? 2 有效。 ? ?

? ? ? ?

? ?

1

概率论与数理统计公式（全）

2011-1-1

一致性

设 ? n是 ? 的一串估计量，如果对于任意的正数 ? ，都有

n??

?

?

limP(|? n?? |??) ? 0,?

则称 ?n 为 ? 的一致估计量（或相合估计量）。

? ) ? 0(n??), 则 ? 为 ? 的一致估计。若 ? 为 ? 的无偏估计，且 D(?

只要总体的 E(X)和 D(X)存在，一切样本矩和样本矩的连续函数都是相

应总体的一致估计量。

（ 3）区置信区

间估计间和置

信度

设总体 X含有一个待估的未知参数 ? 。如果我们从样本 x1,x,2 ,?,xn出

发，找出两个统计量

?

?

1

??

1

(x

1

, x,

2

,?, x

n

) 与

?

2

??

2

(x

1

, x,

2

,?, x

n

) (?

1

??

2

) ，使得区间 [?

1

,?

2

] 以

1??(0 ?? ?1)的概率包含这个待估参数 ? ，即

P{?

1

?? ??

2

}?1??,

那么称区间 [?1,?2 ]为 ? 的置信区间， 1?? 为该区间的置信度（或置

信水平）。

单正

总体

期望

方差

区间

计

态

的

和

的

估

2设 x

1

,x,

2

,?,x

n

为总体 X ~ N(?,? ) 的一个样本，在置信度为 1??

下，我们来确定 ?和 ? 的置信区间 [?1,?2 ]。具体步骤如下：

（ i）选择样本函数；

（ ii）由置信度 1?? ，查表找分位数；

（ iii）导出置信区间 [?1,?2 ]。

2

1

概率论与数理统计公式（全）

2011-1-1

已知方差，估计均值（ i）选择样本函数

u ? x ? ??

0

/ n

~ N(0,1).

(ii) 查表找分位数

? ?x ? ?P??? ? ? ?? ?1??.

? ??

0 / n? ?

（ iii）导出置信区间

?

0

?

0

??x ? ? , x ? ?

? ? n n??

未知方差，估计均值（ i）选择样本函数

t ?

x ? ?

S / n

~ t(n ?1).

(ii)查表找分位数

? ?x ? ??P

?? ? ? ? ?? ?1??.?S / n? ?

（ iii）导出置信区间

? S S ?x ? ? , x ? ?

? ? n n??

方差的区间估计（ i）选择样本函数

w ? (n ?1)S 2?

2

~ ? 2 (n ?1).

（ ii）查表找分位数

? ?(n ?1)S 2 ?P?? ? ? ?

2 ?

?1??.

2? 1 ?? ?

（ iii）导出 ? 的置信区间

? n ?1 n ?1 ?S, S

? ? ? ?

2 1? ?

第八章假设检验

1

概率论与数理统计公式（全）

2011-1-1

基本思想假设检验的统计思想是，概率很小的事件在一次试验中可以认为基本上是

不会发生的，即小概率原理。

为了检验一个假设 H0是否成立。我们先假定 H0是成立的。如果根据这个假

定导致了一个不合理的事件发生，那就表明原来的假定 H0是不正确的，我们拒

绝接受 H0；如果由此没有导出不合理的现象，则不能拒绝接受 H0，我们称 H0是

相容的。与 H0相对的假设称为备择假设，用 H1表示。

这里所说的小概率事件就是事件 {K ?R?}，其概率就是检验水平α，通

常我们取α =0.05，有时也取 0.01 或 0.10。

基本步骤假设检验的基本步骤如下：

(i)提出零假设 H0；

(ii)选择统计量 K；

(iii)对于检验水平α查表找分位数λ；

(iv)

?

由样本值 x1, x2 , , xn 计算统计量之值 K；

? ?将 K与 ? 进行比较，作出判断：当 | K |??(或 K ??) 时否定 H

0，否则认为

H

0

相容。

两类错误

第一类错误当 H0 为真时，而样本值却落入了否定域，按照我们规定的

检验法则，应当否定 H0。这时，我们把客观上 H0 成立判为

H

0 为不成立（即否定了真实的假设），称这种错误为“以真

当假” 的错误或第一类错误，记 ? 为犯此类错误的概率，即

P{否定 H0|H0为真 }=? ；

此处的α恰好为检验水平。

当 H1 为真时，而样本值却落入了相容域，按照我们规定的

检验法则，应当接受 H0。这时，我们把客观上 H0。不成立判

为 H0成立（即接受了不真实的假设），称这种错误为“以假

当真”的错误或第二类错误，记 ? 为犯此类错误的概率，

即

P{接受 H0|H1为真 }=? 。

两类错误的关系人们当然希望犯两类错误的概率同时都很小。但是，当

容量 n 一定时， ? 变小，则 ? 变大；相反地， ? 变小，则 ?

变大。取定 ? 要想使 ? 变小，则必须增加样本容量。

在实际使用时，通常人们只能控制犯第一类错误的概

率，即给定显著性水平α。 α大小的选取应根据实际情况而

定。当我们宁可“以假为真” 、而不愿“以真当假”时，则

应把α取得很小，如 0.01，甚至 0.001。反之，则应把α取

得大些。

第二类错误

1

概率论与数理统计公式（全）

2011-1-1

单正态总体均值和方差的假设检验

条件零假设统计量对应样本函数分布否定域

H

0

:? ? ?

0

已知 ? 2

|u |?u

U ? x ? ?0

1??2

H

0

:? ? ?

0

H

0

:? ? ?

0

H

0

:? ? ?

0

?

0

/ n N（ 0， 1） u ? u1??

u ? ?u

1??

|t |?t

T ? x ? ? 0

S / n

1??2

(n?1)

未知 ? 2 H0 :? ? ?0

H

0

:? ? ?

0

t(n ?1) t ?t

1??

(n ?1)

t ? ?t

1??

(n ?1)

2w ??

?

(n?1)或

H

0

:? 2 ?? 2

未知 ? 2

2

w?

H

0

:? ??2 2

0

(n ?1)S

2?

0

2

w ??

2

1??2

(n?1)

? 2 (n ?1)

w ? ?

1

2

??

(n?1)

2w ?? ?(n ?1) 2H

0

:? 2 ??

0

1

概率论与数理统计公式（全）

2011-1-1

1

献花(0)

(本文系昵称6917986...首藏)

类似文章 更多

发表评论：