分享

数学家眼中的概率究竟是怎样的(二):测度与概率

 quasiceo 2018-01-07
2017-04-09 20:27

你所想要知道的 代数、可测集、测度、概率空间、可测函数等,都在此推文中介绍,以一种通俗易懂而又不肤浅的方式。

(接上篇)

不可测集(non-measurable sets)的存在,意味着对于一般的样本空间 ,并非其任意子集 都可以赋予一个相应的概率而不导致悖论。为了避免悖论,只能将不可测集排除在外(毕竟不可测集是很怪的集合,也没有什么实际用途),而将注意力集中于可测的那部分子集。

代数

问题在于,如何构造样本空间 的这些可测子集呢?不妨将所有这些可测子集的集合记为 (英文字母 的花体)。在此, 为集合之集合(set of sets,数学上一般以花体字母表示),也称为 “集合系” 或 “集类”(class of sets),其每个元素本身也是一个集合(在此为可测子集)。

显然,样本空间 这个全集应该是可测的,即

进一步,如果 的子集 可测,则 的余集 也应该是可测的:

其中, 由于所有不在 中的元素所组成:

由此可知,空集 也是可测的,即 ,因为空集 是全集 的余集。

另外,如果集合 与 都是可测的,则其并集 也应该是可测的,即

不难看出(使用数学归纳法),任意有限个可测集的并集仍是可测集。满足以上条件的集合系即称为一个 “代数”(algebra)或 “域”(field)。

本质上,一个代数就是关于余集与有限并集运算封闭(closed under complement and finite union)的非空集类。

在实际应用中,经常需要将 “有限并集” 推广到 “可列并集”(countable union),即要求如果可列个集合都是可测的,则其并集也是可测的:

一个关于可列并集也封闭(closed under countable union)的代数即称为 “代数”(-algebra)或 “域”(-field)。

进一步,将样本空间 ,连同定义在其上的 代数,即 ,称为 “可测空间”(measurable space)。下文的测度就是定义在可测空间之上的。

可测集与测度

那么,究竟如何判定一个点集是否为可测集呢?如果可测,又如何计算它的测度?

1902年,法国数学家勒贝格(Henri Lebesgue,1875-1941)在其博士论文中开创性地提出 “测度论”(measure theory),这或许是有史以来最才华横溢的数学博士论文之一。

Henri Lebesgue(1875-1941)

对于实数轴上的任意点集 ,勒贝格提出提出使用一系列的区间来覆盖集合 ,比如

由于区间的测度就是其长度,故集合 的测度(如果存在)应小于这一系列区间的长度之和,即

当然,我们希望选择这些区间,使得它们的长度之和越小越好。由此,可定义集合 的 “外测度”(outer measure):

其中,为 “下确界”(infimum),也称 “最大下界”(greatest lower bound)。如果一个点集存在最小值,比如闭区间 ,则下确界就等于其最小值(minimum),即此闭区间的左端点 。然而,对于开区间 ,并不存在最小值,但其下确界依然是 。

根据实数的性质,对于 中任意点集 (包括不可测集),此下确界一定存在(可能取值无穷大)。类似地,还可以定义 “内测度”(inner measure),即将全集 的外测度减去点集 之余集 的外测度:

如果外测度等于内测度,则称集合 为 “可测集”(measurable set)。但此定义使用起来并不方便,而现在广泛运用的定义,则由生活在德国的希腊数学家 Constantin Caratheodory 所给出。

任给 中某集合 ,可将集合 分解为 “与 相交” 及 “与 不相交” 的两部分:

显然,上式右边的两个集合没有交集。如果对于任意 ,恒有

则称 为可测集;并将其外测度 作为其测度(measure),记为 。

在此,集合 的作用是相当于一个测试集(test set)。如果存在某个集合 ,使得

则说明集合 是一个很奇怪的不可测集。在此定义之下,可以证明,由所有可测集所组成的集合类构成一个 代数(关于余集及可列并运算封闭的)。

对于可测空间 ,连同定义在 上的测度 ,构成三位一体的 ,即称为 “测度空间”(measure space)。

测度论在现代数学中有着广泛的应用。比如,勒贝格使用其测度概念所建立的勒贝格积分(Lebesgue integral),基本替代了此前的黎曼积分(Riemann integral),因为勒贝格积分的性质更为优越(可积函数范围更广,求积分与极限运算更易交换次序等)。

概率公理体系

1933年,前苏联数学家柯尔莫戈洛夫(Andrey Kolmogorov,1903-1987)意识到,可以使用勒贝格所创立的测度论来建立概率论的严谨基础,并由此建立了概率的公理体系。

Andrey Kolmogorov (1903-1987)

简单地说,如果整个全集 的测度为 1,则测度空间 就称为 “概率空间”(probability space)。对于概率空间,一般将其测度 记为 ,称为 “概率测度”(probability measure)。

对于概率空间 ,其中 为样本空间, 为由 的可测子集(即随机事件,random events)所构成的 代数,而 为定义在 上的概率测度。

柯尔莫戈洛夫所提出的概率公理体系,包括以下三条针对概率空间 的公理(axioms)。

公理1:非负性,即对于任何随机事件 ,都有 。

公理2:完全性(unit measure),即 。

公理3:可列可加性(countable additivity),即对于 中任何互不相容的随机事件 ,都有

从这三条看似简单的公理出发,即可推导出全部的当代概率论!

随机变量与可测函数

在随机试验中,由于样本空间 中的结果 (也称 “样本点” 或 “基础事件”)未必是具体的数,为了方便起见,常将 对应于某个实数 ,即考虑如下函数:

由此,样本空间 中可测子集 即被映射到实数轴上,成为 中的某个子集

反之,考虑实数轴上的某个点集 ,如果通过函数 的 “逆函数”,反向地找回到 中的子集 ,是否依然是可测的?

其中, 称为集合 的 “原像”(preimage)。我们之所以对集合 的原像 感兴趣,是因为概率测度仅定义于样本空间 ,故只有回到 才能计算 的发生概率 。

作为最低要求,我们希望至少对于形如 的开区间,其原像 是可测的,即

满足此条件的函数 即称为 “可测函数”(measurable function)。

可以证明,对于可测函数而言,实数轴上任何开区间(乃至任何开集)的原像都是可测的。更一般地,对于任何 中的开集,通过余集、可列并集、可列交集所生成的集合(称为Borel sets),其原像也都是可测的;这就足够满足我们一般的应用需要了。

那么,究竟什么是随机变量呢?其实,它就是定义在概率空间上的可测函数 。由此可见,随机变量实际上是一个确定性的函数,它既不随机,也不是变量。只是由于随机试验的结果 在变,故可测函数 的取值也在变。但大家显然已经习惯于 “随机变量” 这个称呼了。

初看起来,可测函数的概念似乎有些抽象,但我们也不必过虑。因为连续函数都是可测函数,而计量经济学中所用的函数一般都是连续函数。本质上,可测函数是一种几乎连续的函数,因为它的不连续部分为零测集(即测度为零的集合)。

总之,尘埃落定,世界几乎依然是美好的,除了那些难得一见的不可测集与不可测函数。

参考文献

程士宏,《测度论与概率论基础》,北京大学出版社,2004年。

Billingsley, Patrick, Probability and Measure, John Wiley, 1979.

Davidson, James, Stochastic Limit Theory, Oxford University Press, 1994.

Royden, H. L. and P. M. Fitzpatrick, Real Analysis, Pearson Education, 2010.

高级计量经济学与Stata现场班

(c) 2017, 陈强,山东大学经济学院

www.econometrics-stata.com

转载请注明作者与出处

Our mission is to make econometrics easy, and facilitate convincing empirical works.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多