分享

《为什么—关于因果关系的新科学》解读

 WHC超级英雄 2019-08-08

关于作者

图灵奖得主朱迪亚·珀尔 :AI现在的重点是曲线拟合,而不是智能

朱迪亚·珀尔,“贝叶斯网络”之父,美国以色列裔计算机科学家和哲学家,因其人工智能概率方法的杰出成绩和贝氏网络的研发而知名;2011年因创立因果推理演算法获得图灵奖,同时也是美国国家科学院院士,IEEE智能系统名人堂第一批10位入选者之一。

关于本书

在本书中,人工智能领域的权威专家朱迪亚·珀尔及其同事领导的因果关系革命突破多年的迷雾,厘清了知识的本质,确立了因果关系研究在科学探索中的核心地位。

核心内容

第一部分,应该怎么用科学的方式,看待因果关系?

第二部分,应该怎么用科学家的智慧,来完善自己的因果思维?

今天要为你解读的,是一本难度系数非常高的书,叫《为什么》。副标题是“关于因果关系的新科学”。难度有多高呢?在我过去一年的解读中,这应该是最难的一本,没有之一。

按照惯例,我们都会用一句话,或者一个问题,来概括整本书的核心内容。但是今天,我可能得多说几句,因为这本书的内容太丰富了。

这本书主要说了什么呢?借用作者的原话,其实也没什么,我只是推开了一扇新的科学,叫因果科学的大门而已。注意,他说的不是一个新的课题,或者新的研究,而是一门新的科学。

当然,敢说这话的,也不是一般人。这本书的作者,是人工智能领域的传奇人物,著名的计算机科学家朱迪亚·珀尔。老人家今年已经83岁,曾经被《大西洋月刊》评为机器学习技术的开山鼻祖。

但是现在,已经80多岁的珀尔,却是这门技术,最激烈的批评者。他的态度为什么会有这么大的转变?我们有必要花两分钟说说,因为只要读懂了这个原因,我们也就大致了解了这本书的主要内容。简单说,珀尔的态度之所以发生转变,原因就在“因果”这两个字上。

珀尔认为,现在的人工智能,根本就不具备真正的智能。它只能算是一个庞大的数据库。它所有的能力,都是基于已有的数据,都来自人类的输入。但是,真正的人工智能,必须能够超越经验,能够想象一些从来没发生过的情况,能够处理那些从来没有被录入数据库之内的事。而要想具备这种超越经验的能力,首先要具备因果思维。

那么,为什么说因果思维,能让你具备超越经验的能力呢?举个例子,在《圣经》里,上帝针对吃苹果这件事问夏娃,“你都做了什么?”夏娃回答,都是因为蛇,是蛇骗我吃的苹果。注意,上帝问的是事实,是你都做了什么。而夏娃回答的是因果,是做这件事的原因。对人类来说,因果是一种特别自然的思考方式。但是,就是因为太自然了,以至于很多人都没注意到,这种思考方式,其实反映了人类的一种,超越经验的能力。

你看,夏娃之所以要回答做这件事的原因,是因为她猜到,上帝可能会责备她。她想找个理由,获得宽恕。但是,注意,上帝责备她这件事,实际上从来没有发生过,它根本不在夏娃的经验之内。只是夏娃猜到,上帝会责备她。你看,在这一问一答的因果分析中,夏娃已经完成了一次超越经验的思考。

换句话说,因果,不仅仅是对已知经验的总结。比如因为我吃了饭,所以我觉得饱。因果还有更深一层的意义,它其实是一种超越经验的思考能力。

说到这,你可能会说,只要把这种因果思维,变成一串代码,输入给人工智能,不就得了?当然,这么想也没错。但问题就出在,这串代码根本不存在。因为在过去的100多年里,在科学的世界里,根本就没有因果关系。很多科学家认为因果关系根本不存在。换句话说,因果甚至都没有被纳入科学的范畴,科学家怎么可能用科学的语言来描述它?而没有科学的语言,又怎么可能把它教给人工智能?

说到这,我们可以说说,这本书的核心了。它的核心价值,就是让因果这门学问,重新回到科学的范畴之内,研究怎么用科学的视角看待因果?

当然,这门科学最终会发展成什么样?会不会成为一门新的科学?现在都难说。我只能说,假如能成,那么此时此刻,你就见证了一个伟大的时刻,见证了一门新科学的诞生。当然,即使不成,我们也算是参与了一场精彩绝伦的,有关因果的科学思辨。

在正式解读之前,我要先说明,这本书的信息量非常大,很难用半个小时说清。而且书中的某些内容,确实超出了我的能力范围。今天的解读,我们顶多算是揭开了因果科学的一个边角。假如未来某天,你有缘读到这本书,也希望今天的解读,能对你阅读原书有所帮助。

接下来,我将分成两部分,为你解读这本书。第一部分,我们一起看看这场持续了100年的,有关因果的科学思辨。说说到底应该怎么用科学的方式,看待因果关系?第二部分,我们再深入借鉴科学家的智慧,说说应该怎么用科学家的智慧,来完善自己的因果思维?

第一部分

咱们先说第一部分,应该怎么用科学的方式,看待因果关系?

前面说过,在过去的100多年,在科学的世界里,根本就没有因果关系。为什么没有?这要从100多年前说起。

1877年,著名的发明家、人类学家,也是统计学的鼻祖,达尔文的表弟,叫弗朗西斯·高尔顿,做了一个实验。这个实验得出一个结论,认为科学的世界里,根本没有因果。

这个实验并不复杂。把一块木板立起来,然后木板的上半部分,是一排排的小格挡。下半部分,是一排垂直的竖槽。一个小球从上边的正中央落下来,经过一排排小格挡的碰撞之后,落在下面的槽里。当然,落在哪个竖槽,事先算不出来,碰撞是随机的。这个板子,叫作“高尔顿板”。


在实验里,虽然小球的下落是随机的,但是,当你放下一堆小球之后,会发现,小球的分布呈现出一种规律。中间部分的竖槽里,球特别多,然后越到两边,竖槽里的球越少。整个小球分布,呈现出一个平滑的钟形曲线。统计学上,管这种现象叫正态分布。

高尔顿用这个实验,来模拟人的遗传。比如身高,人的身高会受到很多遗传因素的影响,就像板子上那些小格挡一样。但是,不管有多少因素,最终都会呈现一种正态分布。也就是,大多数人都会处在一个平均区间,不高不矮。而特别高和特别矮的人都是少数。

当然,到这一步,并不是什么新闻。真正有趣的是接下来,高尔顿把这个实验又延续了一步,在原来的高尔顿板下面,又接上一个高尔顿板。也就是,让原本在竖槽里正态分布的小球,再下落一次,再次经过一大堆小格挡,并且再次落在一排竖槽里。这么一来,会发生什么呢?

无论是理论推导还是实验演示,呈现出的结果都是,第二层竖槽里的小球分布,会把正态分布这个趋势放大。也就是,各个竖槽之间的小球数量,会变得更均匀。这个由小球组成的曲线,会变得更平缓。

这两层高尔顿板,模拟的是两代人的遗传。对应到现实世界,呈现出的结果应该是,在第一代人当中,特别高和特别矮的人是少数。而到了第二代,特别高和特别矮的人,都会变多,而身高是平均值的人会变少。就像第二层高尔顿板里的小球分布一样。假如你没太明白,我再次建议你点开文稿,看一眼图片,马上一目了然。

说到这,你一定已经注意到,现实世界并不是这样。不管是在哪一代人中,特别高和特别矮的人,都是少数。这就奇怪了,你看,假如下一代的身高,是在上一代的基础上遗传的。那么,身高特别高的人,生出的孩子,很可能比父辈还高。这么子子孙孙一代代下来,就会有越来越多,特别特别高的人。同样,也会有越来越多,特别特别矮的人。但是,这些并没有发生。身高特别高的人,下一代的身高,大概率上会矮一点。同样,特别矮的人,下一代往往会高一点。总体上看,每一代人的身高分布,并没有呈现出越来越大的两极分化。

高尔顿还观察了600多个英国名人,发现这些名人的儿子们,普遍不如父辈有名。就像咱们常说的,富不过三代。高尔顿把这个现象叫作回归平庸。现在,我们稍微改了个字眼,管它叫,回归平均。也就是,不管上一代比平均值高多少,或者低多少。在下一代身上,这些差异大概率上都会缩小,他们会接近平均。

那么,到底是什么原因,导致了回归平均这个现象呢?这个问题,高尔顿思考了12年,终于得出结论,根本就没有原因,没有神秘的力量。世界本身就不是因果能解释得了的。冥冥之中,我们就是会回归平均,没有理由。当然,这其中还有很多复杂的研究思考,咱们在这就不展开说了。

其实,不管到底是什么力量,导致了回归平均。它都指向一个事实,那就是,父亲的身高,并不能百分百决定孩子的身高。上一代,并不能决定下一代。它们存在一定的关联,但不存在绝对的因果。高尔顿把这种关系称为,相关性。这就是相关性这个概念的起源。

后来高尔顿的学生,叫卡尔·皮尔逊,把这个思想壮大,认为世界上只有相关,没有因果。这也成为很多科学家的共识。这就是为什么说在过去很长一段时间里,科学的世界里,只有相关,没有因果。

同时,皮尔逊还对相关性做了区分,认为在这些相关性中,有些相关很有意义。比如父辈的身高和孩子的身高。还有些相关性没什么意义。比如一个国家的人均巧克力消费量,和这个国家的诺贝尔奖得主人数,呈现正相关。这种相关性就没意义,总不可能是吃巧克力导致了得诺贝尔奖的几率增加。

你看,皮尔逊的论证,好像很有道理。到这一步,有关因果的争论,好像已经有了定论。但是,不知道你发现没有,皮尔逊的观点里,其实有一个自相矛盾的地方。回顾一下刚才的话,皮尔逊说,巧克力消费量和诺贝尔奖得主的人数,这种相关没意义。而之所以没意义,是因为吃巧克力不会导致得诺贝尔奖的几率增加。

注意,这里用到了,导致这个词。什么叫导致?说到底,不还是因果吗?换句话说,皮尔逊自己不承认有因果,认为世界上只有相关。只是有些相关有意义,有些相关没意义。而判断有没有意义的标准,还是因果。说到底,作为因果关系最忠实的反对者,皮尔逊自己也在使用因果关系。

你看,到这一步,有关因果的争论,就变得有点尴尬了。从科学上,我们证明不了因果关系存在。但是,我们的思考,又离不开因果关系。那么,我们到底应该怎么用科学的方式,来看待因果关系呢?

对于这个问题,珀尔在这本书里给了一个答案。他借用了一点哲学的视角。他认为,要想说明白因果,得先把主观和客观,这两个维度分开看。在他看来,因果,其实是一种人类的主观思维方式。也就是,当我们观察到一些客观事实之后,就会主观的建立起因果联系。至于客观世界,也许不是按照因果规律运转的,就是只有相关,没有因果。但是,人类认知这个世界的方式,却是通过建立因果关系。比如你吃完一个馒头之后,你确定,只要再吃几个,你就会饱。但是,事实上,你并没有吃到后面的馒头,这只是你的猜测。为什么会产生这个猜测?因为你在无形中建立了一种因果关系,觉得是吃馒头这个原因,导致了你吃饱这个结果。所以你确定,只要再吃几个馒头,你就会饱。你看,即使是再简单不过的一次思考,我们就已经调用了因果关系。

换句话说,不管客观世界存不存在因果关系,我们主观上都离不开因果这个思考方式。

其实,在读到这的时候,我个人是感觉,这个结论有点不够解渴。作为一本讲因果关系的书,书里从头到尾,都没有正面回答,应该怎么用科学的语言,来定义因果关系。书里只是描述了因果关系的两个特征。第一,开头说过,因果关系其实反映了一种超越经验的思考能力。第二,因果关系是一种主观建立的思考方式。

但是,回过头来想想,作者这么想也并不是没有道理。首先,现在的科学研究,确实还没到这一步。怎么用科学的方式定义因果关系,根本就没有一个定论。但是,你又不能一直纠结在这个问题上,因为有一个因素,逼得你必须往前走。这个因素就是人工智能。假如我们纠结于,因果到底存不存在?或者怎么用科学语言来描述因果关系?等研究明白了之后,再把它们变成代码,教给人工智能。那这个周期未免太长了。就像你非要把牛顿的力学定律研究明白之后,再制造一把锤子一样。珀尔其实是想跳过理论研究这一步,直接去实践,去琢磨怎么把因果思维,教给计算机。

所以,他先是在相关性的定论中,找出一个漏洞。你看,到这一步,说因果不存在这个观点,不能完全站住脚了。你就算不支持因果关系存在,至少也找不出彻底颠覆它的理由。好,既然理论上纠缠不清,我们也不必费脑筋,干脆直接通往实践。我们直接琢磨下一件事,就是怎么把因果思维教给机器?

在确定这个目标之后,我们首先要解决的问题,就不是怎么定义因果关系。我们的首要问题变成了,怎么完善自己的因果思维?你看,既然因果思维是主观的,现在你又要把它教给机器。那么在传授之前,你至少得先尽可能完善自己的因果思维。就像你想当老师,首先得提高自己的水平。而且,这不光是科学家的问题,这和我们每个人都有关。

接下来,第二部分,我们就来说说,怎么完善自己的因果思维?

第二部分

在介绍书里的观点之前,我有一点个人的思考,非常想跟你分享。当然,这也是因为这篇解读稿本身篇幅有点长,而且很严肃。我的个人分享,就算是一个中场休息吧。我想跟你讲两个故事。

第一个故事,是我们都很熟悉的神话,后羿射日。说的是,天上有九个太阳,庄稼热得寸草不生,人也快热死了。怎么办?一个叫后羿的人,用一把大弓,射下了八个太阳。当然,我们都知道这个故事是虚构的。但是,我希望你注意的是,我们在构思这个故事的时候,使用的因果模型。那就是,当天上有九个太阳,这个原因,会导致什么结果?答案很明显,那就是热。

第二个故事,来自于著名的小说《三体》。说的是,在遥远的外星系,有三个太阳。这三个太阳在万有引力的作用下,彼此吸引,做出了无穷无尽的不规则运动。这个运动没有任何规律。人类根本算不出来。它已经超过了人类目前的数学极限。注意,在这个故事里,我们的因果模型已经变了。我们已经意识到,用不了九个太阳,只要有三个,它们的运动规律,就已经超过了人类的数学极限。

你看,在后羿射日的故事里,我们建立因果模型时,只考虑到了,热这一个因素。因为在人们编这个故事的时候,还没有发现万有引力。但是,在《三体》的故事里,人们已经意识到,万有引力的存在。所以,我们也意识到,三个太阳带来的不仅仅是热,还有人类无法预测的不规则运动。

当然,这个因果模型也不一定准确。没准未来的某一天,人们又发现了万有引力之外的新规则。我想说明的是,这个世界同时存在很多不同维度的规则,比如热力、万有引力、能量守恒,等等。你能察觉到的规则越多,越关键,你的因果模型就越准确。

好,这是我个人,对于怎么完善因果思维的一点思考。接下来,咱们书归正传,说说珀尔作为一个科学家,是怎么看待这件事的。在这本书里,珀尔给出了很多完善因果思考的方法。其中,有两个方法出现的频率最高,几乎贯穿全书。第一个方法叫区分混杂因子,第二个方法叫找到中介因素。

咱们先说第一个,区分混杂因子。什么叫混杂因子?咱们得从一个著名的悖论说起。这个悖论叫,辛普森悖论。

它说的是,假设有一种药物,对男人有害,对女人也有害,但是,对人类有益。是的,你没听错,就是一种药,对男人有害,对女人有害,但是对人类有益。你可能觉得,这不是自相矛盾吗?太匪夷所思了。别急,听完下面的推论,你会觉得更匪夷所思。

首先,这个结论是有扎实的数据支撑的。假设,这个实验把患者分成了两个组,一个是吃药的处理组,一个是没吃药的对照组。处理组包括40名女性和20名男性。而对照组反过来,包括40名男性和20名女性。但是,两个组的总人数是相同的,都是60人。

然后,在没吃药的对照组,40名男性中,有12人患上了心脏病,患病率是30%。20名女性中,有1人患上了心脏病,患病率是5%。而在吃过药的处理组,20名男性,有8人患病,患病概率是40%。40名女性,有3人患病,患病率是7.5%。

当然,我知道这些数字很复杂,你也不用刻意去记。你只需要大概知道。男性不吃药,患病率是30%,吃了药,患病率是40%。显然,药物对男性有害。而女性,不吃药,患病率是5%,吃了药,患病率是7.5%。一目了然,它对女性也有害。

但是,接下来,反常的数据出现了。假如把男性和女性的人数加在一起,重新计算这个比例。它就变成了在没吃药的60个人里,得病的总数是13人,患病率是22%。而吃过药的60个人,得病的人数是11人,患病率是18%。再重复一遍,从总人数上看,不吃药,患病率是22%,吃药,患病率是18%。这就得出了一个结论,这个药对人有效。

前前后后把这些结论连在一起,就构成了辛普森悖论。一个药对男人有害,对女人也有害,但是对人类有益。假如你还是不信的话,我在音频稿里,放了一张辛普森悖论的图表,你可以看看,一目了然。

辛普森悖论本身并不是一个新发现,它已经让学术界争论了几十年。这回,珀尔从因果关系的角度,提出了一个新解法。这就是,你要找到造成辛普森悖论的混杂因子。所谓混杂因子,就是同时会影响原因和结果的那个因素。在这个实验里,吃不吃药是原因,有没有得病是结果。那么,是什么因素,同时在干扰这两点呢?仔细想想,你就会发现,是性别。

你看,男性和女性服药前后的发病率不一样,说明性别对服药结果有影响。同时,在对照组里,男性比女性多,而在处理组里,男性比女性少。这说明,男女的服药比例,也跟性别有关。好,到这一步,我们可以确定,性别是这个实验里的混杂因子。这个混杂因子,也叫后门路径。它就像在这个因果链条里,开启了一个后门,然后从后门进入,干扰因果关系。

意识到性别这个混杂因子之后,你要做的,就是阻断这个混杂因子。所谓阻断,其实就是要坚守一个原则,那就是,绝不能把跟混杂因子相关的因素,直接加在一起,一定要分开计算。体现在这个实验里,性别是混杂因子,你就不能把男女的人数直接加在一起,而是要分别计算男女各自的得病概率。分开计算之后,这个混杂因子的干扰,就被排除了。被排除之后,你才能做接下来的统计。

按照这个方法,男性服药前的得病概率是30%,女性服药前的得病概率是5%。那么就可以算出,对男女总体而言,服药前的得病概率是二者的平均值,17.5%。而服药后,男性的得病概率40%,女性是7.5%,平均值是23.75%。你看,算完之后,对男女总体来说,服药前得病的概率是17.5%,服药后是23.75%。这么一来,你就获得了一个正确的结论。这个药对男性有害,对女性有害,对人类也有害。

这个算法乍一听可能有点复杂,我建议你花一点时间,稍微想一想。它就像一层窗户纸,一旦捅破,你会发现其实特别简单。更重要的是,珀尔本人,把因果思维分成了好几个层级,都是什么,咱们就不多说了。但是,我刚刚跟你说的区分混杂因子,是最高级的一级。花点时间搞懂这一级,你就能体会到珀尔眼中的,最高级的因果思维是什么样的。

当然,假如你觉得这一级有点复杂。咱们把难度稍微降低一点。说说第二个稍微简单一点的方法,叫找到中介因素。

什么叫中介因素?简单说,就是由一个原因,导致第二个原因,而第二个原因,导致最终的结果。这第二个原因,就是中介因素。

举个例子,在几百年前的航海时代,船员经常得坏血病,最终可能导致死亡。当时的人猜测,这可能跟饮食有关,因为海上没有新鲜的蔬菜和水果。18世纪,苏格兰海军发现,服用柠檬能预防坏血病。好,这就得出了一个因果模型,柠檬是原因,预防坏血病是结果。

当时,本来给船员吃的是西班牙柠檬,后来发现,西印度柠檬更便宜。为了节省成本,就换成了西印度柠檬。同时,为了防止变质,人们还把柠檬榨成汁,煮熟了带上船。结果,坏血病大面积爆发。你看,这个因果模型,被颠覆了。显然,柠檬并不是预防坏血病的原因。直到20世纪初,人们才弄明白,真正对坏血病有预防作用的,是柠檬里的维生素C。而西印度柠檬的维生素C含量只有西班牙柠檬的四分之一。而且柠檬汁煮熟后,这些仅存的维生素C也被破坏掉了。

在这个故事里,维生素C,就是中介因素。是吃柠檬导致了吃进维生素C,而吃了维生素C,又导致了预防坏血病。

换句话说,找到中介因素,是建立因果模型的关键。假如你的因果模型不能被反复验证,你就要考虑,是不是忽略了中介因素。

好,这是我们今天说的第二个,提升因果思维的方法,找到中介因素。在珀尔建立的因果思维层级里,无论是找到中介因素,还是区分混杂因子,它们都属于高级的思考方法。花点时间搞懂它们,对我们还是很有帮助的。

以上就是第二部分内容,怎么提升自己的因果思维?我们说了两个方法。第一个方法是,区分混杂因子。也就是找到那个,同时对原因和结果产生影响的因素,然后想办法阻断它的干扰。第二个方法叫,找到中介因素。也就是,由原因一导致原因二,而原因二又导致结果。这个原因二,就是中介因素。中介因素,是建立准确因果模型的关键。

总结

到这里,这本《为什么》先为你解读到这。咱们今天一共回答了两个问题。第一个问题是,科学家是怎么看待因果关系的?珀尔给出的结论是,因果是我们观察世界的主观模型。第二个问题是,怎么提升自己的因果思维?咱们说了两个方法,区分混杂因子和找到中介因素。这部分刚说完,就不再重复了。

最后,再次强调,这本《为什么》是一本难度很高,也很值得一读的书。万维钢老师曾经在他的专栏里,用十期节目的篇幅解读过。假如你想进一步了解,我推荐你去听万维钢老师的解读。假如你对这个话题非常感兴趣,并且有强烈的探索欲,我推荐你阅读原书。现在,这本书的精排电子书已经上线,你只要在首页搜索《为什么》,就能马上看到。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多