分享

我为你归纳了关于归纳的知识(图文版)

 jocw的图书馆 2021-01-15

欢迎回来,我们继续聊逻辑。

上期说,我们要在逻辑知识逻辑能力之间搭一座桥,桥上有三把利剑、三枚盾牌和一面镜子,借助它们,我们将认识「三种推理」和「三类谬误」,澄清「逻辑与口语表达」之间的关系。

上期,我们拔起了演绎之剑。从AEIO到Alpha Go,不愧是最锋利的逻辑之剑,但我们却说它是最难用的剑,人类只能以外挂的形式来使用它的力量,为什么要这么埋汰人类呢?

有限理性

请听题:

汤质盯着张三,张三盯着韩梅梅,汤质已婚,韩梅梅未婚,问,是否有一个已婚人士盯着一个未婚人士?

A:是

B:不是

C:不确定

很多人会选C,因为题目中没有给出确定的信息,我们不知道张三婚否。

问题选自心理学家斯坦诺维奇的著作《超越智商》,据说无论智商高低,80%的人都会做错。

正确答案只能是A。

在一个逻辑系统中,张三「婚否」是不重要的,他要么已婚,要么未婚。无论已婚未婚,所以给定的前提下,一个已婚人士看着另一个未婚人士是必然成立的。

上面这种推理叫「完全析取推理」(fully disjunctive reasoning),它要求你对「所有逻辑可能性」进行分析,演绎出一个必然包含在前提中的结论。

计算机就是这么“自然而然地”思考的,对人来说却极不自然。用斯坦诺维奇的话说,我们都是「认知吝啬鬼」——选项C与直觉最相符,在过往经验中,类似的状况都应该选C,于是大脑完成了一个隐秘的而高效的归纳,跳过了细致的思考。

我们是名副其实的演绎残废。

虽然这种吝啬和残废常常给我们使绊子,但我们也得承认,它是人类高效思考的前提。

道理很简单,「是不是有个已婚人士看着未婚人士」这种奇怪的问题只会在心理学测验中出现,真实世界中的问题是复杂且模糊的。比如我该从事什么职业,我该留在大城市还是回老家发展,一只股票该买入还是卖出等等。如果人在做每一项决策时,都要考虑「所有变量」「所有逻辑可能性」,那么任何一个简单的判断,都会变得极其复杂,以至于无法判断。

所以,我们的大脑无法处理,也无需处理所有逻辑可能性,绝大多数情况下,我们只需要处理「有限的经验可能性」就足够了。

人类的知识就是这样运行的。

对此,认知科学界公认的大神,在本节目出镜率很高的赫伯特·西蒙做过一个非常精彩的概括:

知识的使命,就是从所有的逻辑可能性总类中选出一个其经验可能性较为有限的子类,从而在描述可能性的各变量之间建立一定的功能联系。

知识的最终目的是确定过去和现在已知事实与将来的事实之间的关系,从而由当前状况产生唯一一种可能性。我想象不出比这一表达更彻底的关于知识用途的工具观了。

《司马贺传:穿越歧路花园》

拿掉定语,其主旨是:

知识的使命,是从总类中选出子类,从而在各变量之间建立联系。知识的最终目的是,确定事实与事实之间的关系,从而由状况产生可能性。

「有限理性」(bounded rationality)是西蒙最著名的理论,是认知科学、行为经济学中最重要的理论假设之一。他认为,人只能在一个封闭的变量系统中才能做出有效决策。

任何一个对象都有无限细节,一滴水、一个人、一个社会,我们只能在无限细节中的框定出有限的变量,才有可能寻出其中规律。

比如我们可以找出与「职业选择」有关的重要变量来制定决策,也试图通过某些关键变量来预测一个股票的长期价格走势,变量选得好,能保证我们在大部分状况下做出相对符合趋势的决策。

重点来了,我们必须通过「有效的归纳」才能做到这一点。

将性质归结为类型

上期说过,归纳是从小范畴中发现大范畴、从个别(特称命题)发现一般(全称命题)的推理,与演绎推理的“路径”正好相反。

在逻辑学中,归纳推理的基本形式是:

观察到a、b、c都属于S且是P(a,b,c都属于天鹅,且是白色的)

没有东西被观察到属于S且不是P(没有观察到天鹅的不是白色的)

所有S都是P(所有天鹅都是白色的)

(注:S指主项Subject,P指谓项Predicate)

由于是从特殊观察中推出一般结论,所有它不是必然有效的,属于或然性推理。所以前面「有效的归纳」的说法是错的,更准确的说法是高强度的归纳。

有关归纳推理的本质特征,维基词条一语道破天机:

(归纳推理)基于对特殊的代表的有限观察,把性质(或关系)归结为类型

注意这里的表述:特殊代表的有限观察,性质归结为类型

我们离不开归纳,是因为我们的经验永远来自有限观察,对事物的理解又总是类型化的。

于是,如何观察特殊代表,把哪些性质归结为何种类型,就拉开了人与人思考质量的差距,区分了好知识和坏知识。

前面讲「职业选择」时一晃而过的图示,其实是人力资源界鼎鼎大名的霍兰德职业模型,一个久经考验的经验模型。

它在影响职业选择的个人特性中找出了两个关键性质(关键变量)。

第一个特性是人的行动偏好,有人喜欢想,有人喜欢干。

另一个特性是人的对象选择偏好,有人喜欢面对“人”,有人喜欢面对“事”。这两个特性,就是两个关键变量。

然后把人划分成了六种类型

比如行动力强且喜欢与人打交道的人,是企业型,适合带团队、当领导。

喜欢思考且喜欢琢磨事物的人,是学者型,适合搞研究、当学者。

临近的类型往往有高度关联性,对角线的类型则是反对关系。

这样,每个人都会有自己的霍兰德代码,对应特定的职业类型。

基于类似的思路,还可以把人分成了五种、九种、十二种、甚至十六种……但无论多少种,它们都是帮我在逻辑可能性的总类(人性的所有可能)中找出经验可能性有限的子类(人格类型-职业类型),并描述变量间功能性联系的「知识」,基于归纳的知识。

从二元到多元

和你们一样,我特别喜欢这类知识,它能让你在付出极低认知成本的情况下,为复杂对象建立起一个简化理解的框架,这种相对高级的归纳,能帮助我们超越“原始人归纳法”的局限性。

原始人归纳法当然是我杜撰的词,其实就是二分法,好人/坏人,危险的事/安全的事,喜欢的工作/不喜欢的工作,重要的事/不重要的事。二分法是基于单个性质(变量)的粗暴分类,我们还说不清这个性质(变量)是啥,什么是好,什么是安全,什么是重要?所有的判断都来自于生存本能。

前面讲的这类知识,之所以相对高级,就在于它们找出了更多变量,划分出了更多类型,让我们对事物有了多元的认知。

但我总是强调它们「相对」高级,因为这类知识有一个明显的弊端,就是它们显得不“科学”。

十二生肖和六十四卦也为我们提供了简化框架,它和六型人格、九型人格,十六型人格有什么本质区别吗?

要回答这个问题,我们必须深刻地理解「归纳推理」的本质。当我们谈论科学性时,我们是在谈论客观性和严谨性,当我们谈论客观性和严谨性时,我们其实在讨论「归纳强度」。

有些严肃的科学知识看起来格外牛逼,有数学化的表达形式,有精确的预测能力,虽然看起来和前面这些简单归纳出来的家伙完全不是一路货色,但它们本质上都是经验模型,关键差别在于,它们对原始经验材料归纳强度完全不同。

科学发展史,某种程度上就是一部曲折的归纳技能强化史,下面我们来仔细谈谈。

从直观到实证

今天的知识之更所以精确,首先是归纳方法进步了。

密尔在《逻辑学体系》为归纳梳理出了五种方法,简称密尔五法,将归纳从一种不自觉的认知方式提炼成了研究因果的方法,为实证科学奠定了基础。

密尔五法的第一个方法求同法就是最经典的归纳法,科学家在情境1中观察到事件ABCD和现象wxyz一起发生;在情境2中观察到事件AEFG和现象wtuv一起发生;因此推断A可能是w的原因或结果。

比如在过去十天里,我有三天状态特别好,思路特别清楚,正好我这三天的早上都去跑步了,由此我得出一个结论,跑步会导致状态变好。

求同法是最自然而然的归纳方式,它的局限性很明显。

首先是无法区分原因和结果,不知道是因为状态好才去跑步,还是因为跑步了状态才好;其次是我们观察到所有影响因素,也许那三天还有别的事情同时发生,比如睡得早,吃得好了,稿子写到了容易的部分了,天不下雨了,它们都会同时影响到我跑步的意愿和思维的状态,这里面的因果关系是纠缠不清的。

你观察到的是ABCD和现象wxyz一起发生,事实上发生的事情一个字母表都数不过来。

无论我们要探究跑步与状态的关系,还是发现某种习惯与疾病的关系,乃至搞清楚某种行为偏好与社会成就的关系,就都会遇到类似的障碍。

除非,有一个平行宇宙,平行宇宙的你除了不爱跑步,其他一切都不变,你才能确切地指出它们之间存在某种因果关系。

这就是求异法的思路。

你在情境1中观察到事件ABCD和现象wxyz一起发生。

接着在情境2中观察到BCD和xyz一起发生。

于是推测A是w的原因或结果,或是重要的相关因素。

求同法从共有事件中寻因果关系,求异法从差异事件中寻找因果关系。差异性比共性更容易察觉,而且我们可以通过人为干预来制造差异,所有求异法比求同法更具普适性。

“求异”也科学发现的普遍思路,通过建立对照组,科学家能非常方便地使用求异法来发现因果。

90年代,科学家怀疑吃过量的盐会导致高血压和心脏病,于是拿黑猩猩做实验,处理组吃含盐量高的食物,对照组吃正常的食物,持续20个月,结果处理组的血压明显高于对照组。之后实验人员降低了处理组食物中的含盐量,血压随之降低。于是研究人员得出了吃盐会导致血压升高的结论,更准确的说法是,得出了「吃盐会导致黑猩猩血压升高」的结论。

但过量吃盐是否会导致人的血压升高呢?我们并不能肯定,人的生活都环境也比猩猩复杂很多,过去的生活作息、饮食习惯很难被准确收集,更何况,给一群无辜的人吃有潜在健康风险的高盐饮食在伦理上是不被允许的。

在这种情况下,严格意义上的求同和求异都无法使用,只能使用共变法

在情境1中,ABCD与wxyz同时发生;情境2中,A发生了某种变化,w也发生了某种变化,我们推测A和w有某种程度上的关联。

求同和求异是定性的推断,它的结论要么是有因果关系、要么是没因果关系,而共变法是定量的推断,它追究得更具体,它问,A与w在多大程度上有关系。

从求同到求异,是研究思路上的转变;从直观到实证,则算得上是方法论上的进步;而从定性到定量,则是认知模式上的大转型。这背后的深远意义可能是连密尔自己都没有意识到的。

从定性到定量

人类为万物定量的历史是从结绳记事开始的。我们创造数字,研究数学是为了创造一种语言和工具,用最精确的方式来描述万事万物之间的因果联系。一两千年中,数学家们为此付出了卓绝的努力,谁曾想,到了20世纪,人类所有关于定量的智慧集结起来,反而直接消灭了因果联系。

今天的世界,一个被统计学笼罩的世界。

前面讲到,任何一个对象都有无数细节,我们只能通过观察有限的代表来认识它们,统计学说:我就是来干这件事的!

在统计的世界里,需要认识的对象是一个总体,我们无法直接研究总体,只能透过「样本」间接地认识它。样本的特征就是可供统计的变量,这些变量的值(values)就是数据。当我们观察的样本足够多时,我们就能找出变量变化的一般规律,获得某个总体的参数,即关于某个对象知识。

譬如,你想知道吸烟和肺癌之间是否存在因果关系,你可以找到1000个人(样本),记录他的烟草消费量和肺癌患病率这两个变量的值,用一系列数学方法演绎出最终的结论。当然,这里的结论并不是明确了它们的因果关系,而是得到它们之间的「相关系数」。

相关性是统计学先驱高尔顿在研究人体特征时发明的概念,他发现身高高的人,臂长也相对更长,但这明显不是因果关系,因为它们共同受到遗传因子的影响,所以只能用相关性来描述。

在高尔顿那里,相关性还只是一个为因果关系辩护的证据。但在他的学生,也是另一位统计学先驱卡尔·皮尔逊看来。相关性是凌驾于因果之上的,他认为「存在一个比因果关系更广泛的范畴,即相关性,而因果关系只是被囊括于其中的一个有限的范畴。」

因果关系被他降格成了相关关系中的一个特例,即在统计学上表现为相关系数为1或-1。假如吸烟量和肺癌患病率的相关系数为1,那么意味着你多抽一个单位的烟,就多一个单位肺癌因子。

人们一般认为是相关性反映了因果关系,结果皮尔逊说,反了,是因果关系反映了相关性。因果只是人类的观念,相关和概率才是自然的语言。

理论进步的同时,实证手段也得到了进一步的发展,统计学领域的集大成者费舍尔发明了随机对照测试,堪称人类有史以来最强实证手段。

数学家已经证明了随机取样的次数越多,样本趋势就越能代表总体的趋势,更重要的是,随机取样能在最大程度上消除那些「同时影响因果」的干扰因素对我们的影响,比如前面提到的天气、睡眠和饮食等等,这类因素在统计学中被称为混杂因子(confounding factor),是妨碍人类发现因果联系的元凶。

假如我们在全世界范围内随机选取一万人,他们虽然可能有类似的生活环境和饮食作息,但样本选择的随机性分散了这些变量,稀释了它们对样本的影响,使得我们只需要关注跑步习惯和某项智力测试成绩之间有没有线性关系就够了。

理论上,只要我们资源无限多,我们就能得到一张表达了人类所有可能的行为对应身心状态变化关系的表格。这就是统计学给出的,关于人类这个总体的参数,也是我们得到的关于人类这个对象的知识。

皮尔逊曾说:「描写两个事物之间关系的终极科学表述,总可被概括为……一个列联表」

今天,几乎所有学科都在用统计学的语言描述着自己的研究成果,人们也多多少少地接受了皮尔逊所倡导的世界观。

从二元到多元,从直观到实证,从定性到定量,从因果推断到概率分配,是人们对归纳价值和局限性的认识逐步加深,应对手段逐渐升级的结果。

概括来说,归纳负责在经验材料中建立类型化的对象,识别因果关系。归纳强度的提升,让对象更加具体,关系更加明确。借助统计手段,让人们得以处理无限大的对象——再大的总体,也可以通过有限的样本来间接地认识,特征成了变量。我们把这些「量」带入到严谨的推理空间,演绎出了一系列可靠的相关关系,最终建立了我们需要的功能性联系。

那些放之四海而皆准的科学知识,是高强度的归纳加上的高精度的演绎的产物。

这么看来,今天的知识似乎已经无限逼近它的最终目的了:确定过去和现在已知事实与将来的事实之间的关系,从而由当前状况产生的唯一一种可能性。

注意,这句话的重点在「无限逼近」。

严肃的论文在报告它们的研究成果时都会说:准确率、成功率高达99.96%,你去做亲子鉴定,医生会告诉这个小朋友99.999%是你的孩子……。

这就是基于归纳的知识最尴尬的地方。

吸烟真的导致肺癌吗?

大家看到的这张图,显示了1900年到1960年人均吸烟量和肺癌死亡率的增长趋势。

这60年间,美国烟草销量猛增,肺癌也从一种罕见疾病变成了男性最常见癌症之一,大量证据指向吸烟会导致肺癌。但即便如此,人们也总能找到理由来否认这些证据,比如很多老烟枪都会说:「人家张学良老将军天天抽烟喝酒烫头,照样活到103岁,怎么解释」。

孤例当然不需要讨论,但比较有说服力的说法是,这60年,人类的生存环境发生了剧烈的变化,汽车尾气的排放量在持续增加,工业发展导致空气质量在持续恶化,这些都有可能导致肺癌患病率增加,你怎么偏偏就和香烟过不去呢?

即便我们用随机抽样大法,捕捉到了抽烟频率和病死率的相关性,高明的反对者依然可以说,可能是某种基因上差异导致了某些人就是容易对吸烟上瘾。这些基因可能还会导致其他不健康的生活习惯,导致这些人得肺癌概率比普通人高,而吸烟只是诱发了这种基因的表达而已。没有这种基因的人吸烟提神醒脑,有益无害。

高明反对者中的代表人物,不是别人,正是统计学泰斗兼老烟民费舍尔同志。

在当时的技术条件下,人们是无法证伪这件事的。事实上,21世纪初人们真的发现了类似的基因,有些人抽烟就是容易上瘾……

你会发现,有些反对意见看起来是非常犀利、合理、甚至还有些“先见之明”。且不论真正的因果为何,它们至少表明了,仅凭统计学的结论,我们得到的“事实”是非常脆弱的。

压倒性的证据依然出现在实验室里。

20世纪50年,医学期刊上已经出现了关于吸烟有害的实验证据,比如研究者在老鼠的身上涂抹烟焦油,结果倒霉的小老鼠患上了癌症,人们还在烟雾中发现此前已知的致癌物,虽然在逻辑上老鼠患癌不等于人患癌,致癌物能致癌可能是另一个统计的结果,但这个时候再耍流氓就不合适了,实验证据结合之前的统计数据,已经形成了一个了强有力的证据链。

这才有了这张图的后半段,人均烟草消费量的峰值出现在1964年。当年美国卫生局长在一份报告中声明:「在男性中,吸烟与肺癌有因果关系」。随后烟草销量骤降,肺癌死亡率也随之下降。

回看这100年的数据,你会发现人类完成了一次极其成功的公共卫生干预事件,可当你深入了解60年代之前的那段历史,又能体会到人类用统计来捕获因果时的尴尬。

现象暗海上的浮木

花篇幅讲这个例子,是为了引出了一个思考:在我们对世界认知存在盲维,且实证手段存在局限的前提下,那些统计意义上的可靠知识究竟有多可靠?

基因曾是我们的盲维,高精度的化学提纯也是科学革命之后的才能做到事,我们有幸跨过去了,如今我们的前沿科学面对的是一个乱丢骰子的上帝,和一个在理论上存在却怎么也探测不到的暗世界。

盲维总是存在,观测手段总有局限,这个前提似乎是无法摆脱的,我们在很长时间里都离不开统计意义上可靠知识。

意识到这点,你就能理解能皮尔逊那些离经叛道的观点了——对于人类来说,概率似乎比因果更真实。我们漂浮在暗海之上,海里充满了各种混杂因子,影响着潮水的方向,那些知识,是我们能抓住的最粗壮的浮木。

因果推断问题至今仍然是一个很热门的学术问题,学者提出了很多新的理论来克服统计研究方法带来的因果推断困难问题,如果你对这方面的前沿理论感兴趣,可以看看这本书,写得极其精彩。

因果推断问题之所以把科学家们搞的焦头烂额,问到根上,还是因为归纳和因果的问题是一个典型的哲学认识论问题。

早于密尔100年、皮尔逊300年,休谟挖的那个坑,到今天都没有被填上。

休谟之叉

休谟曾把人类的知识分成两种:一种是关于事实的知识,比如所有天鹅都是黑色的,来自于我们的经验,相当于归纳的、综合的知识。

另一种是与现实无关,是纯粹的理念性的知识,他叫做「证明的知识」,相当上期我们讲到的于演绎的、分析的知识,比如形式逻辑、数学推导就是证明的知识。

这种二分法就是传说中的哲学神器之一——休谟之叉,一把插入知识的深处,摧毁了知识的根基。所有演绎的都必须基于归纳的知识之上展开,归纳又永远受限于人类有限的经验能力。

密尔、费舍尔的工作不过是把这个叉子捏得更紧一点而已,但间隙总是存在的,那0.0001%就是证明。

回顾上文的一个观点:

有些严肃的科学知识看起来格外牛逼,有数学化的表达形式,有精确的预测能力,看起来和前面这些简单归纳出来的家伙完全不是一路货色,本质上它们都是经验模型,同样是归纳。

从原始的二分法到定量统计,技术上不断升级,但知识的内核没有变过。

物理与诸神

哲学家奎因说:「就认识论的立足点而言,物理对象和诸神只是程度上、而非种类上的不同。这两种东西只是作为文化的设定物进入我们的概念的」

类似的话皮尔逊也说过:「力作为运动的因,与树神作为生长的因可以等同视之」

而奎因在下一句里道出了重点:「物理对象的神话之所以在认识论上优于大多数其他的神话,原因在于:它作为把一个易处理的结构嵌人经验之流的手段,已证明是比其他神话更有效的。」

力、时间、参数、概率,它们是更容易被处理的结构,准确地说,是更容易被实验手段测定、被数理逻辑演绎的结构。通过这些“处理”,我们在混杂无序、相互勾连的经验场域中搭建出一个变量有限的空间,在其中学习前人总结出的变量间的功能性联系,来应对世界的不确定。

事实已证明,人类从这个空间里获得的指导,比从神话寓言、宗教训诫里获得的更有效。

但你不要把科学当成新的神话和宗教,这是原始人的归纳法。

思维之火

讲完归纳推理,会给大家造成一种错觉,好像把归纳和演绎的来龙去脉说清楚,就足够解释我们知识和构成和认知的规律了。

但这真的是一个错觉,我们至多能说,对归纳和演绎规范化应用让我们获得了结构清晰的知识,但人类的认知过程是非常复杂的,我能说出这些知识,你能理解这些知识的意义、内涵与话外之音,中间有一系列奇妙的事情发生。

在归纳和演绎之前,在结构化知识之下,还有一片未知地带,那里藏着人类思维之所以如此神奇的秘密。

下一期我们要追本溯源,进入认知语言学的世界,见识一下思维之火,类比。

类比推理在传统逻辑学中是跑龙套的角色,经常沦为归纳推理下的一个子类,但在认知语言学中,它却成了扛大旗的主角,大量的认知语言学研究是围绕着「类比」展开的。

比如我手上这本《表象与本质:类比,思考之源与思维之火》,作者是认知科学界的大神「候世达」,厚厚的一本书,只论证了一个观点:类比是人类认知的核心。

何以如此?我们下期再谈。


精研百天,掏空私货
私房课《认知大三元
好评上线,欢迎扫码支持↓ 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多