分享

数据并非真相,产生胡扯的原因——读卡尔·伯格斯特龙著《拆穿数据胡扯》(上)

 云蔚志读书 2022-08-31 发布于上海

本书的两名作者都是拥有数十年统计学及相关学科教学经验的大学教师,善于培养学生对数据进行逻辑和定量思考的能力。本书源于二人在华盛顿大学教授的一门叫作“Calling Bullshit”的课程,该课程旨在使一个非专业人士,在一些简单的技巧和工具的帮助下,运用批判性思维,看穿那些看似无比正确的胡扯。

一、胡扯的简介

当今社会的胡扯现象随处可见,广泛存在于新闻、商业、医疗、政策等领域。而且新派胡扯利用数字、统计数据和数据图表粉饰那些可疑的论断,使之看起来严谨且准确。以下是一个典型的胡扯例子:根据货币汇率进行调整后,我们表现最好的全球基金在过去9年中有7年跑赢了市场。

(一)定义

在作者看来,胡扯就是全然不顾事实、逻辑连贯性或实际传递的信息,而是利用语言、统计数字、数据图表和其他表现形式,通过分散注意力、震慑或恐吓等方法,达到说服或打动听话人的目的。这一定义指出了胡扯的本质是欺骗。

在上面的例子中,虽然有明确的数据,显示出积极诱人的成果,却存在着诸多模糊不清之处,真相尚难以确定,比如:回报率到底是如何调整的?该公司有多少基金未能跑赢市场,相差多少?就这个问题而言,是某一只基金在9年中有7年跑赢了市场,还是在这7年中每年都有一只不同的基金跑赢了市场?

(二)产生胡扯的原因

1. 逻辑错误

从逻辑上看,胡扯的错误大致有错误归因、以偏概全这两类。

错误归因是以相关性替代因果关系,或者凭借日常经验来判断前后事件存在因果关系。这种手法非常隐蔽,也不容易被识破。

科学家通过测量相关性来推断出因果关系。但是,相关性并不意味着因果关系,不要看到数据显示相关性,就草率地认为存在因果关系。我们应当清楚,一件事情的发生可能有多个原因,只认定原因是某一因素,或者仅仅与结果有一定的相关性,就贸然下定论,显然是不充分的。

所以,我们在讨论因果关系时,一直在说可能性,而不是确定性。比如,酒后驾车极大地增加了发生车祸的风险,但不能说酒驾就一定导致车祸。请注意区分以下三种概念:概率原因(A是B发生可能性增加的原因)、充分原因(A发生,则B肯定发生)和必要原因(如果A没有发生,则B不会发生)。

此外,我们也经常被经验所误导:以往在A事件之后,观察到B事件也随之而来,就认定A是B产生的原因。这种推断方式就与《三体》中自以为发现喂食定律的那些火鸡一样,完全是机械的思维。

以偏概全也很常见,往往是故意从大量数据中仅筛选出对自己有利的证据,以达到欺骗的目的。

2. 对科学、数字的盲目崇拜

从历史上看,新派胡扯试图用科学和数字来表现其严谨性、准确性,这是在利用近代以来对自然的数学化。在西方,这种把整个世界视为数学化的传统由来已久。

因此,哪个学科越能用统计数字表述,哪个学科就越“科学”,也就越不容置疑。但是盲目地崇拜数字,就会反受其害。书中提到了一个有趣的古德哈特定律,指出了唯数字论的缺陷:一旦受到控制目的的压力,任何观察到的统计规律就会立刻崩溃。

人类学家史翠珊将其简洁表述为:指标变成目标后,就不再是一个好的指标。心理学家唐纳德·坎贝尔也提出了一个类似的原则:任何定量社会指标用于社会决策的次数越多,就越容易受到腐败压力的影响,也就越容易扭曲、破坏它所监测的社会过程。

显而易见,如果某个指标可带来足够多的奖励,人们就会想方设法地提高自己的得分,反而会削弱该指标的评估价值。常见的现象有,论文造假,学校排名造假,销量造假,政绩造假等等。

3. 互联网新闻经济的逻辑

从经济的角度看,胡扯的产生与互联网新闻的模式密不可分。

在互联网兴起之前,出版的成本非常高,而且需经过严格审查。互联网带来了个人出版的民主化,借助社交媒体的病毒式传播,每个人都可以很方便地发布自己的作品。

由于互联网经济本质上是一种流量经济,更多的点击率就带来更多的广告收益。因此,抢夺用户注意力是赚钱的关键,大量的标题党和虚假惊悚的胡扯就应运而生。而社交媒体平台为了抢先发布带来的关注流量,往往也省去了核查信息的环节,纵容了胡扯的泛滥。

(三)胡扯泛滥的原因

作者发现,制造胡扯是如此便捷,而确认和清除胡扯却是又慢又难。

特别是生活在网络时代,每个人既是消费者又是生产者,各种吸引眼球的胡扯内容可以迅速转发,达到万次以上的级别。社交软件的推荐算法也在推波助澜,不断推送更多的同类消息给其用户,形成一种恶性循环。再加上大量的机器人活跃在网上,模仿真正的用户,制造了无数虚假的信息。

此刻,看似强大的科技却令人失望了,一方面以变声、美容这样滤镜技术在增加胡扯,另一方面并没有足够的能力解决胡扯的泛滥成灾。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多