分享

用数据说话—读《大概率思维》

 凡人sypls 2019-02-12

用数据说话读《大概率思维》

 

人生赢家都是概率赢家,完整、准确、简洁的数据能帮助我们做出正确的人生决策。作者是麻省理工学院的高材生,被称作“华裔赌圣”,他用数学法则把其他游戏者打的落花流水而成为牌桌上的赢家。他写这本书当然不是要教读者游戏,他认为自己是统计学的坚定践行者,他希望把用在牌桌上的统计学原理应用在投资理财、商业决策和人生规划上,帮助更多的人规避人生陷阱,科学做出决策。

 

概率赢家

马恺文是麻省理工学院的机械工程学学士,但他并没有把这种正规教育用到日常生活和工作中,反而他用数学和统计学原理从事21点游戏。他对一些简单的公式和方程进行完善,来确定赢牌的概率,进而确定每手牌下多少赌注。他认为只要遵循这些公式,就可以获胜。

事实也正是如此。他们经过无数次的练习,确保每一次出手都建立在数据分析的基础之上,绝不草率和意气用事。虽然不是每手牌都能获胜,但总的说,他和他的团队赢了很多钱,以至于很多赌场把他们列入了黑名单。他又着手把在游戏中总结出来的统计学算法应用在橄榄球、篮球等体育项目上,开始打造一系列激励、挽留、评估和招募员工的算法,来判断什么样的队员会在接下来的比赛中取得更好的成绩。

美国的小说家把他的故事写成了剧本,拍成了电影,引起了更大范围的轰动。大多数看这种类型电影的人都能从中得到快感,就像看武侠小说一样,可以满足成人快速成功的神奇的童话梦想,然而作者并不希望如此,他希望人们更加明白,“概率计算可以让你知道生活中的很多道理”。

他玩游戏获胜是凭借统计学原理,是要经过计算的,这不是运气,也无关钱财,是关于如果根据过去判断未来的算法。比如已经出了什么牌,余下的牌的概率是多少,手中牌多少时是否应该继续拿牌等,这些都是要通过概率进行计算,同时要有团队的配合。他们屡试不爽。自大学毕业后,马恺文已经成为跨领域的专家,包括期权交易员、网络创业家等。他的经验有助于解读具有争议性的数字,使用客观的分析,让更多人做出聪明的决定。

 

数据陷阱

我们做决策基本都建立在对对累计数据分析的基础上,比如乌云密布,我们就会认为要下雨,因为以前数次乌云密布带来的都是降雨。只不过,生活中的决策更多的是凭直觉和经验,没有对数据的真实性、准确性和完整性做更深入的分析,就很容易陷入数据陷阱,很难得出更加符合事实真相的客观有价值结论。作者提到的几种数据陷阱,让我们很容易误入失败的逻辑当中,影响我们科学的决策。

一是赌徒谬误和大数定律。赌徒谬误指的是某种随机过程的重复独立试验中的出现偏离预期结果的异常,这些异常可能会被未来的相反结果抵消。赌博的人大都是越输越要玩,他们认为输了这么多次,下次一定会赢。扔一个硬币,从概率上讲只要次数足够多,正反面出现的比例应该相当,每一次出现正面和反面的比例更为50%,如果前面出现的都是正面,那投掷者认为下一次出现的一定是不同的结果,而事实上,下一次的结果和前面的结果之间没有任何关联。根绝大数定律原则,只有大样本的统计才更加有效,而小数规则说明,小样本的统计容易出现极端结果。比如一个班级学生的任何特点都不足以说明这个年龄段孩子的特征,而我们常常犯这样的以偏概全的错误。

二是证实性偏差和选择性偏差。我们更加关注支持个人观点的数据,忽略与个人观点相冲突的证据。我们只想看到与自己已有观念相符的数据和输入。赌徒总是认为自己会赢,所以轻易的不会放弃。阴谋论是典型的证实性偏差,我们认为某件事背后存在者巨大的阴谋,就会发现一切符合阴谋推论的证据。而选择性偏差是因为他们根据经过选择的数据得出来的结论,比如飞机不安全,他们找到所有关于飞机事故的案例来说明这个结论,却忽略飞机事故占比要远小于汽车事故的占比的事实。

三是损失规避和沉没成本。规避损失指的是潜在的损失对于人们的影响高于同等价值的收益对于人们的影响,简单的说,就是同样一件东西,失去它的痛苦,要大于得到它的快乐,这个东西是我的了,就不愿意让他失去。如果那些钱本来应该是我赢的,结果没赢到,我就会感到特别难过,也就不愿轻言放弃,因为我已经把他看作是自己的了。沉没成本指的是你付出的这些成本,包括时间、精力、物质费用是不可以再收回来的。沉没成本是已经无法挽回的成本,是无法规避的,这是和规避损失有很大不同的。

 

科学思维

要正确的根据数据来做出决策,就要规避数据陷阱,避免伪统计量给我们的分析和判断带来的不利影响,从下面几方面来审视数据的有效性。

一是数据的完整性。作者更想告诉我们,要学会用数据说话。我们可以通过过去来判断未来,但前提是我们要有足够的数据,足够丰富,数量足够大,这样才能更加接近真实。不要轻易的下判断,作者说要慢一点,等一等,等到数据满足作出判断的条件再做决策。统计的质量取决于输入数据。有很多时候我们的数据无效的。比如判断一个球员的潜质以及他是否会在下个赛季取得好成绩,有很多指标可以作为数据的基础,但有的数据有效,有的数据无效。同理,我们想要知道一个孩子的未来发展,只看成绩是无法得出客观的判断的,还要看孩子的抗挫折表现、自控能力的表现等等。成熟的判断者很多时候并不是用计算的方法得出结论,但他们也不是凭直觉。尽管看上去是凭借直觉,是由于他们接触太多这样的案例,已经掌握足够多的数据,因此是数据驱动直觉作出的判断。盲人摸象就是数据不完整而犯的认知错误。保持数据的完整性和丰富性,是走向科学判断的关键一步。

二是重视和保持长期视角。除了数据要尽可能完整和丰富之外,还要正确理解数据表现的波动性原理。一枚硬币正反面出现的概率肯定是各50%,但在次数少的情况下,一定是偏重于某个面,这属于波动性,如果不能正确认识,就会影响我们的判断,影响我们的信心保护和智力发挥。对于孩子而言,只要全心投入、认真学习,成绩高低几分并不用太在意,要用长期的视角,来审视结果。老话说“卷土重来”“东山再起”“后起之秀”都是这个道理,“论持久战”的思想也是权衡各方信息之后做出的科学判断。孩子的生长发育有阶段性和不平衡性,有的人发育的早,有的人晚,有的孩子成熟稳重,其他人同龄人还很幼稚,家长完全不用着急,从长远看,只要认真努力,结果也都差不多,幸福还是掌握在自己手里,人生是长跑,不用在意是否输在起跑线上。

三是决定和结果不是线性关系。作者认为,在判断一项决定好坏的时候,你永远不能仅仅考虑结果,糟糕的结果并不意味着拙劣的决定,完美的结果也不意味着良好的决定。决定和结果是不同的实体,决定的质量可以通过做出决定使用的逻辑和信息来评估。影响结果的不确定因素很多。有时候结果是好的,但是和决定没有关系,完全是意外因素干扰,这时候的盲目庆幸和沾沾自喜是没有必要的,应该更加慎重的审视决定的基础,而不要犯证实性偏差的错误,认为结果好了,当初所有决定就都是正确的,乐极生悲的原理就是如此。世界的复杂性告诉我们,事物的发展都不是线性的,因果关系在大数据时代要被相关联关系取代,这是思维的变革。这个时候要保持冷静,要敢于决定,不要担心失败,也要敢于承担责任,敢于认清事实,相信自己,也相信数据。

 

对这本书还有两个要说明的:一是说起打牌,生活中也有很多爱好者,他们也擅长用计算的方法,用概率的统计思维,来分析其他玩家手中的剩余牌的情况,但几乎没有人把这种思维上升到数学层面,迁移到生活和工作上,影响和改变决策能力和水平,这不得不说是有点可惜。二是因统计学知识、数牌游戏规则、橄榄球和篮球规则的缺乏,很多案例也没搞清楚,影响对书中内容的进一步了解,影响对作者观点的理解,有些遗憾。

 用数据说话—读《大概率思维》

 

大概率思维

【美】马恺文

刘清山 

江西人民出版社

201810月第1版第1次印刷

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多