有人吐槽说上期视频不够深奥,那么我们这期就申奥一下,希望有生之年奥运会再次在我国举办。 不管黑猫白猫,能撸的羊驼就是好箱子 概率与统计是一门朴实而又神奇的学科。朴实是因为它和我们日常生活息息相关,小到布朗运动,大到宇宙诞生,到处充满了概率的身影;神奇是因为我们虽然很熟悉它,但一不小心仍然会绕进去。比如说: 现在有两个箱子,分别装了10只羊驼(有黑有白): 然后我随机挑一个箱子,放到你面前,让你从里边随机挑一只羊驼出来撸,撸完了就放回去(羊驼:“喵喵喵?我这体型怎么塞到箱子里的???”)。 就这样,你连撸了12次,其中8次是黑羊驼,4次是白羊驼。那么,你觉得你面前的箱子,是甲还是乙呢?稍微分析一下:
嗯……估计是甲箱子没跑了,毕竟乙箱子不太可能有这么多黑羊驼啊。但是呢,也不能完全确定是甲箱子,毕竟乙箱子也有可能出现这种结果。既然这样,就请你猜一下,这箱子是甲箱子的概率是多少? 先猜一个数! 然 后 往 下 翻 ↓ ↓ ↓ 正 确 答 案 是 96.7% 这个答案说明了什么呢? 我们回过头来看一下。假如你现在一只羊驼都没撸过,一上来就让你猜面前的箱子是甲还是乙,那么你猜对的概率就是50%。 现在,你撸了第一只羊驼,刚好是黑色的。那么再请你猜一下,这箱子是甲还是乙? 感觉上来说,甲箱子里面黑羊驼多一些,所以它是甲箱子的概率大一些。有多大呢?用贝叶斯公式计算一下,会发现这个概率高达70%。 以此类推,撸到黑羊驼能提高它是甲箱子的概率;反之,撸到白羊驼会降低它是甲箱子的概率。 这就是贝叶斯方法的一个重要意义:根据新出现的信息,不断去调整、更新之前的判断,从而提高准确率。 当然了,凭借某些日常生活经验,我们也能解决很多概率问题,也知道用新信息去调整自己的视角和判断。比如说,我昨天发微信给男朋友没有收到回复,今天发微信给男朋友又没有收到回复,那么我们就可以初步判断,他大概率是死了。 直觉有时候也很重要 现在,我们再回到那个简单而又深奥的问题——扔硬币。前999次都是正面,那么第1000次是背面的概率是多少? 嗯……独立事件啊,不管扔多少次都是1/2啊! 虽然这个思路是对的,但是如果在现实生活中,你真的连续扔出了999次正面,难道你不会怀疑这个硬币有问题吗?又或者说,假如你连续氪金数十万,连一张SSR都没抽到,难道你不会怀疑这个抽卡系统有问题吗? 确实应该怀疑一下的。当大量的生活经验、事实数据摆在你面前的时候,不怀疑一下才是不正常的。 根据上面提到的贝叶斯方法,我们应该利用新到手的信息,不断地去调整、更新之前的判断,从而提高准确率。 我们不妨这么想,既然连续扔出了999次正面,那就说明这个硬币本身可能有问题。换句话说,这硬币极有可能压根就不是一枚公平的硬币。做工粗糙也好,魔术道具也罢,总之它扔出正面的概率极有可能不是1/2,而是比1/2高很多的一个数字。 假如扔第1000次的时候,有人突然跳出来跟我们打赌,谁猜对了谁赢钱,那我们应该毫不犹豫的压正面。因为根据现有的信息,这枚硬币出现正面的概率是100%,那么我们就有充分理由猜测这枚硬币下次还会出现正面。
什么鬼,中学数学教错了嘛? 可能有的朋友已经开始纳闷了:什么鬼(・◇・)? 同样是扔硬币,独立事件和贝叶斯方法的答案怎么不一样?难道独立事件给出的答案是错的吗? 其实两种思考方式都没错,只是它们应用场景不同。为了搞清楚这个问题,我们需要回到更原始的问题上来:我们说扔硬币出现正面的概率是1/2,这个1/2是怎么来的?我们为什么会产生这种“先入为主”的判断呢? 是这样的:我们通过日常生活经验,或者凭借观察与思考,总能够给某些事情做出“先入为主”的判断。比如说,我们买彩票之前,可以通过排列组合计算出大乐透一等奖的概率大约是1/2142万;期末考试之前,能够根据这学期的逃课次数估计出自己挂科的概率高达99%;相亲之前,能够通过自己的财产相貌学识等信息,自信的判断出对方看上自己的概率约等于0。
但实际情况可能又是另外一回事:彩票抽奖用的数字小球不可能是完美的;老师判卷的时候也说不定太累了眼一花就给你及格了;相亲对象说不定碰巧和你穿了情侣衫然后看上你了。同样的,硬币材质也不可能是均匀的。而贝叶斯方法的意义就在于此——不断收集新的信息,去调整自己最初的判断。 比如我们可以通过大数据统计,看看往期的中奖号码,分析一下是不是某些数字出现的概率高一些——虽然这看上去很不科学,但现实生活中的确有一位叫做约瑟夫·贾格(Joseph Jagger)的人,利用类似的办法分析出了蒙特卡罗某家赌场的制造缺陷,进而发现了轮盘赌的某些号码出现的概率比赌场原本计划的概率要高一些。于是他拿着一大笔钱,分批次去压那些“有缺陷的数字”,最后……还是赔了。
再举一个栗子:我们一般会认为在日常生活中,1~9这9个数字出现的频率大致是相同的。但是福兰克·本福德(Frank Benford)通过统计发现,这9个数字的频率其实相差很大。 以首位为例,数字1出现在首位的概率是最高的,约为30%;数字2其次,约为18%。这个规律看似没什么卵用,但它曾经帮助警方抓获一个做假账骗钱的坑爹企业家。这货用投资人的钱到处挥霍,买了好几幢豪华别墅,20几艘私人游艇,结果最后做假账的时候被一个会计识破了——因为账面很假,离本福德发现的数字规律相差很远。 贝叶斯“玄学” 好了,我们前面的干货其实已经不少了,现在我们讨论一些比较“玄学”的东西。比方说,世界真的有真理吗?人类凭什么能认知这个宇宙呢? 这个问题很大很大,大到让人摸不着头脑。不过没关系,我们慢慢来。 想象一下这么一个场景,有点儿像《2001太空漫游》里的设定:假如你孤身一人漂浮在漆黑的宇宙之中,身边空无一物,只有一个巨大的纯黑立方体飘在面前,每隔几秒钟就会显示一个数字。由于你没有别的事儿可干,就盯着看了半天,发现它只会显示0~9这10个数字,而且每个数次出现的频率差不多。于是你就猜测,它数学就只有婴儿水平,每次都会随机挑一个个位数展示给你,所以接下来每个数字出现的概率都应该是相同的,都是10%。 也就是说,这就是你对这块儿立方体的一种认知。这个概率不是神赐予你的,而是你通过观察总结归纳出来的,你觉得这10个数字是随机的。 但是呢,这个立方体现在突然连续出现了100次0,让你猝不及防。然后你就用上面提到的贝叶斯方法更正了自己的观点,觉得0这个数字出现的概率比其它数字要高。甚至你开始猜测,从现在起,以后应该都是0了。 可惜的是,这个立方体仿佛是在耍你。在输出100个0之后,它又输出了100个1……100个2……100个3……一直到100个9。嗯……好像又开始有规律了……于是你又利用贝叶斯方法再一次调整自己的认知。 那么现在有一个很哲学的问题出现了:
做出选择之后,我们再来第二个问题:你相不相信人类有能力找到宇宙背后的真正规律? 嗯……然后我们再来第三个问题:如果三维世界中的生物故意在二维世界中捣乱,每隔1米插一个洞,那么这个规律对于二维世界来说就是真理,但事实上它只是三维生物毫无意义的行为罢了。 既然如此,假设我们自信找到了宇宙背后真正的规律,那么我们怎么才能知道这些规律不是四维生物刻意捣乱的结果呢? <完>完> 特别鸣谢 《醉汉的脚步》| 列纳德·蒙洛迪诺(Leonard Mlodinow) 本色出演 :@网易王三三 今天出镜的这只羊驼叫王三三 他是网易新闻的主编 & 首席野生内容官 王三三作为一个青年文化胡说家 什么都看一点,什么都懂一点,什么都高一点 经常卖最新鲜的安利 最新的游戏、番剧、电影,他都能给你展开讲讲 还做些人类观察 & 卧底调查 比如(点击标题阅读) 还有他们最出名的漫画策划《戏精宿舍》系列 |
|