上一期关于年会上的程序员的漫画,截至到今天获得了113万的阅读数。同时也收到了非常多的评论。有很多读者质疑一个问题: “一次抽出50个数 和 抽50次(每次1个)在概率上难道不是相等的吗?” 这个问题需要分两步来回答。 1、如何抽出50个数。正确的设计是先将全部有效工号list的索引生成随机序列,再取序列的前50位为中奖者。如果你的随机序列算法没有太奇怪的话,可以保证每个人的中奖率是公平的。如果你刷了不少面试题,大概还记得 洗牌算法(ShuffleArray)吧,也知道它有各种错误实现。实现这个算法要用到随机数,于是又有了伪随机数的问题,所以原文我们没有自己实现这个算法,我们用了random.org提供的随机序列(见原文中被review的代码,就是http调用api取随机序列的)。 2、在抽奖程序中 “抽50次”的隐含前提是每抽出一个号码后会公布,然后从奖池中移走。所以让我们假设有效工号是51个,每次抽出一个工号、公布、移走。再抽取下一个、公布,移走……直到50个中奖名额都取完。很显然进行第一次抽取(公布前),奖池中每个人的中奖概率是1/51;但进行第50次抽取(未公布前),奖池中每个人的中奖概率是1/2。所以用抽50次的方法,每次抽取时,奖池里剩下的人的获奖概率是不平等的。。 还会有人问:所谓的生成随机序列,生成的时候难道不也是一个一个地取号码?但在序列生成完成前,只要这50个号码还未公布。奖池里所有人的人仍然拥有相同的概率。 但从群众的情绪角度出发,人们肯定更愿意看系统一个一个地抽出下一位获奖者,而不是更在乎什么概率上绝对公平。 如果要兼顾公平和现场气氛,理想的做法是抽出一次50个工号后,再配合一个激动人心的看起来是正在抽奖的动画来显示下一个中奖号码 正如进度条的存在意义一样…… 说到抽奖的概率问题,不可不提的是著名的“三门问题”(Monty Hall problem)
她的答案看起来相当反直觉,所以在专栏上登出以后,收到了来自群众和学界的雪片般的质疑。
作为反击,Vos Savant 在她的专栏对三门问题做了更详细的分析(用来解决三门问题的方法很多,她在回信里用的是最容易理解的simple solutions)
没想到,她收到了更多措辞粗鲁的回信。92%的大众不同意她的答案,65%来自高校的来信认为她是错的。
尽管第二次回复后收到的来信重得差不多把杂志的(物理意义上)邮箱都压坏了,vos Savant第三次在专栏上回复坚持自己是对的。并号召全国的数学课堂都拿这个问题做一下概率实验,无论人肉或计算机模拟都行。 最后几乎所有做了实验的反馈都证明她是对的:改变选择后赢取豪车的概率上升为2/3,而不是1/2或1/3。大部分教授和学生在看到实验数据时都震呆了。 连Paul Erd?s在内的顶级数学家都在这个问题上失了足 (迄今为止发表论文数最多的数学家,在数论、图论、组合数学、概率论、集合论、近似理论等领域颇有建树)。即使在 'a formal mathematical proof of the correct answer “面前,他仍然拒绝相信且更加愤怒。直到亲眼看到数百次计算机模拟的结果,他才不得不承认自己错了(见注2)。 Paul的牛逼生平见注3 (译文) 如此多的数学/理工博士会栽在这个问题上,就是因为它太反直觉了。对于所有搞科学为生的人,过于相信自己的直觉是会倒霉,不经过计算就羞辱对手更是会倒大霉的,也有可能学界对吉尼斯、IQ测试、女性这几个关键字的组合有天然敌意。但结果就是,以上这些来自各大高校的Ph.D的精彩言论(连同署名和学院)被一直留在vos Savant官网的页面上。25年来,任何三门问题的论文/讨论/wiki都会引用这个页面。除非她不再给服务器续费或被骗走域名,这些人差不多会被一直围观下去。 与此类似的另一个经典概率悖论是 Two envelops problem
不够过瘾的话来看看和三门问题密切相关,但更反直觉的 Bertrand's Box Paradox 解释请看 注5 和 注6(中文) ,或结尾处扫码取药。 感觉没被虐够的欢迎来到 Boy or Girl paradox (Two Child Problem ) 为什么三个场景下,概率会不一样?分析请看 注7 和 注8(中文),或结尾处扫码取药。 感觉智力被伤害的同学们,来看个段子开心开心吧, 分析过程及问题拓展请看注8或注9,或结尾处扫码取药。 这是96年vos Savant在《Parade》杂志专栏上讨论的另一个坑人概率段子。作为智商最高的人类,她还真的是很厉害,1990年的三门问题大讨论后,估计受到一万点伤害的学界们很可能会一直用各种悖论或陷阱问题钓她的鱼。但直到2012年她才犯了一个错误,随后纠正了。后来2013、2014、2015年她每年都各犯了一个错误(回答专栏问题时),全都被wiki页面记录下来……(注10)(她仍然在《Parade》上开着那个专栏) 上述这些争议问题一个共性都是它们都用了难度看起来很低的提问方式,数字很小,好像随便心算一下就能得出答案。这种迷惑性让人们更轻信自己的简单计算的结果或被直觉蒙蔽。如果三门问题当初是个千门问题,提前知道结果的主持人打开了其中239扇门…… 没准人们更愿意使用条件概率或模拟来计算。那样的话,很可能它不会引发如此大的争议。 另一个共性是很多时候,这些问题的复杂度或争议,是由于自然语言很难描述好一个数学问题。命题里模糊的表述会严重影响条件,从而得出截然不同的概率。 对了,放假期间闲得没事干的同学,可以移步 注6 链接(译文)中的最后一个“充满争议的数学问题”,经典虐脑概率题:Three prisoners problem 最后,西乔和神秘的顾问团 祝大家春节愉快(结果看完你们不会愉快了对吧,摔!) 由于上述每一个问题都基本上会引发巨大争议,篇幅所限,这篇漫画不提供分析过程。有疑惑的同学请参考脚注或自行google。不方便看到英文wiki的同学可以长按二维码去看答案,我摘录了各题的部分解答和分析过程。 可预见将会收到很多评论,恕不能一一回复。建议写出了自己见解或分析的同学们分享到朋友圈讨论。
|
|