【原】怎么识别被数据伪装过的胡扯？

浅字淡墨 2021-05-13

展开全文

人类可能从有语言开始就在不停地胡扯，就像史前岩洞壁画上，那些站在人群前指天画地的人，基本都是在胡扯，因为那时根本就没人知道这世界究竟是个什么样子。

然而，经过千万年对语言的熟练运用，人们已经很容易辨别那些口头上的胡扯了。但新的问题是，从19世纪80年代流行起来的图表和数据，由于其复杂性和确切性的特征，再借助如今的互联网大数据，很容易地就把胡扯打扮得一本正经，让人无从分辨，从而上当受骗。

那么我们有办法去识别这些新时代的胡扯吗？

信息学家杰文·韦斯特和生物学家卡尔·伯格斯特龙，在华盛顿大学就开设了一个叫“在大数据时代拆穿胡扯”的课程，教年轻人如何识别这些新时代的胡扯。

伯格斯特龙说，拆穿被数据伪装过的胡扯也没有想象中的那么难，你不需要取得经济学或统计学学位，然后去看懂所有的图表，这些都不需要，你需要的只是一些常识和良好的思维习惯。

我们一起来看看两位教授提供的相关建议。

第一，接收到一则信息先想三个问题，1.谁说的？2.是一手信息吗？不是，他从什么渠道获得？3.他为什么告诉我？第二，凡是好得出奇或坏的渗人的消息，都需要格外留心，先存疑，然后等待可靠的证据去验证。第三，警惕来自主观信念的比较。比如，特朗普坚称观看他的就职仪式的人，比奥巴马那时候的人多。因为他只是反复强调这件事，公布的所谓数据又无从查证，所以这明显就是一种主观臆测，很可能就是胡扯（事后事实证明，的确就是胡扯）。第四，大数据对机器的依赖非常强，而机器也会有偏见。比如，用以预测个人犯罪行为的计算机模型对那些少数族裔表现出了极高的偏见，原因有可能是用来“训练”算法的数据反映了现有的文化偏见。机器和给他们编程的人一样容易犯错，而且不会因为感到内疚而纠正自己的错误。

记住并熟练运用这些常识和思维方式，我们就能大概率识别出那些被数据伪装过的胡扯。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：浅字淡墨 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多