一位名叫汉娜的美女数学家,曾经在TED用数学论证了《数学告诉你,完美伴侣如何选择》(点击链接查看ted演讲),而最近,她和BBC刚刚拍摄了一部制作精美的关于数据的纪录片《数据之欢(The Joy of Data》。汉娜教授也亲自上阵出境,从data的词语来源讲起,娓娓道来了信息/数据的产生到如今的发展,以及我们身边的数据是如何影响我们的。 正如她所说,我们生活在两个平行的宇宙中。 一个宇宙有形、吵杂、散乱, 你可以看到摸到、感知到它; 另一个宇宙以数学形式存在, 我们认知的关键 正在于此 而数据则是这两个宇宙之间的桥梁. 所以到底什么是数据 它如何采集存储分享并且变得有意义? 接下来就让我们跟着汉娜教授 听听她要告诉我们的故事 ↓↓↓ 视频时长28分钟,建议在WiFi条件下观看。 暂时无法观看的同学可以直接下拉查看文字版摘要。 注意:本纪录片分上下两部分,本文推荐上部,下部近日将在文摘推送,欢迎持续关注。 有时候我们看上去像是被数据淹没了 一波又一波的消息和信息,沉迷于计步器上的数字,不停地为新的信息腾出空间。我们购买它、享用它、偶尔淹没于它,现代科技将我们自己和周围的一切量化成它,数据是我们这个时代的新式货币,数据已经变成一切事物的'神奇咒语犯罪率精神病、识字率、宗教、甚至酒醉记录,你能想到的领域都有人在搜集数据。它拥有变换形式的能力,它在某种意义上 就是减少了不确定性。 所以到底什么是数据?它如何采集存储、分享、并且变得有意义? 我们大部分人对数据时代的工程师们都鲜有耳闻,尽管他们为我们带来了一场技术与意识形态的革命,并创造了一个人类意识无法企及的数字世界/这是一个关于我们这个时代的'词语'的故事,更多更好的源源不断的数据洪流是如何改变社会,甚至我们对自己的认知的,不敢相信我现在的生活是这样的。所以来吧,因为这'洪流'还挺可爱的 维基百科后隐藏的 数学结构 我的名字是汉娜·弗莱,我是个数学家我想先来一段忏悔:我并没有一直热爱数据,事实是数学家们都不怎么喜欢数据,大部分的职业生涯我都是我开心地坐在一个没有窗户的房间和我的公式一起描绘周围的世界。你可以捕获一次完美任意球的弧度是一辆赛车漂亮的空气动力方程,真实世界的数学是如此的简洁有序和优雅,所有这一切优点数据都完全不具备。 但有那么一个时刻让我改变了想法。 2011年的时候我碰巧看到了一个 叫马克的维基百科的青年用户发明的小游戏:马克发现你点击任何维基百科词条的第一个链接,并为接下来的每一页一直重复这个动作结果会呈现出一个固有的模式。比方说词条'数据'的页面,从'集和'链接到'数学'到'数量'到'性质' 最后到'哲学'哲学'经过几个链接后会回到它自己现在词条'鸡蛋'结束在了同一个地方,甚至著名的'哲学系'男子乐团,也会一路把你带回'哲学' 尽管你到那前会先经过'科学'。对这是一个非常神奇的发现需要运用一些统计。 另一个维基百科的用户艾尔·梅尔,写了个程序来研究这个现象,他发现令人惊讶地 将近百分之九十五的维基百科页面,最后都会回到'哲学'。很酷,但这个发现是怎么改变我对数据的看法的呢? 马克发现的这个模式和之后获取和分析的数据,揭示了一个隐藏的数学结构,因为维基百科就是一个藏满了链和环的网络,它可以被数学很好的描述对我来说这是对平行宇宙的完美例证。 一个宇宙有形、吵杂、散乱 你可以看到摸到、感知到它 另一个宇宙以数学形式存在 我们认知的关键 正在于此 而数据则是这两个宇宙之间的桥梁 转自大数据文摘 作者:大数据文摘字幕组 陈啸明 狗小白 白丁 YU 崔云柯 |
|