分享

我们应该如何使用数据?这是我听过的最好答案

 昵称52221680 2020-01-18


内容来源:2019年12月9日,在腌do鲜高汤讲坛《大数据如何改变中国》中,阿里巴巴集团前副总裁、数文明科技CEO涂子沛,复旦大学数字与移动治理实验室主任、国际关系与公共事务学院教授郑磊,就新书《善数者成:大数据改变中国》进行了主题演讲。笔记侠作为合作方,经主办方和讲者审阅授权发布。

高级笔记达人 | 朱宝
封面设计 责编 | 子墨
第  4491  篇深度好文:3841 字 | 7 分钟阅读

活动笔记·大数据

本文优质度:★★★+    口感:乌龙桃桃

笔记君邀您阅读前,先思考:

  • 大数据的未来还有哪些变化?

  • 大数据时代什么是不应该改变的?

一、三个故事:善数者成

我今天的分享,将通过三个故事展开,大家一起来看现今社会的样子。

我记得2012年《大数据》一书出版的时候,有这么一个段子:什么是大数据?大数据就好比高中生谈性,人人都在谈,但是没一个人知道是什么。

但是今天,人人都熟知大数据,并且它无处不在。大数据真的改变了我们的社会,改变了我们的国家。

但我想问的问题是:大数据有没有改变你?

所以新书的标题叫“善数者成”。你们是不是善数者?在21世纪的第一个10年有没有成?这是我关心的,所以我选了以下三个故事。

1.“数”中自有黄金屋

第一个故事,是关于钱的故事。

18世纪60年代,欧洲有个叫贾格尔的机械工程师,他赶上了当时的纺织革命,纺织革命中棉花被称为白金,从美国运到欧洲,再被加工成纺织品。

贾格尔动了心思,把自己的积蓄都投入棉花产业,买机器、雇员工、开工厂。

但是工厂刚开张,美国南北战争就爆发了,导致棉花禁运。没有了原材料,贾格尔最终破产,背负了一身债务。

这时他去赌场碰运气,却创造了赌博界的传奇。赌场里有很多轮盘,轮盘上有37个数字。他相信一个轮盘转久了就会失衡,转久了有些数字被转到的几率就会变高。

于是,他雇了六个人,分别记录赌场六个轮盘每次停留的数字,当天晚上对数据进行分析。

终于,他发现某个轮盘和他预料一致,有三个数字出现的概率是明显高于1/37。于是贾格尔出手,一上午就赢了赌场所有的钱,第二天又是如此。

赌场觉得蹊跷,查证过程中发现轮盘有问题,就连夜把六个轮盘进行移位。

不过,贾格尔很聪明,他提前在有问题的轮盘上做了记号,第三个上午赌场的现金又被赢完了。贾格尔因此成为历史上少有的不出千赢完赌场当天钱的人。

如果六个人把收集的数据给其他的工程师,其他工程师也可以分析数据,但只有他演绎了这样的传奇,因为他相信数据;同时,也有人相信数据,但只是在一旁看是没有办法看出来的,必须把数据记录下来。

数据的第一件事是记录,文字是数据,图片、视频也是数据。数据不是一切,但一切都在变成数据。

新时代的基本矛盾是,人类产生的数据已经超出了人脑甚至机器可以处理的界限,很多数据搁置在政府、企业,长期没有得到分析。

善数者为什么能成?

善数者相信数据,对数据有信仰,相信数据能帮他解决问题、洞察事物的真相,所以他们愿意去记录数据、收集数据。

2.“数”中自有颜如玉

第二个故事,是关于爱情的故事。

杭州宝石山有很多老头老太太聚集在相亲角,北京陶然亭、广州天河公园也有。越是一线城市,剩男剩女就越多。因为信息成本太高,找对象很难。

什么叫信息成本?举个例子:

每个人都有朋友圈,每个人的圈子是非常有限的,而未来的对象就在朋友圈圈层能触达的地方。

从这个角度来讲,找对象首先是个大数据的问题。当信息不对时,你就会付出信息成本。除此之外,还要付出时间成本、金钱成本甚至生命成本。

现在来讲下如何用大数据来找到自己的另一半。

2012年,已经35岁的美国加州大学博士麦金利,对于另一半这件事有点焦虑,于是决定到像Facebook这种社交网络平台上去找。在哈佛学生创立了一款用来找对象的社交软件平台OkCupid。

平台上有5000多个问题,一般的话,新用户在这个平台要回答三百到五百个问题,如:你喜欢政治问题吗?你现在想结婚吗?在回答完问题之后开始进行匹配。

但是,麦金利做得非常巧妙。如果你认为某些问题很重要,是必须回答的,就可以调整问题权重。但是,他发现了一个问题,即便他按照自己的需求去回答问题,跟他匹配的人还是特别少,回应他的人更少。

他意识到,这是因为他不知道他喜欢的女孩子回答了哪些问题。对于这点,要用数据分析哪些女孩回答了哪些问题,他要如何回答才能增加匹配的可能性。

于是,他做了个爬虫,爬了两万个女性的回答,用算法把他们分为7类,挑出两类他喜欢的,看她们如何回答相关问题。为此,他针对两类女性分别注册了两个账户,使用不同的回答、不同的照片、不同的自我介绍。

结果,平台给他匹配了上万名女性。他每天都要见两到三位女性,用数据化方法管理约会,每次约会后进行记录哪些人可以约第二次,第三次。

就这样,真爱慢慢浮现,她在第88次出现。这个博士毕业后就和这位女孩结婚了。

有人说,我什么都不会,还能成功吗?说个我身边的例子吧。

我有个读艺术的朋友,他女友上周告诉他,她妈妈要来广州见他。为此,他收集了她们家能搜集到的全部的信息进行大数据分析,得出的结论是她妈妈一定很爱钱,觉得绝望沮丧。

但他突然想到,他妈妈当了梨花社的社长,他的大数据分析漏了这一点。于是通过女友了解到她妈妈是业余票友。于是,他再次分析后发现喜欢唱戏的人都喜欢上台、听掌声……总的来说,就是喜欢听奉承。

因此,他把女友妈妈喜欢的戏用几天时间进行学唱,等到和女友妈妈聊天时,假装不经意提到了她妈妈的偶像,还当场唱了几句,女友妈妈当时态度就变了,还要教他。饭没吃完,他就感觉自己被当成一家人了。

其实,每个人获得信息和数据的能力是不一样的,几乎所有的信息都在互联网上,有些人找得到,有些人找不到。

如今,“数商”已经是我们这个社会基本的生存技巧,它是指在处理之前必须要找到信息,而智商是对信息进行处理,因为找不到信息就无法处理,巧妇难为无米之炊。

3.“数”中自有乌托邦

第三个故事,是关于大数据如何改变社会的。

故事主角克里斯汀是佛罗里达州的一名小报记者,有一天看到警察开快车将人撞死的新闻。在她的印象中,已经不止一次看到类似的新闻了。

于是,她去查了数据库,发现10年间有几十则警察撞人的新闻,但只有一人被判刑。因此,她推测警察习惯开快车。

为了证明这个猜测,就需要数据作为证据。她最开始抱着测速器在高速公路上等,只要有超速的车,她就追上去看看司机是不是警察。但是,这很难获得数据。

后来她想了个办法,收集了佛罗里达州所有收费站几千辆警车通过的数据。然后选取两个收费站,用距离除以时间差,得出警车的平均速度,发现本州五分之一的警车都存在超速行驶。

数据还表明,很多超速都发生在下班时间,是急着回家而非处理公务。她把这一发现刊登在报纸上,受到社会广泛关注。

2014年,她做了同样的事情,把全州警车过消费站的数据再次收集分析,发现开快车的现象下降了80%,一名警察因之被开除,数百名警察被处分、没收警车。结果证明,她做的这件事是有意义的。

今天,要想获得更好的成长,你不仅需要智商、情商,还需要提高你的“数商”。因为智商是对信息进行处理,而数商是在处理之前找到信息。

三个故事讲完了,我们稍微回顾下:

贾格尔用科学的方法击败赌场,三天共赚1200万英镑,这是因为他对数据有极强的信仰,他相信数据,所以收集数据,最终获得成功。
 
麦金利在互联网上发现并利用别人未能发现的数据,为自己找到心仪的对象,说明我们不仅要相信数据,还要掌握能够处理数据的工具,这样才能获得竞争优势。
 
克里斯汀借助收费站数据查证警察开快车的故事,说明数据的外部性,此数据可能发生彼作用。

我们的辩证法告诉我们,世界是一个整体,这个整体就是大数据,而个人数据分散于整个世界之中。至于你能不能巧妙地去利用数据,需要你去发现数据上存在的问题,需要你的创新思维。

通过这三个故事主要是告诉大家:善数者成。善数者,可以获得财富,可以找到爱情,也可以改变世界。

而大数据,正在改变世界,也在改变中国。

二、人文和反思:

大数据会产生什么问题?

我重点研究公共管理和政策方面,主要包括两部分。第一,政府自身如何用数据来改变内部的管理和对外的服务;第二,面对大数据时代,政府应该在公共政策方面如何应对。

1.什么应该改变?

我们平时去政府办事,总是需要不断填表格,一般表格分为三部分:你是谁?你要干什么?你可不可以干?填完表之后再附上一堆证件证明,然后开始走流程,初审、复审、终审……

在这个过程中,政府真正想要的是表格、证件、证明,还是上面的数据?肯定是数据。那么,除了让我们填表,还有没有别的方式来获得这些数据?

过去,我们办一件事可能要跑七个部门,填七次表格,但这对政府来说是七件事。

比如买房这件事,对于每个买房者都是“买房”这一件事,但是对于政府就分为审核买房资格、理公积金贷款、办房产证等多件事。

所以,现在政府正在从公众视角来重新定义什么是“一件事”?办成这“一件事”需要哪些数据?这些数据现在在哪里?能不能把这些数据打通,让数据代替人跑?

答案是肯定的,那就是让数据在相关部门之间横向流通起来。当数据流是纵向的、相互孤立的时候,就意味着这些数据烟囱之间存在缝隙,这对老百姓来说就是一个个坑——老百姓要自己带着表格、证件和证明去把这些坑填上。

然而,打通这些烟囱并不容易,其中涉及到的部门利益、流程、标准、动力等都会成为打通烟囱时的障碍。

另外,政府数据除了可以在政府内部共享,还可以开放出来让社会来开发利用。现在,我国地方政府推出的数据开放平台已经有100多个了,大家可以到这些平台上获取和利用政府数据,减少不必要的时间、精力浪费。

最近,我在深圳的数据开放大赛上看到了“小区罗盘”这样一个应用。它给每个小区做了一套指数,比如一个小区的老人友好性、儿童友好性、宠物友好性、环境宜人性、交通便利性、体育便利性、医疗便利性等等,总有一款是你在买房租房时想要知道的。这些指数背后,就是利用了很多政府开放出来的数据。

数据就像原料,只有开放出来让社会来充分利用各取所需,大家才能各显神通,进而让我们的生活变得更加丰富更加美好。

2.什么不应该被改变?

讲完了什么应该被改变,我们反过来提出一个问题:大数据时代,什么不应该被改变?

我们认为,有三样关于人的东西不应该被改变。

① 人的智慧、思想和意志

大数据是要赋能于人,还是要取代人?大数据是否等同于事实本身?如果数据本身是不真实、不全面、不及时的,那么基于这些数据所作出的决策也不会是准确的。

虽然说数据是客观事实的反映,但它还不等于客观事实本身。即便有一个摄像头每天24小时跟着你,它也无法知道你每一次行动的理由和意图。

“让数据自己说话”的理想离现实还有很大距离,数据也无法钻进人的脑子,无法解释人类的自由意志。

所以,我们对大数据也绝不能盲目迷信,不能觉得有了大数据就能一了百了,放弃作为人应该有的独立思考的意志。也因此,数据不能够、也不应该取代人的思想和智慧,至少我认为是相辅相成。

② 人的温度

在六月份《善数者成:大数据改变中国》这本书截稿前,我们在书里写下这样一句话:“遍布街角的摄像头虽然能够时时回看,却无法取代邻里之间的守望相助。” 

因为即便你在城市里到处装上探头这样的所谓的“平安工程”,它也不等同于平安城市。

前段时间,湖南有这样一则新闻:

一个小孩在小区里被一名精神病人活活打死,而邻居们就在边上,他们谁都没去救这个孩子。

监控视频冰冷地还原了整个过程,但也只是提供事后证据,没能守护这个孩子。

今天早上再看到这句话时,不禁心里一颤,没想到这句话竟然不幸言中。

③ 人的尊严

涂老师在书里写过这样一句话:“可以大规模地、持续地在公共场所获得一个人的照片,而且不需要经过当事人的同意,甚至在当事人不知情的情况下就能获得数据。这种能力,历史上任何力量都未曾具备过。”

但我们是否需要反思一下:这种力量是否应该有一个边界?它是否有利也有弊?

一方面,这种力量可能让我们的生活变得更安全,但另一方面也可能让我失去隐私,失去人的尊严。那么,我们是否应该拥有最基本的知情权和同意权?

3.每一个数,都有温度

我们需要停下来思考一下数据主义和人文回归之间的关系。现在,我们更多是在思考数据可以被如何采集和利用,却忘记了有时我们采集数据的对象是一个个活生生的人。

我在美国写博士论文时,需要采集有关人的数据,在采集之前,必须先通过学校内部的伦理审查。在这个审查过程中,我要提交我准备如何采集、使用和保护数据的方法和过程,以避免对被采集人造成伤害。

如果没通过这个伦理审查,我绝对不可以开始我的研究,更不要说通过论文答辩了。但如果我的研究对象不涉及到人,就不需要经过这个审查。

在大数据时代,我们更需要问一下:我们在采集数据的时候,有没有考虑到对方是活生生的人?

我们正在建设各种各样的大数据中心,我们是否需要问一下:我们要建的这些中心是会视一切为数据,以数据为中心,还是要以人民为中心?数据是要用来为人服务的,还是只是把人当作数据的来源?

某地要求环卫工人上班带手环,然后通过手环来监测环卫工人是否在休息,是否有偷懒。从管理者的角度来说,这可以提高监督能力,但是一个劳动者需要被监控到这个程度吗?

还有地方准备把一个人是否频繁跳槽纳入信用体系,频繁跳槽的人信用就会下降,难道一个人就没有换工作的自由了吗?大数据是要解放人?还是要束缚人?

在大数据时代,人会成为自己,还是会成为工具?康德的回答是:“人就是人,而不是达到任何目的的工具”。

我们认为,利用大数据的最终目的应该是维护人的尊严和权利,满足人对美好生活的向往,促进人的全面发展。

其实,每一个数都有温度,如果这个数没有温度,它可能是冰冷的,冰冷的倒也算了,但它有可能变成一把冰刀。那么,这个温度应该是多少度?

通过讨论,我们得到了一个非常好的回答,这个温度是37度,人的正常体温。如果温度太低,它不能温暖人,不能带来服务,或者是无法让我们感受到有获得感;但是这个温度过高,就可能会烫伤人。

所以,我们在运用技术时,也要把握一个度,保证这个技术能够真正温暖人。

所以,我们这本书的名字《善数者成》有两层意思,既要善于用数,更要善意用数,两个“善”合在一起才是真正的“成”。谢谢大家!

*文章为作者独立观点,不代表笔记侠立场。


主办方简介——

复旦大学数字与移动治理实验室(Lab for Digital &Mobile Governance,简称复旦DMG实验室)成立于2010年6月。实验室致力于对政府在数字时代所面临的新机遇和新问题开展学术研究、创新实验与决策咨询。研究方向包括政府数据开放、共享与治理;政府数字化转型;政务服务创新;共享经济协同治理等。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多