分享

大数据算不出思维创意

 大闲人 2013-11-24
《大数据时代》作者舍恩伯格接受本报独家专访坦言——
大数据算不出思维创意
文汇报2013-11-24第一、七版

图片说明:维克托迈尔-舍恩伯格,十余年潜心研究数据科学的技术权威,最早洞见大数据时代发展趋势的数据科学家之一,最受人尊敬的权威发言人之一。他曾先后任教于世界最著名的几大互联网研究学府。现任牛津大学网络学院互联网治理与监管专业教授。

  “大数据并非万能,比如创意和想象,用大数据是‘算’不出来的。”因《大数据时代》走红的牛津大学互联网研究院教授维克托·迈尔-舍恩伯格,日前在沪接受本报记者独家专访。这位“大数据商业应用第一人”直接表示大数据也存在“短板”:大数据可以预测经济、防灾避险、预防犯罪,但是它不能预测不可预知的事情,别指望大数据能帮你100%地完成创造性工作。

独家透露:新书本月完成,先出电子版

  舍恩伯格的著作《大数据时代》、《删除》今年在中国持续热销。前者揭示大数据将给人类带来巨大变革、后者提醒大数据选择性遗忘之道,令很多读者大呼开眼界。当记者问及舍恩伯格接下来的写作计划时,他坦言最近的确在写一本新书,“瞧我这黑眼圈,就知道这本书现在还写着呢!预计本月完成。”

  舍恩伯格透露,新书的内容是对《大数据时代》的拓展与补充,希望展示大数据的另一面,涉及的大数据应用领域人人都会关心。相较之前作品,新书篇幅会更短小,内容也会更紧凑。“这样的安排是为了更加符合新媒体时代的阅读需求。当然,也有读者反映,我之前的书太长了。”舍恩伯格透露,明年春天,这本书会首先以电子版的方式与全球读者见面。

  目前,几家中国出版社也正在为这本书的出版而竞价,有望在两三周内决定出版社。舍恩伯格表示,中国读者在他心中占有极重要的位置。

回应质疑:想用大数据,先知其“短板”

  在舍恩伯格的书和演讲中,人们获取得最多的都是关于大数据的种种神奇之处。比如大数据不光可以用于服务业,还可以用于经济预测、防灾避险、疾病诊断、识别潜在犯罪分子等等。有人质疑,舍恩伯格简直是把大数据给神化了。

  大数据真的无所不能?对此,舍恩伯格给出的回应是“大数据当然有局限”,“就像这个世界上没有万能的工具一样,我们需要更好地了解与运用大数据,就得清晰地认识到大数据存在的局限。”他举了两个例子:首先,它不能预知不可预知的事件,这类事件通常被称为“黑天鹅”。大数据是基于过去的数据来预测未来,当过去不可掌握时,它便无计可施。其次,它不可能替代人类的思维。大数据统统来源于现实,而人类的许多想法来源于脑海而非现实,甚至会产生许多非理性的、创造性的思维与想象,这些都是大数据不可能做到的。

 

“算法”支点,撬动大数据创业

独家对话《大数据时代》作者、牛津大学互联网研究院教授维克托·迈尔-舍恩伯格

记者 范昕 张祯希

  从《大数据时代》到《删除》,维克托·迈尔-舍恩伯格的每部作品一经面世,总能在全球范围内引发热议。书中提出的大数据强大的预测功能以及选择性遗忘之道等等,早已超越单纯的学术思想,将给人类的未来生活带来切实的变革。日前,舍恩伯格在沪接受本报记者独家专访时透露,他的下一部作品将于本月完成,明年春天与全球读者见面。接下来,他最关注的是与大数据相关的一系列应用问题。

  “最需要懂得大数据的,并非出自哪个特定领域,而是那些拥有大量数据却不知道如何运用的人或者公司。就像坐在金矿上却不去挖掘,金矿于他而言简直是一种浪费。”在舍恩伯格看来,“算法”撬动大数据的创业时代。只需要拥有对于数据分析的思路也即一套“算法”,创业可以有很多新的可能。而“算法”来自创意。

  

坐观大数据前景:红利各行各业皆可享

  记者:最近,世界各地都能看到您演讲的身影。您最常受邀到什么地方给什么人演讲?您认为什么人最需要懂得大数据?

  舍恩伯格:的确,近几年我获得了许多的演讲机会。由于大数据并非针对某个特定的领域,而是受到所有人的关注,所以我演讲的受众来自社会的各个领域。

  我最常演讲的地点包括大企业、贸易协会、社会组织。在中国,我曾到华为、海尔、中国移动等企业办过讲座;当然,也有IBM等国际化企业以及谷歌、脸谱等社交网络。上周,我在波士顿做了一场关于公共卫生方面的演讲,再上周,我做了一场关于保险方面的演讲。可见,大数据对于各个领域都存在影响,同时社会各界对于大数据的关注度也越来越高。

  最需要懂得大数据的,并非出自哪个特定领域,而是那些拥有大量数据却不知道如何运用的人或者公司。就像坐在金矿上却不去挖掘,金矿于他而言简直是一种浪费。

  记者:中国的网购狂欢节“双十一”刚刚过去。您认为大数据将给电商带来哪些红利?

  舍恩伯格:回顾15年前,电子商务在美国刚刚起步。一开始,电商仅仅是一些为客户提供商品的网上商城。后来,人们渐渐开始拓展电子商务的新领域,他们希望电子商务能够为客户提供更好的用户体验,这便是大数据的萌芽时代。亚马逊等大的电子商务网站开始利用大数据来进行推算,从而为用户提供更好的商品推荐,与此同时也为商家提供更准确的估价数据。通过大数据,商家能更加有效地售出自己的商品,而消费者也更加愿意掏腰包。所以我们发现,像中国的“双十一”、美国的“黑色星期五”这样的网购狂欢日层出不穷,电商的销售额逐年增长。

  我觉得电商们应该坐下来仔细想一想自己的“核心价值”到底在哪里。一些电商认为自己的“核心价值”就是如何卖出更多的商品,比如衣服、裤子、电子商品等等。不过在我看来,他们的“核心价值”应该是,如何获取那些有价值的的数据,通过破译这些大数据推算出顾客真正的喜好与购买习惯,让这些大数据真正为自己的销售服务。

  记者:听说热门美剧《纸牌屋》就是用大数据算出来的,这是真的吗?大数据还可以怎样应用到文化领域,有没有类似的案例可以和我们分享?

  舍恩伯格:我并不知道《纸牌屋》是不是真的用大数据算出来的,但似乎制片人是这么说的。

  关于大数据在文化领域的运用,我想到了这样一个事例:作家一般都会十分在意自己所写的哪一部分内容更受到读者欢迎。这一点便被kindle加以运用,当读者划下电子书中的某一句、某一段内容后,kindle便会将其反馈给亚马逊,而亚马逊则会进一步将其反馈给作者。如此一来,作者便能够知道自己所写的哪一部分内容是真正受到读者喜爱的。我个人也时常登陆亚马逊,查阅读者在我的书中划了哪些重点。当然,也有许多作者并不喜欢这种方式,他们觉得创作是为了自己而不是为了读者。但我个人非常赞同这种方式,倒不是说要因为读者的反馈来改变书中原有的内容,而是这种反馈机制使得阅读成为了一种读者与作者交流的双向体验。这是一个十分有趣的问题,我们不光要关注大数据是否被加以运用,还要关注大数据的运用会产生怎样的价值。

  

再析大数据真义:“相关关系”开启新维度

  记者:时至今日,尽管大数据成为全球最热门的词汇之一,但仍然有很多人说不上来大数据究竟是什么。如果让您向一个从不知晓“大数据”概念的人来解释大数据,您会如何介绍?

  舍恩伯格:大数据其实极易解释。简而言之就是,当你掌握一件事物的众多数据时,那么你就比掌握寥寥数据时更容易了解该事物的运作机制。因为掌握的数据越多,你对于这个事物的特性的掌握也就越全面。这有点类似于摄影技术,如果你对一辆运动中的汽车的拍摄频率为一分钟一次,那么你获得的仅仅是照片而已。但是如果你对它的拍摄频率增加到一秒钟10次甚至是20次的话,你可能得到的就是一部可以运动的录像。录像相比照片而言对于汽车运动的呈现更加精准、深入。同样,相对于我们父辈所处的“小数据时代”,我们现在所处的“大数据时代”为我们了解事物增加了许多新的维度。

  记者:在《大数据时代》一书中,您明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这一观点被很多人认为是您最具价值的发现,也是挖掘大数据最为重要的逻辑。而事实上,这一观点也为您惹来了最多的争议。连译者电子科技大学的周涛教授都在序言里表示看不下去,他甚至认为如果放弃对因果关系的分析,是人类的堕落。我想请问,在大数据的逻辑中,因果关系真的不重要吗?

  舍恩伯格:我并不是想说“相关关系”比“因果关系”更重要。我只是想强调这样一点,过去我们认识世界的方式主要是通过“因果关系”,但是现在又多了一个方法——“相关关系”。可以说,“相关关系”为我们认识世界提供了一个新方法。

  我能理解为什么许多读者都更加倾向于探究“因果关系”。事实上,我本人也是如此。这是我们从小到大的一种思维惯性。举例来说,如果有一天我去餐馆就餐后突然感觉到肚子痛,我的第一个想法便是我在餐馆吃了变质的食物。但是,造成肚子痛的原因也极有可能是我与一个携带病菌的朋友握了手。因此,“相关关系”有时能为我们理解世界提供一些不同的方向。

  我觉得,谦虚的心理与包容的心态在大数据时代尤为重要。很多时候,我们并不能了解“为什么”,我们可以做的便是知晓“是什么”。与其对虚幻的原因穷追不舍,倒不如聚焦于真实存在的事物本身。事实上,有时“是什么”解决了,“为什么”也会迎刃而解。所以,我并不是说“相关关系”比“因果关系”更重要。而是想说,当我们并不能掌握“因果关系”时,“相关关系”不啻为一个更简便、快捷的思维方式。

  

直面大数据漏洞:隐私保护不妨交给市场

  记者:商家用大数据创造出越来越庞大的市场,用户却感到很惶恐,因为个人隐私泄露的危险大大增加。大数据时代,这样的矛盾如何化解?有没有什么措施能够让用户的隐私得到保护?

  舍恩伯格:首先,我们需要了解一个事实,那就是许多大数据并非个人数据,比如天气数据以及汽车引擎的数据,这些物质上的数据并不存在侵犯隐私的潜在危害。其次,即便是关于人的数据,也不一定来源于私人领域。这些数据的测量与使用是将人类作为一个整体来进行的。这种整体化的处理方式可以将对于隐私的侵犯降到最低。

  但是,我们也必须承认,的确有一些数据对个人隐私造成了侵犯。对于这些数据,我们可以采取两种手段来避免和确保个人权利,那就是法律手段与市场手段。

  很显然,在大数据时代,西方目前的隐私法已经逐渐失去原有的效应。比如,现在欧盟已经在着手修改隐私法,但是由于他们对于大数据时代并不了解,所以并不能设计出适用于大数据时代的隐私保护法。在我看来,法律应更多地关注和限制如何使用大数据而非如何获取大数据。

  我倒是觉得采用市场手段避免隐私侵犯说不定更可行。过去两年中,美国许多社交网络公司相继爆出隐私泄露丑闻。由于这个市场很大,用户选择很多,因此一但某个公司深陷隐私泄露丑闻,受众可以毫不费力地选择别的公司。举个例子来说,几年前脸谱网站在美国的社交网络中占据垄断地位。不过最近两年,另一款名为snapchat的新社交网络很受追捧。人们发现,在snapchat中,用户上载的照片被朋友点开看到之后,便会永久消失,这一特点相较于脸谱网站更加有利于用户隐私的保护。现在,每天几乎都有3.5亿张照片发布在snapchat上。这个例子很好地证明了市场本身对于隐私同样具有很好的保护作用。

  

支招大数据创业:有“算法”不愁海量数据

  记者:最近您的这样一个预测给很多人带来希望。你说大数据将给创业带来很多新的可能,甚至不需要什么本钱,只需要拥有对于数据分析的思路也即一套“算法”就可以创业。有人质疑,您这种说法的噱头高于实际应用,落地存在不少困难。比如这样一个很现实的问题,那些对于数据分析拥有独特思路的创业者们如何去获取海量的数据?欧美有没有成功的案例可以借鉴?

  舍恩伯格:利用大数据来创业,没那么难,只要掌握了一套“算法”。至于获取海量数据,这不是什么问题,目前,我们可以通过4种途径。

  第一条是通过网络免费获得。美国一家叫做decide的比价网站现在非常有名,他们的价格数据都是从亚马逊等大型购物网站上搜集的。麻省理工学院也有家专门统计通货膨胀率的公司,他们的操作手法是每隔一段时间在网上抓取商品的价格信息来进行统计。

  第二条是从客户手中免费获得。英国有家交通导航公司,他们要求客户提供自己所在路段的路面情况,通过这些数据的整合,再将目前通畅的路段信息反馈给客户。

  第三条是通过与拥有数据的大公司合作来获得。有些大公司掌握了许多数据,却不知该如何运用它们来创造价值。一些拥有大数据思维的小公司便可以与大公司合作。大公司提供数据,小公司提供数据分析等服务,最后再进行分成。因为对于大公司而言小公司并不对其构成竞争关系,所以这样的做法对于双方来说都是有利无害的。

  第四条是从政府渠道获得。政府对于一些小公司公开大数据,使其能够进行一些数据服务。过去,政府通过资金资助的方式来帮助小公司,现在,政府则可以通过输出大数据的方式。不过,这条途径暂不适用于所有国家,目前只在美国与英国被广泛运用。

接下来,他关注的是——

  

产品和服务的大量定制成为可能

  一百多年前的大生产让太多的人买得起商品,但这些商品是一模一样的。我们面临这样一个矛盾:手工制作的产品漂亮无比却非常昂贵;与此同时,量产化的商品价格低廉,但无法完全满足消费者的需求。

  我认为下一波的改革是大规模定制:为大量客户定制产品和服务,成本低、又兼具个性化,可以满足每个人不同的需求,又可以让数以百万计的人买到这样的东西。比如消费者希望他买的车有红色、绿色,厂商有能力满足要求,但价格又不至于像手工制作那般让人无法承担。

  做到这一点,商家需要对客户需求有很好的了解,背后需要依靠大数据带来的信息。数据能够告诉我们,每一个客户的消费倾向,他们想要什么,喜欢什么,每个人的需求有哪些区别,哪些又可以被集合到一起来进行分类。大数据是数据数量上的增加,以至于我们能够实现从量变到质变的过程。举例来说,这里有一张照片,照片里的人在骑马。这张照片每一分钟、每一秒钟都要拍一张,但随着处理速度越来越快,从1分钟1张到1秒钟1张,再到1秒钟10张后,电影就产生了。这说明数量的增长将实现质变。

  

大数据创业将成就新经济增长点

  我们运用大数据的目标是要让它带来价值、创造价值。

  数据的产生和收集本身并没有直接给我们带来服务,这些数据被收集以后用于不同目的,则有可能提供新的服务。这成为了很重要的经济增长点。大数据本身的优点就在于数据可以被一次次再使用。

  比方说实时车辆交通数据公司Inrix在智能手机上有一款应用,每天都有1亿用户。它可以帮助你在开车时避开堵车路段,给你一张道路的拥堵图,红色标志的路段就是堵车。单纯的道路拥堵图有用,但是并没有什么特色,Inrix这款应用的价值在于,它所提供的实时信息不是由交警提供的,而是来自每一个真实的用户,用户在使用的过程中会告诉服务器,他走得多快,他走到哪里,每一个用户都是探测器。这里还隐藏着更大的秘密,这家公司可以重复使用这些数据,给人们带来新的服务,从而吸引投资。因为,他们理解了周末哪里堵车哪里就有更好的销售,他们可以把这样的数据提供给投资公司,投资公司会根据这些数据对零售业进行投资。

  你觉得之前成立新公司需要大笔资金,但事实并非如此。Inrix一开始并没有钱,如果你想在大数据时代获得成功,你已经不需要大的生产基地,大的仓库了。你只需数据,只要拥有数据,对其进行分析就可以了。有云存储的话,这个成本就更低。Inrix在成立之初根本没有服务器和电脑,他们只是租用了云服务,也不需要很多的启动资金,他们只是有这样一个产品想法。

  大数据时代的思维方式是:每天早上起来想一下,这么多数据我能用来干什么,这些价值在哪里可以找到,能不能找到一个别人以前都没有做过的事情。你的想法和思路,是最重要的资产。

  

运用大数据需要知道哪些不可为

  大数据时代这样一点非常重要,就是企业应该要知道哪些事情可以做,哪些事情不能做,客户的信任将是最珍贵的资产。

  举个例子,大数据时代美国运通有这样一个功能,你给他们打电话的话,他们会知道你是谁,好比说你的电话号码跟你的姓名相关。如果在电话里说:你好吗?维克托先生,我能为你做什么,这会吓着客户,因为他不知道为什么你知道他的名字。营造信任很重要。我相信你的过程中,也希望你们相信我,所以我们做大数据分析的时候,客户需要信任服务供应商,而服务供应商也需要表现出来为什么他是值得信任的。

  (摘自维克托·迈尔·舍恩伯格11月11日于福布斯·静安南京路论坛上的演讲)


延伸阅读

  

《大数据时代》

  这本书指出大数据的核心是预测——将数学算法运用到海量的数据上来预测事情发生的可能性。借助大数据,亚马逊可以帮我们推荐想要的书,谷歌可以为关联网站排序,脸谱网站知道我们的喜好,而脸谱网站可以猜出我们认识谁。同样的技术还可以运用到疾病诊断、推荐治疗措施,甚至是识别潜在犯罪分子上。书中展示了谷歌、微软、亚马逊、IBM、苹果、脸谱网站、推特、VISA等大数据先锋们最具价值的应用案例。

  作者预测,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革,向人们揭示一个大规模生产、分享和应用数据的时代正在开启。

  其中,全书最具洞见之处在于,作者明确指出大数据时代最大的转变是:放弃对因果关系的渴求,取而代之的是关注相关关系。也就是说,只要知道“是什么”,而不需要知道“为什么”。这颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。

  

《删除》

  随着廉价数字存储设备的普及,记忆成为数字时代的常态,但是互联网如果记住了我们想要忘记的东西,就很容易毁了我们的生活。比如脸谱网站上照片会被网络永远铭记,甚至会影响到一个人的职业发展。

  这本书告诉人们,在大数据时代,面对海量信息人类该如何取舍,怎样才能构建一个积极而安全的未来。大数据取舍之道,就是把有意义的留下来,把无意义的去掉。只有理解了在大数据中,需要的是什么,以及如何判断这种需要,才能举一反三地明白到底为什么要去掉那些不需要的。

  作者考察了促进遗忘终止4大驱动力——数字化,廉价的存储器,易于提取,全球性访问。之后,他提出了当前数字化记忆的两大威胁——信息权力与时间,并给出了应对威胁的6大对策——数字化节制、保护信息隐私权、建设数字隐私权基础设施、调整人类的现有认知、打造良性的信息生态、完全语境化。最后,他提出了一种应对数字化记忆与信息安全的极有可能的关键对策——给信息设定存储期限。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多