分享

独家对话《大数据时代》

 未来刚刚发生…… 2013-01-14
独家对话《大数据时代》http://img./Article/2012/12/1ea94fac38484fe45b2652d25d94d6f1.jpg

       斯塔西?施耐德(Stacy Snyder)曾经的梦想是成为一名教师。2006年夏天,她完成了获取教师资格证书所需的课程并通过了所有考试;然而她的梦想却在即将实现之时突然破灭——她所在学校的一位负责人告诉她,她无法取得教师资格证书。

        学校负责人展示了一张她上传到自己的MySpace页面上的照片,照片上的她戴着一顶海盗帽,正端着一只塑料杯饮酒。这张照片是她向自己朋友展示的,甚至可能只是搞怪,但学校认为这样的行为与教师的标准不符。斯塔西向学校承诺将这张图片从网上删除,然而为时已晚——照片早已被搜索引擎索引,并被网络爬虫所记录。她希望她的照片被遗忘,然而互联网并不允许。
        
这是牛津大学互联网学院的教授维克托?迈尔-舍恩伯格(Viktor Mayer-Sch?nberger)在2009年 出版的《删除:数字时代遗忘的价值》(中译版为《删除:大数据时代的取舍之道》,以下简称《删除》)一书中引用的一个案例。他告诉读者,遗忘本是人类的天 性,但随着信息技术的发展,记忆变得越来越容易,遗忘却越来越困难;无法遗忘不仅会给个人带来不必要的困扰,也给企业制造了麻烦——他们存储的数据日益增加,但其中很多随着时间的推移而失去了价值。因此,他呼吁引入一种遗忘的机制,例如为数据设定一个保存期限,让我们记得去遗忘
        
尽管没能提出切实可行的遗忘方法,但《删除》独特的视角仍受到了学术界和互联网业界的广泛关注;这本书不仅获得了多项图书奖,还被翻译为德语、意大利语、韩语等不同语言。

        大数据成为业界新的热点之时,在这一领域有着深入研究的维克托于近日出版了其新作《大数据时代:生活、工作与思维的大变革》(以下简称《大数据时代》),通过一个个生动的案例向读者介绍大数据的价值及其将会带来的改变。

 

        从杀毒软件开发者到跨界学者
        
维克托出生于奥地利萨尔斯堡,父亲是一名律师,母亲是一名商人。他经常会在演讲中引用他家人的例子。我母亲曾经营一家电影院,我每年都会问她过去一年最好的电影是什么,她总是说我知道,我知道,就是XXX’,但她总是错的。他试图用这个例子说明大多数人对于数据并非特别擅长,因而需要数据分析工具和模型。
        
维克托从小便对软件兴趣浓厚。他12岁时便开始接触编程,少年时期曾在国际物理奥林匹克竞赛和奥地利青年程序员竞赛中获奖。1986年,18岁的他创办了著名的杀毒软件公司IKARUS。不过正当他希望在软件领域一展身手之时,父亲却要求他攻读法律。
         “
我说我想成为一个软件人,不想学法律,但他却坚持他的意见,于是我进入法学院学习,同时经营着软件公司。
        IKARUS
发展迅速,1991年,维克托被评为奥地利最杰出的5名软件企业家之一;不过很快,他便无法兼顾繁重的学业和日益壮大的IKARUS,最终他选择卖掉公司,专注于学术道路。从萨尔斯堡大学毕业后,维克托又在哈佛大学、剑桥大学和伦敦政治经济学院等世界名校攻读了多个学位,并在毕业后先后进入哈佛大学、新加坡国立大学和牛津大学任教。2000年,他还因为在学界和业界的突出贡献被评为萨尔斯堡州年度人物。
        
谈到跨界的经历,维克托表示自己很幸运。很多政客和律师不懂商业,而商人不懂法律、政治,我则有幸能兼顾两边——我进入了软件业,成为一个创业者;同时又懂法律,了解决策者们的想法。

        掌握不同领域的知识不仅为维克托在互联网治理等交叉学科方面的研究提供了很大的帮助,也让他获得了许多IT企业和政府部门的青睐——他曾先后为微软、IBM、惠普等公司提供咨询服务,也担任过新加坡商务部、科威特商务部和文莱国防部的智囊。

 

 

        三大转变定义大数据
        
大数据是今年IT界最热门的概念之一,然而对于大数据是什么,连许多经常谈论这一概念的从业者也无法给出准确的答案。正因为如此,大数据也被质疑为一个炒作出来的伪命题。
        
维克托也并未直接给出大数据的定义——在《大数据时代》的引言部分,他就明确指出大数据并非一个确切的概念。不过,他用三大转变描述了大数据的特性。在接受记者采访时,他详细阐释了这三个转变:
         “
首先,在大数据时代,我们可以获得和某个现象相关的所有数据,而不只是少量的样本。例如一项针对相扑比赛中非法操纵比赛结果的研究对64000场比赛进行了分析,这算不上一个很大的数字,但由于这是过去十年所有的比赛,所以它是大数据。大数据是相对的而非绝对的。
         “
第二,由于有了更多的数据,我们可以接受更多的混杂、更多数据上的不精确。如果我们对于一个事物只有50个数据点,那么每一个数据点都必须非常精确,因为每个数据点都是有用的;但是如果我们有5000万个,去掉10个,甚至去掉1000个都没有太大的问题。

         “第三,我们分析大数据主要为了预测未来是什么,而不是为什么。我们关注的是揭示哪些事情将会发生的相关关系,而非揭示为什么这些事情会发生的因果关系。因为很多时候我们以为我们找到了事情背后的原因,实际上却没有找到。更多时候知道了是什么就足够了。例如知道流感将会扩散到哪里就足够了,我不需要知道为什么;知道什么时候在网上购买机票能够获得最优惠的价格就足够了,我不需要知道为什么此时价格最低。

 

         “忘记不相关的数据会带来更好的预测结果
        
表面上看,此次出版的两本书相互矛盾:《大数据时代》强调了数据的价值,而《删除》却提出数据应该能够被忘记。对此,维克托表示,两本书相互补充,而以上的两个观点可以完美地相互作用。
         “
大数据只有在没有噪音、没有无用的数据的情况下才能很好地发挥作用。在《删除》中,我认为我们需要有摆脱那些过时的、和我们现在不相关的数据的可能性。如果亚马逊忘记了和你当前的兴趣与偏好不相关的购书记录,它推荐书的效果将会更好。只有好的数据才能带来好的预测。

        对于大数据被过分炒作,维克托也表示担忧:它被夸大了,好像一切都突然成为了大数据,大数据能解决所有问题,事实上人们并不了解它究竟是什么;一旦人们发现它不是万能的,就会感到泄气,然后大数据就被抛弃了。在他看来,尽管大数据非常强大,但人们需要明白它不是什么,我们不能将它过分夸大

 

 

对话《大数据时代》作者维克托?迈尔?舍恩伯格

 

        数据是潜在的产品

 

http://img./Article/2012/12/1e3be6792151da278f4cc80907d25f65.jpg

维克托?迈尔-舍恩伯格


        
人物简介:数 据科学的技术权威,最早洞见大数据时代发展趋势的数据科学家之一。现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项 目负责人,哈佛国家电子商务研究中网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚 大学、圣地亚哥大学、维也纳大学的客座教授。


        12
11日,维克托携两本书的中译本来到北京,在不同场合与读者及业内人士交流大数据相关的话题。本报记者在亦庄云基地与维克托进行了深入对话,和他探讨大数据时代的记忆与遗忘。

        
电脑报:你说大数据时代应该关注的是相关关系而不是因果关系,那么为什么对于企业来说真的不重要嘛? 
        
维克托:是的。亚马逊不需要知道你为什么会买某本书,或者为什么它给你推荐了某本书你就买下了它;它只需要知道你买了这本书,然后它会向你推荐相关的,仅此而已。类似的,快递公司UPS通过大数据发现他们的车辆在GPS的指引下左转时出事故的概率较高,于是他们更改了导航软件,让车辆更多地右转,尽管这浪费了时间,但降低了出事的风险,因此提高了效率;他们并不知道车辆左转时发生了什么,为什么更容易出事,而他们也不需要知道这些。

        
电脑报:亚马逊、Google这些大公司已经积累了很多数据,但小公司、创业公司却没有多少数据,在大数据时代他们应该怎么做?
        
维克托:的 确,这很有趣。很长时间以来,这些大公司的强大之处在于他们的服务器集群等基础设施。如今有了云计算,创业公司可以根据需要购买计算和存储能力,以解决基 础设施方面的不足,但他们没有数据。数据是一些大公司独家拥有的。当然如果小公司选择了正确的领域切入,也能够获得数据。例如Inrix公司,他们开发导航软件,还能提供实时路况,告诉你哪里堵车。他们是怎么获得这些信息的呢?他们的基础导航服务是免费的,但如果你同意下载这个应用,它就会就会将你的行驶速度等信息传回后端,于是你就成为了这个平台的传感器。每天有数百万人使用Inrix,因此Inrix拥有数百万传感器,并获取了大量的数据。他们能记录在特定天气下人们的驾驶速度,并将这些信息告诉保险公司,或者告诉政府作为加强道路安全的参考。

        
电脑报:通常企业只能通过自己搜集的数据进行预测,但他们的数据是有局限的。比如我在亚马逊上搜索了一本书,但最终通过其他渠道购买了,亚马逊并不知道,它仍会推荐相关的书,我却不再需要,如何解决这样的问题?
        
维克托:事实上目前已经有一些公司在分享自己的数据了,例如在网络广告领域。不过问题的关键在于你自己是否愿意你的数据被企业共享,如果你愿意让他们共享数据,你就能获得更好的推荐。如今在硅谷有一些创业公司正试图打造由个人、由消费者控制的信息共享平台。

        
电脑报:相对来说用户可能会对大公司更加信任,更愿意把信息分享给他们,那么小公司如何让用户分享更多数据?
        
维克托:这不一定。可以换个角度来看,很多人不愿意把数据分享给Google或者Facebook,他们认为这些公司过于强大了;他们反倒更愿意把数据分享给小公司、创业公司。有意思的是,大数据能帮助大企业,也能帮助小企业,但对中型企业帮助不大。比如200-500人规模的企业,它们不够小,不像初创企业那么灵活,也不像Google那么强大,因而被挤压在中间,没有自己的优势。

        
电脑报:在企业内部,大数据应该由什么部门负责?
        
维克托:CEO。这是很基本、很重要的。很多线下企业制造了大量的信息,他们有很多数据,但他们不明白数据就是价值,对他们来说数据是问题,所以他们设有首席信息官来处理这个问题;而由于信息是在基础设施上流动,他们还设有首席技术官来维护这些基础设施。他们没有意识到数据是产品,否则CEO会亲自去看数据,然后说这很有价值。管理者应该改变认识,明白数据不是风险或问题,而是潜在的产品,是价值的源泉。

        
电脑报:你认为在大数据时代,与隐私保护相关的法律应该有所调整吗?
        
维克托:是 的。隐私权可以让个人对互联网、电子商务更信任;如果没有隐私权,我会对我在网上所做的事情很谨慎,因为一旦我将某件事告诉别人,我就可能把它收回来了, 我无法控制它。所以我们需要隐私法,但隐私法也需要创新。如今欧洲的隐私法规定,企业最多只能将数据保存到首要目的完成的时候为止。这是在小数据时代制定 的法律,在大数据时代已不再适用,因为数据的价值往往并非体现在其首要用途上,而是在其次要乃至第三位的用途上,可能是你收集数据时并不知道的用途。所以 我们要做的是,让数据不再只能被保存到它的首要用途完成时为止,而是将决定权交给和数据相关的个人,让他们来决定是否删除数据。

        
电脑报:在《删除》中你说应该对企业保存数据的时间有所限制,这是否会影响企业对于大数据的使用?
        
维克托:我的意思是,数据能保存多久应该由和数据相关的个人来决定。例如我如果希望我的数据在亚马逊上保持很长时间,我需要有这个权利和意愿;但我必须同时拥有删除这些数据的权利。亚马逊也会因此获益,因为如果我告诉他们删除我8年前的购书记录,因为这和我如今的兴趣无关,这样能将一些噪音排除,他们的推荐会更精确,我可能会买更多的书。

        
电脑报:如果大数据能够准确预测未来,我们就可以在面临选择时做出最合理的选择,但很多时候我们的个性、我们生活中的快乐正是源自于一些非理性的选择,大数据是否会让我们失去这些?
        
维克托:只 有当我们知道了真相是什么、当我们理性的时候,我们才能非理性。我们可以理性地去面对不合理的情况,这是我们主动选择不理性的,符合人类的习惯。例如数据 告诉我抽烟不好,但我依然可以抽烟,这是非理性的,但这个非理性的决定是基于一个理性的选择,因为我知道了真相,所以我在做选择时是理性的。如果没有数 据,我就不知道我什么时候是理性的,什么时候是非理性的;很多时候我认为我做了一个正确的决定,实际上却是一个错误的决定。所以在有了数据之后我们的生活 依然可以很有趣。

        
电脑报:你说遗忘是人类的天性,但事实上如今的人类也丧失了一些我们祖先所拥有的能力,那么人类在数字时代丧失遗忘的能力是否可以被看作是一种进化?
        
维克托:可以这么说,但进化应该是个缓慢的过程,尤其是要重组大脑。在很偶然的情况下,进化可能会使人类丧失某项能力,但这需要很多年才能完成。

 

本文出自2012-12-24出版的《电脑报》第51 A.新闻周刊

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多