分享

读涂子沛的《大数据》

 有梦想才能成功 2015-07-28
    首先说下这本书好的地方就是将大数据变化为一本科普读物,不是讲大数据的关键技术和具体实现,而更多的是围绕美国政府基于数据的管理历史线条展开,让大家更加容易理解大数据在政府执政和公共事务管理中发挥的作用,所以我看完后最大的感觉就是关注智慧城市的相关人员完全有必要阅读该书,会对以后在智慧城市的管理和建设中如何更好的理解大数据,应用大数据,发挥大数据本身的业务价值有更好的理解。

为何近几年出现大数据,最重要的还是随着信息技术和互联网,管理的精细化,全球化和社交圈扩大,数据呈现了指数级的增长。2009年美国的数据,离散制造业966PB,政府848PB,传媒行业715PB,这是麦肯锡2011年出版的一份报告《大数据:下一代创新,竞争和生产率的前沿》里面的一个估算。正是由于数据指数级的增长,对数据的开放,信息自由,数据的采集,数据的分析和处理,预测和决策提出了更高的要求。

信息自由,一为信息公开,二为信息发布。公开是政府和某一社会特定主体的关系,是点对点的;而信息发布是政府和社会的关系,是点对面的。信息自由法已经成为美国不可缺少的一个基本法案,只有信息自由才谈得上进一步的数据开放和数据共享。

我们信奉上帝,除了上帝任何人都要以数据说话。信息技术发展,数据指数级增长,已经彻底改变了政府,社会,商业群体的决策方法。需要的是形成一种数据驱动的决策方法,数据治国,需要基于实证的事实而非简单的意识形态。而真正要让数据能够上升到决策层面,首先需要的就是数据大范围采集,数据抽样,数据测量和数据质量管理。另外数据驱动和事件驱动是两种模式,数据驱动强调的是历史和预测,而事件驱动强调的是实时和响应。大数据有一个维度专门是指速度和快速响应,更需要考虑事件驱动和数据驱动融合。

帝国法则,详细讲述了数据的收集法则,使用法则,发布法则和管理法则。数据能够满足既定的用途,它才有质量。如果不能满足既定的目标和用途,就谈不上质量。换句话说,数据的质量不仅取决于它本身,还取决于它的用途。数据质量的问题涉及到数据收集,使用,发布等所有过程的问题。数据质量管理要有标准,有流程,有救助机制。

从软件的开源到数据的开放,我们过渡到一个新的世界,可以讲数据开放式本身的另外一个重点。在这个新的世界里面,数据远远比软件更加重要。从2004年以来,美国一直在进行数据开放运动,联邦政府也专门家里了数据开放门户网站DataGov,其主要目标就是通过数据开放,通过鼓励新的创意,让数据走出政府,得到更多的创新型应用。从而进一步巩固政府透明化,民主化和政府效能。

数据之争涉及到原始数据采集,数据质量,数据安全,数据粒度,数据价值,数据虚实多个维度。而DataGov不仅仅开放了原始数据,地理数据,还包含了数据分析工具的开放。数据开放为创新提供了无穷的燃料,因为创新型应用,数据的能量将逐层放大。

预测未来最好的方法,就是创造未来。而数据最大的价值仍然在预测上面,在解决了数据开放,数据采集,数据质量管理,数据处理后,最重要的作用就是基于数据进行科学的预测和决策。数据竞争将是企业赢之道,一些企业已经将他们商业活动的每个环节放在了数据收集,分析和行动的能力上。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多