分享

政府整合数据存在的问题、解决方法与路径

 源源不断 2017-03-09

链接|智慧城市领域435个政府委办局2130家运营商8626家系统集成商通讯录

链接|2017第六期新型智慧城市评价高级研修班招生简章【惠民服务篇】智慧小镇、智慧城市PPP流程、网信安全、互联网+政务服务)


一、 数据应用存在的问题


问题

  • 信息共享的效益难题

  • 信息共享迷信导致了思维停滞

  • 工具变成了目标必然导致效益丧失

  • 数据整合理念需要认真反思



1
信息共享的效益难题


国内电子政务建设一直强调信息共享,十五年后还在强调信息共享,只能说明信息共享建设始终缺乏成效,使我们不得不考虑是目标有误还是路径不对。电子政务建设的成绩大都集中在政府业务处理自动化方面而非信息共享,只有理清信息共享的效益难题,数据整合才能避免重蹈覆辙。



2
信息共享迷信导致了思维停滞


缺少质疑精神使信息共享反省始终不到位,长期过度的宣传使人不敢对信息化常识有一点怀疑,信息共享已成为一种迷信,在信息资源稀缺时代强调信息共享尚有一定道理,但在全球信息爆炸之后还持同样的看法就不合理了,只强调增加数据的信息共享只能使资料过剩愈加严重。对信息共享价值的迷信使思维停滞,任凭无效的信息共享蔓延。



3
工具变成了目标必然导致效益丧失


信息共享效益不好的重要原因是把信息共享当成终极目标,而忘记共享效益才是目标,以为信息共享就是效益,其实信息共享只是工具,工具与效益是两回事,真正有效益的信息共享只是少数,多数信息共享对政府工作并无帮助,效益也无法聚集,有效益的信息共享都是精心设计的结果。


信息共享的效益均来自最终目标实现产生的总效益,有效的信息共享应能降低最终目标实现成本、加快实现进度、提升最终价值。只有对最终成果有贡献的信息共享才是有效的,在信息化建设中稀缺的不再是资料而是最终效益目标,目标导向是提升效益之路。



4
数据整合理念需要认真反思


一窝蜂的智慧城市建设最容易出现概念不清决心大,事前不想清楚为什么是粗放文化的通病,粗放文化使国内信息化建设缺乏效益。信息化使政府积累的数据资料越来越多,数据整合问题已经提上日程,但是对于什么是数据整合、数据整合的效益如何产生并没有充分讨论,粗放的数据整合与粗放的信息共享都不会产生效益,认真研究政府数据整合的理论与方法已是当务之急。



二、 数据来源、使用方式二维矩阵



1
精细分类的重要性


电子政务信息共享出现的诸多问题均来自粗放的概念思维,例如系统业务之间的数据共享与决策研究用的信息共享并没有区分,用统一的信息共享交换平台解决两方面的问题其结果是一个都做不好,建设大数据管理中心如果仍旧采用粗放的思维方式,不对数据来源与应用模式的细分只能乱上加乱。面对不断增加的数据复杂性只靠决心大是不行的,方法必须科学,精细分类是降低复杂性的手段,对数据来源与使用方式分类有助于问题的清晰化。



2
两类数据来源:人工数据与自动化数据


政府工作常用的数据资源一种来自人工,另一种来自自动化设备。人工填报的数据不论是统计调查还是业务记录,都是人脑生产的数据,人工填报数据不可能很快也不能做到精准,人工数据都属于小数据范围,其优点是收集容易处理简单。


自动化设备可以是各种传感器也可以是互联网,当然并不是说数据只要经过互联网就是互联网数据,而是指利用互联网机制自动收集的数据,自动化数据也可称为电脑数据,电脑数据精准而客观且数据生产的效率非常高,远远超过人工数据的规模,所以被称为大数据。小数据与大数据的区别不只是规模更是来源不同。



3
两类数据应用:系统业务与专家应用


系统业务应用是业务流程对数据的使用,大量出现在政府系统化业务之中,如政府行政许可审批、办理出入境手续、各种网上办事等等,这些服务是精准地按照当事人相关的数据进行操作,其结果是由制度与数据决定而与操作者无关,系统应用只认数据,没有信息概念。


专家应用是在信息层次上使用数据,要从数据中提取信息,与自己的知识经验相结合来进行分析判断,形成新的见解,这是人脑使用数据的模式,常见于政府的决策研究,决策使用信息而非数据,数据要抽象出信息才能应用。



4
数据应用的四大类型


将两类数据来源(人工数据、自动化数据)与两类应用(系统业务模式、专家应用模式)组合起来,即可得到四种数据的收集与使用状况:


1.     数据操作业务:  人工数据  ——系统业务;

2.     搜索监管业务:  自动化数据——系统业务;

3.     信息决策应用:  人工数据  ——专家应用;

4.     优化改进应用:  自动化数据——专家应用。


数据整合的四种模式形成如下的2×2矩阵: 

数据来源——数据使用矩阵图


使用方式

数据来源   

系统业务:

数据精确使用

(系统、人工智能方式)

专家应用:

信息模糊使用

(人脑分析使用方式)

人工数据

(小数据)

业务数据、人工调查、个人填报等

1:数据操作业务

居民网上办事、政府业务精细化管理,面向数据操作,提高基层操作效率

3:信息决策应用

数据的统计应用、可视化数据展示,获取整体信息

用于决策研究等

自动化数据

(大数据)

视频、传感器、互联网数据等

2:搜索监测业务

信用系统、案件侦破、金融诈骗防范、反恐等业务

以及环境监测类应用

4:优化改进应用

大数据分析、大数据挖掘、可视化展示,获取专业信息用于工作优化改进等



1
类型一、数据操作业务



数据操作业务特点


数据操作业务常见于政府的系统化业务,为提高工作效率业务都设计成规范化操作系统,工作人员按标准化流程操作,系统运行结果与操作人无关,是系统在使用数据而非操作人员使用。

政府大多数网上服务均属此类模式,发改委等十部委提出的“一号一窗一网”的服务方案所指的都是此类业务,业务使用的是与服务对象相关的数据,如办理户口、签证等只使用与个人相关的数据,处理结果由数据及规则决定,操作者没有自由量裁空间,其结果是按规范产生的,谁操作都一样。


数据操作型业务质量要求


(1)数据精准:这种业务完全是依据与当事人有关的数据操作,数据不准确就会出错,保证数据的准确是第一位的。

(2)调用迅速:调用迅速是提高效率的关键,要能够跨部门使用政府数据,减少用户跑腿,不仅方便用户、方便工作人员还能减少数据欺骗。


业务数据整合要点


数据操作业务是政府基层服务的主要形式,其使用的数据是用户填报数据与业务流程积累的数据,不同类的业务数据是由不同的业务部门收集的,数据并没有链接,不同部门的数据必然会存在不一致问题,虽然数据都已入库,但未经磨合的跨部门调用是不可能通畅的,数据整合的任务就是要使之流畅化。不同部门业务数据进行整合并不需要数据集中存储,主要是提升按主题标识码调用不同数据库的速度,要统一各部门的主题标识码,要能够核对数据并及时更正错误,排除数据的相互矛盾,使业务数据跨部门查询流畅化。



2
类型二、搜索监测业务



搜索监测业务的应用场景


搜索监测业务属于大数据资源微观应用业务,常用于案件侦破、危险分子查询、反恐、反欺诈等工作,其关注的焦点是个体信息,目的在于发现异常的个体行为而非普遍性规律。类似于常见的“人肉搜索”。利用各种信息痕迹追踪怀疑目标,也用于对环境的监管,发现超标信号进行预警。


搜索监测型业务使用者主要是安全机构,如公安部门、金融保险部门、政府补贴欺诈防范部门(政府医疗费、困难补助每年都有大量骗费行为)、反恐反洗钱部门等,交通安全部门、环保部门,也包括用户信用服务机构。


搜索监管业务的数据处理要求


搜索监测型业务使用的数据源包括记录人们信息痕迹的大数据资源,如互联网查询记录、移动电话记录、ETC车辆行动记录、视频画面、信用卡使用记录等等,很多数据源涉及到个人隐私,使用必须谨慎,要依法办事。


对于重要的社会安全治理,政府会建设城市感知网收集数据进行安全监管,例如人流危险监管、公共设施安全监管、环境保护监管、食品、药品监管等,这些数据的整合主要措施是压缩内容、实现可视化展示,提高数据的利用效率。


搜索监测数据整合关键


搜索监管业务使用的大数据资源非常专业化,对原始数据整合是不可能的,因此数据整合主要是在结果层次上,这种应用要从大数据中搜索特殊的个体数据,数据整合主要是整合搜索出的结果数据,建立特殊目标的数据库,例如建立违规黑名单、收集欺诈洗钱怀疑目标等等,减少服务风险等。


对感知网渠道获取的监管大数据资源的整合主要是建立可视化图形系统及建立监管预警的标准,提升系统的自动化预警、报警能力,可视化系统可以提升环境安全态势的直观性,有助于管理人员更方便地理解态势。


记录用户的金融行为可以建立用户的征信数据库,记录用户的交通驾驶行为可以建立用户交通风险数据库。



3
类型三、信息决策应用



信息决策应用特点


信息决策应用模式主要用于政府和企业的领导层决策,政府宏观决策需要多方面的信息,政府不会靠数据直接决策,先要从数据集提取信息,并与已有的信息、经验结合起来进行判断,进而制定出带有普遍性的政策。高层决策信息更多来自小数据,小数据宏观性好,容易看懂,而很少会利用大数据,大数据处理复杂,只有经专家处理后浓缩的信息可供领导层决策参考。


大数据对政府高层决策贡献不大,因为数据量越大其涉及的信息面反而越窄,政府决策需要依赖很多不能数字化的信息,如社会经济发展态势,重大的国际国内事件,社会公众的情绪意见等,宏观决策使用数据的规模并不大,主要是掌握趋势,而这些数据主要来自统计数据。


领导层信息来源


城市领导的主要工作是解决城市发展中的一些棘手的问题,监督与激励部门领导做好分管的工作,领导干部的决策能力是长期工作积累的结果,数据与信息的作用是潜移默化的,很少出现利用数据资源对某项决策进行辅助决策的局面。领导层的洞察力主要在于平时对数据与信息的利用。


领导层的信息来源更多是通过人际渠道,数据利用主要是统计数据,会更多利用专家们研究的成果,领导层会非常关心其它地区的做法,特别是规模相当城市的数据及采取的一些举措。


信息整合关键是少而精


领导层最关注的是整体的态势,包括全球、全国、本省、本市的基本数据,这些数据主要是统计数据,数据量不需要很大但查询要方便,尤其本地区数据是工作汇报的重要内容。对领导层而言查询方便比数据完整更重要。


除了关注宏观统计数据之外,领导层通常很关注类似规模地区的发展数据、相关政策措施,地区数据中心要多收集此类数据供领导层参阅,经济专家对形势的分析也为领导关注,专家的文章往往太长,领导时间稀缺看不下来,数据中心可整理出摘要供领导查阅。



4
类型四、经营优化应用



经营优化应用场景


经营优化主要适用于企业应用特别是企业自用大数据资源的应用。亚马逊利用自己积累的数据来分析用户的购买喜好,成功地向用户推荐新书,电信运营商利用大数据挖掘用户的使用习惯定向推荐服务套餐,大型商场利用自动收款机分析用户的消费心理,这些大数据的使用方法都是围绕着公司业务进行的,旨在改进公司销售,互联网公司利用大数据改进广告收益,金融公司使用大数据降低金融风险。


政府本身并没有太多的大数据资源,政府数据还是以小数据为主,即使把众多小数据整合起来还是小数据规模,用好小数据应是政府数据整合的重点。但是政府可以与拥有大数据的企业合作,利用企业的数据资源与信息渠道改进政府工作。国家信息中心与蚂蚁金服和腾讯网络合作,共同收集各地智慧城市公众反映大数据来评价智慧城市发展水平取得了很好的效果。


经营优化数据应用特点


企业大数据资源主要来自本公司业务,这种大数据资源最适合改进本公司业务,目前发展得也最快。政府利用企业的大数据资源有一定难度,企业原始数据不愿意给政府,因企业需要保护公司用户的隐私及公司的商业秘密。政府不必非要企业的原始数据,可以订购企业的分析成果与可视化数据产品,这类数据产品不侵害企业利益因而企业愿意配合。


社会大数据资源的整合


企业利用大数据资源改进业务有自身的需求,政府并不需要进行管理,企业向社会开放大数据资源是市场行为政府也不需要干预。政府可以采购企业大数据资源的加工成果,如大数据分析报告、大数据可视化产品等,政府可以规划城市所需的多种大数据产品,向社会开放数据产品采购清单,向企业系统采购,不仅政府自用还将向社会开放,使大数据资源物尽其用。



三、 需求导向创造效益



信息爆炸与数据价值


信息资源爆炸时代数据资源早已不再稀缺,信息会通过各种方式向外泄漏,想回避都不容易。按照经济学理论,供应增加必然带来边际效用下降,数据价值下降是不可避免的趋势。


数据价值下降是竞争的结果,以提供信息为目的的数据价值下降最快,因为类似的数据太多了,政府内部的数据资源会受到外部资源的激烈竞争。以提供信息为主要目的的数据中心会丧失原有的重要性。


政府的业务数据却不会受到外部竞争,业务数据是用户办事过程记录的数据,是继续办事的依据不可被替代,在政府服务精细化改进中会有更大作用,整合的业务数据会不断增值,这应当是数据中心今后工作的重点。


数据整合不需要面面俱到


数据整合是提升应用效益的工具,数据整合本身并不是目标,工具并不是效益的来源,恰当的目标选择才是效益的来源,选择就是在增添智慧。政府数据整合既然不是终极目标就不必整合全部数据,只需整合有用的数据,要选择那些使用频率高、使用价值高的数据入手,放弃使用率不高的数据整合,集中精力将有用的数据整合做得更好


数据整合要从具体目标起步


信息共享做不好的原因之一是捆绑了通用平台,想靠信息共享交换平台来解决不同的信息共享问题,结果与设想大相庭经,在没有积累大量具体经验之前开发通用系统是不会成功的,数据整合工作要吸取这一教训,先从具体项目入手,特殊目标效益未实现之前,不要搞普遍性解决方案。


现在国家发改委、网信办等十部委联合提出了“一号、一窗、一网”的惠民服务要求,这已经是一项非常具体的要求,能够实现上述服务需要的跨部门数据使用已不容易了,即使在该任务中,也要挑选最重要、最有影响、使用频率高而无重大难点的任务先做,以用户满意率提升为中心,完成任务是当务之急。通用平台让软件公司去想,政府不必自找麻烦。


大数据整合更不必操之过急


国内大数据应用才刚刚开始,很多地方还处于既无经验又无资源的阶段,建设大数据中心实在勉为其难,不如集中精力把小数据应用做好,大数据应用可让大企业和大城市多试,待他们成功了再学不迟。政府应用大数据没有竞争性,早做晚做没有差别,政府不必学企业争先恐后地大数据,把公众急需的小数据服务做好就是成功之路。


延伸阅读:

胡小明:为电子政务服务的大数据之观点摘要


关于政府电子政务服务的大数据,我们在这里因为大数据太热了。我觉得这里面有风险,希望我们在研究大数据的时候,我们不要被大数据热冲昏头脑。所以应该把这个问题想清楚,哪些是可以解决的,哪些是不能解决的。


平常心对待大数据


第一是要以平常心对待大数据,在宣传热的情况下,我们发现我们更多讲的是大数据的技术、大数据的手段改进。而对大数据的实际应用,仔细来看真正的例子还是少的。我们讲数据挖掘,讲这么多年之后,讲数据挖掘还是啤酒尿布,这说明问题呢?说明在应用领域和技术领域这两者差距还是非常大的。


而现在我们需要的从实际当中来考虑这个问题,我觉得大数据有点被惯坏了。目前大家都在说成立大数据机构,申请大数据经费。但是从大数据实际应用来看,我觉得我们并不是很明确。到底解决什么事情,它能不能做呢?还有很多问题,我觉得大数据从我看来,它只是一个工具。它永远是我们要做目标的仆人。希望大数据的发展和应用,不要走信息资源共享的路,信息资源共享喊了很多年。从国新办的17号文开始到现在已经搞了十五年了。但是在信息资源共享方面到底有多大的进步能说出来,我认为一直没有做好,也没有说出太多东西。当然这里面的原因是非常多的,为什么会这样呢?我觉得有一个非常重要的原因,就是我们把数据资源共享的能力和效果想的太高了,我们以为它能够解决多少问题,实际上它并不能解决那么多问题。


随着社会数据资源的增加,信息共享手段的增加,政府那点数据共享它能所做的贡献是越来越少的。并不是所有的信息共享都是有用的,可以说多数的信息共享并不是很方便。而且他们的成本效益并不都是正的,在这种情况下,你要求全面的信息共享肯定是失败的,正确的做法应该是仔细挑选,可能十项里面只有一两项是好的,你有什么必要推全面的信息共享呢?所以集中精力来做真正有效率的事情,这才是我们该做的。所以说在大数据方面来讲,我们一定要以目标位中心,以平常心来对待大数据。以目标位中心就是不是所有的大数据都是有用的,可以说大部分的大数据都是没有用的,真正有用的东西是少部分的,你必须把有用的挑出来。当你想解决什么问题的时候,这时候你再谈大数据,我认为是有价值的。当你的问题还不清楚想用大数据的时候,我认为这完全是错的,它根本没有用。因为数据资源是不缺的,数据也可以是垃圾。最缺的是你的目标,你到底想干什么,现在我们最大的问题是我们想干什么不清楚,所以我觉得这是一个很大的问题。


目前我们对大数据概念,大家讲的都是不一致的,讲的都不清楚。对于政府的官员来讲,他认为我的政府数据很多,我只要把数据合起来就是大数据。因此他认为他的一切数据都是大数据,你整合起来就多了。为什么会有这种想法呢?有很多的原因,其中一个原因你挂上大数据能够申请经费,能够得到重视,能够符合潮流。如果你没有挂上大数据,你是小数据的整合。所以这个问题也是一个因素,但是这些问题都不重要,最重要的到底什么能解决问题,这是最重要的。


另一个方面来说,我们现在看的大数据,大部分是基本大数据的概念,是从互联网公司来的。互联网公司它有了很高的技术,它能够利用起来大数据。因此这个概念基本上是由互联网巨头决定的,过去也有预测、石油勘探它也是一堆数据,但是都不说它是大数据。互联网出来之后它创造了一种经济,也就是说一个名词,一个概念的出现是和应用结合起来,应用可能带来有效的东西。它就是来自互联网大数据的概念,而政府大数据它基本的概念还是传统的,这两个是不一样的,所以政府大数据整合,并不是我们现在所讲的大数据数据。而是我们传统的数据整合、数据处理、数据分析,它是传统的技术。所以这两个技术是不一样的,它们的概念不一样。


传感器大数据


然后是传感器大数据,为什么?因为我们技术的发展出现了非常多的传感器,而这些传感器,它收集的数据是非常多的,这种数据用在什么地方呢?用于人工智能。比如说无人驾驶汽车以及机器人等等这样的技术,他们也用这个技术。但是这个技术多不多,量大不大,我觉得不是最大。它最重要的特点是什么呢?就是数据处理的过程当中没有人的干预,它是自动化的,所以它们属于人工智能这方面的大数据。


当我们在分析这个问题的时候,我们要关注一下当前你想解决什么问题,其实对不同地区是不一样的。比如说互联网和传感器大数据,什么工业4.0类似这些东西都跟这些有关,对于政府改善服务,它最主要的是整合大数据,这个大数据主要还是在传统的数据范围内,他们需要的技术是不一样的。


对于政府来讲,最重要的东西经常是最简单的,永远是这样,重要的都是简单的。如果它不简单,它就不会重要,重要的都是简单的。我们现有的数据改善服务,这种服务全部都是在大大数据范围内,只是我们说大数据,但是从技术来讲他们都是传统的技术使用和改进。互联网数据也可以来做,但是它并不会在政府工作改进上占据主要的位置,因此对于我们政府的工作来讲,核心的问题是小数据整合最重要,这才是最重要的。


互联网大数据改进是专业部门做的,传感器大数据用于工业智能,用于人工智能改进,建立各种各样的智能系统,它们是有用的。


大数据不适合大决策


下面我再讲一下大数据并不适合于大决策,大家都知道小数据适合大决策,原因是什么呢?当我们的数据量太多的时候,毕竟你关注的范围要窄,你关注的范围窄,你的量才能大,才能深,这么以来你对问题的看法和视角都狭窄。我们处理大决策的问题它需要广阔的视角。对于具体的问题来讲,大数据适合于解决小问题。


另外,很多问题是没有办法依靠大数据的,比如说国际形势发生了变化,现在网上经常在讨论说希拉里和川普他们俩谁上台,他们俩上台政策不一样,你该怎么处理,对世界经济影响也不一样。像这样的问题你能不能用大数据来分析,我觉得是不可能的。但是绝不可能分析出他们的政策会带来什么样的改变,因为这些东西来讲是未来的东西。比如说经济发展美国十几年前的9.11事件,出了很多问题,而这些问题对中国经济发展是有利的,为什么?因为把美国搞乱了,中国有很多的机会。这样重大的政策反而不是大数据能够搞出来的,原因是什么呢?当你数据量太大的时候,你的视野不一定狭窄,如果你的视野宽阔你的数据量并不那么多。所以正因为这个原因,我们要想清楚。


高层决策最主要是靠全面信息,而不是狭窄的数据。我谈了大数据的服务问题,因为我现在在深圳,我帮他们来讨论一些问题,他们总觉得政府的数据资源非常多。我要打通把数据整合,然后我就可以分出来很多东西来支持政府,这是它的一种基本思想。但是这种基本思想一般来说是不行的,为什么?政府的数据实际上一点也不多,总说政府资源占90%,那些都是三十年前的概念,因为那时候没有互联网。现在互联网巨头不比政府的数据多十倍、百倍、千倍。而且政府的数据主要来自于人工调查,人工调查的效率和机器识别的数据是不一样的。所以政府的数据是很少的,你可以把它集合起来解决问题。但是你不是需要靠大数据来分析,而是靠转动的数据分析,来挖掘政府数据的潜能,所以这个很重要。


在这种情况下,如果政府把所有的数据都整合了,然后等着你去打通,去分析出结果,这样行吗?政府信息资源虽然没有开放,但是没有不透风的墙,政府信息代表的东西都会通过各种各样的渠道传递出去,包括我们的手机、聊天、谈话等等。所以在这种情况下,你想有一个非常重大的发现出来是不容易的。


如果你能够发现这些重大信息,你这些能力如何给政府提供。实际上我们提出的东西对政府的官员来讲你的东西是小儿科,是外行。你要依赖大数据政府是不放心的。在这种情况下,你把各种各样的数据整合起来,让它变成一个可视化的服务这反而是有效的。一个可视化的服务队政府官员来讲是很欢迎的,就像我们天天都要看天气预报。我们看天气预报一个月几次台风,可视化数据能够迅速的一眼能够对整体有一个改观。所以说对于政府领导来讲,你提供一个可视化的图,包括云图和变化图。


人工智能发展的过程当中,也是有一个进程的。在六七十年代,当时人工智能非常火,搞来搞去做不下去了。后来人们也做机器发现做来做去也做不下去了,什么时候开始这轮又起来了,核心是它把人工智能改成了大数据,改成了数据学习。实际上里面包含的信息,比如说机器翻译,以前我也见国际歌搞翻译的人,那时候的思想是造型和理解的角度来翻译,现在发现越来越做不下去的。现在的翻译是怎么做的,上一句话是这个,下一句话是那个,什么概率最高用那个,别的东西不管。哪个词出现的频率最高就用哪个,现在我们发现我们的软件越来越快,就是一般打这个字,下个字什么概率最高就提出来,这样对你加快速度就更容易了。


智能化的城市也和我们的大数据应用紧密的结合起来,它这种应用和我们决策的应用是不一样的。实际上数据有两种情况,一个是用在人工智能领域,它应用的系统是自动化的,而提出来之后机器自己来用,因为计算机本身你别看它总是数据,但是它一点都不懂信息,它脑子里面只有数据的概念,它碰到数据算概率,没有别的概率。但是人决策不一样,它会把所有的数据拿过来看一遍、想一遍,这两个用途是不一样的。所以说机器使用大数据和人来使用大数据它是两种不同的使用方式,你会知道为什么人使用大数据结果是不确定的,机器数据是死的。


当我们在研究大数据的时候,一定要从应用出发,而不能从资源出发。一个数据,它是资源,还是垃圾,我们不要认为所有的数据都是资源。因为资源和垃圾它俩没有区别,资源就是垃圾,垃圾就是资源,完全取决于不同的人在这里看,资源和垃圾本身上是一样的,就好像你想删掉就删掉,你删掉的就是垃圾,你不删掉的就是资源,所以垃圾和资源是同一个东西。我们如何区分,它判断标准就是对人工的帮助,所以这就是要注意的事情,我们不能从资源出发,现在我觉得在全国各地处理推广大数据的时候有一个观点我是非常怀疑的,各地做的顶层设计里面。你到底是解决什么问题,你先把数据收集过来。


大数据的发展要在应用中成长,而不是在大楼中成长,这是什么大数据呢?实际上你发现有很多大数据确实可以解决问题,它还需要长期不断的积累,不断的改进。因此有效的大数据你不断的维护它和改进它,它在应用中成长,而不是在你的大楼中成长。


所以如果你没有想清楚做什么,你的大数据组织是非常危险的,它会浪费你很多的资源。你搞一堆垃圾,你还想升官,那样肯定不行,因此你不能这么做,你要挑出来有用的东西,在应用中不断改进,也许它所用到的数据,只是几十分之一就可以了。我的数据卖给你,当时我想卖一点钱,他说我不要,我说你为什么不要,他说我要等我的用户,我的用户咨询到哪一个我买哪一个,宁可贵一点我也要,我不要你们企业的数据,他用的是这样来想的。


在这样的情况下,我们就需要在大数据当中我们要进步,对高层的服务和对基层的服务是不一样的。政府的数据整合最重要的是基层的服务,整合的数据对基层的服务有用,对高层的服务它要了解外体和整体,它并不需要精确的数据。所以我们要把精确的数据送到前线,什么是前线呢?直接为公众服务的,他知道这家是困难户,这家收入多少。然后把整体的趋势可视化的图形送领导,这样领导一眼就知道大概的趋势,这样的话才会更有效。


我们要以解决问题为中心,真正能解决问题的东西不见得数据量大才是能解决问题的。


我举一个例子,美国友一家公司,这个公司花钱花的太多,每一个公司都超预算非常头疼,于是派了一位领导解决这个问题。一开始把帐单都打出来看看有什么不合格,后来计算机打出来他根本没有办法看,谁浪费最多,排第一,每次超支最多的,每个月发一份,然后他就不管了,各个部门都怕自己的排名表靠前,于是很快就把这个问题解决了。解决这个问题并不是靠大数据分析来解决的,而是靠排名表解决的,所以说很多问题要以解决问题为中心,大数据并不是唯一的工具。


大数据被政府惯坏了,只会花钱不会干活了。所以我们要先整合好小数据,所以数据的应用应当始于足下,而不要让大数据误导,这是我讲的一些想法,谢谢大家。


来源:胡小明,原国家信息中心副主任

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多