分享

【干货分享叁】智慧园区的大数据策略和应用

 老牛伏骥2017 2018-03-20




APEC技展会智慧园区发展与创新高峰论坛汇聚了全球优秀智慧城市、智慧园区领域专家,与会专家就各自的研究与实践领域发表专业演讲。


来自深圳前海信息技术有限公司董事长、深圳大数据产业发展促进会副会长王界兵博士为大家分享《智慧园区的大数据策略和应用》,讲述如何提升园区客户服务?如何科学地进行运营分以及智能决策来全面提升园区的服务满意度及价值,大数据在其中的应用和价值有哪些?以下是王界兵董事长演讲实录:



非常感谢邀请来分享智慧园区的大数据策略和应用,在智慧园区的建设中,案例并不是很多,但是配合这个会议我思考了一下,提出本人的一些建议。


首先给大家灌输一下大数据的概念,大数据是四个V,这些年接触大数据都不用去多讲,但是大数据这个体量怎么样才算大数据?从PB到TB到GB到MB,到底是多大?把这个事情说清楚的人并不多。


这个地方要给大家灌输一个很重要的概念,比如说我们接触到的1500万人的健康档案,我们可以提取1万人的阿尔茨海默氏病,这个体量并不大,但是它真的是一个大数据。你说我1500万人,我可以提炼出各种病人的大数据,当然,你有各个维度的,你有这个体量的,所以有的人说,你给我30万人的大数据,但是你可能在这里面只找到几百人,就不能说是大数据,在这个人群上提炼不来患这种人群的特点。


但是大数据这个概念有点被过度使用,过度使用以后,现在的大数据概念上升为是一个技术方法,就是你用了大数据的技术方法,我搞大数据,也许你的体量不大,但是你用了他的技术方法,基本上也算是大数据,这是让概念变得更广义了。从这个技术来讲,比如说大规模的技术学习,到今天还有人问我,说大数据无非是做统计。这个观念是非常不正确的。有的人说你用统计做做看,你用统计下棋是绝对不行的,因为每一盘棋都是不可重复的,你只能是通过机器学习,你先搞不清楚这一步棋是攻还是守,你都没有搞清楚,只有通过机器学习。


但是大数据的方法论里除了这个以外,还有并行计算、内存计算、文本处理技术、自然语言处理技术,可以说,大数据是这里面最复杂的。我今天说把应用放在这个云上,放在那个云上,这个跟大数据不一样。


我们公司也是做Hadoop的,十年前,从谷歌发布的Bigtable这篇文章引发了大数据的爆发,到今年正好是十年。任何一项技术要想在世界上获取大规模的推广跟应用,离不开它的价值,你说现在的手机5万块钱一部,能不能每个人都拿一部手机?不可能。2006年的时候,谷歌说,我做大数据就用商用服务器,很便宜,几万块钱搞定一台。从那个时候起,大家都意识到,大数据一定会在这个市场上大规模的推广,因为它便宜。


所以从去年Hadoop在大数据的市场份额占到20%到30%之间,到2020年Hadoop会占到50%的市场份额。从单一的用户批处理,Hadoop已经进入到了多用户、多租户、批处理交互实时流,所以说应该是应用覆盖范围是越来越广。实际上Hadoop的供应商也是很强大的一个阵容,包括IBM也是阵营里的一员。Hadoop生态圈也是很健壮,全部是以动植物命名的,可以完全进入一个像公园的地方。但是你把生态圈划分板块的话,数据源,数据的接入,数据的处理跟数据使用的板块。


现在讲一下智慧园区的大数据。站在我做数据的人来看园区,最重要的无非是物业与服务,有物理空间,基础网络、IT,云计算,车辆管理,也有企业的人才,从原则上讲,这些全部应该是围绕着企业来做的,企业是核心。从这个数据上看,以企业为核心,它的这些数据实际上是园区可以去收集获得,包括企业的商业模式,用水用电,现在企业的用水用电,我在帮园区看它的数据做征信,比如说这个园区不付钱跑了,你通过用水电知道是不是跑了,水电是不是没有用了,园区业绩已经在不断的下滑。人才、门禁、技术、办公、物业、访客这些数据从各个数据的角度是可以用来分析一家企业,但是这个是从数据上来看园区。


从大数据的策略上看园区的话,我觉得是三方面的策略。一个是园区自身是不是有大数据,我们拿来做分析。第二是能不能用园区之外的大数据来为园区服务,园区也说,我怎么参与到大数据的策略。我们如何服务于园区的企业,让他们提升自己的竞争力。


比如说园区自身的大数据分析,一个园区的管理是不是能够进行量化评估,视频图像的分析在车辆管理方面是要用到大数据的各项技术。运营的优化这一块也比较重要,包括智能楼宇,你说我观察他的水电也好,生态也好,包括我在做云计算的中心,我的资源配置也好,我的策略也好,这个也是有运营优化。



对于企业来讲,我可以去评估它的增长,但是也可以去大数据服务园区,这也是值得园区去思考,因为园区肯定是希望里面的企业是有竞争力,并且能够对人才的分析、品牌口碑的分析,帮他去查询这些招投标的信息,为他服务,这都是可以去作为园区去考虑。

再一个就是作为园区,我们所谓的云平台,咱们能不能为园区提供强大的信息平台,包括大数据的平台,商业智能、数据挖掘的工具、爬虫、数据员、数据共享的平台,如果说企业有了这些工具,对他们开展大数据创新型发展,他们觉得很有用,这个我觉得是一个可以去思索的地方。


下面我讲讲大数据的机制体现,大数据的行业应用很广,哪个行业能没有数据,但是除了行业以外,大数据有很多的商业场景。这个商业场景就好比说,你没有做过这个行业,你不行,但是实际上很多行业的商业场景是相通的,是不是要去为咱们的数据建立数据服务,咱们是不是要去给客户做客户画像,是不是要做数据库之间的互联互通,这些都是很重要的商业场景。


而且大数据的切入点,通常出来大数据的人觉得很可怕,我现在已经运营了几十年的业务系统,你忽然给我上大数据,你把我的老系统干到哪里去?这个不用太过操心,因为我们一般来讲,大数据的切入点都是一个辅助的决策系统,原有的信息系统会进行持续服务,但是我们把大数据定位在辅助的决策上。



大数据的价值体现,比如说咱们做客户分析,这也是大数据蓬勃发展,百度、谷歌最重要的一点,精准定位也是我们抱怨最多的,因为客户来搜集我的资料,我去了哪个网页,买了什么,他都知道。但是客户分析并不是唯一的地方,咱们还有数据服务,智能决策,运营的优化,数据仓库的问题,这个要取决于这个大数据的定位。你是要通过大数据系统,你是要对外扩张还是对内对外优化,你的销售,你的服务,还是说你要做营销,对内你要做优化,你要做决策,还是说你要定位自己是服务或是决策,这就要看你做一个大数据项目是怎么样定位。


大数据最后会形成小数据,为什么?你通过原始数据到互联互通到预测,但是它的价值是在不断的提升。大数据的机器学习是件很可怕的事,我们在做广东省信息中心的政务服务的时候,他们也在规划新的信息系统,说你把业务梳理一遍,全部通过积极学习梳理出来一个数据库,为什么要做这个事,因为你把这些东西形成数据库以后,以后回去办业务的时候不需要人了,机器就可以帮你办了,机器库形成了以后,你处理各种事件,你有了这些材料下一步应该怎么办,机器人都会了。所以这会是很可怕的事件,也不是说可怕,机器会慢慢取代人在很多的岗位上。


大数据离不开数据,很多领导一上来说大数据项目,说大数据能给我带来什么好处。很可能还要考虑到一点就是,当咱们没有把数据都作为资产管理起来的时候,你再去说这个价值,那都是不现实的。第一步,你的数据好好管理了没有?这个都没有管理起来,你再去说价值,一定是一个不系统的,有可能你在单点找到价值点,但是长久也没有用。也就是说,今天大部分情况,企业也好,政府也好,我们遇到的都是相当于一个数据沼泽地。



所以咱们的趋势在大数据的策略,一定是建立一个数据湖。在数据湖里,通过Hadoop来支撑建立原始数据的沙盘,包括元数据目录、血统、生命周期等,在这个沙盘上建立数据库科学空间。在数据服务上,形成了数据四大方面,包括它的管理、安全、整理、分析,只有这样,把数据资产按照这四个方面你去管起来,你就会说这个地方咱们真正上到技术贡献,去实现数据的价值。谢谢大家!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多