分享

大数据的商机

 Lion3158 2015-07-24

随着大数据产业的发展,数据作为资产的属性日益明显,并且已经形成了数据银行的需求和环境。本周三,创新微课堂探讨了大数据时代的新思维之人工智能、众包模式和数据市场。


演讲人/齐红威(数据堂(北京)科技股份有限公司创始人、CEO


大数据很火,今天我们聊聊其中能产生商业机会的人工智能、众包模式和数据银行。

人工智能


人工智能这几年商业化较快,2001年人工智能还在实验室,这几年智能化技术在普遍应用,是能颠覆传统产业的。比如苹果手机上的Siri,就是典型的人工智能在语音领域的应用。


现在的大数据和以前的海量数据到底有何区别?现在80%的数据是以语音、视频、图像等非结构化数据的形式存在的,即机器无法理解,只有人才能处理的。在面对这些语音、视频、图像的时候我们要先把它进行结构化处理,变成机器能够读懂的东西。这时人工智能的需求就产生了。



语音识别


国内语音识别产业是SIRI带动的。语音成为好多产品入口级的东西。不方便打字时,我们用语音指令代替敲文字。


比如语音助手,说一段话它帮你转换成文本发出去。还有语音车载,导航需要输入目的地用的也是语音指令。再比如家电遥控,整个遥控器只有一个按钮,按下以后使用语音提示。


不久的将来还会有语音客服,用机器来替代人工,后台为我们服务的将会是机器。目前有些服务商提供的服务已经是半人工的,比如银行、移动客服,有“集团客户请拨1,个人客户请拨2”的简单路由。


再有,现在机场、地铁、车站语音播报和导航播报其实不是人,是机器在说。


随着识别精度的提高,语音将成为标配和入口,谁抢占语音入口就等于抢占了一个通道。当然识别技术门槛很高,一般的公司做不了,百度目前提供了百度语音开放平台,将来可以通过语音指令在PC端和手机端做搜索、查天气、订酒店等一系列动作,也就是只要通过语音,都要从它这里过一下。未来三五年,大家会突然发现语音已经是类似现在敲文字一样非常标配的东西。


语音识别要做好三点:语音识别——语音转成文本;理解意图——文本里什么意思;语音合成——把文字转化成人的声音发出来。


图像、视频识别



考勤刷脸是通过人脸识别。商场门口的摄像头从单纯数人头,数人流,正在发展为数男性、女性、大人、小孩,做精准的商场人群判断。路边橱窗里放展品,广场大屏幕放广告,电梯间里做宣传,怎样确定受关注程度?可以通过在附近设置摄像头来分析路人的兴趣程度,如果扭头看,就是有关注。


现在建设信用社会,在银行、券商开户以前需要本人到场,以后远程开户就可以解决。通过视频软件远程甄别身份,这靠的是人脸识别技术,背后是公安局里13亿人身份证的照片库。


大家去机场,工作人员拿着登机牌和身份证上下打量你,比对是不是本人,既耽误时间乘客体验又不好。这个过程能够改善,通过现场摄像头拍照片,在很短的时间内电子识别是不是本人。


我国各个角落都有摄像头,可以用来做嫌疑人的识别。现在找嫌疑人需要好多民警盯着屏幕看完整个视频,将来换上高清摄像头,加上识别技术,能够过滤一半以上明显不是嫌疑人的人,可以减少一半警力投入。


手机端的图像运用也有许多公司在做,比如在路上或者橱窗里看到喜欢的衣服想要查找,无论在淘宝还是京东都要输入关键词,这个关键词不好描述。现在只要拍照片,通过技术识别款式,直接与库里比对来找。


总结来说,人工智能是大数据的核心技术,因此蕴含着巨大的商机。


众包模式


以前公司做业务全靠自己养的各类人才,成本很高,现在出现了众包模式,类似于众筹,能发挥企业外更多人的力量。


百度地图实时路况就是典型。最初与出租车合作,通过实时分析车速和车的位置来判断路段拥堵程度,但是出租车数量有限并不准确,现在启用众包模式,当用户使用百度地图时,也成为数据的提供者,大众参与贡献路段数据,使得精准度提高到几十米。


大众使用地图导航是免费的,当到达目的地,应用会提示附近的餐饮店、加油站等,对这些餐饮店、加油站是收费的。这是百度地图的商业模式。


再比如城市优化要采集空气质量信息我们做空气质量采集的盒子,挂在出租车上,找到需要采集的数据。这也是众包模式。


还有公司通过众包采集超市和批发市场的价格数据,要求众客拍摄超市小票,上面记载着产品数量、价格、购物时间等一系列信息。如果做到全国范围,能清楚分析线下用户喜好和商品价格。


这个数据价值很大。政府CPI部门、期货交易商、线下卖方、商品生产企业都会花大价钱去买这个数据。比如沃尔玛现在是用几百万雇人去抄竞争对手的价格数据,这样抄下来的只是价格,而众包采集到的数据不仅更准确,还包括购买关联,购买数量等更全面的信息。


美国东西海岸有几小时时差,沃尔玛有几千家门店,他们用大数据的理念去做交易数据的即时分析,西边的店根据东边店的销售情况选择货物的摆架位置,从而提高销售额。


再比如末端配送公司揽收最后一公里业务,比如顺丰给我1块钱,我帮你送最后一公里,这个本身不赚钱,实际拿的是客户的个性化信息,这些数据可以拿来做好O2O服务。


数据市场


数据堂的核心业务是数据银行。我们都明白,数据是资产化的,和石油一样是各行业想要的资源,想做服务就要和数据合作。


数据是什么?数据是原材料,有原生价值,可以直接卖掉。数据是原油,有衍生价值,在原始数据上做分析,能卖分析结果。比如体检公司有大众的健康数据,经过分析做出如“北京白领健康情况如何”等的主题报告,保险公司、医药厂商都会愿意买这些数据。数据是资产,有初次和再利用价值,数据可以多次使用和无限再生。数据是货币,具有交易价值。


做数据未来可以做到千亿级别的公司。数据堂做数据银行,通过把手上的数据加工为标准化产品,对接给有需求的客户。我们手上有以下五类数据:


做这个事情我们是有牌照的,在运用数据时,不会直接出具数据的内容,会依法依规进行数据处理。


数据堂数据来源有几种方式,通过众包采集线下大数据,通过采购和代理采集行业大数据,通过数据爬虫采集线上大数据,通过政府合作采集政府大数据。经过数据处理,我们把标准数据提供给客户,客户做应用可以到我这里付费查询。


点击下方阅读原文查看亮闪闪的研习社第三季度超级课程表(含入社通道)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多