最近在研究大数据和机器学习,国内关于这个方面的图书汗牛充栋,但真正值得看的没几本。春节假期我读了刘新海博士的《征信与大数据》、李杰教授的《工业大数据》,推荐同好者研读。 点击加载图片 刘新海博士在《征信与大数据》里对美国的征信体系进行了比较详细的介绍,全书三部分,第一部分介绍了美国三大征信机构以及其他征信类企业,第二部分介绍了美国以信用评分为代表的征信应用模式,第三部分介绍了互联网大数据征信的机遇与挑战。从知识性的角度看,这本书从美国征信的起源一直介绍到阿里巴巴的芝麻信用等互联网大数据征信的应用,能够对征信业有个全局性的了解。对于征信应用场景的介绍,让我想起很多汽车业的潜在应用。征信本质上是要解决信息不对称问题,它的确不是万能的,但采取类似征信的办法,能够解决汽车行业的诸多行业问题。最近一年区块链成为热点,理论上区块链能够彻底解决征信难题,但考虑到区块链技术本身对信息公开的要求远远超越这个时代,我们未来几年应该都不用考虑区块链颠覆现有的征信技术,大数据征信仍然会是优先需要考虑的技术。 点击加载图片 李杰教授的《工业大数据》是难得的一本深刻阐述了互联网大数据和工业大数据应用的差异。目前比较热的大数据概念都源自互联网大数据,互联网大数据对数据质量要求不高,对结果的准确性要求业不高,研究数据之间的统计相关性。而工业大数据分析对数据质量要求很高,对结果的准确性要求业很高,主要借助跨学科的技术融合获得数据之间的逻辑关系。作者在书中提出:如果要建立工业大数据应用,创造新价值,需要产业链相关企业能够建立一个智能信息同盟,将各自数据交由一个熟悉产业链各环节的机构,这个机构不参与企业实体运营,专注信息服务体系建设。这个机构在产业链数据基础上,给用户提供定制化的信息服务产品,这类产品可以分享,而企业基于这些产品进行价值挖掘,这类产品不共享。去年底我们建立的汽车联网产品认证联盟,正是致力于实现这个目标,我相信这代表了未来汽车产业的大数据应用模式。 从汽车行业看,要实现工业4.0时代的转型和价值创新,第一要实现全价值的在线化,不仅生产过程、供应链要联网智能化,产品本身也需要联网化,这样才能实现终端具备联网智能,才能形成数据流。实现车间和产品联网,在中国并不容易实现,汽车联网产品认证联盟2017年的工作目标就是要推动中国汽车的联网化早日实现。 点击加载图片 第二要建立大数据分析能力。过去很多年,国内整车企业采用粗放式经营仍然取得了很好的业绩,接下来这种粗放式拍脑袋决策模式是否能够持续不得而知,但显而易见的是,行业外部数据的匮乏是关键。内部数据的挖掘利用也没有得到重视,对国内车企而言,不要说工业大数据,即使是阿里、腾讯已经实用化的互联网大数据的落地应用——精准广告,也仍然没有形成共识。当然,这里面有用户画像、精准广告本身缺乏历史数据难以进行机器学习的问题,但更大的问题是决策者本身缺乏这个领域的知识,保持原状反而更安全。 第三是建立大数据决策平台。目前美国GE的Predix作为工业大数据分析平台正在迈向分析技术通用化,李杰教授基于NI Labview研发的Watchdog Agent系统是另一种通用分析工具。但国内汽车行业眼下需要的不是这类大而全的分析工具,需要首先让汽车行业管理层建立基于数据分析的决策思维模式。 点击加载图片 我认为当下需要先建立汽车大数据人才培养体系,没有行业科普,这类新技术很难应用。而大数据技术离不开机器学习,如果作为汽车行业的决策者没有大数据技术通识,无论经理层和外部技术供应商如何努力,汽车行业始终保持数据离线,无论如何都不可能建立工业大数据分析体系。BAT已经在利用大数据技术进行的市场营销正在汽车行业进行科普,这本质上是一种征信技术的应用场景,目前看,如果没有这个应用场景的教育,整个产业很难形成闭环生态,最终基于大数据技术的用户画像和精准营销都会成为笑谈。 我相信接下来汽车行业的先知先觉者会达成共识,整个行业共建信息服务联盟,通过跨领域共享一些数据完成基础信息服务平台建设,否则任何单一厂商都无法自建完整的数据连接、分析和决策系统。汽车行业关于材料、机器设备、工艺、测试、维护的方法已经足够,缺乏的是基于这些方法的数据积累和模型化,这才是真正的产业智慧。在这些智慧的基础上,才能建立连接、云计算、虚拟网络、数据、社群和定制化服务体系。前者是看得到的,有限的,后者才是具备无限价值想象空间的转型目标。 |
|