大数据分析是项目还是工具? 文/张礼立
“大数据不仅仅是大量的数据”这句话里面包含了多重涵义。 当代大数据处理技术的价值在于技术进步,同时也是技术进步,使大数据成为商业中有价值的核心驱动因素。作为智能制造的三驾马车之一,工业大数据已经被多数的制造企业所认知并接受。许多制造业企业认为自己在生产运营方面也累积了大量的数据,是时候可以用到大数据了。 的确,一个制造型企业,几十年的经营操作下来,确实纪录了不少的数据。这些纪录的数据是大数据么?对于许多制造厂商或资产密集型企业而言,工业大数据是什么,到底有什么用,以及相关的预测性分析是什么且有什么用都是一系列需要明确的问题。
数据类型的多样性是大数据的重要属性
大数据不仅仅是大量的数据的堆积。大数据的重要属性之一,便是,人们设法收集,并弄清楚,不断变化的数据类型。如果只是大量采集同一类型的数据的话,再大的数据量都不能称之为大数据。 在流程繁重,工艺制造要求非常严格的制造环境中,在全制造范围内,从原材料,设计,制造,销售与物流的全制造链来看,踏踏实实地收集并存储海量的流程变量或标签,一定是正确的,也是必要的。 但是,如果收集来的大量数据,如果本质上相同的数据话,那并不等于拥有大数据。例如,生产环境中收集的时间序列模拟流程变量,数据的类型是单一的,很容易建立索引,即使存在千千万万,也不足以成为大数据。
数据必须包括高度可变性和种类多样性 制造工厂中存在无数的大数据应用,但并不包括简单地分类和展示一连串的流程测量结果,这些工作基本的统计展现就可以完成。一些大数据数据库或数据湖的构成部分数据类型也是文本信息、图像数据、地理或地质信息和非结构信息,例如,通过社交媒体或其他协作平台获得的数据类型。
资产性能管理(APM)就是工业大数据应用的一个绝佳的案例。要了解资产的性能,我们除了要纪记录在生产运营中的数据,还需要收集并检测无数的不同数据类型,确定各个数据类型之间的联系并对其进行分析。在性能管理过程中,企业能够解读数据并提供新的任何单一数据流都不包含的信息。这基本体现了大数据的复杂性、高速性和高度可变性。
企业自身要培养大数据专家
作为一个行业,我们需要有机地发展行业特定的大数据分析工具集,这样我们才能让现在的行业专家,从足够的数据科学中实现数字化转型,反之则不然。为了形成这种态势,我们将需有一大批优秀的企业利用这种方法,并向其他人或同行证明其价值。 正如六西格玛管理技能不是由技术和咨询公司出售给该行业的,而是由领先的公司(GE)开发并向全球进行推广的。我提倡工业大数据分析应用的推动与发展也可以借鉴并采用类似的方法。 美国硅谷的Cisco (思科)作为网络设备与解决方案的巨头,仅仅在供应链环节,现在就拥有近80名数据科学家。而这些数据科学家都是通过两年的内部训练项目成长起来的。类似Cisco的做法现在越来越成为趋势,其主要的原因是因为团队已开始提供强大的投资回报(ROI)。 中国的制造业企业为了成功实践智能制造,要通过组织培养自己的数据科学团队,行业领先的企业需要扩大合作,努力做到以下四点:
|
|