工业大数据既有发散的机会,又有收敛的技术。这两个工具可能用得一样,但是目的绝对不一样。首先介绍一下工业大数据,然后人工智能和CPS会连在一起跟大家分享。 工业大数据 在美国七年,IMS中心是2000年建立的,我从做发动机,电梯,空调,然后再回到学校当教授做大数据,目前全球有90多个企业伙伴,比如说像三菱电机、华为、中传、重车高铁、三一重工等等。我们花了15年时间写出来的这本《工业大数据》,根本没有想过要写这本书,很多企业说你把他它整理出来,所以这本书是2015年在通用电气公司发表的,基本上把过去15年做的方法、思维逻辑可以传承的东西留下来了,里边还有一些案例。从大数据到人工智能,因为国家推出制造,这本书讲了很多智能制造的案例,比如半导体、汽车、发动机、机器人等都用最新的方法解决过去人还不能解决的问题。 《新一代工业智能》2017年新出版的,CPS就是未来的智能系统不停留在传感器或者软件。它是一个管理系统,汽车跑的时候碰到一个坑,下次开这个路一公里前会告诉你这个路有一个坑,然后把这个再分享给别人,别的车就知道这条路有一个坑。比如说可以省很多油钱,开车气压不稳,你不知不觉每天就浪费五块钱,一个月浪费一百五十块钱,一年就浪费了一千多块钱,那么你完全不知道,这时CPS会告诉你。 现在我们在做的工业大数据,基本上是围绕工业问题,污染、效率、质量、生产过剩。这些问题给了我们很多知识经验,所以数据的做法就是把这些问题的原因和参考性找到,最后产生价值。工业大数据常常讲一句话,就是经验到事实,就是我可以把人的经验变成可以用数学或者数据的结果来证明的确可以这样做。做产品的企业比较喜欢集中在产品上,也就是“蛋黄”,发动机起飞之后,很多的“蛋白”数据就出来了,“蛋白”数据可以拿来分析,可以找到飞机起飞、落地的原因,它和空气湿度有关系,和风向有关系,所以从起飞、飞航、落地三个阶段做归类,是做维护还是做安全检查,这样就分开了,所以数据的分类、分割、分享等都可以做好。 2006年小松智能维护大数据,但是数据量太大,量大不是问题,重点是没有把数据传出去,你要把数据先分类、分割、分解之后再传出去做分析,不要所有的传上去做梳理,这个很累的。所以我们利用蛋黄、蛋白观念挖掘数据,所以我们把经验累积起来。还有把工地建模起来,工地建模扫描之后,一个晚上就把工地挖完了,这就是智能化。 轮胎也是如此,轮胎压力不一样,跑的时候也不一样,怎么调整就不知道,你一个月多花一百美金,一年多花一万多美金,由此就可以知道哪一个轮胎不好,但是这是人根本做不到的事情,我们为什么讲这个东西?我们讲工业大数据,就是要利用很多数据资源,历史数据一定要有,传感数据要去使用它,然后再做分析方法,再找出他的原因做预防,这些是很重要的。以前是数据全部上传,这个观念也对,也不对,就看你做什么行业,比如说制造苹果手机要上云这没有什么了不起,比如高铁跑一天的数据这就是中国自己的数据,但是外国一天一截车厢数据量就要一万美金。所以关于大数据有三个基础,就是DT,PT,AT,DT叫做数据技术,PT叫做平台技术,AT叫分析技术。分析技术有两个,一个是分析的工具,另一个是分析的工艺。工具好比厨房烹饪的工具,工艺是厨师要有的,会不会做饭看厨房就知道了,但是我给你一条鱼三个人三个不同的做法,三个不同的味道,所以工具看不到的工艺可以看到,因此工具可以开源,工艺不可能开源,因为他是工匠精神。这样多的开源,我可不可以把这些做分析?谈到DT讲的三个特性,接下来的三个“B”,第一个就是数据要分裂性,很多行业数据量大但是都没有背景,所以都不能用。第二个“B”是数据的优劣性,第三个“B”是数据的背景性,所以这方面工业大数据DT不是一般人都能够做到的。 平台做出来让每个人都能用,但是必须要处理数据,第一层就是看看怎么收集数据,第二层就是数据到信息化内容转变,第三层就是虚拟网络化内容管理,第四层是对问题的识别及决策,第五层是装备的充组,它是一层一层的。比如很多数据不需要收集,直接在处理端就完成了,上云之后没有数据本质了,但是它有分析的价值,它本质不一样,云都处理好了。比如鱼处理好了,我可以一鱼三吃。所以这方面的技术你们都可以去做,但是它有一套系统哲学,咱们国内机会很多,都有很多小成功,小成功也创造了很多财富。在二十六年前我就说数据有一天可以经过一个学习软件把它分类、分割、分解、分析,然后做分享。然后就会有一个芯片出来,当做工业又不太一样,工业需要系统性,可靠性,我们开发的软件,就是飞机发动机测试,风电,高铁,还有大的发电站,还有中国电信整个的传输,我们今天谈的目的就是人工智能怎么改进工业大数据分析,这是我们今天要谈的主题。 人工智能怎么改进工业大数据分析 人工智能不能把数据智能化,但是可以把意义智能化,我在美国做的第一个人工智能,是用邮政包裹分析它,就是自动化分包裹,自动化辨别地址,不需要人来操作。后来我们把这个软件用在工业方面,我们学习软件有监督式的、非监督式的,里面有很多软件可以用,目的就是把软件工具变成让人可以看得懂的意义。 举一个例子,我们用SOM,一个分类学习的方法,它可以把很多数据一方面缩减,一方面分类、分割,如和辨别出来它是内环还是外环,就和医生听心脏声音一样,他本人听不出来,他要磁共振来辨别。所以我们可以经过这个分类找到。 CPS可以更智能化,更有管理性,CPS是实体系统和信息系统对称的系统,比如车跑的时候有一个信息管理系统可以让我们知道哪个地方风险最高,那个地方转弯经常出车祸,我还没有到,在一公里前就减速到30公里每小时,就可以保证安全。我可以对地形进行扫描,扫描之后我能知道它的位置在哪里。 数据来源有很多种,数据的关系,数据的意义,所以海上风电,当我看到这个风速在变的时候角度不一样了,所以可以根据这个把风速切割,发电量和风速、角度的关系,这个是人不可能知道的事情,当我知道以后就可以知道这个风电连续三个小时就在衰退,明天我就可以做一些事情。 动车也一样,高铁跑的时候直接就用建模分析,每个高铁数据做分析了,我就知道哪一段路不稳,未来中车要做全世界的“一带一路”规划,光有数据是不行的,没有支撑平台不行,两百公里以下的一小时中国可以做,两百公里以上的中国不能做,现在要跑460公里一小时的速度,那这就需要技术来支撑它。 2005年我们和丰田一个压缩机合作,这个压缩机轴承一年坏十几次,它在跑的时候一定要压缩,要有效率,它会产生共振,一共振就断了,这只需要三秒钟时间,所以三秒钟时间之内你要监测到地震或者海啸马上把能量释放出去就可以解决了,所以我们当时就监测它的阀门,监测到这个动作马上打开,15微妙就能够知道。做完了之后我们用123参数,这个参数完全没有用,12个参数必须找到最重要的经验,我们就用CPS分类,但是我得懂物理模型,把它的变化线分割。分割准不准会造成误差,如果按照原来的情况会有误差,但是如果分割线稍微小心一点,给你警示多一点绝对不会有故障。像这种案例,没有办法做解释,你做过了就知道了。 日产机器人健康监控,机器人自己做一个比较,我们不可能监控他,我根据运动点来做比较,做了比较之后建立一个档案,和其他人做比较,就会知道这个房间有八百人,每一桌比较一下,每一桌找好的然后再比较一下。所以不需要他是谁,不需要监控,就是不需要数据量,但是需要它的差异化和特性。我们在加拿大厂做了实际生产,去年11月20号很快抓到两个机器人在变化,三天前就知道故障了,顾客一句话都不说,让我们赶快做。 中国并不是把过剩的东西送去“一带一路”沿线国家,早期是因为东西做得很多,过剩了,水缸满了,挖一条沟让水出去,这叫“一带一路”,其实并不是这样,所以要把架子和系统工程带出去。智慧海洋我们之前做的,海洋里面有一个海,系统,它动的时候就有风浪,有天气,每个小时都在变,因此把它变成智能化系统保障服务,就是利用建模让你能够省油。所以就有很多大数据在北京,对每个船航运路线,性能、操作进行监控,工具怎么使用可以每天做分析,分析后对每一条船都会很了解,这个船在动可以监控它的角度,浪是多大,风是多大,阻力是多大,每7—10年可以让顾客买一条新船,这种就是“”蛋黄+蛋白“”服务,让全世界的船都省油了,顾客会很高兴的交给你管。 现在我们开发的很多电讯传感器,所以我们开发了皮肤传感器,直接贴在皮肤上,你的皮肤一动我就知道力度大不大,比如腿痛,所以可以根据这个算出Z,可以放在身上找到你肌肉受伤的问题,运动员跑步过度了。这种我们可以做很多利用。 最后一个案例,是我们目前做得比较成功的案例。假如你出车祸到了医院,流血的躺在那里,通过然后呼吸机呼喊、报警,护士就叫医生过来,结果一抢救没有抢救过来,报警是要等到时间发生,假设一个人出车祸了,出车祸之后就钻一个孔进去,所以我们可以利用传感器在身上和脑的压力比较,我可以知道它的压力变化。 结论就是,大数据要的不是一个机会,做大数据要么是精密,要么是事实,要么是效益。 |
|