分享

谈谈人工智能

 yi321yi 2019-03-10

自2016 AlphaGo 围棋战后,人工智能是确实被点燃起来了。

这是一张来自IT桔子的投资数据,可以看到投资的金额是在逐年递增,整个人工智能行业越来越火热,需求的岗位也越来越多。所以先从技术的角度聊聊什么目前人工智能是怎样的。前方会有大量理论知识,可以选择性跳过。

在过去人工智能主流是符号主义学派,他们认为人工智能是建立在数理逻辑为基础的。典型的就是我们编程出来的软件,就是被认为是带有智能,只是这个智能比较低级。所以人工智能其实没那么玄,不过确实被过去的一些电影作品,文学作品所夸大了

我们先聊聊人类智能是构成。人类的智能是通过神经系统感知,传递,存储,加工,最后做出反应。人通过身上的大量的感觉神经元,感知外界信息,转换成信号传送到大脑,然后通过大脑进行加工整合成立体的印象。比如大脑整合苹果的颜色属性(如红色)和形状属性(如圆形),得到苹果就是圆形红色的结论。

目前的主流的人工智能流派是连接主义,连接主义学派是仿生的学派。用工程技术的手段模拟人脑的神经系统的结构和功能,通过大量的处理器模拟人脑的众多神经元,用处理器复杂的连接关系模拟人脑中神经元之间的突触行为,用大量知识,经验进行学习,构建出智能。这就是目前的人工智能。

机器学习是人工智能的重要研究方向之一,通过线性代数(集合,向量,矩阵)来描述特征形成数据,以这些数据构建起概率统计模型,同时运用模型对事情预测分析,目的是为了解决问题。其实就是我们在大学里的数学建模嘛。

机器学习的预测结果并不一定准确,因为

一任何算法预测出结果与所有训练数据结果难以丝毫不差。

二训练数据与真实数据相比是不完全的,而且会有噪音的存在。

因此在机器学习中误差难以避免的。典型的问题就是过拟合(过度的贴近训练数据的结果)和欠拟合(未能学习训练数据中的关系)。一般欠拟合可以更换学习算法进行改进,但过拟合是不可避免的。所以在没有遇见过的样本的表现(泛化能力)是重要指标之一。

为了降低误差,人工神经网络出现了。大脑对信息的加工是复杂的多次的处理。人工神经网络其实就是模拟大脑对信息的处理,对信息的多层次的处理,通过权重的控制,不同特征的提取,降低误差,让模型的表现优异。深度学习其实就是人工神经网络的加强版,多加几层,利用逼近定理让精度更高一些。不过深度学习还缺少缺乏一些理论基础,比较前沿,有待验证,尽管已经取得不少结果。

训练的数据带结果的,叫监督学习。训练的不带结果的,更多是为了把训练数据进行分类,叫无监督学习。各带一半的,叫半监督学习。目前监督学习是机器学习的主流任务。

因此机器学习日常要解决的问题。

一解决误差问题。(贝叶斯公式,线性回归,决策树,交叉验证,集成学习等等)

二数据问题,如噪音,数据过多,过少等。(数据剪裁,数据分类等等)

三性能问题,一个神经网络可能会包含上100个参数,每个参数包含有上100种取值。所以需要调参,进行一个误差与效率的折中。

恭喜理论知识到此结束,然后我们聊聊我的看法和商业应用。

上面有说到,目前计算机的运算能力依然是机器学习发展瓶颈,所以定制芯片是解决这个问题的解决方案之一。

目前谷歌的tensorflow是主流的机器学习的框架。我看了一些封装了各种模型调用就行。但机器学习需要的人是理论基础比较好的,数学基础比较好的,编程只是一种手段,不需要过于精通

然后到应用层,图像识别,语音处理,文字处理等等这些是应用的基础层,之前理论说到的感知。应用方面会有几个大方面

一决策类。像自动驾驶,智能投放系统,量化交易等等。不过之前的理论有说到过,机器学习是会有误差的,但人的操作也会有误差,但机器学习的误差会来得更低一些,发挥也会更稳定一些,所以会优于人工。或者是一些辅助决策类。

二替代低端劳动力类。像一些扫地机器人,无人港口,智能客服等等。大幅度的替代传统人力,生产无人化。

三定制化的服务类。像推荐系统,智能老师等等。机器学习能计算出一些人类难以手工计算的复杂度异常高问题,提出多种的解决方案。定制化的服务就是属于此类,由标准化与差异化组成。人工是难以做到千人千面,但机器能轻松做到。

人工智能的本身其实是不产生价值的,更多是处于优化环节,在商业链条上不占据位置的,价值是在于效率优化,这价值要能支撑得起高昂的人才成本。当然也有可能在改造的过程中,造成一些定式的打破,产生新的需求。我认为这波人工智能热潮的红利应该是传统行业,传统行业大部分核心业务仍需要靠人力辅助来完成,因为机器替代人工的这个效能是能达到10倍以上,这将会是最大的红利。上面也说到其实机器学习的人才的需求是比较高端的,所以人力的成本会很高。没有足够的势能差是难以推动。互联网其实已经经历过改造,核心的业务其实都已经由机器所替代

当然机器学习并不是万能的,有要求的

一问题足够复杂,因为简单的用不上

二问题的结果并不是由随机,是由轨迹可循的。

三可训练的数据能量化(外貌是能量化,但世界观,文化是难以量化)且数据数量足够多

四世界是变化的,短期的,变动不太大的,或者周期性变化的领域。

五场景相对小,运算力还难以支持起巨大的场景。

六创意类,机器学习是本质上是归纳整理,是需要新的数据,才能产生新结论。

七机器学习是会犯错,不能是在一些犯错会造成严重后果的领域。所以核导弹还是需要人来控制。

以上是我对人工智能的见解。毕竟我不是从业人士,只是出于技术人对技术好奇,花两周时间的学习,了解了这是什么东西,所以如有错漏,欢迎批评指正。本公众号有本人的联系方式。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多