谈谈人工智能

yi321yi 2019-03-10

展开全文

自2016 AlphaGo 围棋战后，人工智能是确实被点燃起来了。

这是一张来自IT桔子的投资数据，可以看到投资的金额是在逐年递增，整个人工智能行业越来越火热，需求的岗位也越来越多。所以先从技术的角度聊聊什么目前人工智能是怎样的。前方会有大量理论知识，可以选择性跳过。

在过去人工智能主流是符号主义学派，他们认为人工智能是建立在数理逻辑为基础的。典型的就是我们编程出来的软件，就是被认为是带有智能，只是这个智能比较低级。所以人工智能其实没那么玄，不过确实被过去的一些电影作品，文学作品所夸大了。

我们先聊聊人类智能是构成。人类的智能是通过神经系统感知，传递，存储，加工，最后做出反应。人通过身上的大量的感觉神经元，感知外界信息，转换成信号传送到大脑，然后通过大脑进行加工整合成立体的印象。比如大脑整合苹果的颜色属性（如红色）和形状属性（如圆形），得到苹果就是圆形红色的结论。

目前的主流的人工智能流派是连接主义，连接主义学派是仿生的学派。用工程技术的手段模拟人脑的神经系统的结构和功能，通过大量的处理器模拟人脑的众多神经元，用处理器复杂的连接关系模拟人脑中神经元之间的突触行为，用大量知识，经验进行学习，构建出智能。这就是目前的人工智能。

机器学习是人工智能的重要研究方向之一，通过线性代数(集合，向量，矩阵)来描述特征形成数据，以这些数据构建起概率统计模型，同时运用模型对事情预测分析，目的是为了解决问题。其实就是我们在大学里的数学建模嘛。

机器学习的预测结果并不一定准确，因为

一任何算法预测出结果与所有训练数据结果难以丝毫不差。

二训练数据与真实数据相比是不完全的，而且会有噪音的存在。

因此在机器学习中误差难以避免的。典型的问题就是过拟合(过度的贴近训练数据的结果)和欠拟合(未能学习训练数据中的关系)。一般欠拟合可以更换学习算法进行改进，但过拟合是不可避免的。所以在没有遇见过的样本的表现(泛化能力)是重要指标之一。

为了降低误差，人工神经网络出现了。大脑对信息的加工是复杂的多次的处理。人工神经网络其实就是模拟大脑对信息的处理，对信息的多层次的处理，通过权重的控制，不同特征的提取，降低误差，让模型的表现优异。深度学习其实就是人工神经网络的加强版，多加几层，利用逼近定理让精度更高一些。不过深度学习还缺少缺乏一些理论基础，比较前沿，有待验证，尽管已经取得不少结果。

训练的数据带结果的，叫监督学习。训练的不带结果的，更多是为了把训练数据进行分类，叫无监督学习。各带一半的，叫半监督学习。目前监督学习是机器学习的主流任务。

因此机器学习日常要解决的问题。

一解决误差问题。(贝叶斯公式，线性回归，决策树，交叉验证，集成学习等等)

二数据问题，如噪音，数据过多，过少等。（数据剪裁，数据分类等等）

三性能问题，一个神经网络可能会包含上100个参数，每个参数包含有上100种取值。所以需要调参，进行一个误差与效率的折中。

恭喜理论知识到此结束，然后我们聊聊我的看法和商业应用。

上面有说到，目前计算机的运算能力依然是机器学习发展瓶颈，所以定制芯片是解决这个问题的解决方案之一。

目前谷歌的tensorflow是主流的机器学习的框架。我看了一些封装了各种模型调用就行。但机器学习需要的人是理论基础比较好的，数学基础比较好的，编程只是一种手段，不需要过于精通。

然后到应用层，图像识别，语音处理，文字处理等等这些是应用的基础层，之前理论说到的感知。应用方面会有几个大方面

一决策类。像自动驾驶，智能投放系统，量化交易等等。不过之前的理论有说到过，机器学习是会有误差的，但人的操作也会有误差，但机器学习的误差会来得更低一些，发挥也会更稳定一些，所以会优于人工。或者是一些辅助决策类。

二替代低端劳动力类。像一些扫地机器人，无人港口，智能客服等等。大幅度的替代传统人力，生产无人化。

三定制化的服务类。像推荐系统，智能老师等等。机器学习能计算出一些人类难以手工计算的复杂度异常高问题，提出多种的解决方案。定制化的服务就是属于此类，由标准化与差异化组成。人工是难以做到千人千面，但机器能轻松做到。

人工智能的本身其实是不产生价值的，更多是处于优化环节，在商业链条上不占据位置的，价值是在于效率优化，这价值要能支撑得起高昂的人才成本。当然也有可能在改造的过程中，造成一些定式的打破，产生新的需求。我认为这波人工智能热潮的红利应该是传统行业，传统行业大部分核心业务仍需要靠人力辅助来完成，因为机器替代人工的这个效能是能达到10倍以上，这将会是最大的红利。上面也说到其实机器学习的人才的需求是比较高端的，所以人力的成本会很高。没有足够的势能差是难以推动。互联网其实已经经历过改造，核心的业务其实都已经由机器所替代。

当然机器学习并不是万能的，有要求的

一问题足够复杂，因为简单的用不上

二问题的结果并不是由随机，是由轨迹可循的。

三可训练的数据能量化(外貌是能量化，但世界观，文化是难以量化)且数据数量足够多

四世界是变化的，短期的，变动不太大的，或者周期性变化的领域。

五场景相对小，运算力还难以支持起巨大的场景。

六创意类，机器学习是本质上是归纳整理，是需要新的数据，才能产生新结论。

七机器学习是会犯错，不能是在一些犯错会造成严重后果的领域。所以核导弹还是需要人来控制。

以上是我对人工智能的见解。毕竟我不是从业人士，只是出于技术人对技术好奇，花两周时间的学习，了解了这是什么东西，所以如有错漏，欢迎批评指正。本公众号有本人的联系方式。