智能的本质：从工程师的角度看

翠竹明月 2018-03-31

展开全文

人工智能有很多流派、各种说法和定义。早在几十年前，人们就把人工智能分成三个学派，分别称为符号主义、连接主义和行为主义。除此之外，还有各种不同的定义。学派和定义多了会把人搞糊涂，就要对概念本身做点思考。

我们要问：为什么这样划分学派、为什么没有其他学派？对此，钟信义先生从一个角度有点意思：他认为这三个学派其实都是模拟：模拟神经结构、大脑功能和动物行为。这个分类的视角很有启发性——三个学派其实是三个层次。

从工程师的角度讲，我们研究智能是有目的的：是为了应用、而不是玄乎的概念。古人讲究“知行合一”，就是“脑体的有效协同”、就是在行动总体现智能。所以，单纯从理念上说，“行为主义”是站在了智能概念的制高点上。但是，理念落地的时候会遇到一些困难，其中有些困难需要用模拟人的大脑功能来解决——这就是“符号主义”。但符号主义仍然有些问题难以解决。于是，学者们想到模拟大脑的结构，这就是“连接主义”。这大体就是三个学派的关系。由此可见，另外两个学派解决的主要是概念落地时面临的部分问题——所以，识别这两个学派时，不仅考虑目的还附带手段。换句话说：很多标准算法即便可以解决同样的问题，也往往不算作人工智能的范畴。

下面再详细地分析一下各个学派的关系。模拟智能行为的一个重要问题是如何决策。这是任何智能系统都不可避免的问题，行为主义也不例外。长期以来，行为主义（也就是控制论学派）是应用最广泛、影响力最大的一个学派，其影响力甚至远远超出了“人工智能”学科本身。究其原因是：该学派能够针对一类相当广泛的实际问题，找到一般性的解决方法。这就是反馈控制理论（经典控制论）和现代控制理论的内容。

但是，这两项控制论是有很大局限性的。现实中最主要的局限性是对象模型一般要用常微分方程组来描述——这种对象适合于动态系统的变化范围不大的情况，其控制器可以用电感、电阻和电容等电子线路来搭建。在控制论刚刚出现时（甚至在我读大学时），这都是一个极大的优势：可以落地。

但无论如何，这种模型是有局限性的，难以用于复杂非线性、离散或者混杂系统。对于复杂的系统，其实也有一般性的解决方法：数学模型——因为几乎任何对象都可以建立数学模型。数学模型有这么大的好处，但也有不足：其广泛应用要等到计算机性能足够好以后才逐步步入历史舞台，否则就会受到极大的约束——20年前我刚到宝钢时，就能体会到这种约束、稍微复杂一点就不能实时计算。现在，这个约束没有了，CPS就呼之欲出了。CPS之所以受到重视，就是因为这种技术具备高度的一般性、能解决各种问题。现在成为热点的原因是计算、存储、传输数据的能力不再是瓶颈，其价值就会被释放出来——此外，我常常强调问题的另外一面：广泛应用的另外一个条件是实际问题需要足够的复杂才行，否则就是“高射炮打蚊子”，没有多大必要性。而智能制造和工业互联网的应用，恰恰就让这种必要性体现出来了。这就是我常说的：要想雪中送炭，也得先有下雪的地方。

说数学模型是一种一般性办法，是指它有能力为所有对象建模。但在实际应用过程中，数学模型却不是那么容易建的——不像常微分方程组那样有成熟的、一般性的办法。实际操作的时候可谓“八仙过海各显神通”。而逻辑规则就是一种简单而常用的模型，很多决策可以用逻辑规则来解决。在写程序的时候，往往就是用IF语句这类土办法来解决的。如果这种逻辑关系简单，理论上也就没什么好研究的了。学者们总要找一些难题来解决——如何解决复杂推理问题。为此，若干年前出现了Prolog和LISP语言，相关理论也就被称作人工智能或专家系统，也就是所谓的“符号学派”或“计算机学派”。从本质上说，这些系统就是逻辑推理复杂了一点，和多用几条IF语句没有多大区别。所以，若干年前就有人用把有三条IF语句的算法成为“智能控制”——道理是对的，大家笑话他的原因是有点夸张。

我曾经很奇怪：符号学派为什么没有发展起来。后来意识到，一个重要的原因是：对于具体问题，人们完全可以用普通的计算机语言来编程序、具体问题具体分析，没有必要绕个大弯子。也就是说，合适的应用场景少了：你是想“雪中送炭”，怎耐没有下雪的地方。

讲到这里大家应该明白：符号学派是当初是解决相对复杂的、传统控制论方法难以解决的决策推理才提出来的——如果太简单了也就没有必要了。同样，连接学派是因为符号学派解决不了的问题才提出来的。我们知道：人的很多知识是感性认识，很难表达出来、自然也就很难编码。比如，“张三很漂亮”、“衡水老白干好喝”、“这是一棵樟树”、“这步棋很重要”。这些感觉性的东西都是很难用编码的办法表达的。于是，才有了“连接学派”的用武之地——其特点就是机器自己学习。机器学习会遇到新的问题：有没有条件学好、如何学好？其实，大数据解决了有没有条件学好的问题、深度学习解决了如何学好的问题。

从我们工程师的角度看，我们做事是为了解决问题的。什么办法最好用就用什么办法。比如，我们造飞机是为了起飞、需要模仿飞鸟。但是，飞机却没有模仿鸟类扑扇翅膀。所以，模仿是为了追求目标的搭成，而未必是手段的一模一样。这样看来，三个学派的关系就清晰了：模拟神经元的结构是为了模仿大脑的功能，但实现大脑的推理过程未必需要神经元这种结构。同样，实现人或动物的行为，未必需要模仿大脑的复杂功能。所以，行为学派是最本质的——虽然从算法的角度看，似乎不太怎么像“智能”。提到ArtificialIntelligent时，人们常常并不包括控制论学派、而是主要针对另外两个学派——这是从学问角度看问题，而不是从解决问题的角度看问题。但智能制造、CPS的很多理念，就是从控制论学派发展而来的。

我一直认为，智能与工业界的结合，多数情况下并不是现在流行的人工智能（即与深度学习相关的智能），而是用计算机代码写出来，形象地说就是“用N条IF语句”或者是我常说的“吴淑珍式的智能”。人们过去并非不知道这么做，而是问题不够复杂。是智能制造的复杂性逼迫人们把自己的做法告诉计算机，让机器快速决策，也就是必要性增加了。这个道理我说过很多次了：人在制造环节中最重要的要求是规范化、而不是自由发挥，关键就是要说明白在什么条件下怎么做。

当然，现在流行的人工智能当然也有用，主要用于产品质量的检测（主要是图像）、设备诊断和服务等场合，而不是生产制造的控制环节。

很多人认为，“通过模仿结构实现模仿功能、再模仿功能”是一条不错的路子。所以，科学院的很多人花了很大力气去研究人的大脑。这种事科学家可以做，企业不能做：投入产出不合算。对企业来说，就是要用最有效的办法解决问题。比如，如果人的知识能够通过代码写下来，就不一定要让机器去自己学习。

我们再把眼光放大一点：智能就一定要模拟人脑吗？也不一定。因为计算机处理信息的方式和人不一样，为了达到智能的目的，不一定要模拟人的思维方式。计算机的存储和运算能力是人类不能比的，对人来说的很多“笨办法”可以被计算机运用得出神入化——在我看来，大数据就是一种不同于人类常规思维方式的智能。我把大数据的思维方式提炼为：把成功或者失败的案例记下来，跟着学（避免）就是了。显然，当数据量非常大的时候，人类的大脑是不可能记住这么多案例的。换句话说，智能不一定模仿人的思维方式。

走向智能从书的编委们曾经一起写过一本《三体智能革命》的书。在这本书中，我们用20字箴言来描述智能：状态感知、实时分析、自主决策、精准执行、学习提升。这20个字是从功能模拟为出发点，解析出对功能的需求，并不受限与具体的结构和功能模拟方法：因为我们的目的是应用，何必被手段来束缚呢？

按照学术界的观点，智能是用来处理复杂问题的、处理普通算法无法解决的问题。否则就不要叫人工智能了。从这个角度看问题，有人提出了对智能的一种观点：智能是在巨大的搜索空间中迅速找到较优解的能力。显然，人工智能的两个主要学派常常是具有这个能力的。我们注意到：不论是图像、语音识别还是阿尔法狗下棋，都需要“在巨大的搜索空间中迅速找到较优解的能力”。事实上，谷歌公司在成立之初，就把自己定位为人工智能公司——或许就是借鉴了这种定义。从某种意义上说，这是从大脑的“行为”来定义智能的。大数据的很多算法，就符合这种定义。

最后讨论一个问题：智能为什么重要？我有个观点，可以与ICT技术起来说：

互联网为什么重要？因为互联网可以让我们离开物理空间——通过控制Cyber空间，来控制物理空间。

智能为什么重要？因为智能可以让我们离开Cyber空间，让计算机做得更好、让人去做更重要的事情。

大数据为什么重要？因为能够保证以上两点的落地。

对于我们工程师来说，不论办法土不土，达到目的就好；特别地，不要把问题想得太玄了。想得太玄、把自己下着了，就做不成事了。