从历史看穿人工智能的本源与未来

天承办公室 2024-05-11 发布于北京

展开全文

了解一些关键的术语，知道这个领域一些关键人物，对于再读人工智能的书或者这个领域的人写的文章，至少不再会觉得是在看天书。要了解真相，就需要从最基础的了解。最基础也是最简单的，其实是先看历史，即先看大的框架。

其实这真的是一本很枯燥的书，而且还有好多的专业理论知识很难读，最后我竟然还是读完了，为什么? 因为有些地方读着读着你会发现，有点像个小说，也有点像个哲学书

尤其讲这些人工智能领域里的泰斗们，其实都是大多都是导师与学生的关系，泰斗之间有着千丝万缕的联系，这里面的关系图谱，我觉得比红楼梦里的人物关系链了解起来难太多。什么徒子徒孙式地传承着理论思想和研究发现。学派之间也会有争斗与批判，到看到讲图灵那章的时候就更加有趣了，除了讲他的学术贡献，还有其性取向等生活风，最后再有一章跟你讲苏格拉底，跟你谈论生死。

1 知识食物链

生物学家不敢怠慢化学家，化学家不敢怠慢物理学家，物理学家不敢怠慢数学家。乔姆斯基也说过类似的话：物理不好解的问题就升级到化学，化学解不了的就再升级到生物学。在《大英百科》的Propedia卷中，知识链条依次被列为：逻辑，数学，科学，历史与人文，哲学。也就是说，数学上面是物理，再上面是化学，再上面是生物，等等。

在知识的“食物链”中，人工智能可能被视为处于一个交叉点，它既是数学和逻辑等基础学科的应用，也是生物学、物理学和化学等应用学科的工具和方法。逻辑似乎处于一切科学的底部——因为逻辑的研究探索一切事物的本质.

2 神经网络

专业解读：神经网络是一种模仿人脑工作原理的计算系统，由许多简单的单元（称为“神经元”）组成，这些单元通过连接（权重）相互作用。它可以学习从输入到输出的映射，通过调整神经元之间连接的权重来改善其性能。神经网络可以是浅层的，也可以是深层的，具体取决于它包含的层次数量。

深度学习是一种机器学习方法，特指使用深层神经网络（即含有多个隐藏层的神经网络）来学习数据的表示。深度学习通过构建复杂的、多层次的模型来捕捉数据中的高级抽象特征。

相同点：深度学习是基于神经网络的，尤其是深层神经网络。它们都依赖于数据来学习特征和任务。

区别：深度学习特指使用深层结构（多个隐藏层）的神经网络。简单的神经网络可能只有一层或几层，而深度学习网络则包含更多层，这使得深度学习能够处理更复杂的问题，学习数据中的更深层次特征。

用大白话解读：想象你有一堆乐高积木，你可以用几块积木搭建一个小房子，也可以用很多积木搭建一个大城堡。这里，乐高积木就像是神经网络中的“神经元”，小房子就像是浅层的神经网络，而大城堡就像是深度学习中的深层神经网络。

相同点：无论是搭建小房子还是大城堡，你都在用相同的乐高积木（神经元）。

区别：小房子（浅层神经网络）简单，用的积木少，只能表现基本的结构。大城堡（深度学习的深层神经网络）复杂，用的积木多，可以展现出更多细节和特色。所以，深度学习能解决更复杂的问题，就像大城堡能展示更多华丽的细节一样。

人工智能领域非常火的词儿就是“深度学习”。神经网络由一层一层的神经元构成。层数越多，就越深，所谓深度学习就是用很多层神经元构成的神经网络实现机器学习的功能。

3 自然语言处理：最早的聊天机器人

最早的人机互动的聊天机器人叫ELIZA，现在对话程序有一个更流行且形象的词儿“聊天机器人”（chatbot或chatterbot），但根儿都在ELIZA。

还有我们客服类的问答系统（Question Answering System）是一种人工智能应用，旨在直接回答用户提出的自然语言问题。问答系统的基本原理：

问题理解（Question Understanding）

这是问答系统的第一步，涉及对用户提出的问题进行解析和理解。问题理解的目标是识别问题的类型（如事实型、解释型、列表型等）、提取关键信息（如实体、属性、关系等）以及确定用户的意图。这一步骤通常使用自然语言处理（NLP）技术，如句法分析、语义角色标注和实体识别等。

知识查询（Knowledge Retrieval）

在理解了问题之后，问答系统需要从其知识库中检索相关信息。知识库可以是结构化的数据库、知识图谱或非结构化的文档集合。知识查询的过程可能涉及搜索算法、文本检索技术和语义搜索，目的是找到与问题相关的信息片段或数据。

知识图谱：它是一个结构化的知识表示，包含了实体、概念、分类和它们之间的关系。知识图谱使得问答系统能够理解和利用领域知识，从而提供更加精确和丰富的答案。知识图谱作为核心，使得系统能够有效地利用结构化知识

答案生成（Answer Generation）

一旦系统检索到相关信息，它就需要使用自然语言生成（NLG）技术来构造一个清晰、准确的答案。答案生成可能涉及信息的整合、摘要和重新表述，以确保生成的答案不仅准确无误，而且易于用户理解。

达.芬奇说过: 最高级的快乐就是理解的愉悦，The highest form of happiness is the joy of understanding，真正的快乐并不仅仅来自于物质的满足或表面的快感，而是源自于深刻理解世界、生命和知识的过程中所经历的愉悦。当我们对某个复杂的概念、一个难题或是生命中的一个重要事件有了更深层次的理解，我们经常会感受到一种特别的满足和快乐。

所以探究本质所带来的愉悦比简单的天天接受爆炸式的AI资讯更能获得真相，而不会随息逐流，才能辨别何为真，何为假。

3 从生物学里衍生出来的两条探究人工智能的脉络线

从生物学里找计算的模型，一直是人工智能的研究方向之一，学术上大致有两条传承的脉络：一条源自麦卡洛克和皮茨的神经网络，演化到今天成了深度学习；另一条则源自冯诺伊曼的细胞自动机，历经遗传算法、遗传编程，其中一条支线最后演变成了今天的强化学习。

因为此前也一直没有没有搞懂神经网络，深度学习，机器学习，强化学习这些术语究竟是什么关系。此处基于生物学的衍生出来的模型脉络终于理清楚。

第一条脉络线：描绘了从生物神经系统到 McCulloch-Pitts 神经模型的概念演变。

神经网络和深度学习：上述已讲过

这条脉络起源于麦卡洛克和皮茨提出的神经网络模型，它受到生物神经系统的启发，尝试通过模拟大脑神经元的连接和工作方式来处理信息。
随着时间的推移，神经网络发展为深度学习，这是一种使用多层（深层）神经网络来学习数据表示的技术。深度学习模型通过多个隐藏层来捕捉数据中的复杂模式和特征，广泛应用于图像识别、语音识别和自然语言处理等领域。

第二条脉络线：冯诺伊曼的细胞自动机，从遗传算法到遗传编程，再到强化学习。

冯诺伊曼提出的细胞自动机理论是一种用计算机模拟生物细胞行为的模型。这个模型把复杂的生物系统分解成很多小的、基本的部分，我们可以把这些部分想象成网格上的点，每个点就是一个细胞。

在这个模型里，每个细胞都在一个有规律的网格上，它们可以和周围的细胞互相影响。每个细胞都有一个状态，比如可以是“活着”或者“死了”。这些状态会根据细胞自己当前的状态和它周围细胞的状态，按照我们事先设定好的规则来改变。规则是局部的，就是说一个细胞的变化只和它周围的细胞有关。

在真实的生物世界里，细胞通过化学物质或者直接接触来互相沟通。而细胞自动机模型用数学的方式来模拟这种沟通，帮助我们研究复杂系统的行为和变化。这种方法不仅让我们更好地理解生物系统，还在计算机科学和其他科学领域里有很多应用。

最著名的细胞自动机例子之一是“生命游戏”（Conway's Game of Life），由数学家约翰·霍顿·康威在1970年发明。这个游戏通过简单的规则展示了复杂的行为和模式。

生命游戏的基本规则如下：

网格世界：想象一个无限大的网格纸，每个格子可以是“活”的（通常用黑色表示）或者“死”的（通常用白色表示）。
邻居：每个格子都有8个邻居（上下左右和四个对角线）。
生存与死亡规则：

出生：如果一个“死”的格子周围有3个“活”的邻居，那么在下一代中，这个格子就会“活”过来。
存活：如果一个“活”的格子周围有2个或3个“活”的邻居，它会在下一代中继续保持“活”的状态。
过度拥挤：如果一个“活”的格子周围有4个或更多“活”的邻居，那么它会因为“过度拥挤”而在下一代中“死亡”。
孤独：如果一个“活”的格子周围少于2个“活”的邻居，它会因为“孤独”而在下一代中“死亡”。

游戏过程：

初始状态：开始时，每个格子随机地被设定为“活”或“死”。
演化：根据上述规则，每一代中每个格子的状态都会根据它周围邻居的状态来更新。然后，整个网格进入下一代，所有的格子都会同时更新状态。
模式与生命：随着代数的增加，你会发现一些格子的集合会形成稳定的模式，有些则会消失，还有些会形成复杂的动态结构，就像“生命”一样在网格上移动和变化。

强化学习

强化学习是一种让计算机程序（我们称之为“智能体”或Agent）通过与周围环境的互动来学习如何做出决策的方法。在这个过程中，Agent会尝试采取不同的行动，并从环境中获得反馈，以此来改善自己的行为。

想象一下，你有一个遥控车，这个遥控车就是我们的Agent。它在一个房间里，房间里有很多障碍物和一个目标地点。遥控车的目标是尽快到达目标地点，同时避免撞到障碍物。

状态（St）：在每个时间点t，遥控车的位置和它周围的环境（比如障碍物的位置）就是当前的状态。
行动（At）：遥控车可以向前、后退、左转、右转等，这些就是Agent可以采取的行动。
奖赏（Rt+1）：每当遥控车采取一个行动后，它会根据行动的结果得到一个奖赏。如果它离目标更近了，可能会得到正的奖赏；如果撞到障碍物，可能会得到负的奖赏。
新状态（St+1）：行动执行后，遥控车会进入一个新的状态，比如它可能移动到了新的位置。
策略（π）：遥控车的驾驶策略就是它决定在每个状态下应该采取哪个行动的规则。比如，它可能学会了在看到障碍物时转弯。

强化学习的目标就是找到一种策略，让遥控车（Agent）能够通过不断尝试和调整，学会最快地到达目标地点，同时获得最多的奖赏。Agent会记住哪些行动在某些状态下是有效的，哪些不是，并根据这些经验来改进自己的策略。

通过这种方式，强化学习使得Agent能够自主学习如何在复杂的环境中做出最优的决策。这种方法在很多领域都有应用，比如自动驾驶汽车、游戏AI、机器人控制等。

神经网络是基础：神经网络提供了一种基础的计算模型，它通过模拟人脑的结构和功能来处理信息。
深度学习是神经网络的扩展：深度学习使用多层神经网络来学习数据的复杂表示，是神经网络在层次结构上的扩展和深化。
机器学习是更广泛的领域：机器学习包含了深度学习和其他学习方法，它的目标是让计算机系统能够通过学习数据来自动改进性能。
强化学习是机器学习的一个分支：强化学习专注于智能体如何在环境中通过试错来学习最优的行为策略，它是机器学习领域中的一个重要分支。

4 为什么人类会比其他动物聪明

原理就在于：

神经元数量与智力：尽管人类大脑的大小并不是所有动物中最大的（大象和鲸的大脑体积更大），但人类的智力水平高于其他动物。这是因为智力的决定因素不仅仅是大脑的大小，更重要的是大脑中神经元的数量。
人脑神经元数量：人类大脑中大约有860亿个神经元，其中大脑皮层（负责高级认知功能的区域）含有约160亿个神经元。大脑皮层的神经元数量是衡量智力的一个重要指标。
大象大脑的对比：虽然大象的大脑总神经元数量达到2570亿个，但大部分神经元位于小脑（主要负责协调运动和平衡），而非大脑皮层。大象的大脑皮层只有56亿个神经元，远低于人类，这解释了为什么人类的智力水平更高。
能耗与智力：大脑皮层中的神经元数量越多，其消耗的能量也越大。人类大脑每天消耗的能量占到了人体总能量消耗的25%，这一比例反映了大脑在智力活动中的重要作用。

5 当我们谈论生死时，我们在谈论什么

苏格拉底说：哲学家只研究“正在死”（dying）和“刚刚死”（being dead）。除了这个啥都不管。有一种说法是哲学起始于苏格拉底之死。

苏格拉底认为生与死是自然界循环不息的两个方面，相互依存，相互转化。在苏格拉底看来，生死是一个连续的循环，死亡不是终结，而是另一种形式的存在或转变。

苏格拉底的生死观与东方哲学中的生死观在某些方面有共通之处，稻盛和夫讲过：衡量一个人生活是否成功的标准不是他拥有多少财富或地位，而是他的灵魂是否比出生时更为高尚和纯净，他提到“越是磨难处，越是修心时。

而在文章中有一段假想的苏格拉底与作者尼克的对话，因为跨越时代，所以说是假想的，不过特别有意思。苏问，尼克答，尼克不断落入苏下的套中。

通过模拟与苏格拉底的对话，其实尼克留给我们的是一种更深层的思考：

意识与智能：人工智能是否能够拥有类似人类的意识？机器是否能够具备自我意识和情感？
生命的定义：生命是否仅限于生物体？如果人工智能达到了高度复杂的水平，我们是否应该将其视为一种新形式的生命？
伦理与道德：如果人工智能具有某种形式的“生命”，那么我们如何定义机器的权利和责任？我们对它们的行为应该遵循哪些伦理准则？
人类的角色：在人工智能不断发展的背景下，人类的角色和价值将会如何变化？我们如何与智能机器共存？
6 刺猬vs 狐狸青蛙vs 飞鸟

- 以赛亚·伯林借用古希腊诗人阿基罗库斯（Archilochus）关于刺猬和狐狸的比喻，把人分为刺猬和狐狸两种，狐狸是全才，知道很多事，但刺猬只知道一件大事。全才科学家弗里曼·戴森借用类似的说法，把科学家也照此分类，但他用了飞鸟和青蛙的比喻：鸟更像是刺猬，而青蛙更像是狐狸。在戴森看来，希尔伯特、杨振宁都是高瞻远瞩的鸟，而冯诺伊曼和费曼则属接地气的青蛙。爱因斯坦当然是超级大鸟。

刺猬类型的人物通常对某一领域有深入的理解和广泛的知识，他们的思想和工作往往围绕着这个核心理念展开。

狐狸类型的人物对许多不同的领域都有所了解，他们能够灵活地处理各种问题，但可能没有刺猬那样对某一领域的深入专注。

飞鸟类型的科学家具有高瞻远瞩的视野，他们往往能够看到更广阔的图景，提出具有革命性的理论或概念。

青蛙类型的科学家更加接地气，他们在具体的实验和应用中表现出色，能够解决实际问题，并在现有理论的基础上进行改进和完善。冯诺伊曼和费曼被戴森归为这一类。

想想自己，究竟是“狐狸”还是“刺猬”？