【原】通用人工智能（AGI）

格武致知 2023-07-05 发布于重庆

展开全文

1、定义：通用人工智能技术是一种系统性技术，它用于构建具有通用任务解决能力和持续自主学习能力，具有感知、认知、决策和规划的智能体。并且这个智能体需要具有类人脑的智能特征及水平。通用人工智能技术的终极目标是让这样的智能体具有类人脑的智能能力及能效效率，可以在在环境适应性、非特定域任务处理能力、学习能力、认知和逻辑思维能力、记忆能力、感知能力、自主驱动能力、情感及意识、运行能效效率等多方面达到人类水平。

2、近期随着OpenAI和google的一系列成果的面世，AGI的呼声已经较原来高了很多，甚至大家希望GPT-4具有AGI的能力。但目前而言，我们还在AGI的路上，即towards AGI。

3、当前AGI相关的成果还是比较丰富的。首先在自然语言处理、认知、常识处理和逻辑推理方面，GPT-3、PALM、LAMDA、ChatGPT等大语言模型发展迅速，大语言模型在AGI领域目前处于引领地位。

4、AGI的现状‍‍‍‍‍‍‍‍‍‍‍‍‍

5、通用感知主要解决如下三个科学问题。首先是如何构建通用多模态的感知机制。其核心在于通用。第二,研究如何建立客观事物到特征空间的映射,即特征抽取。第三,如何构建现实世界与脑中世界模型的映射和同步。核心是世界模型的映射。

6、人脑中是有一个客观世界的主观建模的，且推演和决策都基于这个主观模型,即世界模型。如特斯拉在进行自动驾驶时，实际上是以一个上帝视角对当前的人、车都进行了建模，并且对未来的运动进行了估计，这都是决策基于主观模型的一些例子。

7、通过世界模型可以实现行为的决策，也就是说,行为决策是基于世界模型而产生的，智能体可以通过预估多个未来的状态及行为方案，将最优的方案的行为与现实世界交互。

8、依照丹尼尔·卡尼曼在《思考快与慢》一书中的理论，人脑中实际包括了两个系统。其中系统一是快速、自动地、无意识地对输入进行响应的一个系统。而系统二是较为慢速的、有意识的、逻辑上的、有很多的思维步骤的一个系统。

9、我们可以认为第一代人工智能主要以知识驱动为主，需要编写符号系统和大量的人工规则。第二代人工智能系统以数据驱动为主，通常需要海量的数据训练深度网络，从而实现对客观现实世界的有效处理。我们需要构建的第三代人工智能应该是知识和数据的深度融合来驱动的，它具有着表征学习亚符号空间模型进行处理的特点。可以接受知识，也具有着可解释性和高可靠性。其特点是在认知系统中具有着知识库和逻辑推理的过程。

10、在认知上，我们主要解决两大科学问题，首先是认知架构的组成结构及运作机理问题，包括顶层框架的组成结构，认知行为的运作过程，这是一静一动。此外还有知识存储的形态。第二个科学问题，是适用于非结构化数据处理的认知架构和构建原理问题。尤其是大语言模型为基础的认知能力及表达方式，以及第二类，基于元技能模型为基础的认知系统的构建。

11、在记忆结构上，主要包括如下几种记忆类型，首先具有Working Memory，它是当前状态，例如传感数据中间计算结果的一些存储。第二类是过程记忆，它是长程的无意识记忆的一个存储体。第三类是显示的声明式记忆，包括语义记忆和情境记忆。

12、认知架构是一种顶层设计思维，告诉我们需要做什么才是完整的类人脑功能结构，但目前，我们还需要更强有力的各个组件进行支撑，才能让这个框架变得更有价值，更通用。

13、现在具有两类主流技术路线。其中OpenAI一直秉承着生成式的技术路线。包括GPT3以及代码生成Codex。以及后续的一些演进GPT3.5版本。另一类是谷歌的BERT类基于掩码预测的大语言模型路线。

14、通用大模型的逻辑认知状态可以总结为以下几点，首先在优势上面，大语言模型可以利用海量的人类的文本信息进行训练，第二，当前大模型在很多地方也确实超过了人类的水平，或者逼近了人类的水平，第三，它可以具有一定的逻辑推理能力，包括常识、事件、隐式推理等等，第四，它还具有着一定的代码生成能力和代码解释能力，最后，它还具有强生成和强创造特性。

15、大模型从一定层面上可以看作是认知架构的一种具体实现，具有强认知能力，是当前最火热的学术领域之一，不过大多数分析仍然从人工智能内容生成（AIGC）、多模态、自然语言处理的角度去理解它，而没有从强智能的里程碑的意义的角度去理解它，是有所缺失的。

16、学习是在外界刺激和好奇心的双驱动下进行的。也就是说学习的动机主要出于两者，一者是外界的激励刺激，另一个是自身的好奇心。

17、AGI系统具有感知、记忆、控制、推理，执行等认知能力，并具有智能行为及应用。AGI系统具有多种神经网络模型结构及构筑模块，多样化的学习机理，具有基于泛化的评估方法。

18、收敛于基础模型可能是目前的主要趋势，是AGI的强力催化剂。

19、于神经网络的AGI架构如下，首先，它是一种结合了大模型和强规则系统的一类AGI模型，其中大语言模型可以实现有经验的有想象力的逻辑推理和创造，但其上下文关联的能力是有限的，因为它具有固定的context window，另外，它的不稳定性和意识流的特性仍然存在，因此需要构建一个长程控制系统，实现有约束力的，有规则约束力的，能够形成深度的思考，稳定和长程的一个约束结构，它不需要非常灵活，但是它需要实现这种长程的，稳定性的深度思考，或者说是一个控制逻辑，并且具备类似于神经调制的宏观状态调控能力。在此为基础，通过融合世界模型，接纳非结构化数据的感知，同时通过记忆模型，记忆相应的智能体的历史经验和新的一些知识规则，并可以通过对外的数据互通，精确的指令控制，及与人的沟通，实现对客观世界的交互和输出。在学习机制上，需要综合利用超大规模数据预训练、增强学习、持续学习、仿生学习以及模仿学习等多种学习机制，构建一个具有终生学习能力的开放式系统，并实现智能体与外界环境的闭环与紧密交互，从而实现较为综合理想的AGI系统。