生成式AI发展综述

小飞侠cawdbof0 2023-10-23 发布于北京

展开全文

来源：智汇杰瑞

作者：姜松

导读

传统的人工智能（AI）通常被称为狭义或弱人工智能，专注于执行特定的任务。随着人工智能技术的不断发展，当前又出现了一种生成式人工智能（Generative AI），也被称为“下一代人工智能”。本文将浅析生成式AI与传统AI的区别，探讨二者的学习过程，同时展望AI技术的未来。

一、AI的学习过程

自ChatGPT、Bard、Claude、Midjourney以及其他内容的生成工具问世以来，人们对生成式AI抱有很高的期待。那么生成式AI与传统AI分别是如何学习的呢？

01 生成式AI的学习过程

1. 收集数据

与传统AI一样，第一步是收集数据。对于GPT模型来说，数据由大量文本组成。例如，GPT-4就是通过互联网上数GB的文本进行训练的。

2. 预处理数据

这一步包括清洗数据，并将其转换为模型可以理解的格式。对于GPT，这包括当文本被切割成更小的部分（令牌）时的标记化。

3. 创建训练模型

该模型使用基于变压器的语言建模进行训练。模型显示令牌序列，并要求它预测序列中的下一个令牌。例如，在输入“一只猫坐在……”这句话的模型时，可能需要预测缺失的单词。然后，该模型进行预测，并计算预测和实际单词之间的差异。这种差异用于更新模型的权重并改进其预测。

4. 反向传播和优化

将损失用于执行反向传播。这是一个计算损失函数相对于模型参数梯度的过程。然后使用优化算法，再用亚当或随机梯度调整参数，以尽量减少损失。

5. 重复

重复步骤3和步骤4，直到模型的性能停止改善。

6. 调整数据

在初始训练之后，可以针对特定任务进一步定制模型，包括在更小的、面向特定任务的数据集上进一步训练模型。例如，如果使用者想利用 GPT 生成医学文本，那么可以进一步将其配置为医疗文章数据集。

7. 生成内容

进行了上述6个步骤后，可生成所需内容。

需要说明的是，基础大模型是生成式AI的“大脑”，而正在兴起的整个价值链将支持该技术的训练和使用（图1）。专用硬件提供了训练模型所需要的庞大算力，云平台则提升了对这类硬件的利用。MLOps和模型中心供应商则提供企业所需的工具、技术和实践，让企业能够调试使用基础大模型并将其部署到终端用户应用中。

下图描述了生成式AI的价值链。

图1 生成式AI的价值链

02 传统AI的学习过程

1. 收集数据

数据集必须符合AI的目标，例如，如果教人工智能识别垃圾邮件，我们首先需要一组标记为垃圾邮件或非垃圾邮件的电子邮件数据。

2. 数据预处理

数据通常需要清洗和格式化，然后才能用于学习。这包括删除不必要的信息、处理丢失的数据或将文本数据转换为数字格式。

3. 数据分割

数据集通常分为训练集和测试集。训练集用于训练模型，测试集用于评估模型对不可见数据的性能。

4. 训练模型

训练模型根据输入进行预测，并计算预测与正确输出（错误）之间的差异。然后，调整模型参数以尽量减少此错误。

5. 模型评价

对模型进行训练后，使用测试数据对其进行评估。

6. 设置和优化

根据测试数据中模型的性能，可以选择返回并调整模型参数、使用其他模型或收集更多数据。

在分析了生成式AI与传统AI的学习过程后可知，传统AI可以对新的、看不见的数据进行预测或分类，而在生成式AI中，我们可以训练一个机器学习模型，它就会创建一个与其训练数据相似的输出。这种类型的机器学习可以处理数字、文本、图像和音频等不同类型的数据。

二、生成式AI与传统AI的区别

第二天的培训会主题是“示范授课，提升教学水平”。这一天，第一幼儿园特邀请了几位优秀教师进行示范授课。每位示范教师都选择了自己较擅长的教学内容，并结合多媒体技术进行了精彩的展示。

生成式AI是一种能够创造新事物的人工智能形式，可以创建音频、文本、代码、视频、图像和其他数据等内容。生成式AI模型通过数据集进行训练，并能通过研究基本模式来生成新数据。例如，利用生成式AI讲故事，我们只需提供一个开头，生成式AI就可以接写这个故事。生成式AI的突出例子是GPT-4语言预测模型。通过对大量互联网数据进行训练，它们能够创建类似人类创建的文本，而且与人类写的文本几乎没有区别。

传统AI就像一个战略大师，能够根据一套规则做出明智的决策。以人机国际象棋大赛为例，计算机懂得所有规则，可以预测你的动作，并根据预先确定的策略决定自己的棋路。他并没有发明新的下棋方式，只是从已经编程的策略中选出一个合适的策略——这就是传统AI。传统AI的其它例子包括语音助手，如Siri、Alexa和Netflix，以及亚马逊的推荐系统、谷歌的搜索算法等。传统AI需要遵守某些规则，无法自主创造新内容。

下表主要对比了生成式AI与传统AI。二者之间的主要区别在于它们的功能和应用场景不同。传统AI主要用于数据分析和预测，而生成式AI则更进一步，可以创建全新的内容。

表1 AI综合比较表

	传统AI	生成式AI
主要特点	执行特殊任务	可以创建新数据
	研究数据并做出决策或预测	使用原始数据创建新的原创内容
	在一组预定义的规则下工作	可以生成文本、图像、音乐和代码
学习方法	控制式学习	不受控制的学习
学习方法	需要标记数据以用于训练	不需要标记数据进行训练
限制	受限于具体任务	生成内容的细节不受控
	无法创新原创内容	生成的内容可能不够一致或准确
	需要大量标记的数据进行训练	需要大量数据进行训练
典型应用场景	人机对战国际象棋	OpenAI公司的GPT-4
	Spam Sieve for mac邮件过滤器	DeepArt绘画转换
	语音助手（Siri、Alexa）	创建内容（故事、艺术、音乐）
	推荐系统（Netflix、亚马逊）	DeepFake（AI换脸）
	搜索引擎（谷歌）	个别AI响应

综上，生成式AI和传统AI技术的主要区别在于，生成式AI能够生成新内容，所生成的新内容通常以“非结构化”形式（如书面文本或图像）呈现，而非以表格形式排列。

其底层技术是一类被称为基础大模型的人工神经网络，其灵感来自于人类大脑中数十亿相互连接的神经元。人工神经网络需要通过深度学习加以训练，“深度”即指神经网络中的层数之众、之深。深度学习技术推动了AI领域的众多新进展。而某些特质使得基础大模型区别于过往的深度学习模型。首先，训练基础大模型可以使用体量庞大、类型多样的非结构化数据。例如，一类被称为大型语言模型的基础大模型可以通过互联网上公开可用且涵盖各类主题的大量文本进行训练。其他深度学习模型虽然也可以处理大量非结构化数据，但训练所用的数据集通常更为具体。例如，为了让模型识别照片中的某些物体，需要使用一组特定图像对其进行训练。

事实上，其他深度学习模型往往只能执行一项特定任务。相比之下，基础大模型可以同时实现多种任务，并且还能够生成内容。上述能力是通过从所摄取的广泛训练数据中学习得到的，比如通过规律和关系学习，基础大模型能够预测句子中的下一个单词。这就是为什么ChatGPT能够回答不同主题的问题，DALL-E 2和Stable Diffusion能够根据描述生成图像。

三、生成式AI应用现状

2023年被称为生成式AI的突破之年。2023年8月1日，麦肯锡公司发布最新的年度全球AI研究报告，证实了生成式AI的爆炸式增长。随着技术的发展，关注AI的人群已经从技术人员转变为企业高管。近四分之一的受访高管表示，他们在工作中亲自使用人工智能工具；超过四分之一的受访者表示，使用人工智能的组织已经将生成式AI纳入了董事会的议程。此外，40%的受访者表示，由于生成式AI技术的进步，他们的组织将增加对人工智能的总体投资。

2023年6月14日，麦肯锡在最新发布的《生成式人工智能的经济潜力》研究报告中分析了47个国家及地区的850种职业，探讨AI呈指数级发展对全球经济带来的影响，以及AI对哪些行业冲击最大，哪些行业人员将面临失业威胁。该报告的调查数据覆盖了全球80%以上的劳动人口。

1. 生成式AI已广泛应用

2023年4月中旬，麦肯锡公司进行了一次现场调查。结果显示，公众使用生成式AI的可能性越来越高，受访者预计新技术将改变他们的行业。下一代人工智能已经引起了商界人士的兴趣：来自不同地区、行业和各层次的人们多年来一直在使用生成式AI进行工作。所有受访者中的79%表示，他们在工作中或工作之外接触过生成式AI，22%受访者表示他们在自己的工作中经常使用它。使用人工智能的四成受访者表示，由于生成式AI，他们的组织预计总体上会增加对人工智能的投资，而28%的人表示生成式AI的使用已经列入其董事会议程。

最常使用生成式AI的行业是营销和销售、产品和服务开发，以及服务运营，如客户服务和后台支持。之前的研究表明，这三个领域从生成式AI应用中获得了约75%的年度总利润。

四分之三的受访者认为生成式AI将在未来三年内引发行业竞争性质的重大或破坏性变化。从事技术和金融服务行业的受访者最有可能期望AI做出重大改变。之前的研究表明，最依赖智力劳动的行业可能会遭遇更大的打击，并有可能获得更大的利润。

科技公司预计下一代人工智能将产生最大的影响——增加的价值相当于全球行业收入的9%。而知识型行业，如银行（高达5%）、制药和医疗保健（高达5%）以及教育（高达4%）也可能产生重大影响。相比之下，制造业，如航空航天、汽车和先进电子产品，可能遭受的破坏性影响较小。这与之前对制造业影响最大的技术浪潮形成了鲜明对比。

2. 生成式AI被高效应用于领先企业

调查结果表明，具有高AI绩效指标的组织正在尽最大努力使用人工智能。这些受益于人工智能的组织已经在更多的业务中使用生成式AI，特别是在产品和服务开发以及风险和供应链管理方面。考虑到人工智能的所有可能性，包括更传统的机器学习，机器人流程自动化和聊天机器人，高性能人工智能也比其他人更有可能将人工智能用于开发产品和服务，例如，优化产品开发周期，为现有产品添加新功能，并创建基于AI的新产品。这些组织也比其它组织更频繁地使用人工智能进行风险建模，并将其用于人力资源，例如绩效管理、组织设计和优化劳动力分配。

3. 生成式AI改变薪资结构

与人工智能相关的薪水将会改变，预计人工智能对劳动力的影响将是巨大的。调查结果显示，组织在支持其AI野心方面所扮演的角色发生了变化。在2022年，使用AI的组织最常雇用数据工程师、机器学习工程师和所有数据专业人员，这是所有受访者在之前的调查中报告通常填写的职位。但是，与上一次调查相比，报告招聘与人工智能相关的软件工程师的受访者比例要小得多。最近，随着生成式AI的引入，运营工程领域的角色出现了，因为对这套技能的需求正在增加。

展望未来三年，受访者预测AI的采用将改变许多劳动力的角色。总的来说，他们预计更多的员工将被重新培训而不是被解雇。近25%的受访者表示，他们公司超过20%的员工将接受再培训，而8%的受访者表示，他们的员工人数将减少20%以上。

预计将高级AI执行者将比其他组织进行更高水平的再培训。这些组织的受访者表示，由于采用人工智能，他们的组织将在未来三年内裁员30%以上。

4. 生成式AI将继续受到高度关注并保持稳定影响力

虽然生成式AI工具的使用正在迅速普及，但调查数据并未表明这些新工具有助于组织整体采用人工智能。实施人工智能的组织的比例基本保持稳定，至少目前为止是这样。55%的受访者表示他们的组织已经实施了人工智能。不到三分之一的受访者继续声称，他们的组织已经在不止一个业务中实施了人工智能，这表明人工智能的使用规模仍然有限。产品和服务开发以及服务运营仍然是最常采用AI的两大业务职能，这与前四次调查结果一样。总体而言，只有23%的受访者表示，其组织在2022年至少有5%的息税前利润（EBIT）与人工智能的使用有关——这与之前的调查相比几乎没有变化——这表明组织有更大获益空间。

四、生成式AI的潜在风险

根据调查，似乎很少有组织完全准备好广泛使用生成式AI，或者已准备好面临这些工具可能带来的商业风险。只有21%的受访者表示，他们的组织已经制定了相关政策来管理员工在工作中使用人工智能技术。当被问及采用生成式AI的风险时，很少有受访者表示他们的公司正在减少最常提到的风险。生成式AI的风险是不确切性。与网络安全和监管合规性相比，受访者更经常提到不确切性，这是之前调查中与人工智能相关的最常见风险。只有32%的人表示他们正在消除不准确之处，低于38%的人表示他们正在减少网络安全风险。有趣的是，这一数字远低于2022年报告与人工智能相关的网络安全下降的受访者比例(51%)。总体而言，与往年一样，大多数受访者表示他们的组织没有解决与人工智能相关的问题。

由于这是一项不断变化的新技术，许多现有的监管和保护框架尚未赶上生成人工智能及其应用。主要问题是能够识别或验证由人工智能而不是人类创建的内容。另一个被称为“技术奇点”的问题是，人工智能将变得更加智能化并可能超越人类的智力。

五、生成式AI的影响与发展趋势

生成式AI的影响是广泛的：一方面，生成式AI可以帮助我们在几分钟内创建无数个原型，从而缩短创意开发过程所需的时间。在娱乐行业，它可以帮助人们创作新的音乐、编写剧本、甚至炮制假新闻。生成式AI在创造力和创新方面发挥着关键作用，并在与之相关的任何领域带来革命。另一方面，传统的人工智能可继续成功地应用于特定任务。传统AI是当今大多数AI应用程序的驱动力，这些应用程序优化了各个行业的效率。

具体来说，生成式AI可能带来以下影响。

1. 促进网络安全技术提升

生成式AI可能会对中小型企业的网络攻击数量产生影响，极易成为攻击目标。网络犯罪分子利用AI创造了新的和复杂的攻击工具，包括恶意软件、漏洞利用、定制钓鱼和其它技术。但另一方面，生成式AI又可用于提供先进的智能安全工具，以改善攻击监测技术并提供完全自动化的响应。

2. 促使相关技术产业进步

2023年7月20日，硅谷初创公司Cerebras推出一款超级计算机，它使用专用芯片，旨在为AI产品提供动力。这些芯片的尺寸与餐盘大小相当，是通常用于人工智能的芯片的56倍。每个Cerebras芯片都具有数百个传统芯片的计算能力。新型超级计算机是在AI繁荣的背景下提出的，这刺激了对芯片和计算能力的需求。

3. 改变软件工程工作

4. 帮助客户经理及时了解公共信息和数据

5. 减少客户服务用时，让客服代表有时间去做更有价值的工作

6. 加速药物发现

7. 军事方面，可应用于无人自主系统、ISR，以及作用于指挥、控制和通信（C3）

可见，生成式AI为工作和职场带来切实效益的变革性用例已然存在。从制药业、银行业到零售业，众多企业正在产生一系列用例，以捕捉价值创造潜力。

六、结语

虽然生成式AI与传统AI具有不同的功能，但它们并不是相互排斥的。生成式AI可以与传统AI协同工作，提供更强大的解决方案。例如，传统AI可以分析用户行为数据，而生成式AI可以利用这种分析来创建个性化的内容。

生成式AI和传统AI在塑造人类未来方面都发挥着重要作用，每一种都提供了独特的可能性。掌握这些尖端技术将成为公司和个人跟上快速变化的数字世界的关键因素。