1.1 大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型。 通常说的大模型的“大”的特点体现在:参数数量庞大、训练数据量大、计算资源需求高 2020年,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿,2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上,达到1.8万亿,2021年11月阿里推出的M6 模型的参数量达10万亿。 ![]() ![]() ![]() 巨大的规模、涌现能力、更好的性能和泛化能力、多任务学习、大数据训练、强大的计算资源、迁移学习和预训练、自监督学习、领域知识融合、自动化和效率。 1.4 大模型应用 大模型的应用领域非常广泛,涵盖了自然语言处理、计算机视觉、语音识别、推荐系统、医疗健康、金融风控、工业制造、生物信息学、自动驾驶、气候研究等多个领域。 ![]() ![]() 二、人工智能和大模型的关系 人工智能包含了机器学习,机器学习包含了深度学习,深度学习可以采用不同的模型,其中一种模型是预训练模型,预训练模型包含了预训练大模型(可以简称为“大模型”),预训练大模型包含了预训练大语言模型(可以简称为“大语言模型”),预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT开发的大模型产品,文心一言是基于文心ERNIE开发的大模型产品 ![]() ![]() 三、基于大模型的智能体 智能体(AI Agent),又称“人工智能代理”,是一种模仿人类智能行为的智能化系统,它就像是拥有丰富经验和知识的“智慧大脑”,能够感知所处的环境,并依据感知结果,自主地进行规划、决策,进而采取行动以达成特定目标。简单来说,智能体能够根据外部输入做出决策,并通过与环境的互动,不断优化自身行为。智能体本身既不是单纯的软件也不是硬件,而是一个更为宽泛的概念,它们可以是软件程序、机器人或其他形式的系统,具备一定的自主性和智能性。 基于大模型的智能体是指利用大语言模型(如GPT、BERT等)作为核心组件,构建的能够执行特定任务、与环境交互并做出决策的人工智能系统。这些智能体具有自主性、交互性、适应性等特点,能够模拟人类的认知和决策过程,提供更加自然、高效和个性化的交互体验。它们能够处理海量数据,进行高效的学习与推理,并展现出跨领域的应用潜力。 例子: ![]() ![]() 四、什么是AIGC AIGC的全称为“Artificial Intelligence Generated Content”,中文翻译为“人工智能生成内容”。这是一种新的创作方式,利用人工智能技术来生成各种形式的内容,包括文字、音乐、图像、视频等 大模型与AIG C之间的关系可以说是相辅相成、相互促进的。大模型为AIGC提供了强大的技术基础和支撑,而AIGC则进一步推动了大模型的发展和应用 ![]() ![]() ![]() ![]() AIGC大模型的提示词(Prompt)是指用户向大模型输入的文本内容,用于触发大模型的响应并指导其如何生成或回应 这些提示词可以是一个问题、一段描述、一个指令,甚至是一个带有详细参数的文字描述。它们为大模型提供了生成对应文本、图片、音频、视频等内容的基础信息和指导方向。 ![]() |
|
来自: 江南一鱼6jvvqc > 《AI软件》