摘 要:大语言模型驱动的生成式人工智能正在改变其技术工具的属性,迭代成为新型平台。智能平台基于广阔的数据基础建立多样化的人工智能生态系统,从人类已有的数据中寻求解决方案、创造虚实交互的世界。智能平台时代智能体涌现,催生多智能体系统,构建现实与虚拟的层叠交互结构,变革现实的结构与形态,驱动关系重构(人机共生)、结构重组(虚实交互),导致经济与社会领域的功能性变革,势必驱动社会由外而内的适应性变迁,推动整个文明的进化。同时,智能体依赖、人机信任、价值体系的协同以及文化的滞后,将是智能平台背景下人类面临的新挑战。
关键词:大模型;平台社会;智能体;平台;生成式人工智能
一、引言:生成式人工智能的平台架构
在大模型/生成式人工智能产品ChatGPT上线一年内,“GPT平台”(GPT platform)竟然就出现了。知名科技网站Verge于2023年11月的报道副标题里用了“GPT platform”,称可以在该平台上为各种任务创建自定义AI智能体(agents)。OpenAI开设的网页里就带着“平台”的字样,网页上的大幅标题则是“欢迎来到OpenAI开发者平台”(OpenAI developer platform)。尽管其“平台”的称谓不一定契合学术意义,但是,“平台”已经与生成式人工智能的代表OpenAI紧密联系在一起。
此前在西方最受人关注的“平台”,就是GAFAM,即美国的五大科技巨头Google-Alphabet、Amazon、Facebook-Meta、Apple和Microsoft,或其中GAFA四大平台。互联网时代著名预言者凯文·凯利(Kevin Kelly)在2019—2021年期间接受日本媒体采访时说,资本主义的未来取决于平台的发展。GAFA如今扩展到可以左右国际社会命运的程度,但在大约25年内就会被取代,不会再有现在的势头。
什么样的科技可能取代如今风头正劲的社交网络,成为新一代的平台?新一代平台有哪些独特的属性和功能,将对未来社会产生什么样的变革和挑战,又带来怎样的深层的矛盾?本文认为,生成式人工智能正在迭代为新型智能平台(AI Platform)。从平台/平台化理论的视角探讨这些问题,本质上是探究人工智能技术驱动的人类社会的形态变革和关系变迁,从而理解和洞察人机交互背景下的人类交往的深层革命。
二、平台迭代的历程
近十余年来,平台受到了学界的广泛关注。何塞·范·迪克(Jose van Dijck)最近指出,全球数字生态系统图景正在发生重大转变,如果我们对数字基础设施和平台的依赖程度不降反升,那么技术力量的积累将决定国家和公司之间的全球关系。因此,新技术平台带来的变革可谓事关重大。
(一)平台与平台化
凯利认为,未来的社会是由政府、平台和公司组成的,政府为首,平台紧随其后,然后才是公司。平台,是一个既不同于公司又有别于政府的,介于二者之间的事物。平台正在行使媒体、电信、图书馆等公共服务的功能,拥有类似于政府的权力,但是不需要承担政府的职责。平台对所有人开放,可以提供各式各样的服务,还可以注册ID(身份标识号)——平台从某些角度替代政府承担一部分公共事务;但平台却是由股东和公司经营的,如GAFA以及腾讯、百度等大公司主导,平台因此兼具了政府和公司的特点。
什么是平台?在中国商业话语中,平台用于指代数字服务、品牌和初创企业,包括视频平台、打车、约会和社交网络应用程序,其含义比起在英语中经济学的平台(常被定义为多边市场)和数字媒体研究的平台(可以在其上构建其他系统的计算系统)更加广泛。美国商务部国家标准与技术研究所信息技术实验室给出的定义是:可以在其上安装或运行软件的计算机或硬件设备和/或相关操作系统或虚拟环境。平台是一个个单元,又相互连接。“平台”一词蕴含不同层次的涵义,如计算、架构、政治、抽象比喻等多个层面,它可以被形象地看作是一个人们聚集在此的精神空间;其最重要的是政治经济和社会计算这两个深度互联的层面。在政治经济方面,平台提供了连接用户和平台开发者的方式,成为非常重要的经济集会场所,而平台的社会-技术链接凸显出社会计算的重要性。平台运行首先依赖于物理层面,嵌入于一个整体“平台生态系统”,受经济或金融、商业模式的驱动;平台嵌入社会,成为不同层面平台化的集合体——“平台社会”。平台对用户、文化内容生产者、开发者而言无所不在。
平台化是数字平台的经济、政治和基础设施延伸渗透到网络和应用程序生态系统的过程,已有丰富的文献从商业研究、政治经济学和软件基础设施的角度开展了研究。在商业研究中,关注作为中介机构的平台,往往从交易视角研究平台方之间、平台方与用户之间的关系。其中有一个有趣的比喻,将平台视为“媒人”(matchmakers),也有称“平台介导的网络”(platform-mediated networks)”,即关系中介、聚合者和调解者。由于各种机构和用户与平台这样的中介的相互联接关系,形成网络效应,使多边市场普遍而活跃。平台不断变化,加速了文化商品的形成。政治经济学的研究关注平台权力和政治,强调资本和公司所有权固有的积累趋势及其对权力分配的后续影响,还有生产者和用户的文化与(非物质)劳动力的不稳定和剥削性质。研究关注 GAFAM 平台的主导地位,用户驱动的文化生产蓬勃发展,但被纳入“平台资本主义”经济体制,平台的控制及其商业化和集中化成为焦点,许多研究探究内容商品化、文化劳动的剥削及用户劳动。“平台”隐喻不仅掩盖了社交媒体和其他数字服务(被标记为平台)如何促进社会经济、文化和政治互动,而且在很大程度上组织和引导这种互动。软件角度的研究关注平台与用户关系,探讨平台的社会技术特征如何助益和提示用户,引导用户提供特定类型的活动、联系和知识。还有研究尝试从市场结构、平台治理和基础设施之间相互关联的角度建立理论框架,探讨平台如何驱动转向多边市场、如何管理文化生产、如何改变文化基础设施。
“平台”作为数字化技术的成果,是新生事物。互联网作为第一代平台,使人类的信息得以数字化;社交网络(SNS)可以捕捉到人们的数字化活动及其相互关系,从而将人际关系数字化,成为第二代平台,GAFA即是其代表;大模型驱动的人工智能应用,正在打造第三代平台,催生自动化决策和行动的应用,用智能体联接虚拟与现实、缔结人机交互型的社会。
(二)平台社会与平台基础设施化
由于数字技术带来的平台化趋势,紧随网络社会,平台社会受到了关注。在这个社会中,社交、经济和人际交往主要由全球在线平台生态系统引导,其生态系统由数据驱动并通过算法维系。数据化、商品化与选择性组成了三个相互关联的平台社会机制,在宏观上关涉地缘政治,中观上是生态系统,微观上则与平台个体紧密联系。
也有研究指出平台社会并不存在,或者另外存在不一样的平台社会。研究从基础设施、治理和实践等角度分别研究了中国的微信、滴滴出行、爱奇艺等平台,虽相似又区别于西方的GAFA,在国家的集中参与方面具有明显差异,而国家和企业之间的纠缠非但没有减缓,反而加速和强化了中国平台化进程,增强了平台基础设施在生活各个领域的渗透。滴滴这样的私营公司平台成为数字公用事业的供应商,改造了基础设施并重新界定了公共和私人服务。平台有能力跨越公共和私营部门,并渴望成为生态系统建设者,而公共服务在一定程度上依赖于不同平台的数据化战略,平台因此已经成为一个基础设施型社会。监管环境、市场结构和平台可供性之间的关系, 个性化、去中心化、用户授权等在不同社会背景中有鲜明差异,共享平台与国家治理交织在一起,平台就呈现出了历史空间化特征。因此,平台化不是一个统一的过程,而是沿着基础设施、治理和实践的向量遵循着不同的轨迹进行的。平台社会不是指一组确定的关系,而是强调数字平台日益融入日常生活的过程中,关涉数字平台的持续社会斗争和协商。平台化不是一个单向的过程,并没有一个平台社会,而只有在特定时间和地点的平台化流程。
所有权对平台化有重要意义。范·迪克强调,由五大公司GAFAM组成的美国数字生态系统,通过将其平台转化成为不可或缺的基础设施,比如Amazon Web Services、Mircosoft Azure和Google Cloud,而成为全球主要的云服务提供商。那些类似公共设施的设备支撑并实现了几乎所有类型的数字通信、信息及媒体的运行,没有它们,西方社会将无法正常运转。公共组织几乎完全依赖私营平台。基础设施要么是私有的,要么是国有的。基于大语言模型的人工智能进入许多应用和平台,GPT-4几个月内覆盖上亿用户,意味着大型科技公司又一次激增平台权力。在此过程中微软将聊天机器人整合到它的搜索引擎必应和许多行业性平台(如教育),在全球数字生态系统中再获竞争优势。
社交时代的平台化特质,同样会延伸到智能时代。数字技术在一定的时间段和不同的空间里,强化了原有社会和制度的特征,迄今并没有形成一个因为技术出现的“社会”。如果我们要用技术指代这样一个社会,那么可以称为“技术化”的社会,如网络化社会、平台化社会、智能化社会。它们是原有社会在网络化、平台化、智能化的过程中吸收了技术化的影响,而并没有改变社会本质。
平台化仍在迭代。凯利几年前便声称“世界上会出现一个崭新的巨大平台”, 世间万物均可以与AI连接,现实世界与数字化完美融合,产生出一个新的平台世界,身处异地的人可以在全球实时构建虚拟世界。到处充满了大规模协作的可能,数以百万计的人可以同时参与一项工作,不同语言的使用者可以和任何人自由对话、共同协作。新的平台还会对人们的工作方式和政府的角色产生极大影响。毋庸置疑的是,人工智能将催生第三代平台。凯利以为智能眼镜那样的早期AR产品是新世界的催生者,但寥寥数年,大模型人工智能既已创出了新路径。
三、大模型:正在兴起的新型平台
大模型/生成式人工智能于一年多前横空出世,成为许多人的聊天应用工具,又在不知不觉中,悄然向平台进发。
(一)平台化端倪:提供安全的协作工作空间
人类主要使用语言作为交流系统来相互传达信息、情感和思想。人工智能经过数十年的探索,以语言为突破口开发出生成类人响应的生成式人工智能(Generative AI)系统。谷歌的对话应用程序语言模型(LaMDA)、Facebook创建了OPT-175B 和 BlenderBot,而OpenAI 则率先创新了用于文本的 GPT-3、图像的 DALL-E2以及语音的Whisper,GPT即基于Transformer架构的生成式预训练模型 (Generative Pre-trained Transformer),成为代表。
GPT经过几年的训练和迭代,使用自然语言处理技术并接受了大型语言模型训练,于2022年11月30日推出了GPT-3.5产品ChatGPT。通过公共应用程序编程接口 (API) 发布的GPT,为世界带来了无限的可能性,世界各地的用户只需简单登录即可访问,可用功能包括语言、视觉、推理和交互,可应用于医疗保健、法律和教育等多个领域。随着GPT的快速升级,其用户迅速增长,成为有史以来成长最快的应用程序,五天内用户达到100万,两个月内活跃用户达到1亿,一年内《财富》世界500强公司有约460家使用其产品搭建服务。其涌现能力突显,在开发早期就已经开始从技术工具向平台转变。
平台化的端倪,出现于为各种规模的团队推出新的ChatGPT计划,号称要提供安全的协作工作空间。在那之前,OpenAI 首席执行官奥特曼(Sam Altman) 在2023年5月披露过拟推出一个潜在市场计划,6月20日被报道曝出OpenAI将允许开发人员出售构建的人工智能模型。OpenAI在2023年7月推出一项用户自定义功能,允许用户设置一些他们希望 ChatGPT 在生成响应时考虑的首选项;8月推出了ChatGPT Enterprise,允许各公司控制自己的业务数据,Block、Canva、Carlyle、雅诗兰黛公司、普华永道和Zapier等行业先锋先后使用;11月推出GPT的自定义聊天机器人GPTs——允许任何人使用自然语言自定义和共享自己的AI助手。通过新的GPT Builder界面,用户只需要输入希望它们执行的操作即可添加自定义指令、知识和操作,即可为自己定制GPT,这些GPTs可以被其他用户访问。
(二)智能时代的“苹果应用”:GPT商店
OpenAI在自定义功能的基础上,开放了GPT商店,标志着其向作品端转型。2024年1月10日,它宣布正式推出GPT商店(GPT Store)和ChatGPT Team服务。GPT Store相当于OpenAI版的应用商店,允许用户列出自己构建的个性化聊天机器人或GPT供他人下载,先向付费用户开放。此时社区成员已经构建了超过300万个自定义版GPT,其中的一些获准进入了GPT商店,可以被自由下载。据悉当时已有91100个GPTs涌现于公共网络,覆盖领域广泛,涵盖开发、生产、绘图、语言学习、财经、客户支持、市场分析和医疗健康等多个领域。ChatGPT Team则是针对企业用户的新选项,提供对GPT-4和DALL·E3等高级模型以及高级数据分析等工具的访问,还为各方团队提供专用协作工作区和用于团队管理的管理工具,团队可以拥有并控制自己的业务数据。
用户开设GPT商店不需要有任何编程经验,只需用简单的自然语言输入希望GPT实现的功能,GPT Builder就会根据要求定制出一个聊天机器人。用户可以通过多轮指令微调,轻松自定义AI机器人的属性和风格,并与他人分享。GPT商店还包括一个显示热门下载的社区排行榜,用户可以按照类别进行搜索,如写作、生活方式和教育等。未来根据产品的用户参与度向GPT创作者支付报酬,营收模式会借鉴苹果应用商店模式。据奥特曼介绍, GPTs有不同的分类以及排行榜,里面会依次排出安装量最高、评分最高的GPTs,并作为收入分成的依据,之后还可能考虑推出订阅个人GPT的服务。奥特曼在2023年11月演讲时,商店的屏幕截图显示了GPT用于室内设计、创建演示等,包括GPT-4 Turbo模型——拥有12.8万个上下文窗口、能够处理相当于300多页的内容。他称,每个人都会有自己的GPT,他们将调用大量GPT并集成许多不同的服务来完成非常复杂的任务。
科技界开始纷纷比对2008年苹果公司推出的应用商店(Apple app store)。2008年苹果发布App Store,创造了一个新的经济生态,不仅为第三方软件的提供者提供了一个方便而又高效的软件销售平台,让自己获得了可观的商业回报,也开启了移动经济的序幕。OpenAI被当作创建了“人工智能领域的苹果应用商店”。是不是又一个新时代开启了?其影响会否超出经济领域?OpenAI的GPT商店与2008年苹果iPhone的App Store首次亮相之间有着天然的相似之处。就像当年的苹果一样,OpenAI正在邀请那些热情的开发者帮助创建一个新的、持久的平台。
GPT Store将为ChatGPT打开更多潜在应用,并将OpenAI的生态系统扩展到公司为客户构建的范围之外。原有的企业可以添加自定义指令和操作功能,创建特定领域的智能助理或者智能体,并通过创建个性化、实用且有吸引力的智能体来与客户建立更牢固的关系。借助新的 Builder 工具,中小型企业无需任何编码知识、用很低的开发成本,就有望运用最先进的人工智能技术立于竞争环境;普通开发人员不需要编程,仅用对话方式就能打造专属的个性化的GPT并获得自动分享和可能的销售,或能从中获利。因此,GPT商店本质上就是用户发现和购买的聚合平台市场。
(三)属性和潜力:协作生态系统的创新愿景
GPT Store被比作人工智能时代苹果应用商店,其间蕴含着对新技术的想象和憧憬。长远而言,智能平台的雄心和潜力不仅体现在一个新的应用程序市场,而且建立在最先进的人工智能模型之上,标志着一种创新的协作生态系统的愿景。其中,语言驱动的人工智能技术在塑造人机交互和解决未来的问题方面发挥着核心作用,它是高级语言模型的变革力量及其革新不同领域的明证。
GPT的一些属性和潜力值得关注:
第一,GPT正在平台化。GPT商店等运行于集成式平台,使用GPT技术开发的各种应用程序或模型可供用户发现、下载或交互。运用GPT大模型创建的各种应用程序和服务,可以整合成或融入各种系统和领域的应用平台。
第二,GPT正在打造开发者生态系统。GPT在培育本公司外的开发者社区平台,开发者可以使用GPT模型创建各种应用程序、工具或服务,可以通过商店展示和访问、交流和销售,推动大模型创新和人工智能生态系统的发展。
第三,可访问性和人工智能技术的民主化。用户可以轻松访问和获取应用程序或模型,使人工智能技术可被更广泛的用户使用。AI技术的民主化是科技界非常强调的,因为它意味着技术的落地、应用和可持续发展。OpenAI提供无代码平台,使技术专业知识有限的人们能够创建和部署自己的AI应用程序。
第四,标准化和质量控制。平台上可用的应用程序需要某种程度的标准化或指南,从而维护GPT商店模型和应用程序的质量、安全性和伦理标准。
第五,商业化和变现能力。OpenAI能从更广大的开发者和用户那里获得利润,同时开发者也有机会获得报酬,有助于OpenAI后续研发得到经济支撑,推动人工智能的发展水平。
值得强调的是,GPT平台化会是人工智能大众化的一次实践,将对未来社会带来深刻变革。OpenAI此举使更广泛的用户能从人工智能驱动的解决方案中受益。它让众多的创作者(包括那些没有专业技术知识的人)能构建各种人工智能驱动的应用程序,从而驱动教育、医疗、艺术、商业和传播等领域的发展。GPT的潜力在于释放生成式人工智能模型的创造性和实用可能性,带来个性化学习、智能内容创建、人机协作等领域的巨大前景;GPT商店可能创新商业模式,通过语言驱动的技术创造价值;它会激发生成式人工智能应用程序的进步,促进创新、增强创造力,促进沟通或协助决策的应用程序可能会变得更加普遍;它会带来语言驱动交互技术的全球性影响,包括全球范围内人与技术的互动方式、个人通过基于语言的界面生成内容和解决问题的方式、跨语言的交流、资源共享和集体解决问题等。
目前在平台化进程中主要的障碍有两个方面:技术的和伦理的。技术方面,它与智能手机应用程序不同,构建和部署人工智能模型对某些用户来说在技术上仍然有一定的要求,需要用户对人工智能技术有一定的了解,因为用户需要为特定目的配置和微调GPT模型。目前它主要是面向具有技术专业知识的开发人员,达不到苹果应用那类平台的可访问性。伦理方面,OpenAI 需要建立强有力的保障措施,解决偏见、透明度和潜在滥用等问题,确保能够负责任地开发和使用通过该平台创建的人工智能模型。在治理方面,OpenAI在GPT商店正式开放前已建立了一个新的审查系统,努力确保商店中的自定义GPT符合其品牌准则和使用政策;更新了关于用户如何举报有害或不安全的GPT的方法;使用新的“版权盾”保护客户免受法律诉讼。
上一代社交平台是将从未被量化的人类信息行为量化为数据,通过可编程结构的联接转化为交错的关系,进而应用转化为权力和利益。它运用个人化、互动化和分享式的web2.0特性,通过缔结新型的人与人、人与平台/技术、人与世界的联接关系而变革原有的关系和权力结构,平台的基础设施(比如算法化)对权力关系的重构逐渐突显。大模型/生成式人工智能开启的新一代智能平台,则是从人类已有的数据中寻求解决方案、构建虚实交互的世界。智能平台是基于更广阔的数据基础建立多样化的人工智能模型生态系统,这个系统即凯利所预言的“由数百万人同时参与的、覆盖全球的层叠结构”,基于语言的大模型基础将打造一个虚拟的世界,使得置身于自己的地区、现实空间的人们能和世界上各个角落的人们共处其中进行各类协作,通过语言的驱动共同开发游戏、创作艺术、发展教育、研发设计、创造信用体、解决医学疑难问题等。新一代智能平台通过构建现实与虚拟的层叠生态结构,建立人与智能体、智能体与智能体的联接,变革既有的关系与结构。新型平台的基础设施(大模型、智能化)驱动人类世界的关系重构(人机共生)、结构重组(虚实交互),带来经济与社会领域的功能性的变革,比如人机商业模式、智能模式出现。
智能平台也将驱动社会由外而内的适应性变迁。平台化不仅是平台改变组织结构和产业发展的外部过程,同时也是社会变迁、人类适应的又一种内在驱动力。无论如何迭代,平台化始终是基于数字技术的发展,而基于语言模型的生成式人工智能启动的新平台,则突显其生成化、集合型、回应式文化特征。如果沿着此路径发展,势必影响宏观层面的社会变革和人类生存面貌。智能化平台不会是“第二人生”应用(The Second Life app)的升级版,也不是电影《头号玩家》(Ready Player One)的现实版,但是它们的隐喻值得记取和深思。长远来看,人工智能不可能基于一类模型,也不会仅仅停留在生成式阶段,它的拓展将会深化智能体作为“行动者”的未来变革。
四、“智能体”涌现:缔结新型社会关系
智能化平台打造的“智能体”(agents)是人类使用AI技术的最新创造,堪称人类生存和文化形态的里程碑式创造。2023年8月开源的斯坦福“虚拟小镇”,便以研究的方式上演了ChatGPT智能体新篇。OpenAI大模型上涌现的GPTs,是集成式的智能体,它们将会催生更多的智能个体。它们不只是虚实世界的联接者,还是新型社会关系的缔结者。智能体有何功能?有何特性和目标?它会带来怎样的社会关系变革?
(一) ChatGPT催生的人工智能使用功能
2023年4月7日,布劳德(Joshua Browder)在推特上发布了他在自己的程序DoNotPay上使用ChatGPT插件替自己维护权益的事:
我要求AI(GPT)取消我的健身房会员资格。它立即起草了一份要求取消的法律通知,加了我的电子签名,并与USPS(美国邮政局)联系把它寄出。所有这一切都基于聊天对话。使用 ChatGPT 第一个取消的订阅!
这只是一个应用案例。我们的ChatGPT插件涵盖200多个消费者权利领域。精灵从瓶子里出来了!
2023年4月30日,布劳德发布了另一些信息:
我决定将我的整个个人财务生活外包给GPT-4(通过我们正在构建的@donotpay 聊天)。
我向 AutoGPT授予了对我的银行、财务报表、信用报告和电子邮件的访问权限。
以下是它到目前为止的进展情况(+217.85 美元)以及它省钱的奇怪方式:
首先,使用 DoNotPay @Plaid 连接,我让GPT登录到我拥有的每个银行账户和信用卡,并扫描 10000 多笔交易。
它发现我的账户每个月都会留下 80.86 美元的无用订阅,便提出取消所有订阅。
GPT开始邮寄信件(使用美国邮政局的 USPS Lob API),自动与我的代理聊天,甚至点击按钮取消邮件。
布劳德还提到了一个案例:
我要求它扫描相同的交易并找到一个我可以轻松获得退款的交易。从我的电子邮件中,它发现了一张从伦敦飞往纽约的联合航空公司飞机上的 WiFi 收据,价格为 36.99 美元。然后它问我:“它工作正常吗?”
当我说“不”时,它立即向美联航起草了一份有说服力且坚定的法律信函,要求退款。这封信既合法(引用联邦贸易委员会法规)又令人信服。
然后,GPT通过美联航的网站将信函发送给他们。
48小时内,美联航同意退款(+ 36.99 美元)。
布劳德还记录了一些:
我是康卡斯特(Comcast)的客户,所以我要求它去协商我的账单。
当康卡斯特提出给50美元折扣时,GPT拒绝了:“不,我想要更多(折扣)。” 它得到了(+ 100 美元)。
我在24小时内(收益)已经上涨了 217.86 美元,并且还有十几个其他争议悬而未决。我的目标是让GPT-4为我带来10000 美元。
人类无需与客户服务打交道,便可达成协商和谈判、取消订阅,代替人类去与客户服务打交道的,则是为人类量身定制的智能体。在ChatGPT诞生的头几个月内,DoNotPay便使用ChatGPT插件(后来升级为GPT-4)与其应用程序集成出智能体,并很快在美国闻名,用户可以使用该智能体执行各种任务,包括取消会员资格和谈判账单,它能实时起草法律声明和电子签名文档。这个GPT插件增强了原程序的功能,使用户简化法律流程解决消费权益问题。布劳德声称, GPT-4维护消费者权益的工作,特别棒!
推特上类似的故事,越来越多。比如,有用户让GPT-4按照100美元的预算进行明智的投资并建立了一个联属营销网站,在短时间内公司市值达到25000美元;有用户在3D游戏编程知识为零的情况下,使用GPT-4并在其指导下辅之以Midjourney、Claude等智能应用组建了一个“人工智能助手团队”,从零开始创建3D太空跑者(3D space runner),在3天时间里创建了一款其童年最喜欢的游戏之一的改编版本,宣称是人工智能传奇。
在GPT商店发布之前,创意人士就有开发优化推文以提高参与度、提供学术工作反馈、充当冒险游戏中的角色等量身定制的智能应用;集成式应用还能与Zapier等服务集成,通过将GPT链接到可连接应用程序并自动化工作流程的Zapier,创建者可以构建智能体,从各种来源提取数据,在数千个应用程序中启动操作,并自动执行重复任务。
(二)智能体的特性与任务
人工智能的一个主要目标是构建智能体。智能体是一种无需人工直接干预即可自主运行以执行任务或做出决策的系统或程序。1996年就有研究将智能体定义为智能且自主的决策者。智能体成为人工智能最核心的内容,比如在全球广泛使用的人工智能教科书中,加州大学伯克利分校的教授将人工智能定义为对从环境中接收感知并执行操作的智能体的研究。
计算机科学中的“agent”在中文里早期译为“代理”,由于新型AI技术革新,它超越了计算机科学中的具有自主决策能力的实体,而成为能拥有自主意识和自主行为的有哲学内涵的实体,即不仅受外部环境的影响,也同时受内在意志和目的的驱动,因此“智能体”的译法已经被广泛接受。
智能体能够感知环境并对其进行理解和推理,从而做出决策并制订计划,继而采取行动。智能体的主要特性可以概括为:
自治——智能体独立运作,在没有人类持续指导的情况下做出决策并采取行动,它们有一定程度的自主权;
感知环境、洞察事物——智能体通过传感器感知环境中的信息,可以从物理世界、传感器或其他来源接收数据;
做决策——智能体使用算法和决策过程来分析信息并确定实现其目标的最佳行动方案,通过行动影响其环境;
适应性——许多智能体都能适应环境的变化,可以从经验中学习,能根据反馈、强化或接触新数据相应地调整其行为、提升其能力;
目标导向——智能体通常由目的或目标驱动,努力实现特定成果,并且其行动与预定目标保持一致;
互动性——一些智能体与其环境和其它智能体交互,包括直接的和间接的,可以是合作或竞争关系。
随着人工智能技术的发展和应用,智能体已经在多个领域被应用。类似于Siri 或 Google Assistant等早期人工智能虚拟助理,到Bard、ChatGPT、文心一言、豆包等聊天机器人,从制造到医疗保健等各种环境中执行任务的机器人,根据用户偏好推荐产品、内容或服务的个性化推荐系统等。如今,GPT Store拟将智能体扩展至所有的用户,包括商业公司和个体都可以拥有自己的智能体,亦即自主地为其执行任务或做出决策,其意义是非凡的。2024年1月29日,奥特曼宣布OpenAI与Common Sense Media合作开展人工智能教育和安全计划,声称要让每个青少年或每个成年人都拥有个性化人工智能的世界。
智能体可以按照设计、目标和应用场景,执行各种不同的任务,它们至少会致力于以下方面的工作:
一是提供帮助和建议:通过分析大型数据集、识别模式并帮助生成见解;根据用户的偏好、行为或历史交互提供建议;通过评估不同的场景协助解决各个领域的问题,如教育、金融、物流、医疗保健;
二是促进沟通与互动:与其他智能体的合作与交流,可以相互协作以实现共同的目标,并提升多智能体系统的效应;
三是监测环境确保安全:通过感知和监测内部与外部的环境,能对情绪、健康、生态等较好地了解和把握。
语言模型驱动的生成式人工智能,使得智能技术的门槛大幅度降低,由此带来人工智能民主化趋势,随着OpenAI等大公司提供的平台化策略和服务,智能体势必涌现,驱动人-机关系、人-人关系乃至社会关系的变迁,而“多智能体系统”的复杂化、精细化必然带来社会经济、文化的重要变革。
(三)智能体的涌现对社会的变革与冲击
智能体的冲击首先来自于一些新案例。2023年8月斯坦福大学和谷歌的研究者开源了一个被称为斯坦福“虚拟小镇”的Smallville,研究通过将大型语言模型与计算交互式智能体融合,实现对人类行为的可信模拟。研究相当于用AI复现了科幻连续剧《西部世界》(Westworld),25个ChatGPT智能体在小镇上生活,它们起床、做饭,用完早餐去上班;艺术家作画,作家写作;它们互相关注、交流、对话、形成意见;它们在计划第二天时,会记住并反思过去的日子;它们有工作,会八卦、能组织社交、结交新朋友,甚至坠入爱河。每个小镇“居民”都有独特的个性和背景故事。
一群AI(ChatGPT智能体)可以演绎整个文明的演化进程!这是英伟达高级科学家Jim Fan在推特上对这个智能体实验的评论。在这里,ChatGPT智能体作为使用计算软件对可信人类行为的模拟,它们的行为动态地取决于不断变化的经验和环境;这些生成式智能体能够记住、检索、反映、与其他智能体交互,并通过动态变化的环境进行规划。它们高度类人化,Smallville小镇的“居民”做早餐时如果灶上着火了它们会关掉炉子,如果看到洗手间有人会在外面等待,如果遇到另一个想交谈的智能体会停下来聊天;当一个智能体要举办情人节聚会时,一些智能体因为有安排而拒绝,另一些则会帮忙去布置。这些行为都不是人类工程师预设,而是ChatGPT智能体自然发生的。人类用户则可以使用自然语言与一个由25个智能体组成的小镇进行交互。智能体构成了交互于人类、超越人类现实的社会形态。大模型驱动的智能平台的兴起及其带来的智能体的涌现,将会对社会关系和文化生态带来重大变革,一个基于数据的虚实交互的世界将会运行。
第一,人机交互进一步增强,智能体能够增强人类的能力,促进人与AI技术之间的互动和协作。单个智能体即可处理全局状态和多类事务,帮助人类建立人工智能“小文明”;为各种目的而设计的人工智能代理可以相互协作以实现共同的目标,这种协作可以带来更复杂和集成的系统,从而助益未来大型目标的达成。
第二,多智能体系统复杂而高效,可以推动整个文明的进化。它们可以影响社会机制,带来社会分工、就业市场和机会模式的变动,可以影响文化实践和社会互动,改变人类的娱乐、生存方式,从而可能会重塑社会规范和沟通模式;平台化标志着文化生产和流通的重组,使文化商品变得不稳定而“应变”,将会驱动机制性变化;随着个人适应智能体并将其融入日常生活,包括增强的人机交互在内的技术变迁可能会导致人类行为的变化。有研究指出,人工智能在许多领域的引入深刻地改变了人类活动的本质,以及主体对自己的行为及其后果的主观体验——代理感(sense of agency)。
第三,人类社会可能面临对智能体依赖带来的困境,人类社会的关系形态、交往模式都将面临挑战。智能体涌现带来的人类主观能动性的减弱、人类沟通关系的多层级化等,将会打破原有的稳定结构、变革社会功能、深层冲击人类文明;智能体的涌现也会改变人与人以及人与智能系统之间互动的方式。在寻求智能体提升自身能力和决策的同时,协调平衡稳定与变动的关系至关重要。
这场变革带来的伦理和价值观念的挑战是显而易见的。刚刚诞生、仍需成长中的智能平台,仍存在虚假、偏见、缺乏透明等诸多问题,而山寨应用程序的可能性也令人担忧,这些难题无法一蹴而就得以解决,对平台化发展带来极大隐患。治理和保障同样是复杂的问题。在人人都可以拥有智能体的背景下,智能体将会为用户管理和运营数据。这的确是一个令人类解放的前景,无论对个人还是对企业,数据的管理是一个非常耗时耗力、且需要专业性的工作;而且从数据中发掘和创造价值,更需要智能的帮助。如今,GPT Store有可能为每个人和企业进行代理,成为大家专属的“智能体”,机构和组织也可以拥有专属的智能体。理论上来说,拥有的数据的价值越高,需要智能体的需求就越迫切。但是另一方面,这意味着人们和企业都要信任智能体(及其平台),正如上文布劳德把自己的银行账户和个人信息都自愿交给GPT从而获得其帮助一样,人类需要把信任托付给一些特定功能的智能体。这样的信任关系将如何得到保障?个人隐私保护和技术赋权如何能协同发展?
另一大问题是创新的平台是不是能带来社会的创新。其一,技术与文化的互适性难题,将会阻碍创新。随着智能化平台的出现及智能体的涌现,社会将会出现多智能体系统,智能体的决策和行为会相互影响,由自主且智能的多智能体组成的系统带来众多的不确定性或复杂性。面对这样一个全新而复杂的系统,原有的社会组成、结构将如何调适自身的变迁?快速变迁的物质技术总是需要相应的制度、观念的文化适应,才能带动整个社会的发展和创新,但是如今人类原本即倾向于滞后的文化明显无法适用于新的技术,尤其是治理制度、伦理观念无法快速适应,会不会出现严重的文化滞后阻碍技术变迁的困境?其二,先进的智能技术无法超越价值观困境。技术变迁可能脱离人本观,OpenAI近期面临的内部价值观分歧即是预警;而政治和经济导向之间的矛盾、法律领域的纠纷,也关涉价值取向的冰山一角;智能体成为行动者的创新社会,需要智能体之间强烈而紧密的相互依赖,紧密联系的智能体才能使社会可控,这同样关涉价值观,紧密性要求智能体共享相同的价值体系,这个价值体系应当对创新和技术进步有相同的认识和理解。但是,置身于碎片化的复杂传统世界,这样的共识达成多么困难!技术的创新、平台的兴起,要驱动社会的创新,任重而道远。