这本书就是展现它未来的模样

张问骅 2023-02-16 发布于甘肃

展开全文

（扫上图二维码即可订阅喜马拉雅平台老牛读书会）

昨日AI已是今日生活，了解今日AI让你看见明日未来。这本书展现的就是它未来的模样。

——芬兰图尔库大学算法研究客座教授，《计算机游戏的算法和网络》、《交互式故事讲述手册》作者乔尼·森德（Jouni Smed）

2022年12月16日，Science杂志发布了2022年度科学十大突破，AIGC（人工智能生成内容，AI Generated Content））赫然在列。一时间，AIGC成为当下最炙手可热的概念。

无论是横空出世的AI绘画，还是势不可挡的ChatGPT，都属于AIGC这一概念。谁曾想到，在元宇宙、Web3.0等概念风靡的2022年，AI凭借“创作”强势崛起。这也预示着AIGC元年即将开启，下一个万亿赛道即将爆发。

什么是AIGC？它起源于何方、它的技术思想是什么？它对资讯、影视、电商、教育、金融、医疗行业会产生什么样的颠覆性影响？它又是如何运用到产品研发、市场营销、管理协作的？它的上中下游产业链是什么，未来会引领我们走向何方？

小编今天就给大家推荐一本由中译出版社本月新鲜出炉的新书《AIGC：智能创作时代》。

本书结合生动的比喻和有趣的案例，向所有关注未来科技的从业者、创业者、投资人、政府部门科普了上述一系列问题，让每个人都能读懂 ChatGPT、更好地了解并把握AIGC带来的行业机遇、一起迎接全新的智能创作时代。

老牛精选

《AIGC：智能创作时代》

杜雨张孜铭著

中译出版社

从机器学习到智能创造

不知道你有没有想过这样一个问题：是什么让我们得以思考？

从如同一张白纸的婴儿，成长为洞悉世事的成人，正是长辈的教诲和十年寒窗塑造了我们如今的思考力。学习，似乎就是智能形成的最大奥秘。

人类崇尚智能，向往智能，并不断利用智能改造世界。走过农业革命，迈过工业革命，迎来信息革命，一次又一次对于生产力的改造让人们相信，人类的智能最终也能创造出人工的智能。

数十年前，图灵抛出的时代之问“机器能思考吗？”，将人工智能从科幻拉至现实，奠定了后续人工智能发展的基础。之后，无数计算机科学的先驱开始解构人类智能的形成，希望找到赋予机器智能的蛛丝马迹。

正如谷歌秘密研究实验室Google X创始人塞巴斯蒂安·特伦(Sebastian Thrun)，所言：“人工智能更像是一门人文学科。其本质在于尝试理解人类的智能与认知。”如同人类通过学习获得智能一样，自20世纪80年代起，机器学习成为人工智能发展的重要力量。

机器学习是指让计算机从数据中汲取知识，并按照人类所期望的，按部就班执行各种任务。机器学习在造福人类的同时，似乎也暴露出了一些问题，这样的人工智能并非人类最终期望的模样，它缺少了人类“智能”二字所涵盖的基本特质——创造力。

这个问题就好像电影《我，机器人》中所演绎的一样，主角曾与机器人展开了激烈的辩论，面对“机器人能写出交响乐吗？”“机器人能把画布变成美丽的艺术品吗？”等一连串提问，机器人只能讥讽一句“难道你会？”。这也让创造力成为区分人类与机器最本质的标准之一。

电影《我，机器人》剧照

人类的智能真的不如机器？

面对庐山雄壮的瀑布时，李白写出“飞流直下三千尺，疑是银河落九天”的千古绝句，感慨眼前的壮丽美景；

偶遇北宋繁荣热闹的街景时，张择端绘制出《清明上河图》这样的传世名画，记录下当时的市井风光与民风淳朴；

邂逅汉阳江口的知音时，伯牙谱写出《高山流水》，能拉近秋夜里两位知己彼此的心灵。

我们写诗，我们作画，我们谱曲，我们尽情发挥着创造力去描绘我们的所见所闻，我们因此成为人类的一分子，这既是智能的意义，也是我们生活的意义。

但是，人类的创造力真的不能赋予机器创造力吗？答案显然是否定的。

在埃米尔·博雷尔1913年发表的《静态力学与不可逆性》论文中，曾提出这样一个思想实验：假设猴子学会了随意按下打字机的按钮，当无限只猴子在无限台打字机上随机乱敲，并持续无限久的时间，在某个时刻，将会有猴子能打出莎士比亚的全部著作。

虽然最初这是一个说明概率理论的例子，但它也诠释了机器具备创造力的可能性。只不过具备的条件过于苛刻，需要在随机性上叠加上无穷的时间量度。

在科学家的不懈努力下，这个时间量度被从无限缩减至了有限。随着深度学习的发展和大模型的广泛应用，生成型人工智能已经走向了成熟，人们沿着机器学习的路，探索出了智能创造的今天。

在智能创作时代，机器能够写诗，能够作画，能够谱曲，甚至能够与人类自然流畅地对话。人工智能生成内容（AIGC）将带来一场深刻的生产力变革，而这份变革也会影响到人们工作与生活的方方面面。

AIGC：开启智能创作时代

面对互联网内容生产效率提升的迫切需求，人们突发奇想，是否能够利用人工智能去辅助内容生产呢？进入互联网时代后，产生了所谓专业生产内容（PGC），也出现了以此作为职业获得报酬的职业生产内容（OGC）。与此同时，“用户生成内容”（UGC）的概念和技术也逐渐发展，由此形成了用户内容生态。

相较于PGC、OGC和UGC，AIGC通过人工智能技术实现内容生成，并在生成中注入了“创作”，意味着自然智能所“独有”和“垄断”的写作、绘画、音乐、教育等创造性工作的历史走向终结。内容生成的四个阶段（见下图）：

内容生成的四个阶段

正如人们最初眺望WEB3.0时构想的“语义网”一样，未来的互联网应该是更加智能的互联网，它不仅能够读懂各种语义信息，还能从信息角度解放人类的生产力。

让人工智能这样的非人机器学会创作绝非易事，科学家在过往做了诸多尝试，并将这一研究领域称为生成式人工智能（Generative AI）（本书未对生成式人工智能和AIGC特别加以区别，均以AIGC代之），主要研究人工智能如何被用于创建文本、音频、图像、视频等各种模态的信息。

虽然各种类型的AIGC应用不断涌现，但在此前并未获得全社会的广泛关注。2022 年下半年，两个重要事件激发了人们对AIGC的关注。

2022年8月，美国科罗拉多州博览会上，数字艺术类冠军颁发给了由AI自动生成并经由Photoshop润色的画作《太空歌剧院》，该消息一经发布就引起了轩然大波。

该画作兼具古典神韵和太空的深邃奥妙，如此恢宏细腻的画风很难让人相信它是由AI自动生成的作品，而它夺得冠军的结果也大大冲击了人们过往对于“人工智能的创造力远逊于人”的固有认知，自此彻底引爆了人们对于 AIGC的兴趣与讨论，AIGC也从看似遥远的概念逐步以生动有趣的方式走入人们的生活，带来了过去令人难以想象的丰富体验。

2022年11月30日，OpenAI发布了名为ChatGPT（Generative Pre-Training，中文意思为生成式预训练）的超级AI对话模型，再次引爆了人们对于AIGC技术的讨论热潮。

AIGC的核心技术价值是实现了”自然语言”与人工智能的融合。自然语言是一个包括词法、词性、句法、语义的体系，也是不断演进的动态体系。

而ChatGPT则代表了AIGC的最新进展。它完成了机器学习算法发展中，自然语言处理领域的历史性跨越，即通过大规模预训练模型，形成人工智能技术理解自然语言和文本生成能力，能完成脚本编写、文案撰写、翻译等任务。

这是人类文明史上翻天覆地的革命，开启了任何阶层、任何职业都可以以任何自然语言和人工智能交流，并且生产出从美术作品到学术论文的多样化内容产品。在这样的过程中，AIGC“异化”为一种理解、超越和生成各种自然语言文本的超级“系统”。

ChatGPT不仅可以清晰地理解用户的问题，还能如同人类一般流畅地回答用户的问题，并完成一些复杂任务，包括按照特定文风撰写诗歌、假扮特定角色对话、修改错误代码等。

此外，ChatGPT还表现出一些人类特质，例如承认自己的错误，按照设定的道德准则拒绝不怀好意的请求等。

ChatGPT：目前功能最强大的AI文本生成器

作为新事物，很多人可能并还不清楚ChatGPT到底是什么？但其实，许多网友，早已接触过类似于ChatGPT的人工智能创作的内容。

在书中，作者简要列举了一些更加常规的、结构化的AIGC应用，例如2016年5月，四川绵阳发生4.3级地震时，中国地震台网开发的地震信息播报机器人，在6秒内写出了560字的快速报道；

2017年8月，当四川九寨沟县发生7.0级地震时，该机器人不仅翔实地撰写了有关地震发生地及周边的人口聚集情况、地形地貌特征、当地地震发生历史及发生时的天气情况等基本信息，还配有5张图片，全过程不超过25秒；在后续的余震报道中，该机器人的最快发布速度仅为5秒……

这种AI结构化写作，还可以被用于生成自动标题与摘要，它可以通过自然语言处理，对一篇纯文本内容进行读取与加工，从而生成标题与摘要。

例如输入文本内容：“今日，中国三条重要高铁干线—兰新高铁、贵广铁路和南广铁路将开通运营。其中兰新高铁是中国首条高原高铁，全长1776公里，最高票价658元。贵广铁路最高票价320元，南广铁路最高票价206.5元，这两条线路大大缩短西南与各地的时空距离。”可以得到AI返回的标题：“中国'高铁版图’再扩容，三条重要高铁今日开通”。

而与前文所展示的例子不同，ChatGPT 可以同时作为问答、聊天及创作 AI 存在，它的使用场景日常且多样，融合了文案生成、小说续写、代码生成、代码漏洞修复、在线问诊等场景，甚至展现出了超越搜索引擎的潜力。

作者通过和ChatGPT对话，带着读者直观感受了ChatGPT 的强大功能，比如作者问ChatGPT

问：我想写一本关于 AIGC 的书，该怎么拟定大纲框架 ?

AI ：第一部分：AIGC 的概述
·介绍 AIGC 是什么，它的基本概念和特点。
·讲述 AIGC 的发展历程，以及它的技术背景。
第二部分：AIGC 的应用
第一章 AIGC：内容生产力的大变革
·讨论 AIGC 在各个领域的应用情况。
·举例说明 AIGC 在客服、语音识别和翻译等方面的具体应用。
第三部分：AIGC 的未来
·展望 AIGC 的发展趋势。
·探讨 AIGC 在未来可能的应用场景。
第四部分：总结

除了写作辅导，作者还试一下它能不能教人表白。

问：我想要在 2022 年结束前，和我喜欢的人告白，请帮我想一段诚挚的告白的话。
AI ：亲爱的，在这个即将结束的 2022 年，我想对你说：我喜欢你，喜欢你的一切。我喜欢和你在一起的感觉，感觉你陪伴的温暖。你是我一生中遇见的最特别的人，我希望我们能一直在一起，共度余生，请让我成为你的伴侣，与你共同走过这段旅程。

不会发朋友圈？不会写贺卡？也可以试试求助人工智能！

问：请帮我写一条朋友圈，表达我失眠的心情，同时体现我的文学才华。
AI ：朋友们，今晚我又失眠了。我坐在床上，面对着漆黑的天花板，想象着各种奇怪的事情，挣扎着想要入睡，却始终如故。失眠之苦，唯有身在其中的人才能体会。
我想起了莎士比亚的名句：“夜深人静，空气中弥漫着一种诡异的气息。”是的，失眠之夜，就像漆黑的夜空，让人感到不安和孤独。
朋友们，你们有没有好的方法，能帮助我入睡呢？敬请指教。

这还不是最有趣的。最有趣的是，ChatGPT 具有很强的上下文连接与多轮对话的能力。ChatGPT 还具有记忆能力，当向它追问 “能不能再夸张一点”时，它可以在之前生成的文案基础上进行改写。这种连续对话大幅提高了人机交互体验。

问：能不能再夸张一点？

AI ：朋友们，今晚我又失眠了。我翻来覆去，把被子打成了螺旋形，绷得紧绷绷的，就像拧紧了弹簧一样。失眠之苦，实在是令人难以忍受。
我想起了莎士比亚先生的名言：“夜深人静，空气中弥漫着一种诡异的气息。”是的，失眠之夜，就像漆黑的夜空，让人感到不安和孤独，我想，失眠之人，应该像受伤的勇士一样，坚强地挺过难关。我们要不屈不挠，不懈地努力，才能摆脱失眠的折磨，才能重新健康地
入睡。
朋友们，你们有没有好的方法，能帮助我入睡呢？敬请指教。

甚至当不会撰写代码的时候，你也可以尝试求助于 ChatGPT。不只是辅助编程，ChatGPT 甚至在一些测试中可以直接修改代码，并给出可以直接复制的代码示例，这在未来将极大减轻程序员的工作强度。

未来最火的职业是提示词（Prompt）工程师？

著名经济学家朱嘉明在本书的代序言中写道，伴随AIGC生成算法的优化与改进，AIGC对于普通人来说也不再是一门遥不可及的尖端技术。

AIGC在文字、图像、音频、游戏和代码生成中商业模型渐显。2B（to Business的简称）将是AIGC的主要商业模式，因为它有助于B端提高效率和降低成本，以填补数字鸿沟。

但可以预见，由于AIGC“原住民”的成长，2C（to Customer的简称）的商业模式将接踵而来。根据有关机构预测，2030年的AIGC市场规模将超过万亿人民币，其产业规模规模生态（见下图）：

AIGC产业规模生态分布

现在，AIGC在语言模型领域的全方位竞争已经开始。所以才有微软对OpenAI的大规模投资，因为有这样一种说法：“微软下个十年的想象力，藏在ChatGPT里。”近日，谷歌宣布推出基于“对话应用语言模型”（LaMDA）的Bard，实现其搜索引擎将包括人工智能驱动功能。

ChatGPT刺激谷歌开始“创新者困境”突围。未来很可能出现Bard和ChatGPT的对决或共存，也就是LaMDA和GPT-3.5的对决和共存，构成AIGC竞争和自然垄断的新生态。

在这样的新兴产业构造和商业模式下，就业市场将会发生根本性改变：其一，专业职场重组，相当多的职业可能衰落和消亡；其二，原本支持IT和AI产业的码农队伍面临严重萎缩。因为AIGC极大刺激全球外包模式并取代码农。

《AIGC智能创作时代》一书中也举例说明了产品经理如何引导 ChatGPT 生成产品需求文档，训练 ChatGPT 根据自己之前写的周报自主修改周报。

根据用户 Jiayuan@Tisoga 在推特上分享的案例， ChatGPT 目前生成的产品需求文档内容完备且带有技术方案，未来产品经理需要做的可能只是和 ChatGPT 聊一下自己的想法以及项目相关背景，让 AI 生成一份草稿文档，再进行修改润色即可。

同样，用户也可以通过不断的提问引导 ChatGPT，层层递进完成从研究框架到研究报告的输出。先让 ChatGPT 生成报告大纲，再通过类似专家访谈一样一步步提问让 ChatGPT 补充报告内容，并在这个过程中根据其答案进行衍生提问，不断完善它的逻辑。例如，按照上面回答中的写作大纲，我们可以让 ChatGPT 继续写下去：什么是 AIGC？它的基本概念与特点是什么？

面对这样强大的功能，很难不让人幻想 AI 生成文本的未来：程序员、研究员、产品经理等涉及重复性工作的脑力劳动者可能都将被 AI 取代，这些职业可能都演变成了新的职业—提示词（Prompt）工程师，目的就是帮助人类更好地与 AI 互动。

智能创作时代正在缓缓拉开序幕

ChatGPT一上线，就引发网民争相体验，到处都是体验与探讨ChatGPT的文章和视频。

据小编亲测，ChatGPT对上至高考作文、下至情人节礼物之类的话题都能说上几段逻辑通顺、且找不出语法毛病的话来，甚至能对某本图书发表貌似客观的评论。

但当数据和所受训练不足以支撑它的回答，明显开始言之无物、顾左右而言他，甚至是一本正经地胡说八道。

最主要的问题，ChatGPT的回答四平八稳，看不出有明显的个人风格或是独立观点，这当然也跟它所受的训练有关。而且一旦涉及专业性强的问题，除了那些领域的专家之外，普通人根本无法判定ChatGPT给出的答案是否正确。

不过，正如朱嘉明老师指出的那样，AIGC的进化是参数以几何级数扩展为基础。AIGC形成的学习能力决定于参数的规模。GPT-2大约有15亿个参数，而GPT-3最大的模型有1750亿个参数，上升了两个数量级。

而且，它不仅参数规模更大，训练所需的数据也更多。根据媒体报道但还未被证实的消息，GPT-4 的参数可能将达到100万亿规模（见下图）：

GPT-4的参数规模

根据学界经验，深度神经网络的学习能力和模型的参数规模呈正相关。人类的大脑皮层有 140多亿个神经细胞，每个神经细胞又有3万多个突触。所以，大脑皮层的突触总数超过100万亿个。

所谓的神经细胞就是通过这些突触相互建立联系。假设GPT-4实现100万亿参数规模，堪比人的大脑，意味着它达到与人类大脑神经触点规模的同等水平。

所以，我们有理由相信，人类的这一创造物终究会帮助人类自身的发展，AIGC 无疑是一种生产力的变革，将世界送入智能创作时代。

在《AIGC智能创作时代》一书中，作者将创作者生产力的提升表现归纳为三个方面：

· 代替创作中的重复环节，提升创作效率。

· 将创意与创作相分离，内容创作者可以从人工智能的生成作品中找寻灵感与思路。

· 综合海量预训练的数据和模型中引入的随机性，有利于拓展创新的边界，创作者可以生产出过去无法想出的杰出创意。

当然，AIGC也并非完美无缺，“人工智能生成的内容如何确定版权归属”“AIGC是否会被不法分子利用，生成具有风险性的内容或用于违法犯罪活动”等一系列问题都是现在人们争论的焦点。

目前，学界与业界在尝试从各个方面解决这些问题。但不管怎样，AIGC的迅猛发展已成不可逆转之势，智能创作时代的序幕正在缓缓拉开。

无论你接受与否，我们每个人都已经置身于AIGC这场迅猛发展的洪流之中。这也是我们在此时推荐本书的初衷。这是一本AIGC入门读物，一本可以让我们真正了解ChatGPT、捕捉下一个引爆点生成式AI的书籍。

ChatGPT、OpenAI、生成式AI、人工智能、Web3.0、聊天机器人、搜索工具、文本创造工具、AI绘画、Stable Diffusion、Midjourney，如果你想更深刻地了解这些日益见诸于新闻的技术术语，本书将是一个很好的开始。

本书的作者之一杜雨为中国社会科学院大学技术经济学博士研究生，先后就职于腾讯、红杉资本，长期关注数字经济与科技创新；作者张孜铭为北京大学管理学硕士，新加坡国立大学金融工程硕士。元宇宙教育实验室智库专家，两人合著有《WEB3.0：赋能数字经济新时代》。

2022年，Web3.0 受到前所未有的关注和讨论，杜雨和张孜铭二人适时推出《WEB3.0 ：赋能数字经济新时代》一书，帮助大众打开这一重要趋势的认知大门。和那本书一样，《AIGC：智能创作时代》也用浅显的语言为我们详细介绍了有关AIGC方方面面的重要话题，以便我们更好地了解并把握AIGC给各行各业带来的机遇和挑战。

经我们的努力，中译出版社特别为我们的读者提供了35本作者签名版《AIGC：智能创作时代》，今天我们也一本不留全拿出来，回馈一直支持我们公众号的粉丝，前35名下单读者即可拥有签名版《AIGC智能创作时代》，数量有限，只有35本，先到先得哦！

老牛精选

《AIGC：智能创作时代》