(扫上图二维码即可订阅喜马拉雅平台老牛读书会) 昨日AI已是今日生活,了解今日AI让你看见明日未来。这本书展现的就是它未来的模样。 ——芬兰图尔库大学算法研究客座教授,《计算机游戏的算法和网络》、《交互式故事讲述手册》作者 乔尼·森德(Jouni Smed) 2022年12月16日,Science杂志发布了2022年度科学十大突破,AIGC(人工智能生成内容,AI Generated Content))赫然在列。一时间,AIGC成为当下最炙手可热的概念。 无论是横空出世的AI绘画,还是势不可挡的ChatGPT,都属于AIGC这一概念。谁曾想到,在元宇宙、Web3.0等概念风靡的2022年,AI凭借“创作”强势崛起。这也预示着AIGC元年即将开启,下一个万亿赛道即将爆发。 什么是AIGC?它起源于何方、它的技术思想是什么?它对资讯、影视、电商、教育、金融、医疗行业会产生什么样的颠覆性影响?它又是如何运用到产品研发、市场营销、管理协作的?它的上中下游产业链是什么,未来会引领我们走向何方? 小编今天就给大家推荐一本由中译出版社本月新鲜出炉的新书《AIGC:智能创作时代》。 本书结合生动的比喻和有趣的案例,向所有关注未来科技的从业者、创业者、投资人、政府部门科普了上述一系列问题,让每个人都能读懂 ChatGPT、更好地了解并把握AIGC带来的行业机遇、一起迎接全新的智能创作时代。 老牛精选 《AIGC:智能创作时代》 杜雨 张孜铭著 中译出版社 从机器学习到智能创造 不知道你有没有想过这样一个问题:是什么让我们得以思考? 从如同一张白纸的婴儿,成长为洞悉世事的成人,正是长辈的教诲和十年寒窗塑造了我们如今的思考力。学习,似乎就是智能形成的最大奥秘。 人类崇尚智能,向往智能,并不断利用智能改造世界。走过农业革命,迈过工业革命,迎来信息革命,一次又一次对于生产力的改造让人们相信,人类的智能最终也能创造出人工的智能。 数十年前,图灵抛出的时代之问“机器能思考吗?”,将人工智能从科幻拉至现实,奠定了后续人工智能发展的基础。之后,无数计算机科学的先驱开始解构人类智能的形成,希望找到赋予机器智能的蛛丝马迹。 正如谷歌秘密研究实验室Google X创始人塞巴斯蒂安·特伦(Sebastian Thrun),所言:“人工智能更像是一门人文学科。其本质在于尝试理解人类的智能与认知。”如同人类通过学习获得智能一样,自20世纪80年代起,机器学习成为人工智能发展的重要力量。 机器学习是指让计算机从数据中汲取知识,并按照人类所期望的,按部就班执行各种任务。机器学习在造福人类的同时,似乎也暴露出了一些问题,这样的人工智能并非人类最终期望的模样,它缺少了人类“智能”二字所涵盖的基本特质——创造力。 这个问题就好像电影《我,机器人》中所演绎的一样,主角曾与机器人展开了激烈的辩论,面对“机器人能写出交响乐吗?”“机器人能把画布变成美丽的艺术品吗?”等一连串提问,机器人只能讥讽一句“难道你会?”。这也让创造力成为区分人类与机器最本质的标准之一。 电影《我,机器人》剧照 人类的智能真的不如机器? 面对庐山雄壮的瀑布时,李白写出“飞流直下三千尺,疑是银河落九天”的千古绝句,感慨眼前的壮丽美景; 偶遇北宋繁荣热闹的街景时,张择端绘制出《清明上河图》这样的传世名画,记录下当时的市井风光与民风淳朴; 邂逅汉阳江口的知音时,伯牙谱写出《高山流水》,能拉近秋夜里两位知己彼此的心灵。 我们写诗,我们作画,我们谱曲,我们尽情发挥着创造力去描绘我们的所见所闻,我们因此成为人类的一分子,这既是智能的意义,也是我们生活的意义。 但是,人类的创造力真的不能赋予机器创造力吗?答案显然是否定的。 在埃米尔·博雷尔1913年发表的《静态力学与不可逆性》论文中,曾提出这样一个思想实验:假设猴子学会了随意按下打字机的按钮,当无限只猴子在无限台打字机上随机乱敲,并持续无限久的时间,在某个时刻,将会有猴子能打出莎士比亚的全部著作。 虽然最初这是一个说明概率理论的例子,但它也诠释了机器具备创造力的可能性。只不过具备的条件过于苛刻,需要在随机性上叠加上无穷的时间量度。 在科学家的不懈努力下,这个时间量度被从无限缩减至了有限。随着深度学习的发展和大模型的广泛应用,生成型人工智能已经走向了成熟,人们沿着机器学习的路,探索出了智能创造的今天。 在智能创作时代,机器能够写诗,能够作画,能够谱曲,甚至能够与人类自然流畅地对话。人工智能生成内容(AIGC)将带来一场深刻的生产力变革,而这份变革也会影响到人们工作与生活的方方面面。 AIGC:开启智能创作时代 面对互联网内容生产效率提升的迫切需求,人们突发奇想,是否能够利用人工智能去辅助内容生产呢?进入互联网时代后,产生了所谓专业生产内容(PGC),也出现了以此作为职业获得报酬的职业生产内容(OGC)。与此同时,“用户生成内容”(UGC)的概念和技术也逐渐发展,由此形成了用户内容生态。 相较于PGC、OGC和UGC,AIGC通过人工智能技术实现内容生成,并在生成中注入了“创作”,意味着自然智能所“独有”和“垄断”的写作、绘画、音乐、教育等创造性工作的历史走向终结。内容生成的四个阶段(见下图): 内容生成的四个阶段 正如人们最初眺望WEB3.0时构想的“语义网”一样,未来的互联网应该是更加智能的互联网,它不仅能够读懂各种语义信息,还能从信息角度解放人类的生产力。 让人工智能这样的非人机器学会创作绝非易事,科学家在过往做了诸多尝试,并将这一研究领域称为生成式人工智能(Generative AI)(本书未对生成式人工智能和AIGC特别加以区别,均以AIGC代之),主要研究人工智能如何被用于创建文本、音频、图像、视频等各种模态的信息。 虽然各种类型的AIGC应用不断涌现,但在此前并未获得全社会的广泛关注。2022 年下半年,两个重要事件激发了人们对AIGC的关注。 2022年8月,美国科罗拉多州博览会上,数字艺术类冠军颁发给了由AI自动生成并经由Photoshop润色的画作《太空歌剧院》,该消息一经发布就引起了轩然大波。 该画作兼具古典神韵和太空的深邃奥妙,如此恢宏细腻的画风很难让人相信它是由AI自动生成的作品,而它夺得冠军的结果也大大冲击了人们过往对于“人工智能的创造力远逊于人”的固有认知,自此彻底引爆了人们对于 AIGC的兴趣与讨论,AIGC也从看似遥远的概念逐步以生动有趣的方式走入人们的生活,带来了过去令人难以想象的丰富体验。 2022年11月30日,OpenAI发布了名为ChatGPT(Generative Pre-Training,中文意思为生成式预训练)的超级AI对话模型,再次引爆了人们对于AIGC技术的讨论热潮。 AIGC的核心技术价值是实现了”自然语言”与人工智能的融合。自然语言是一个包括词法、词性、句法、语义的体系,也是不断演进的动态体系。 而ChatGPT则代表了AIGC的最新进展。它完成了机器学习算法发展中,自然语言处理领域的历史性跨越,即通过大规模预训练模型,形成人工智能技术理解自然语言和文本生成能力,能完成脚本编写、文案撰写、翻译等任务。 这是人类文明史上翻天覆地的革命,开启了任何阶层、任何职业都可以以任何自然语言和人工智能交流,并且生产出从美术作品到学术论文的多样化内容产品。在这样的过程中,AIGC“异化”为一种理解、超越和生成各种自然语言文本的超级“系统”。 ChatGPT不仅可以清晰地理解用户的问题,还能如同人类一般流畅地回答用户的问题,并完成一些复杂任务,包括按照特定文风撰写诗歌、假扮特定角色对话、修改错误代码等。 此外,ChatGPT还表现出一些人类特质,例如承认自己的错误,按照设定的道德准则拒绝不怀好意的请求等。 ChatGPT:目前功能最强大的AI文本生成器作为新事物,很多人可能并还不清楚ChatGPT到底是什么?但其实,许多网友,早已接触过类似于ChatGPT的人工智能创作的内容。 在书中,作者简要列举了一些更加常规的、结构化的AIGC应用,例如2016年5月,四川绵阳发生4.3级地震时,中国地震台网开发的地震信息播报机器人,在6秒内写出了560字的快速报道; 2017年8月,当四川九寨沟县发生7.0级地震时,该机器人不仅翔实地撰写了有关地震发生地及周边的人口聚集情况、地形地貌特征、当地地震发生历史及发生时的天气情况等基本信息,还配有5张图片,全过程不超过25秒;在后续的余震报道中,该机器人的最快发布速度仅为5秒…… 这种AI结构化写作,还可以被用于生成自动标题与摘要,它可以通过自然语言处理,对一篇纯文本内容进行读取与加工,从而生成标题与摘要。 例如输入文本内容:“今日,中国三条重要高铁干线—兰新高铁、贵广铁路和南广铁路将开通运营。其中兰新高铁是中国首条高原高铁,全长1776公里,最高票价658元。贵广铁路最高票价320元,南广铁路最高票价206.5元,这两条线路大大缩短西南与各地的时空距离。”可以得到AI返回的标题:“中国'高铁版图’再扩容,三条重要高铁今日开通”。 而与前文所展示的例子不同,ChatGPT 可以同时作为问答、聊天及创作 AI 存在,它的使用场景日常且多样,融合了文案生成、小说续写、代码生成、代码漏洞修复、在线问诊等场景,甚至展现出了超越搜索引擎的潜力。 作者通过和ChatGPT对话,带着读者直观感受了ChatGPT 的强大功能,比如作者问ChatGPT
除了写作辅导,作者还试一下它能不能教人表白。
不会发朋友圈?不会写贺卡?也可以试试求助人工智能!
这还不是最有趣的。最有趣的是,ChatGPT 具有很强的上下文连接与多轮对话的能力。ChatGPT 还具有记忆能力,当向它追问 “能不能再夸张一点”时,它可以在之前生成的文案基础上进行改写。这种连续对话大幅提高了人机交互体验。 问:能不能再夸张一点?
甚至当不会撰写代码的时候,你也可以尝试求助于 ChatGPT。不只是辅助编程,ChatGPT 甚至在一些测试中可以直接修改代码,并给出可以直接复制的代码示例,这在未来将极大减轻程序员的工作强度。 未来最火的职业是提示词(Prompt)工程师?著名经济学家朱嘉明在本书的代序言中写道,伴随AIGC生成算法的优化与改进,AIGC对于普通人来说也不再是一门遥不可及的尖端技术。 AIGC在文字、图像、音频、游戏和代码生成中商业模型渐显。2B(to Business的简称)将是AIGC的主要商业模式,因为它有助于B端提高效率和降低成本,以填补数字鸿沟。 但可以预见,由于AIGC“原住民”的成长,2C(to Customer的简称)的商业模式将接踵而来。根据有关机构预测,2030年的AIGC市场规模将超过万亿人民币,其产业规模规模生态(见下图):
现在,AIGC在语言模型领域的全方位竞争已经开始。所以才有微软对OpenAI的大规模投资,因为有这样一种说法:“微软下个十年的想象力,藏在ChatGPT里。”近日,谷歌宣布推出基于“对话应用语言模型”(LaMDA)的Bard,实现其搜索引擎将包括人工智能驱动功能。 ChatGPT刺激谷歌开始“创新者困境”突围。未来很可能出现Bard和ChatGPT的对决或共存,也就是LaMDA和GPT-3.5的对决和共存,构成AIGC竞争和自然垄断的新生态。 在这样的新兴产业构造和商业模式下,就业市场将会发生根本性改变:其一,专业职场重组,相当多的职业可能衰落和消亡;其二,原本支持IT和AI产业的码农队伍面临严重萎缩。因为AIGC极大刺激全球外包模式并取代码农。 《AIGC智能创作时代》一书中也举例说明了产品经理如何引导 ChatGPT 生成产品需求文档,训练 ChatGPT 根据自己之前写的周报自主修改周报。 根据用户 Jiayuan@Tisoga 在推特上分享的案例, ChatGPT 目前生成的产品需求文档内容完备且带有技术方案,未来产品经理需要做的可能只是和 ChatGPT 聊一下自己的想法以及项目相关背景,让 AI 生成一份草稿文档,再进行修改润色即可。 同样,用户也可以通过不断的提问引导 ChatGPT,层层递进完成从研究框架到研究报告的输出。先让 ChatGPT 生成报告大纲,再通过类似专家访谈一样一步步提问让 ChatGPT 补充报告内容,并在这个过程中根据其答案进行衍生提问,不断完善它的逻辑。例如,按照上面回答中的写作大纲,我们可以让 ChatGPT 继续写下去:什么是 AIGC?它的基本概念与特点是什么? 面对这样强大的功能,很难不让人幻想 AI 生成文本的未来:程序员、研究员、产品经理等涉及重复性工作的脑力劳动者可能都将被 AI 取代,这些职业可能都演变成了新的职业—提示词(Prompt)工程师,目的就是帮助人类更好地与 AI 互动。 智能创作时代正在缓缓拉开序幕 ChatGPT一上线,就引发网民争相体验,到处都是体验与探讨ChatGPT的文章和视频。 据小编亲测,ChatGPT对上至高考作文、下至情人节礼物之类的话题都能说上几段逻辑通顺、且找不出语法毛病的话来,甚至能对某本图书发表貌似客观的评论。 但当数据和所受训练不足以支撑它的回答,明显开始言之无物、顾左右而言他,甚至是一本正经地胡说八道。 最主要的问题,ChatGPT的回答四平八稳,看不出有明显的个人风格或是独立观点,这当然也跟它所受的训练有关。而且一旦涉及专业性强的问题,除了那些领域的专家之外,普通人根本无法判定ChatGPT给出的答案是否正确。 不过,正如朱嘉明老师指出的那样,AIGC的进化是参数以几何级数扩展为基础。AIGC形成的学习能力决定于参数的规模。GPT-2大约有15亿个参数,而GPT-3最大的模型有1750亿个参数,上升了两个数量级。 而且,它不仅参数规模更大,训练所需的数据也更多。根据媒体报道但还未被证实的消息,GPT-4 的参数可能将达到100万亿规模(见下图):
根据学界经验,深度神经网络的学习能力和模型的参数规模呈正相关。人类的大脑皮层有 140多亿个神经细胞,每个神经细胞又有3万多个突触。所以,大脑皮层的突触总数超过100万亿个。 所谓的神经细胞就是通过这些突触相互建立联系。假设GPT-4实现100万亿参数规模,堪比人的大脑,意味着它达到与人类大脑神经触点规模的同等水平。 所以,我们有理由相信,人类的这一创造物终究会帮助人类自身的发展,AIGC 无疑是一种生产力的变革,将世界送入智能创作时代。 在《AIGC智能创作时代》一书中,作者将创作者生产力的提升表现归纳为三个方面: · 代替创作中的重复环节,提升创作效率。 · 将创意与创作相分离,内容创作者可以从人工智能的生成作品中找寻灵感与思路。 · 综合海量预训练的数据和模型中引入的随机性,有利于拓展创新的边界,创作者可以生产出过去无法想出的杰出创意。 当然,AIGC也并非完美无缺,“人工智能生成的内容如何确定版权归属”“AIGC是否会被不法分子利用,生成具有风险性的内容或用于违法犯罪活动”等一系列问题都是现在人们争论的焦点。 目前,学界与业界在尝试从各个方面解决这些问题。但不管怎样,AIGC的迅猛发展已成不可逆转之势,智能创作时代的序幕正在缓缓拉开。 无论你接受与否,我们每个人都已经置身于AIGC这场迅猛发展的洪流之中。这也是我们在此时推荐本书的初衷。这是一本AIGC入门读物,一本可以让我们真正了解ChatGPT、捕捉下一个引爆点生成式AI的书籍。 ChatGPT、OpenAI、生成式AI、人工智能、Web3.0、聊天机器人、搜索工具、文本创造工具、AI绘画、Stable Diffusion、Midjourney,如果你想更深刻地了解这些日益见诸于新闻的技术术语,本书将是一个很好的开始。 本书的作者之一杜雨为中国社会科学院大学技术经济学博士研究生,先后就职于腾讯、红杉资本,长期关注数字经济与科技创新;作者张孜铭为北京大学管理学硕士,新加坡国立大学金融工程硕士。元宇宙教育实验室智库专家,两人合著有《WEB3.0:赋能数字经济新时代》。 2022年,Web3.0 受到前所未有的关注和讨论,杜雨和张孜铭二人适时推出《WEB3.0 :赋能数字经济新时代》一书,帮助大众打开这一重要趋势的认知大门。和那本书一样,《AIGC:智能创作时代》也用浅显的语言为我们详细介绍了有关AIGC方方面面的重要话题,以便我们更好地了解并把握AIGC给各行各业带来的机遇和挑战。 经我们的努力,中译出版社特别为我们的读者提供了35本作者签名版《AIGC:智能创作时代》,今天我们也一本不留全拿出来,回馈一直支持我们公众号的粉丝,前35名下单读者即可拥有签名版《AIGC智能创作时代》,数量有限,只有35本,先到先得哦! 老牛精选 《AIGC:智能创作时代》 |
|