ChatGPT刷屏，让人脊背发凉的机器人来了

大风兮云卷云舒 2022-12-07 发布于天津

展开全文

作者 | 董温淑

编辑 | 董雨晴

继二次元AI作画之后，又一款AI应用火遍全网，在朋友圈里“霸屏”了。

当地时间11月30日，美国人工智能（AI）研究机构OpenAI发布了聊天机器人ChatGPT。许多人很快发现，不同于此前一些聊天机器人经常出现答非所问、言语混乱等问题，ChatGPT生成的答案不仅逻辑流畅，还能联系上下文语境进行连贯问答。

一位使用者告诉市界：“它可以说是目前为止最聪明的聊天机器人，只有你问不到，没有它不会答。”

除了在网友中狠刷了一波存在感，ChatGPT的亮眼表现还让AI股重获关注。12月5日，国内智能人机交互企业汉王科技触及涨停板，有投资者表示：“AI以后要比人厉害了，ChatGPT、数字经济给汉王带来了最大的风口。”

最会聊天的网红机器人

当你问Siri“怎样应付老板？”时，Siri只能百度这个问题，再把3条搜索结果“转达”给你。而ChatGPT则能给出更“真诚”的建议：“建议你与他（她）直接沟通并尝试解决问题。通常来说，与老板和谐相处的最好方法是要尊重他（她）。”

当你细化问题描述，比如“我是程序员，怎么应付老板？”ChatGPT会针对职业给出更加详细的答案：“与老板相处的最重要的一点是要尊重他（她），并尽力为公司做出贡献。尽量按时完成任务，并确保自己的代码质量达到公司的标准。”

不仅如此，如果你继续追问“被老板发现了怎么办？”，ChatGPT还会在这一语境中，给出补救方案：“首先，你应该向老板道歉，并诚恳地表示自己会改进……同时，你还需要确保以后不会再犯同样的错误。”

这样顺滑、智能的沟通体验，让许多使用者直呼惊喜，并开始用其“整花活”。

有网友发现除了简单的日常对话，ChatGPT还可以回答特定学科的问题，比如“拉格朗日定理是什么？”“英语的虚拟语气该怎么用？”写段小说或代码对它来说也是手到擒来。有网友对此表示：“这样发展下去，程序员和写手都要失业了。”

国盛证券研报认为：“ChatGPT在寻找答案、解决问题的效率上已经部分地超越了如今的搜索引擎，ChatGPT或许在未来会改变我们获取信息、输出内容的方式。”

（图源：ChatGPT）

总结来说，ChatGPT上知天文下知地理，堪称“最强懂哥”。这样强大的AI模型，是全球顶级AI实验室OpenAI的手笔。

微软旗下的OpenAI与谷歌旗下的DeepMind、Meta（原Facebook）旗下的FAIR，被公认为全球AI领域最为领先的三大实验室。而本次凭借ChatGPT火出圈的OpenAI成立于2015年12月，最初为非营利性机构。

OpenAI的创始人之一是有“硅谷钢铁侠”之称的马斯克（Elon Musk），不过马斯克已经在2018年2月宣布退出OpenAI。

2019年，OpenAI宣布重组为一家“有限营利（capped-profit）企业”。具体而言，管理者们设置了一家非营利性的母公司OpenAI Inc，在这家公司基础上成立一家营利性的子公司OpenAI LP，并限制股东对OpenAI LP的投资回报上限。首批股东对OpenAI LP的投资回报被限制为不超过原始投资金额的100倍。也就是说，如果你投资1000万美元，你最多能得到10亿美元的回报。

正是在这一年，OpenAI宣布其获得了微软的10亿美元投资。

微软对OpenAI慷慨注资，绝不仅仅是看中了未来的财务回报，“醉翁之意”是在于OpenAI的前沿技术积累。而这项技术，同样是网红应用ChatGPT实现的基石。

从2018年起，OpenAI开始发布生成式预训练语言模型GPT（Generative Pre-trained Transformer）。GPT可用于生成文章、代码、机器翻译、问答等各类内容。接下来两年，OpenAI基本保持着每年发布一款模型的频率，分别在2019年2月和2020年5月发布了GPT-2和GPT-3模型。每一代GPT模型的智能程度，相较于前一代都实现了极大提升。

2020年9月，GPT-3发布不久，微软就宣布获得了GPT-3的独家授权、有权访问后者的底层代码。

此后，OpenAI似乎并不急于发布GPT-4，而是对GPT-3体现出的歧视偏见问题进行“修修补补”。比如在2022年初发布的AI模型InstructGPT，相比GPT-3能够生成更加友善的内容。

OpenAI称，本次爆火的ChatGPT是InstructGPT的“兄弟版本”。因此，业界普遍将InstructGPT和ChatGPT视为GPT-3.5版本。相比GPT-3，ChatGPT的主要提升点在于记忆能力，可以储存对话信息，延续上下文。

“万能”生成器，从理想到现实

人工智能从业者谷雯告诉市界：“马斯克曾经说'人工智能可能在2025年之前超越人类’，试用过ChatGPT之后，再联想到前段时间的AI作画，我觉得距离这一天的到来更近了。”

无论是AI作画还是聊天机器人ChatGPT，都可以被归类为AIGC（AI生成内容）。实际上，内容生成模型已经有近60年的发展历史。

早在1964年，全球首个聊天机器人ELIZA就已诞生。ELIZA的“人设”被设定为一个心理医生，可在心理治疗情境下，按照预先设定的模式组织语句，与真人进行对话。ELIZA仅有200行代码，但已能“骗过”使用者，被许多人认为是在与真实对象对话。

从ELIZA到ChatGPT，内容生成模型的智能程度无疑实现了代际的提升。在这背后，是数以亿计的数据和极大的算力消耗。

AI模型所依赖的深度学习技术，实际上就是通过不断输入数据，来调整运行算法的模型参数，使输出的结果最接近自然、真实的情况。在互联网发展至今数据量累积、计算设备软硬件迭代的基础上，才让ChatGPT有了成为“懂哥”的条件。

据国盛证券研报，ChatGPT有着多达1750亿个模型参数，OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面，GPT-3.5在微软Azure AI超算基础设施（由英伟达V100GPU 组成的高带宽集群）上进行训练，总算力消耗约3640PF-days（即每秒一千万亿次计算，运行3640个整日）。

而在未来商业领域，ChatGPT及其类似的技术也有望发挥更大的价值。据浙商证券研报，ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看，包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看，包括算力、数据标注、自然语言处理(NLP)等。

目前，国内许多企业已针对AIGC技术进行布局，比如百度推出的AI作画产品“文心一格”，抖音上线的AI绘画特效，腾讯上线的“QQ小世界AI画匠”活动等。

本次被ChatGPT“带上”涨停板的汉王科技则是一家以手写识别、OCR（光学字符识别）为核心技术，开发模式识别相关电脑产品的公司，在智能交互领域有所布局。

无论是《银翼杀手》等科幻电影，还是《AI新生：破解人机共存密码》等计算机专家的著作，都描述了在不远的未来，AI将实现“去工具化”、像人一样拥有创造力。

不过，在这之前，AI领域“模型越大、偏见越大”的问题还有待解决。如英特尔中国研究院院长宋继强曾提到的：“让机器'像人’是很大的挑战。计算机现在最容易超越人的是计算和逻辑智能，但很难超越社交智能和认知智能。”

对于像ChatGPT这类用亿级数据训练出来的模型来说，怎样保证数据没有被有偏见、歧视的信息污染？怎样防止其被用于生成假新闻等有害信息？还是需要思考的难题。