如何识别 AI 生成的文本

传承专家老杨 2023-07-24 发布于广东

展开全文

这句话是 AI 写的——是吗？OpenAI 的新聊天机器人 ChatGPT 向我们提出了一个问题：我们如何知道我们在线阅读的内容是由人还是机器编写的？

自11 月下旬发布以来，ChatGPT 已被超过一百万人使用。它让 AI 社区着迷，而且很明显，互联网正越来越多地充斥着 AI 生成的文本。人们用它来编笑话、写儿童故事和制作更好的电子邮件。

ChatGPT 是 OpenAI 的大型语言模型 GPT-3的衍生产品，它可以针对提出的问题生成听起来非常人性化的答案。这些大型语言模型的魔力和危险在于正确性的错觉。他们写出的句子看起来是正确的——他们以正确的顺序使用了正确种类的单词。但是人工智能不知道这意味着什么。这些模型通过预测句子中最有可能出现的下一个词来工作。他们不知道某件事是对还是错，即使事实并非如此，他们也自信地将信息呈现为真实的。

在一个已经两极分化、充满政治色彩的网络世界中，这些人工智能工具可能会进一步扭曲我们消费的信息。如果将它们以真实产品的形式推广到现实世界，后果可能是毁灭性的。

研究人员尝试了多种方法来检测 AI 生成的文本。一种常见的方法是使用软件来分析文本的不同特征——例如，阅读的流畅程度、某些单词出现的频率，或者标点符号或句子长度是否有规律。

“如果你有足够多的文本，一个非常简单的线索就是'the’这个词出现了太多次，”谷歌大脑的高级研究科学家达芙妮伊波利托说，谷歌大脑是该公司的深度学习研究部门。

由于大型语言模型通过预测句子中的下一个词来工作，因此它们更有可能使用“the”、“it”或“is”等常见词，而不是不可靠的罕见词。Ippolito 和谷歌的一组研究人员在 2019 年发表的研究中发现，这正是自动检测系统擅长识别的文本类型。

但 Ippolito 的研究也显示了一些有趣的东西：人类参与者倾向于认为这种“干净”的文本看起来更好，错误更少，因此它一定是一个人写的。

实际上，人类编写的文本充满了拼写错误，并且变化多端，包含不同的风格和俚语，而“语言模型很少出现拼写错误。他们更擅长生成完美的文本，”Ippolito 说。

“文本中的错别字实际上是一个很好的指标，表明它是人写的，”她补充道。

大型语言模型本身也可用于检测 AI 生成的文本。自然科学加拿大研究主席 Muhammad Abdul-Mageed 说，最成功的方法之一是在一些由人类编写的文本和一些由机器创建的文本上重新训练模型，以便它学会区分两者- 在不列颠哥伦比亚大学学习语言处理和机器学习，并研究过检测。

与此同时，德克萨斯大学的计算机科学家 Scott Aaronson 被借调为 OpenAI 的研究员一年，一直在为 GPT-3 等模型生成的较长文本开发水印——“这是一种在其他方面不引人注意的秘密信号”词的选择，你可以用它来证明，是的，这来自 GPT，”他在他的博客中写道。

OpenAI 的一位发言人证实该公司正在研究水印，并表示其政策规定用户应该“以一种任何人都不会合理地错过或误解的方式”清楚地指出人工智能生成的文本。

但这些技术修复伴随着重要的警告。他们中的大多数人没有机会对抗最新一代的 AI 语言模型，因为它们是建立在 GPT-2 或其他早期模型之上的。当有大量文本可用时，其中许多检测工具效果最佳；它们在某些具体用例中效率较低，例如聊天机器人或电子邮件助理，这些用例依赖于较短的对话并提供较少的数据进行分析。Abdul-Mageed 说，使用大型语言模型进行检测还需要强大的计算机，以及访问 AI 模型本身，这是科技公司不允许的。

Solaiman 说，模型越大越强大，就越难构建 AI 模型来检测哪些文本是人写的，哪些不是。

“现在最令人担忧的是 [ChatGPT 有] 非常令人印象深刻的输出。检测模型跟不上。你一直在追赶，”她说。

Solaiman 说，检测 AI 编写的文本没有灵丹妙药。“检测模型不会成为你检测合成文本的答案，就像安全过滤器不会成为你减轻偏见的答案一样，”她说。

为了有机会解决这个问题，我们需要改进技术修复并提高人类与 AI 交互时的透明度，并且人们需要学会识别 AI 编写的句子的迹象。

“如果有一个 Chrome 插件或任何你正在使用的网络浏览器的插件，那将是非常好的，它会让你知道你的网页上的任何文本是否是机器生成的，”Ippolito 说。

但是人工智能已经在愚弄我们了。康奈尔大学的研究人员发现，人们发现 GPT-2 生成的假新闻文章在大约 66% 的情况下是可信的。

另一项研究发现，未经训练的人只能在与随机概率一致的水平上正确识别 GPT-3 生成的文本。

Ippolito 说，好消息是人们可以接受培训以更好地识别 AI 生成的文本。她开发了一个游戏来测试在玩家意识到这不是人类之前计算机可以生成多少句子，并发现随着时间的推移人们会逐渐变得更好。

“如果你查看大量生成文本，并尝试找出其中没有意义的地方，你就可以更好地完成这项任务，”她说。一种方法是接受难以置信的陈述，比如人工智能说煮一杯咖啡需要 60 分钟。

ChatGPT 的前身 GPT-3 自 2020 年才问世。OpenAI 表示 ChatGPT 只是一个演示，但开发类似功能强大的模型并将其推广到用于客户服务或健康的聊天机器人等产品中只是时间问题关心。这就是问题的症结所在：该领域的发展速度意味着识别 AI 生成文本的各种方法很快就会过时。