大模型「幻觉」，看这一篇就够了 | 哈工大华为出品

mrjiangkai 2023-11-19 发布于上海

展开全文

西风发自凹非寺

大模型“幻觉”，终于有系统综述了！

一口气49页，详细阐述了幻觉定义、分类、导致幻觉的原因，还有检测幻觉、减轻幻觉的方法。

这篇最新综述来自哈工大和华为，一po出就在网上火得不行：

具体来说，文中用一套新的范畴框架来定义模型幻觉，并将其分为事实性幻觉、忠实性幻觉两大类。

此外，它还总结了模型产生幻觉的三大来源：数据源、训练过程和推理，并给出了对应的减轻幻觉策略。

一图预览，观感是这样婶儿的：

可谓清晰又明了。目前相关推文浏览15万+，转赞收藏2000+，网友纷纷评论：

找时间好好看。

还有一位网友的评论亮了：

有意思的是，论文太长，我得用ChatGPT帮我读。

幻觉作为大模型的一种“通病”，找到了病根，也好对症下药。

北大数学教授董彬也曾讲，作为研究者，自己其实是比较喜欢大模型幻觉的：

因为幻觉和创造/创新其实只有一线之隔。

那么这篇综述具体如何解剖大模型幻觉现象？一起来看看。

大模型的幻觉“病理”

大模型出现幻觉，简而言之就是“胡说八道”。

用文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。

正如上文提到的，研究人员将大模型的幻觉分为事实性幻觉（Factuality Hallucination）和忠实性幻觉（Faithfulness Hallucination）。

△左，事实性幻觉；右，忠实性幻觉

事实性幻觉，是指模型生成的内容与可验证的现实世界事实不一致。

比如问模型“第一个在月球上行走的人是谁？”，模型回复“Charles Lindbergh在1951年月球先驱任务中第一个登上月球”。实际上，第一个登上月球的人是Neil Armstrong。

事实性幻觉又可以分为事实不一致（与现实世界信息相矛盾）和事实捏造（压根没有，无法根据现实信息验证）。

忠实性幻觉，则是指模型生成的内容与用户的指令或上下文不一致。

比如让模型总结今年10月的新闻，结果模型却在说2006年10月的事。

忠实性幻觉也可以细分，分为指令不一致（输出偏离用户指令）、上下文不一致（输出与上下文信息不符）、逻辑不一致三类（推理步骤以及与最终答案之间的不一致）。

那么致使大模型产生幻觉的原因都有哪些？

首先“病从口入”，大模型的粮食数据，是致使它产生幻觉的一大原因。

这其中就包括数据缺陷、数据中捕获的事实知识的利用率较低。

具体来说，数据缺陷分为错误信息和偏见（重复偏见、社会偏见），此外大模型也有知识边界，所以存在领域知识缺陷和过时的事实知识。

即便大模型吃掉了大量数据，也会在利用时出现问题。

大模型可能会过度依赖训练数据中的一些模式，如位置接近性、共现统计数据和相关文档计数，从而导致幻觉。比如说，如果训练数据中频繁共现“加拿大”和“多伦多”，那么大模型可能会错误地将多伦多识别为加拿大的首都。

此外，大模型还可能会出现长尾知识回忆不足、难以应对复杂推理的情况。

除了数据，训练过程也会使大模型产生幻觉。

主要是预训练阶段（大模型学习通用表示并获取世界知识）、对齐阶段（微调大模型使其更好地与人类偏好一致）两个阶段产生问题。

预训练阶段可能会存在：

架构缺陷。基于前一个token预测下一个token，这种单向建模阻碍了模型捕获复杂的上下文关系的能力；自注意力模块存在缺陷，随着token长度增加，不同位置的注意力被稀释。
曝露偏差。训练策略也有缺陷，模型推理时依赖于自己生成的token进行后续预测，模型生成的错误token会在整个后续token中产生级联错误。

对齐阶段可能会存在：