【NLP】一文简要了解词义消歧与实体消歧

520jefferson 2022-08-18 发布于北京

展开全文

写在前面

最近刚开始调研实体消歧方面的相关工作，这里先开一个头吧。希望大家可以通过这篇简要的文章对实体消歧任务本身有一个基本的认识。

1. 背景：词义消歧与实体消歧

自然语言文本中存在着大量的多义词，而多义词的存在也会影响人对文本的语义理解，让人对文本的意思产生混淆。

词义消岐(Word Sense Disambiguation，简称WSD) 是NLP中一个非常基本的任务，旨在确定多义词在具体语境中的确切意义。

在词义消歧中，同一词语的不同义项会作为候选词。我们需要在所有候选词中找到与文本中目标词语最接近的那个义项。这里“义项”指的是词是词典中的某个具体表示。

如上图所示，「苹果」在百度百科中共有25个义项，单说「苹果」我们可能并不知道说的是「苹果公司」还是「水果里的苹果」。但结合具体的上下文语境，我们就可以很好地对「苹果」消歧，从而明确「苹果」的具体含义：

实体链指/实体链接(Entity Linking，简称 EL) 在知识图谱构建、信息检索和问答系统等领域具有广泛的应用价值。

实体链指的主要目标是识别上下文中的实体指称具体指代现实世界中的哪一个实体，也就是将实体指称项映射到知识库中的相应实体上去。

具体而言，实体链指一般包括实体识别、候选实体获取、实体消歧这三个主要环节。之所以需要实体消歧，而不是直接将实体识别的结果放入知识图谱的原因主要有两方面：

从以上说明来看，其实词义消歧与实体消歧具有一定相似性, 二者的目的都是处理文本中词汇歧义的问题. 主要区别在于：

这里我们主要给大家推荐两篇近期发表的论文：

两篇论文的模型都非常简单，个人觉得关键或者说亮点主要在于他们对问题的转换。其实，从这两篇论文的名字就能看出端倪：都是将消歧问题转换成了抽取式问题。

论文名称：《ExtEnD: Extractive Entity Disambiguation》
论文链接：https:///2022.acl-long.177.pdf
代码地址：https://github.com/SapienzaNLP/extend.

如上图所示，EXTEND 将实体消歧任务转换为了抽取式任务，或者说MRC类任务。具体地：

将含有目标实体指称项的文本当作Query；
将知识库中对应的所有候选实体及其描述当作Context；
二者拼接然后预测Answer的Span（start\end prediction，start-end matching），这里的Answer就是在知识库中目标实体指称实际关联的实体。

好了，这就是 EXTEND 论文的核心思想。是不是感觉模型已经跃然纸上了，整体上应该和我们之前在一文详解关系抽取模型 CasRel、实体识别LEAR论文阅读笔记、实体识别BERT-MRC论文阅读笔记中介绍过的模型类似。

论文名称：《ESC: Redesigning WSD with Extractive Sense Comprehension》
论文链接：https:///2021.naacl-main.371.pdf
代码地址：https://github.com/SapienzaNLP/esc

ESC 的模型架构和 EXTEND 是相似的。整体上首先将输入的上下文和目标词的所有义项拼接，模型的输出则是目标词真正义项的起始和终止位置。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： 520jefferson > 《机器学习/深度学习/tensorflow》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

520jefferson

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换