【原】BCFNet：一种具有注意机制的均衡协同滤波网络

小白学视觉 2021-04-16

展开全文

重磅干货，第一时间送达

小黑导读

论文是学术研究的精华和未来发展的明灯。小黑决心每天为大家带来经典或者最新论文的解读和分享，旨在帮助各位读者快速了解论文内容。个人能力有限，理解难免出现偏差，建议对文章内容感兴趣的读者，一定要下载原文，了解具体内容。

摘要

基于协同过滤(CF)的推荐方法得到了广泛的研究，通常可以分为两类，即基于表示学习的CF方法和基于匹配函数学习的CF方法。表示学习试图为用户和项目的表示学习一个常见的低维空间。在这种情况下，如果用户和物品在公共空间中具有更高的相似性，那么他们的匹配就会更好。匹配函数学习尝试直接学习复杂的匹配函数，它将用户-项目对映射到匹配分数。尽管这两种方法都得到了很好的发展，但都存在两个根本性的缺陷:一是表示学习依赖于使用点积，对用户和物品的潜在特征表达有限;二是匹配函数学习在捕获低秩关系方面存在缺陷。为了克服这些缺陷，作者提出了一种新的推荐模型——平衡协同过滤网络(BCFNet)，该模型具有两种推荐方法的优点。此外，为了更好地捕捉隐式反馈中的隐藏信息，增强神经网络的学习能力，设计了注意机制。此外，设计了一个平衡模块来缓解DNNs中的过拟合问题。在8个真实数据集上的大量实验证明了该模型的有效性。

论文创新点

这项工作的主要贡献如下：

指出了融合基于表示学习和匹配函数学习的协同过滤方法的意义，提出了一种结合注意表示学习、注意匹配函数学习和平衡模块的BCFNet模型。该模型采用深+浅模式，采用注意机制进行隐式反馈协同过滤。
利用前馈注意机制，更好地捕捉隐含反馈中的隐藏信息，增强神经网络的学习能力。设计了一个平衡模块来缓解交互信息的高稀疏性导致的过拟合问题。这两种策略使本文提出的BCFNet模型在学习复杂的匹配函数时具有很大的灵活性，并能有效地学习用户与物品之间的低秩关系。
在8个真实数据集上进行了大量实验，以验证BCFNet模型的有效性和合理性。结果表明，所提出的BCFNet模型始终优于最新的方法。

框架结构

提出的BCFNet模型的体系结构

首先，提出了BCFNet模型的体系结构。然后，分别介绍了该模型的三个子模块，即注意表征学习(BCFNet-rl)、注意匹配功能学习(BCFNetml)和平衡模块(BCFNet-bm)。最后，作者描述了如何融合这三个子模块和如何学习最终的BCFNet模型。

在引入注意机制后，表征学习和匹配函数学习的统一框架可以得到很大的改进。但由于其DNNs结构，也可能导致部分信息丢失和过拟合问题。在现实生活中的推荐系统中，存在大量的用户和物品，且存在稀缺性问题。在这种情况下，MLP实现中输入的交互相对较少，容易出现过拟合问题，导致结果不理想。此外，在深度学习过程中，用户和物品的一些特征可能被简单地忽略，一些重要的隐含反馈在MLP中可能被赋予较低的权重。

受一些缺乏神经网络和注意力机制的浅层推荐模型的启发，作者在BCFNet模型中加入广义矩阵分解(GMF)模型[12]作为均衡模块。GMF作为一种浅层矩阵分解模型，采用线性嵌入函数作为表示函数，点积作为匹配函数，弥补了MLP在捕获低秩关系方面的不足，缓解了DNNs中的过拟合问题。

实验结果

随着物品人气水平的提高，BCFNet和无B的BCFNet的效果将会得到极大的提高。但是，随着物品人气水平的提高，平衡模块的大部分推广效果会减弱，即在物品人气最小的情况下获得了最高的推广效果。这充分说明了平衡模块有助于缓解项目交互信息的高稀疏性导致的过拟合问题。

平衡模块对五个数据集上不同项目受欢迎程度的子数据集性能的影响

结论

本文提出了一种新的推荐模型——平衡协同过滤网络(BCFNet)，该模型结合了注意表征学习(BCFNet-rl)、注意匹配函数学习(BCFNet-ml)和平衡模块(BCFNet-bm)。因此，它兼具表示学习和匹配函数学习的优点。此外，通过引入前馈注意层，可以进一步提高注意表征学习和注意匹配功能学习的学习能力。此外，在不使用神经网络和注意机制的情况下增加平衡模块可以缓解过拟合问题，捕获低秩关系。在8个真实数据集上的大量实验证明了所提出的BCFNet模型的有效性和合理性。

论文链接：https:///pdf/2103.06105.pdf

每日坚持论文分享不易，如果喜欢我们的内容，希望可以推荐或者转发给周围的同学。

- END -

下载1：【应用线性代数】