ACM SIGIR创立于1978年,是计算机领域面向信息检索、信息科学和搜索引擎技术的顶级学术会议,同时也被中国计算机学会CCF评估为A类会议,每年举办一次,迄今为止已经举办了40届。大会的报告一般分为20分钟的论文宣读(Paper oral)、1小时的重点报告(Keynote)和3小时的教学报告(Tutorial)。 近日,SIGIR 2018 公布最佳论文奖,专知对其进行整理报道,并附上详细PPT内容。 SIGIR 2018 最佳论文 论文:Search Should I Follow the Crowd? A Probabilistic Analysis of the Effectiveness of Popularity in Recommender Systems 地址:https://dl./citation.cfm?id=3210014 摘要:近年来,在推荐系统的评价中采用信息检索方法已成为普遍的做法。然而,人们发现,信息检索的相关指标对推荐流行项目的奖励算法有强烈的偏差——甚至连最新的推荐算法里也有。虽然近期有研究证实并测量了这些偏差,并提出了避免这些误差的方法。但,这里仍然遗留着一个问题, 流行度带来的误差, 我们到底管还是不管?因为,目前来看,流行度,即可能是一个有用而可靠的推荐信号,也可能受到实验偏差的不公平奖励。本文把这一问题,放到了台面上,并通过识别和建模关键随机变量之间的依赖关系,被推荐物品的评分、相关性等来仔细分析流行度。最终,作者找到了一个条件临界值,能够判定,流行度到底实在促进推荐能力的提升,还是降低推荐系统的能力;或者说,测量出来的流行度,到底是反映了真实的流行程度,还是带有很大偏差。作者用实证结果举例并证实了他们的理论结果,并构建了一个没有偏见的众包数据集。在这个数据集中,作者阐明了在公共的有偏见的离线实验设置中可以测量的准确性与通过无偏见观察可以测量的实际准确性之间的矛盾。 |
|
来自: LibraryPKU > 《机器学习》