【原】通过对比对象掩码建议的无监督语义分割

小白学视觉 2021-02-25

展开全文

重磅干货，第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享，旨在帮助各位读者快速了解论文内容。个人能力有限，理解难免出现偏差，建议对文章内容感兴趣的读者，一定要下载原文，了解具体内容。

摘要

能够在没有监督的情况下学习密集的图像语义表示是计算机视觉中的一个重要问题。然而，尽管意义重大，这个问题仍然没有得到充分的探讨，除了一些例外，即考虑在具有狭窄视觉域的小尺度数据集上进行无监督语义分割。在本文中，作者首次尝试解决传统上用于有监督情况的数据集上的问题。为了实现这一目标，作者引入了一个新的两步学习框架，该框架采用了一个预先确定的对比优化目标来学习像素嵌入。这标志着与依赖代理任务或端到端集群的现有工作有很大的不同。此外，作者讨论了拥有一个包含对象或其部分信息的先验的重要性，并讨论了以无监督方式获得这样一个先验的几种可能性。大量的实验评价表明，所提出的方法比现有的方法具有关键的优势。首先，学习到的像素嵌入可以使用K-Means直接聚类到语义组中。其次，该方法可以作为一种有效的无监督的语义分割任务前训练。特别是，当使用PASCAL上1%的标记示例来优化学习到的表示时，作者比监督ImageNet预训练的性能高出7.1% mIoU

代码链接：https://github.com/wvangansbeke/Unsupervised-Semantic-Segmentation

论文创新点

作者的贡献有:

(1)作者提出了一个两步的无监督语义分割框架，这标志着与最近依赖代理任务或端到端聚类的工作有很大的偏差。

(2)在PASCAL上，作者学习到的像素嵌入可以使用K-Means直接聚类到语义组中。请注意，这是一个非常具有挑战性的场景，在之前的作品中从未被探索过。

(3)最后，当对学习到的表示进行微调时，作者在ImageNet上报告了经过监督的预训练后的更好性能。这些结果表明，就学前训练而言，关注密集表征的学习是一个值得关注的研究方向。这与主流的基于图像级特征学习的预训练策略相反。

框架结构