1 引言该论文发表于CVPR2022,主要是关于GAN监督学习在密集视觉对齐中的应用,并且论文代码已经开源。在该论文中作者提出了一种用于端到端联合学习的GAN生成数据的框架。受到经典方法的启发,论文中作者联合训练一个空间变换器,将随机样本从基于未对齐数据训练的GAN映射到共同的、联合学习的目标模式。 实验展示了8个数据集上的结果(如下图所示),可以直观的发现该论文的方法成功地对齐了复杂数据,并发现了图像中密集的对应关系。GANgealing的性能明显优于过去的自监督算法,在多个数据集上的性能与最先进的监督算法相当(有时甚至超过),另外作者也展示了论文中的算法在增强现实、图像编辑和图像数据集的自动预处理方面的应用。 ![]() 论文链接: https:///abs/2112.05143 论文代码: https://www.github.com/wpeebles/gangealing (Github已有740星) 2 GAN监督学习在该论文中,作者提出了一种GAN监督学习的算法。在该算法框架下,对是从一个预训练的GAN中采样得来的,并用这些数据对训练一个神经网络,损失函数为 其中为重构损失,在最原始的监督学习中,是在固定的数据对中进行学习,但是在该论文中,和目标是联合端到端学习的,在测试时,评估神经网络是用真实的输入。随着训练成熟,作者从非对齐分布数据分布中进行采样,其中且表示的是隐空间分布。![]() ![]() 3 联合对齐和聚类在该论文中,作者训练使用标准交叉熵函数在数据对上训练分类器。作者用上的权重初始化分类器,代替随机初始化。虽然训练成本会比较高,但是空间转换器和分类器的泛化效果很好。 4 实验结果如果下图所示是一个非常有趣的小应用为使用GANgealing进行图像编辑的效果图。通过在每个类别中只注释一幅图像,用户可以将其编辑传播到同一类别中的任何图像或视频,本文的链接视频里有使用GANgealing图像编辑更生动的展示。 ![]() 如下表所示为定量的结果,作者使用标准阈值,在下表中显示了论文的方法在具有挑战性的SPair-71K数据集上与几种自监督和最先进的监督方法进行比较结果。可以发现GANgealing在几个类别上显著优于先验自监督方法,GANgealing在多个类别上的表现与最先进的监督方法不相上下,甚至优于这些方法。 ![]() 下图显示了不同簇的密集对应结果。对于每个簇,顶行显示该簇的未对齐真实图像;中间一行显示了GANgealing学习的输入图像转换。最下面一行显示了图像之间的密集对应关系。可以发现GANgealing进行密集视觉对齐的效果很好,能够准确的将目标图像定位并进行标注。 ![]() ![]() END 欢迎加入「目标检测」交流群👇备注:OD |
|