随着深度学习的进步、计算存储的扩大、可视化数据集的激增,计算机视觉方面的研究在过去几年蓬勃发展。在自动驾驶汽车、医疗保健、零售、能源、语言学等诸多领域,计算机视觉的应用都越来越广。 我将在本文中介绍 2018 年主导了计算机视觉研究的 5 个主要趋势。详尽回顾太难,此处只会分享这个领域中令我印象深刻的成就。 1 — 合成数据合成数据,即人工合成、用来训练深度学习模型的数据,在 2018 年的计算机视觉研究领域绝对是重头戏。例如这个 SUNCG 数据集 被用于模拟室内环境,这个 Cityscapes 数据集被用于驾驶和导航,这个合成人类的 SURREAL 数据集 被用于学习姿势估计和追踪。让我们一起来过一遍 2018 年利用合成数据的最佳成果们:
视觉问答(Visual question answering,VQA)是一种结合计算机视觉和自然语言处理的新问题。通常涉及到给计算机展示一张图片,让计算机回答关于图片的问题。答案可以是以下任何一种形式:一个单词,一个词组,是/否,选择题答案,或者是填空题答案。 诸如 DAQUAR, Visual7W, COCO-QA, VQA 之类的多种数据集都致力于解决这项任务. 让我们同样来看看视觉问答领域的今年最佳:
2018年有一些特定的研究方向,一个是域适应。该领域实际上与合成数据密切相关。它解决了为监督学习收集标记数据集并确保数据足够可靠和多样化这一巨大挑战。 这个问题的本质是,我们如何使用一种数据来让网络能处理不同的数据。
2018 年对于计算机视觉最成功的生成模型 - 生成对抗网络(GAN)来说无疑是重要的一年。 让我们来欣赏一些改进 GAN 模型的本年度最佳作品:
3D 对象理解对于深度学习系统成功解释和指引现实世界至关重要。 例如,网络或许能够在街道图像中定位汽车,为其所有像素着色,并将其归类为汽车。 但问题在于它是否真的能够理解图像中的汽车相对于街道中的其他物体的位置。 3D 对象理解涉及广泛的研究领域,包括对象检测,对象跟踪,姿态估计,深度估计,场景重建等。 让我们来看看 2018 年该领域的主要论文:
希望你会喜欢这篇短评。 如果你有兴趣探索更多,建议阅读CVPR,ICLR, 以及机器学习和人工智能领域最负盛名的会议——NeurIPS。 原作:James Le 编译&投稿:佑铭 编辑:重出江湖的小咪 编译来源: https://heartbeat./the-5-trends-that-dominated-computer-vision-in-2018-de38fbb9bd8 |
|