AI 科技评论按,随着计算机视觉技术日趋火热,作为该领域的顶级学术会议,CVPR 参与人数逐年猛增 。上周在美国长滩举办的 CVPR 2019 热度还未散去,6 月 26 日,会议的程序主席 Derek Hoiem 发表了一篇博文。在博文中,Derek Hoiem 表示,现在是计算机视觉技术的黄金时代,同时他也表示,目前的计算机视觉技术只是记忆,而不是智力。雷锋网 AI 科技评论将他的文章编译如下。 对于计算机视觉研究者来说,这是一个激动人心但难以抗拒的时代。上周二,我有幸在 CVPR 2019 大会上向 9277 名与会者发表开幕词。作为四个程序主席之一,我的工作是管理论文决策过程,这其中包括协调 132 个区域主席、2887 名审稿人和提交 5160 篇论文的 14104 名作者,以及规划 1296 张海报的展示和 288 次演讲。这是有史以来最大的计算机视觉会议,但在短短四个月内又将会有一次会议——ICCV 2019。如此多的事情正在发生——谁能跟上? CVPR 每年提交(蓝色)和接收(绿色)论文数量 计算机视觉不再只是一种学术追求。数十亿美元被用于从智能摄像头到自动驾驶的计算机视觉应用程序中。大多数教授把至少一半的时间花在工业界的研究上,即使是初出茅庐的博士生,也能拿到六位数的丰厚薪水。但这是否是一场泡沫?我们如何将成熟的商业化突破与大肆宣传的概念证明区分开来? 首先,让我们简单回顾一下我们是如何做到这一点的:
所以,这就是计算机视觉成功的秘密:它是记忆,而不是智力。让我们以单视图深度预测为例。2005 年,我苦苦钻研这个问题,首次提出了从室外图像自动创建 3D 模型的方法。它的关键是学习「识别」几何图形,将像素标记为地面、垂直物体和支撑物,并使用透视几何规则构建场景几何的简单模型。这花费了大约 30% 的时间。 视频:早期的单视图 3D 重建方法:一点数据、手工设计的特征和一些数学,请移步Youtube观看:https:///qbWDXP0WaA0 单视图构建 3D 模型是现在的一个热门话题,仅在 CVPR 2019 上就有 35 篇论文。有一些方法可以从全景图生成场景布局,从图像生成对象网格,从一个视图生成深度图。然而,正如我们小组和 UCI 在 2018 年指出的,以及 Freiburg 和 Intel 的研究人员在 CVPR 2019 所指出的那样,许多似乎解释了几何学的方法实际上只是在学习和检索与输入类似例子的记忆以做出预测。预测出来的的 3D 模型可能看起来不错,但这些方法并不能推广到新的形状或场景中。 因此,让我们考虑两个非常有意思的问题:
总而言之,如果有人声称刚解决了一个很难的识别或预测的问题,那么问问你自己:他们是否有足够的数据,就像我关心的类型一样,他们的方法能够记住所有的答案?这就要求:
via:https:///reconstruct-inc/the-golden-age-of-computer-vision-338da3e471d1 2019 年 7 月 12 日至 14 日,由中国计算机学会(CCF)主办、雷锋网和香港中文大学(深圳)联合承办,深圳市人工智能与机器人研究院协办的 2019 全球人工智能与机器人峰会(简称 CCF-GAIR 2019)将于深圳正式启幕。 届时,诺贝尔奖得主JamesJ. Heckman、中外院士、世界顶会主席、知名Fellow,多位重磅嘉宾将亲自坐阵,一起探讨人工智能和机器人领域学、产、投等复杂的生存态势。 |
|
来自: taotao_2016 > 《AI》