限时干货下载:回复“资料”获取获取机器视觉教程,行业报告等资源,百度盘群组分享链接更新时间:2018-07-15,失效请在文末留言,不要在后台留言,你也可以在后台菜单“资源搜索”搜索更多你想要的网盘资源! 来源:https://blog.csdn.net/Hao_Zhang_Vision/article/details/52664757 点击阅读原文进入 图像识别任务面临着诸多挑战, 这使得它自计算机视觉领域1966年诞生以来就成为一个十分活跃的子领域. 本文将简要讨论图像识别问题的挑战以及为了应对这些挑战而使用的数据驱动过程. 1. 图像分类问题的挑战 虽然从图像中识别一个对象对人类来说非常的简单, 但图像识别对计算机来说是一项极具挑战性的工作. 在计算机内, 图像是由一个很大三维数组表示的. 比如一张 1024 * 768 的图像, 它拥有R, G, B三个分量, 因此, 这张图像有 1024 * 768 * 3 = 2,359,296 个像素, 每个像素是一个0(黑)到255(白)之间的整数.
除了语义鸿沟之外, 图像识别还有其他的一些挑战, 见上图: - 视角变化. 一个相同的目标相对摄像机可以有不同的朝向. 2. 数据驱动过程 我们该怎样写出一个算法对图像进行分类呢? 和写出一个排序算法不同, 我们不知道如果通过指定一系列识别规则的方法来识别图像中的目标并且能应对上述的这些挑战. 回想我们人类能对图像内容进行有效的识别, 是因为我们之前已经积累了许多经验, 通过对经验的利用, 从而对新情况做出判断. 限时干货下载:回复“资料”获取机器视觉教程,行业报告等资源。持续更新中。。。 |
|
来自: taotao_2016 > 《计算机》