分享

【赠书】计算机视觉学科奠基之作,《VISION》最新中文版推荐!

 有三AI 2022-01-14

本次给大家推荐的书是计算机视觉领域的典型性著作,对于学科的诞生有着非常重要的意义,书名就是《VISION》,中文版译名为《视觉》。本书研究了人类对视觉信息的表示和处理,并对视觉计算处理过程提出了全面的计算理论。全书立足于计算机科学、视觉神经科学和心理物理学的进展,是跨学科交叉研究的经典教科书,并对多个学科的研究都有深刻启发作用。


本书内容

本书详细阐述了Marr提出的用于研究和理解视觉感知的一般框架,将其分为计算理论、算法、实现三个研究层次,是影响一代脑、认知、计算机视觉专家的经典著作。

全书共分为3个部分。

第Ⅰ部分 引言和哲学基础

第1章 哲学原理和方法,介绍了人类视觉感知相关的背景知识,以及信息处理系统的3个层次,视觉的表示框架 。 

第Ⅰ部分 视觉

第2章:包括早期视觉的物理背景,过零点和原初草图,图像的空间排布,光源和透明度等概念。

第3章,图像与表面信息的表示,介绍了图像的处理、约束和可用表示、立体视觉、方向选择性形状轮廓、表面纹理、明暗和光度立体视觉、明度、亮度和色彩,本章占据了全书中将近一半的的篇幅。

第4章:可见表面的直接表示,包括图像分割的描述,需要表示的信息阐述,2.5 维草图的一般形式,表示的可能形式,可能的坐标系,插值、延续性和不连续性,插值问题的计算。

第5章:用于识别的形状表示,重点论述形状表示的问题以及三维模型的表示,推导和使用。

第6章:总结。

第7章:对计算方法的辩护,这一章是自问自答的内容,针对作者提出的理论,作者设想了一些问题并进行回答。

作者:David Courtnay Marr是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。Shimon Ullman是位于以色列雷霍沃特的魏茨曼科学研究所的计算机科学Samy和Ruth Cohn讲席教授。Tomaso Poggio是麻省理工学院脑和认知科学系的Eugene McDermott讲席教授。Ullman和Poggio都曾在麻省理工学院与David Marr共事。

译者:吴佳俊,斯坦福大学计算机科学系助理教授,研究方向是计算机视觉、机器学习和计算认知科学。加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。他的研究曾获ACM博士学位论文荣誉提名奖、AAAI/ACM SIGAI博士学位论文奖、麻省理工学院George M. Sprowls人工智能与决策博士学位论文奖,以及2020年三星人工智能年度研究人员奖。

本书可供心理学、神经科学、计算机科学、人工智能、计算机视觉等相关专业的研究人员、 研究生及高年级本科生等学习使用或作为研究参考。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多