[英]Mark S.Nixon ·电子工业·2010·2版 12345678 第一章 绪论 横截面图 cross-section合成 synthesized光感元分两类:视杆细胞(rod )用于黑白视觉(暗视觉).另一类是视锥细胞,用于色彩视觉(明视觉).视锥细胞一千万,分布在中央槽五度以内。一亿视杆细胞分布在中央槽二十到五度内。视杆细胞就一种,视锥细胞有三种:s波长m波长l波长联合图像专家组 Joint Photographic Expert Group运动图像专家组 Moving Picture Expert Group
图像处理的软件网站:大概最好的是General Site
数学软件工具包
期刊杂志
网络教材
网站
第二章 图像、采样和频域处理
CMYK颜色模型分为青縁、品红、黄色和黑色。 傅里叶变换是将信号映射到分量频率的一种做法。 傅里叶变换表明时域信号是由什么频率组成的。 为了从频域信号恢复时域信号,需要进行逆傅里叶变换。 卷积运算用*标记一个信号 p1(t) 与另个信号 p2(t) 的卷积过程为:将函数p2反折,向右移动距离t ,计算p1 和反折后的p2在各点的积,并积分,得到在t处输出值。 信号系统中,输出激励p1和系统响应p2的卷积,通过反转系统响应时间轴得到p2(t-x ),从而得到记忆函数.卷积过程对激励与记忆函数相乘后的积求和,系统当前输出是对激励的累加响应。 卷积积分可以通过对两个信号变换的乘积进行逆傅里叶变换来实现。 低频带有较多信息,高频信息破坏不那么重要。 在成像系统中,景深是有限的(减少了高频成份)。 高频分量反映亮度上的变化。 离散傅里叶变换DFT FFT只能用于图像大小为2的整数次幂的正方形图像。FFT计算成本 Ο(N2log(N)). 二维DFT计算成本 Ο(N3). 图像的傅里叶变换计算的是频率分量,每个分量的位置表示其频率:低频率分量离原点距离较近,高频率分量离原点距离较远。 二维傅里叶变换的布局是低频率分量位于变换的边角上。 如果直流位于图像中心,频率向图像边缘递增,这样空间变换比较容易可视化。通过将傅里叶变换的四个象限分别旋转180°来实现。只需要将每个图像点Px,y 与-1(x+y)相乘即可实现。 傅里叶变换性质 位移不变性 图像分解为空间频率与图像中特征的位置无关。假设将所有特征移动一定距离,或者从不同位置采集图像,其傅里叶变换的幅度不会发生变化。但相位发生变化。 旋转 傅里叶变换处理具有朝向依赖性。 频率尺度变化 时间是频率倒数。图像被压缩相当于时间缩短,而频率相应增大,其频率分量会扩展。 叠加性 判断一个系统是线性的,只要该系统对两个组合信号的反应与单个信号的反应之和相等。这个性质表明可以利用频域来分离图像。 傅里叶以外的变换 离散余弦 最优图像编码 在能量集中性方面有很大优势。 离散Hartley变换 不需要复数计算,正变换和逆变换是相同操作。 小波 可进行多分辨率分析(即不同尺度或分辨率上的分析)。可同时进行空间和频率上的削减。可进行局部空间频率分析。 阅读资料:The Fourier Transform and Its Applications (Ronald N. Bracewell)
第三章 基本图像处理运算
点算子 亮度值设置255为白色。 对数函数 降低亮度级范围,指数函数 扩大亮度级范围。 常用扩展亮度级范围的方法包括直方图(亮度)正规化。这里是指将原直方图进行扩展有位移,使直方图涵盖所有256个亮度级。matlab命令是imagesc函数。 直方图均衡化 是一个非线性处理过程,适合人类视觉分析的方法来增强图像亮度。 图像直方图处理常用的是正规化。均衡化的缺点一是受噪声影响,二是非线性不可逆。 阀值处理 阀值处理有两种形式:均一阀值和自适应阀值。 均一阀值需要灰度级知识,否则目标特征在阀值处理过程中可能无法提取。 最优阀值处理:选择一个将目标与背景分离的阀值。 Otsu方法 是将图像分割成目标和背景的阀值被选择出来的可能性最大。它只选择一个阀值,从而使图像中所有像素分离成最合适的不同类。 基本原理是利用正规化直方图,其中每个亮度级的值为该亮度级的点数除以图像总点数。 最优阀值就是类分离方差最大时的亮度级, Otsu是自动的,不是手动的。 到目前为止我们关注的是全局方法,即对整帧图像进行处理的方法。 局部适应的方法,通常用于字符识别前的文件二值化。 图像解释的场景中存在多个目标,目标通常被遮挡的,许多目标具有相似的像素亮度范围。因此利用均一阀值处理图像,需要更精细的度量来分离目标。 群运算 是利用分组处理,根据一个像素的近邻来计算新像素值。群运算通常用模板卷积表示。 模板是一组加权系数,方形,大小是奇数,可以恰当定位。 卷积处理 NewImage = Weight*OriginImage. matlab模板卷积算子: convolve 平均算子 平均处理的是降低噪声,这是其优势,与之相关的缺点 是平均处理引起图像的模糊,从而是减少图像中的细节。 高斯平均算子 图像平滑处理最优,比直接平均保留更多特征。 中值滤波 去除椒盐噪声。找出图像背景是统计算子的应用。 模式滤波 减少噪声同时保留特征边界,这是中值滤波显著特性之一。 各向异性扩散 平滑处理的最高级形式是处理过程保留图像特征的边界。这是中值算子优势之一,也是高斯平滑算子缺陷。其原理被称为各向异性扩散。滤波是在特征范围而不是边界进行。 尺度空间 基本思想是图像具有从低分辨率(粗糙取样图像)到高分辨率(细致取样图像)的多尺度表达。 热方程 即为各向异性扩散方程。(各向同性--高斯滤波)。扩散系数:局部变化量保留多少。参考:各向异性 perona&malik 力场变换 图像滤波算子. 反平方定律 E=I/d2;照度与距离平方成反比而与光度成正比.又称平方反比定律、逆平方律、反平方律; 如果任何一个物理定律中,某种物理量的分布或强度,会按照距离源的远近的平方反比而下降,那么这个定律就可以称为是一个反平方定律。 边界是低层特征,形状是高层特征。 数学形态学 利用集合论发展而来的算子分析图像。将图像和形状看做是点集,根据形状利用数学形态学处理图像。 形态学算子定义的是局部变换,把要表达的像素值看做集合。这种改变像素值的方式是通过定义击中或示击中变换进行形式变化的。 腐蚀算子最常见的应用之一是对阀值处理后的图像去噪。 开算子、先腐蚀再膨胀,关算子、先膨胀再腐蚀。 灰度形态学 函数集合形式有两种表达:横截面和暗影。 Minkowski算子,将集合去处变成求和以及求差运算。
第四章 低层次特征提取(边缘检测)
低层次特征是不需要任何形状信息(空间关系)就可以从图像中自动提取的基本特征。边缘检测和角点检测。
一阶边缘检测算子 检测边缘位置,一阶微分可以使变化增强。水平边缘检测算子,对水平方向上的相邻点进行差分处理,可以检测垂直方向的亮度变化。由于差分值为0,水平算子不会显示水平方向上的亮度变化,可以检测出垂直边缘。
第一个目标:canny认为 高斯算子对图像平滑处理(边缘检测)是最优的。 第二个目标:非极大值抑制返回的只是边缘数据顶脊处的那些点,而抑制其它所有点。使结果细化处理,非极大值抑制的输出是正确位置上边缘点连成的细线。 第三个目标:限制单个边缘点对于亮度变化的定位。这是因为 并非只有一条边缘表示为当前检测到的边缘。
二阶边缘检测算子 Laplacian基础算子 是一个实现二阶微分的模板。 水平二阶算子和垂直二阶微分结合可得全Laplacian模板。计算的是一个点与四个直接近邻点的平均值之间的差。 中心权可正可负,可四相邻或八相邻,但要保证模板系数总和0,从而在亮度均匀区域不会检测到边缘。 优点:各向同性(同高斯算子)缺点:不包含平滑,会对噪声产生响应,所以基本不用Laplacian基本式。 Marr-Hildreth 算子 也是利用高斯滤波。把高斯平滑和Laplacian结合起来,得到LoG算子。LoG计算可以用高斯差分来近似。模板系数总和1. 怎样决定过零点的点? 优点:能够给出封闭的边缘边界,能够避免滞后阀值的递归计算,具有多分辨率分析能力(可在不同的尺度上检测边缘)。 变换是中心对称的,LoG忽视了低频和高频成分,相当于一个带通滤波。σ 的取值可以调节算子在空域的张开度和频域的带宽:σ 大得低通滤波。(一阶边缘检测是沿一条轴起高通/微分,另条轴起低通/平滑作用)。 所有边缘检测算子都是用滞后阀值处理来实现的。 相位一致性 是一个特征检测算子,它有两个优点:可以检测大范围的特征,对局部(和平滑)光照变化具有不变性。 一致性检测具有局部对比度不变性:即使阶梯边缘强度变小,正弦波不断叠加,其变化位置并不改变。 傅里叶分量相位最大的点确定特征 缺点: 噪声敏感 不好定位。 相位一致性关键词 频域 小波 卷积 定位特征提取 传统方法 检测图像曲率(角点提取) 局部曲率的峰值是角点。 点v(t)处曲率描述的是沿方向 φ(t)对弧长的变化。 曲率函数的计算方法 对于曲线上的每个点,都有一对正交向量v(t),n(t),它们的模数通过曲率成正比关系。n(t)垂直于v(t),曲率k(t)表示它的模数。 数字图像中的曲线 曲率计算有三种方法
现代方法 区域/图像块分析 尺度不变特性变换 SIFT 的目标是解决低层次特征提取及其在图像匹配应用中的许多实际问题。SIFT包括两个步骤:特征提取和描述。
显著性算子 如果一些区域不能同时在特征和尺度空间进行预测的话,该方法把这些区域看成是显著特征。 与传统方法相比,它的目标是成为一个尺度和显著性特征的通用方法,因为这两者的定义都与特殊的基本形态意义无关,这些基本形态意义不是基于粒子、边缘和角点等特殊的几何特征。该方法是通过确定某一尺度上图像块内的熵来处理的。显著性就是这些熵峰值 的加权和。 描述图像运动 基于区域的方法 运动看作是一组图像平面上的位移,位移支应的是场景中目标的投射移动,即光流。光流是时间单位上的像素移动,像素/帧。如果特征是像素,可以通过观察图像区域(即局部近邻点)亮度之间的相似度来找到对应点。 简化假设:
微分方法 另一个推测运动的方法, 关注像素值的微分变化。光流和空间亮度变化率一起可以描述图像如何随时间变化。
第五章 形状匹配的特征提取(高层次)
阀值处理和差分 直方图均衡化的结果易受噪声阴影和光照 变化影响。 模板匹配 将模板的中心放在一个图像点上,计算模板中有多少点与图像点匹配。对整幅图像重复这一过程,那个最佳匹配点,计数最大的,就是形状(模板)在图像中的位置。 像素匹配的概率,最大似然估计等效于选择具有最小化平方差的模板位置,(模板像素点与相应的图像像素差值 的平方) 二值图像可以减小计算量。直接数字实现模板匹配的速度很慢。更快的如基于快速变换微积分的傅里叶实现。 模板匹配最主要的优势就是对噪声和遮挡的不敏感性。 傅里叶变换实现 卷积和乘法之间的对偶性 空域的乘法相当于频域的卷积 霍夫变换 HT 是一种在图像中定位形状的技术。特别是提取直线、圆和椭圆。 直线 霍夫变换通过对存储证据或者投票的累加器数组进行简单的计数,通过对每一个点追踪所有的双线完成的。追踪的每个点增量数组的一个元素,直线提取问题转化为在累加器空间中定位的最大值问题。 圆的霍夫变换 椭圆检测 广义霍夫变换 第六章 弹性形状提取(蛇模型)
可变形模板 蛇模型 是使一组点(轮廓)进行演变,从而与图像数据相匹配,而不是使形状演变。 主动轮廓/蛇模型 是与特征提取完全不同的方法。主动轮廓是将目标特征即等提取特征包围起来的一组点。类似于利用一个气球来找出形状,气球放在形状外部,将形状包围在内,然后从气球将空气放出,使它慢慢变小 ,当气球停止缩小时即找出了形状,此时气球与形状完全拟合。 在目标特征的外部设置一个初始轮廓,然后对其进行演变并将目标特征包围在内。主动轮廓可以表示为能量最小化处理。目标特征是经过合理公式化的能量泛函的最小值。 能量泛函 是轮廓内部能量、其约束能量以及图像能量的相加函数。这三个能量分别标记为EINT,ECON,EIMAGE.它们是组成蛇模型v(s)的一组点,即蛇模型中所有点的x和y坐标。EINT 决定蛇模型的自然变化,从而决定蛇模型所有点的排列。图像能量EIMAGE引导蛇模型选择低层次特征(例如边缘点)。约束能量ECON给出高层次信息以控制蛇模型的演变。内部图像能量定义为轮廓周围一阶和二阶导数的加权和,一阶导数dv(s)/ds表示由伸缩而产生的能量,即弹性能量。二阶微分d2v(s)/ds2表示因弯曲而产生的能量,即曲率能量。图像能量引导蛇模型提取低层次特征,比如亮度或边缘数据,目的是选取具有最小贡献的特征。线、边缘和端点。 蛇模型的贪心算法 完全蛇模型KASS 其它蛇模型 几何主动轮廓 参数化的主动轮廓(蛇模型)很难同时对多个目标进行分割。几何主动轮廓模型,曲线用水平集函数隐式表达。 水平集方法 实质上是找出形状,但不对其进行参数化,因此曲线描述是隐式而不是显式的,把它看做是函数的零水平集。零水平集是图像中两个区域之间的接口。水平集函数是带正负号的,表示与轮廓的距离 ,内部距离设为负,外为正,轮廓本身即目标形状,其距离为零,即在两个区域之间的交界处。 参考资料 水平集两本重要的教材 Sethian,1999;Osher and Paragios ,2003 无边缘主动轮廓模型 形状骨架化
弹性形状模型:主动形状和主动外观 前面讨论的是可变形的模板或可以演变的形状,主动轮廓是弹性的,但其演变实质上受局部曲率或边缘强度等局部特征的限制。 弹性模板 利用从训练数据样例形成的整体形状约束,考虑图像库中是否包含该形状的所有可能变化。其中最主要的方法是主动形状建模,关注由点组成的形状模型,点的变化称为点分布模型,所选地标点在训练图像中标记,顺序标记很重要。主成分分析将数据压缩成最重要项。 应用过程(找出被建模形状的实例)是利用迭代方法,使模型和图像中匹配点不断增多。可以通过检测模型点周围区域以确定最佳近邻匹配来实现。对数据的最佳拟合模型计算适当的平移、缩放和旋转和特征向量。不断重复以上处理直到模型对数据收敛。 主动形状模型ASM 由于只改变形状以更好地拟合数据,并且形状受所期望的形状外观控制,所以这种模型被称为主动形状模型ASM 主动外观模型AAM 包括纹理,通过重复搜索处理对纹理进行匹配来更新模型参数,使地标点向图像点靠近。
参考资料
第七章 目标描述
边界描述 区域描述的是边界所包围的内容(内部点)。 边界被称为区域轮廓,指它的形状。如果一个点在区域内,它还有一个邻像素在区域外,那这个点就是边界(轮廓)上的点。 区域内部点和边界点通过四连通或八连通来描述。它们是互补的,如果边界像素是四连通,那区域像素就是八连通,反之亦然。 链码 只存储连续像素之间的相关位置。方向数字串 傅里叶描述符 利用表示形状整体频率分量的一组数字来描述轮廓特征。首先要定义一个曲线表达。其次,利用傅里叶理论将其展开 。 基本原理 傅里叶分量(直流分量)的第一个成分只是x和y坐标的平均值,它是以复数形式表示的边界中心点的坐标。第二个成分所给出的是最适合这些点的圆的半径。因此,圆可以用零阶和一阶成分(直流分量和第一个谐波)来进行描述。零阶分量给出是形状的位置(圆点)。椭圆可以加入所有空间分量来重构 傅里叶展开式 基底(、拉格朗日、牛顿插值),傅里叶展开的主要特征是定义了一组正交基。 移动不变性 链码要特别关注的是得到起点不变性。主要在于曲线移动时描述符是否会改变。 离散计算 离散化具有两个作用,首先可以限制展开式中频率的数量,其次,它对定义傅里叶系数的积分进行数值化近似。 累积角函数 曲线上一点的累积角函数定义为从起始点开始的角度变化量。由于它表示每个点角度变化的总和,被 称为累积。累积角函数避免了角函数的不连续性。 椭圆傅里叶描述符 累积角函数把曲线的二维描述变换成适合傅里叶分析 一维周期函数。而椭圆傅里叶描述符保持曲线在二维空间的描述。通过考虑图像空间定义的是复平面来实现。每个像素定义为一个复数。 椭圆傅里叶描述符的不变性 区域描述符 基本区域描述符是对区域的几何属性进行特征化,矩所关注的是区域的密度。 基本区域描述符 面积 周长 紧凑度 是周长和面积的比值。 离散性(不规则性) 是最大弦长与面积比。对于不规则形状,这个比值变大,而紧凑度减小。 矩 矩描述的是形状的构图(像素排列)。矩是形状的全面描述,具有傅里叶描述同样的优势,具有选择性(自带的识别和过滤噪声的能力)。 不变矩 中心矩只具有平衡不变性,不对应其他外观转换。为得到尺度和旋转不变性,需要正规化中心矩。 Zernike矩 可以实现不变性,它给出旋转不变矩的一个正交系。大小保持旋转不变性,它只对相位有影响。可以通过正规化实现尺度不变性。另个优势是存在一个重构定理。原形状f可以通过其矩和Zernike多项式重构。 图像的傅里叶变换可以通过其矩推导出来。 样条是用来对不同分区内的特征进行建模的区间函数。有二次和三次形式。蛇模型是一种能量最小化样条。
第八章 纹理描述、分割和分类基础
第九章 工作表
第十章 射影几何
第十一 最小二乘 估计理论的基础
第十二 主成分分析 pricipal components analysis PCA 也KL变换或者Hotelling变换。它是以线性代数因式分解为基础,因式分解通常用于将矩阵对角化,它的逆容易求得。数据变换对分类和压缩尤其有用。 PCA 收集数据并进行变换,使新的数据具有给定的统计特征。选择统计特性是为了使变换突出数据元素的重要性。PCA技术变换特征向量以定义新向量,新向量定义了具有更好的分类能力的成分。PCA确保我们突出了那些数据根据协方差衡量具有最大变化的数据。 协方差表示两个随机变量之间线性相关性。协方差衡量的是线性关系,线性通常是PCA的主要局限。 协方差矩阵 数据变换 逆变换 特征值问题 PCA运算步骤
|
|