麦客奥德彪的博客地址:
图像缩放是数字图像处理中常用的技术之一。随着数字媒体的普及,图像缩放算法变得越来越重要。本文将探讨图像缩放的原理,着重介绍两种常用的插值算法——最近邻插值和双线性插值,并提供对应的代码实现。我们将解释这些算法的工作原理,以及如何选择最适合您应用场景的算法。 开发中可能非专业的开发人员外,其他人不会对其涉猎,但是图像的缩放这个话题确实值得我们学习和研究。 图像包含图片和视频,当你看视频时全屏变小窗,小窗变大屏等都用到了图像缩放,就视频而言,不同分辨率的切换也用到了缩放算法,比如,电影分辨率是 1080P,播放器的窗口大小是720P,则需要将电影画面从1080P缩小到720P再播放。如果你点击全屏播放,播放窗口变成了4K,则需要将电影画面做放大处理,即放大到4K之后再播放。
这就是我今天要讨论的问题。 图像缩放算法图像缩放算法可以分为两类:插值算法和基于变换的算法。下面是一些常见的图像缩放算法:
这些算法已经在行业中有较多的资料和使用文献,我这里简单梳理一下他们的原理以及在Android中怎么使用这些算法。 缩放的原理 首先要明确一点就是图像的缩放就是将原图像的已有像素经过加权运算得到目标图像的目标像素。比如说,我们已有图像是720P的分辨率,称之为原图像,我们需要放大到1080P,我们称这个1080P图像是目标图像。目标图像在宽度方向上放大了1920 / 1280 = 1.5倍,高度方向上也放大了1080 / 720 = 1.5倍。 那怎么通过720的图像生成1080的图像呢?放大之后会不会存在间隙,这个间隙是否会导致图像“发虚”呢? 做法如下: 先将目标图像的像素位置映射到原图像的对应位置上,然后把通过插值计算得到的原图像对应位置的像素值作为目标图像相应位置的像素值。 这样操作之后是不是就没有间隙了。这就是插值算法要干的事了。1080P目标图像中的(0,0)位置就映射到720P原图像的(0,0)位置,取原图像(0,0)位置的像素值作为目标图像(0,0)位置的像素值。目标图像的(1,1)位置就映射到原图像中的(0.67,0.67)位置。最后,通过原图像已有像素插值得到(0.67,0.67)位置的像素值,并将该像素值作为目标图像(1,1)位置的像素值。下图中,显示了720p放大到1080p的图示和720p缩小到360p的图示。 通过这个演示,可以总结一下图像缩放的一般过程:
然后二者的操作过程是,遍历一下目标图像中的每一个像素点位置,都能找到他们在原图像中的映射位置,并通过插值求出映射位置的像素值,这样就可以得到目标图像了 我们可以推测出,缩放的代码逻辑是:
不用着急,后面可以验证该推测。 缩放的通用表达式 假设原图像的分辨率是 w0 x h0,我们需要缩放到 w1 x h1。那我们只需要将目标图像中的像素位置(x,y)映射到原图像的(x * w0 / w1,y * h0 / h1),再插值得到这个像素值就可以了,这个插值得到的像素值就是目标图像像素点(x,y)的像素值。注意,(x * w0 / w1,y * h0 / h1)绝大多数时候是小数。这就是图像缩放算法原理的通用表达示图如下: 目前比较流行的插值算法基本有三种。 插值算法最近邻插值算法 最近邻插值算法是一种基本的图像插值算法,它的基本思想是对于待插值像素的位置,选择距离该位置最近的一个已知像素值作为插值结果。因此,该算法得名为“最近邻插值”。 最近邻插值算法的具体实现过程如下:
还是看图像从720p放大到1080p,这个例子,我们上面说了缩放的原理就是映射像素,即将目标图像的像素映射到原图像。 1080p假设(2,2)的位置,最邻近插值法的取值过程是: 映射到720P图像,映射位置是(2 * 1280 / 1920,2 * 720 / 1080),也就是(1.33,1.33)位置,其周围4个像素分别是(1,1)、(1,2)、(2,1)和(2,2),很明显(1,1)离(1.33l,1.33)位置最近,那我们取原图像(1,1)的像素值赋值给1080P图像的(2,2)位置的像素点。 左图为放大过程,右图为放大时取值图示:
代码实现
最近邻插值算法java代码_图像最近邻插值算法_异域拾荒人的博客-CSDN博客
使用opencv 库开发,因为需要获取像素等操作,最核心的代码为:
优缺点 优点:是简单易实现,计算速度快 缺点:
应用场景 快速预览图像或图像缩小等场景。 双线性插值算法 双线性插值算法是一种常用的图像插值算法,它能够通过对周围4个已知像素进行加权平均来计算待插值像素的像素值,从而获得更为平滑和细腻的插值结果。听着就比最近邻插值算法复杂,但是效果肯定比它优。 双线性插值算法的具体实现过程如下: 确定待插值像素位置,假设其坐标为(x,y)。找到距离(x,y)最近的四个已知像素,假设它们的坐标为(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)。计算待插值像素的像素值。假设待插值像素的像素值为f(x,y),则可以通过下面的公式计算: 其中,w和h分别表示待插值像素相对于(x1,y1)和(x2,y2)的水平距离和垂直距离,具体计算方式如下: 将计算得到的像素值赋给待插值像素。 线性插值 线性插值是一种数学方法,用于在两个已知点之间估计未知点的值。它假定两个已知点之间的函数是线性的,因此可以使用直线方程来计算未知点的值。 线性插值认为,这个需要插值得到的点跟这两个已知点都有一定的关系,并且,待插值点与离它近的那个点更相似。因此,线性插值是一种以距离作为权重的插值方式,距离越近权重越大,距离越远权重越小。 比如,如下图所示,已知 (x1,y1)与(x2,y2)两个点,需求得x对应的y值。 它表示在两个点(x1,y1)和(x2,y2)之间,对于给定的x值,对应的y值可以通过这个公式计算得到。当x=x1时,y=y1;当 x=x2 时,y=y2。当x在x1和x2之间时,y 的值在y1和y2之间线性变化。 双线性插值 双线性插值本质上就是在两个方向上做线性插值。由于图像是两个方向的二维数据,正好适合使用双线性插值算法。双线性插值其实就是三次线性插值的过程,我们先通过两次线性插值得到两个中间值,然后再通过对这两个中间值进行一次插值得到最终的结果。 假设我们有一个矩形网格,其中四个顶点的坐标分别为 (x1,y1),(x1,y2),(x2,y1) 和 (x2,y2),并且这些点的函数值分别为 f(x1,y1),f(x1,y2),f(x2,y1) 和 f(x2,y2)。我们想要计算点 (x,y) 的函数值,其中 x 和 y 分别在 x1 和 x2 之间,在 y1 和 y2 之间。 沿着x轴进行线性插值,得到两个临时值。 这个即图中的n点。 即图的m点,再沿着y轴线性插值。 即图中p以720P放大到1080P为例,那么1080P图像中的目标像素点(2,2)的双线性插值过程是怎么样的呢? 首先,将目标像素点(2,2)映射到原图像的(1.33,1.33)位置,对应下面图中的点p。找到(1.33,1.33)周围的4个像素(1,1)、(2,1)、(1,2)和(2,2),分别对应图中的点a、b、c和d。 根据上述的公式,我们可以计算出图中的n、m 最后求出p 的像素。 首先n点: m点: p点: 值求得(1.33,1.33)的值之后,将其赋值给1080P目标图像的(2,2)位置的像素点就可以了。这就是双线性插值的过程。 优缺点 优点:可以获得相对较为平滑和细腻的插值结果,而且计算速度也比较快 缺点:
应用场景 图像放大、缩小和旋转等场景 总结此文章主在弄明白图像缩放的原理,并完成了经典算法插值算法的最近邻插值算法,当然,最近邻插值算法的使用场景单一,也不是工作中常用的算法,后续会陆续完成双三次插值算法。双三次算法图像质量方面有明显提升,特别是在缩小图像时,双三次插值算法可以更好地保留图像的细节和纹理。 源码 已完成最邻近插值算法代码 Android-Scaling-algorithm-for-image:
关注我获取更多知识或者投稿 |
|
来自: 昵称55828825 > 《待分类》