顾险峰(纽约州立大学石溪分校终身教授) 引言 依随智能手机的大规模普及,数字摄影已经成为很多人生活中不可或缺的习惯。随着数字图像处理技术的蓬勃发展,PS作为数字图像处理的代名词(photoshop),在普罗大众中早已耳熟能详。数字图像处理中,最为基本的算法非“色彩变换”(Color Transfer)莫属。
直方图均衡化是提高灰度图像对比度的常见算法。如图1所示,左侧输入图像的灰度分布在一个狭窄区域,朦胧昏暗;右侧是直方图均衡化的结果,清晰明亮,对比鲜明。我们设输入图像像素的灰度为一随机变量,其取值范围为单位区间 图2. 基于最优传输的色彩变换。 数据驱动的色彩变换可以视作是直方图均衡化的直接推广。图2显示了一个算例,左侧是输入图像,阴霾遍布下的麦地,阴郁苍凉,中间是范例图像,晴空下的麦穗,右图是输出图像,一扫阴霾,麦浪金黄,明媚爽朗。我们将图像中的每个像素颜色表示成(红,绿,蓝)三元组,所有可能的颜色空间 图3. 输入图像。 图4. 范例图像。
图3至图5展示了另外一个例子,输入图像颜色的概率测度变换成范例图像颜色的概率测度,从而生成了输出图像。图6的鹦鹉图像也进行了颜色变换。
这些颜色变换的算法是基于最优传输理论(Optimal Mass Transportation)。最近,最优传输理论被广泛应用于工程和医疗中的诸多领域,例如直接应用于图像颜色变换、图像注册、曲面保面积参数化和体的保体元参数化、曲面或体的注册。特别是在机器学习中,最优传输理论起到了至关重要的作用。下面我们简单介绍最优传输理论梗概。 蒙日关于最优传输问题的提法 假设
历史上,法国数学家蒙日(Monge)早在1781年就提出了最优传输问题,我们在这里称之为蒙日问题:求保测度的具有最小传输代价的映射
这一问题的提法非常具有普适性,特别是它具有天然的经济学意义。 我们可以用下面的例子来理解最优传输问题的提法:假设空间 蒙日提出的传输代价是 康塔洛维奇的提法 蒙日的提法中,保测度的映射所构成的空间不具备紧性,这为问题的解决带来了本质的难度。1939年,俄罗斯数学家康塔洛维奇(Kantorovich)将传输映射(transportation map)推广为传输方案(transportation plan),从而巧妙地将问题转化,带来实质性的突破。 在蒙日的传输映射 为了表达传输方案,康塔洛维奇在空间
那么如上边际概率条件可以表示为:
康塔洛维奇关于最优传输问题的提法如下: 我们可以看到可容许概率测度 康塔洛维奇将空间 虽然理论上线性规划问题的复杂度为NP,实际中,我们可以用经典的单纯形法或者内点法快速解出。 鉴于最优传输问题的巨大经济价值,康塔洛维奇获得了1975年度的诺贝尔经济学奖。 对偶提法 康塔洛维奇的提法将最优传输问题转化成凸限制下的线性优化问题,这个问题存在对偶的提法。我们可以从对偶问题上看出更多的几何直觉。我们将边际概率测度的限制条件换种方式表达,考察下面的泛函: 这里 注意,在这里测度 在特定条件下,我们可以交换极小,极大算子,从而得到: 我们再考察后一项 如果在某一点
这里 通常情况下,蒙日泛函,对偶泛函和康塔洛维奇泛函满足不等式,
问题的核心在于:何时等号成立?何时最优传输方案称为最优传输映射? 勒让德变换-包络 对偶问题具有非常直观的几何洞察,为此我们先考察凸几何中的勒让德变换(Legendre transform)。
如图9所示,假设
这里截距定义为:
我们可以将勒让德变换进行推广,如图10所示,假设 这里,我们称
如果 对偶问题(DP)可以进一步表示成如下形式:
扭曲条件 根据以上的讨论,我们看到对于最优传输方案
换言之 根据包络的几何特征,假设在
我们得到映射 ,如果这一映射对任意 图11展示了一个不满足扭曲条件的例子,在 假如,代价函数 这里,我们再一次用到了勒让德变换 作为这套理论的应用,我们给出两个在日常生活中最为常见的例子。 蒙日-安培方程 考察代价函数为 则h为严格凸的函数,最优传输映射存在。如果我们考虑 我们令 我们再考虑保持测度的性质: 因此,最优传输映射和蒙日-安培方程具有非常亲密的血缘关系,而后者也和传统的闵科夫斯基问题(Minkowski Problem)有很深的渊源[5]。 加权Voronoi图 从计算角度讲,最优传输映射和计算几何中的加权Voronoi图(Power Voronoi Diagram)是彼此等价的。我们在这里进行一番推导。 我们设
配备狄拉克测度:
考察对偶问题,则
我们在考察
固定 我们得到 这里 由此,我们得到对偶问题为:最大化如下能量
我们可以用爬山法来进行优化。图12,13显示了保面元和保体元的同胚映射,其计算就是基于这个算法。更多的计算工具,数据测试集合可以在[2]中找到。 图12. 曲面保面积参数化[4]。
小结 一个黎曼流形上的所有概率测度构成一个无穷维的流形,即所谓的Wasserstein空间。任意两个概率测度之间存在最优传输映射,这个映射的传输代价给出了两个概率测度之间的距离,被称为是Wasserstein距离。因此,Wasserstein空间是一个黎曼流形。 在工程和医学的诸多领域,算法的核心是寻找一个概率测度,例如机器学习算法。Wasserstein距离给出了衡量概率测度相似程度的严密方法,这是为什么近几年来最优传输理论异常火热的根本原因。 但是,计算最优传输本身并不容易,目前计算机视觉、图形学、机器学习、医学图像的研究者都努力用各种优化方法,工程技巧来提高计算效率。我们可以预见在不久的将来,最优传输理论将会在更多的实际工程中大放异彩。 (丘成桐先生邀请杜克大学的刘建国教授在清华大学数学科学中心,于2016年暑期学校,讲述最优传输理论课程[1]。本文根据课堂笔记整理而成。笔者鸣谢丘成桐先生和刘建国教授。) [1] Fillipo Santambrogio, Optimal Transport for Applied Mathematicians - Calculus of Variations, PDEs and Modeling [2] http://www3.cs./~gu/software/omt/index.html [3] Kehua Su, Wei Chen, Na Lei, Junwei Zhang, Kun Qian and Xianfeng Gu, Volume Preserving Mesh Parameterization based on Optimal Mass Transportation, Journal of Computer-Aided Design (CAD), 2016. [4] Xin Zhao, Zhengyu Su, Xianfeng David Gu, Arie Kaufman, Jian Sun, Jie Gao, Feng Luo, Area-preservation Mapping using Optimal Mass Transport, IEEE TVCG, 19(12), Pages 2838-2847, 2013. [5] Xianfeng Gu, Feng Luo, Jian Sun and Shing-Tung Yau, Variational Principles forMinkowski Type Problems, Discrete Optimal Transport, and Discrete Monge-Ampere |
|