分享

梯度

 容斋承筐 2015-12-07
Tango-nosources.svg
本条目需要补充更多来源(2015年3月29日)
请协助添加多方面可靠来源改善这篇条目无法查证的内容可能会被提出异议而移除。
关于同名角度单位,请见“梯度 (角)”。
微积分学
\int_M \mathrm{d}\omega = \oint_{\partial M} \omega
函数 · 导数 · 微分 · 积分
[显示]基础概念
[显示]一元微分
[显示]一元积分
[显示]多元微积分
[显示]微分方程
[显示]相关数学家
上面两个图中,标量场是黑白的,黑色表示大的数值,而其相应的梯度用蓝色箭头表示。

向量微积分中,标量场梯度是一个向量场。标量场中某一点的梯度指向在这点标量场增长最快的方向(当然要比较的话必须固定方向的长度),梯度的绝对值是长度为1的方向中函数最大的增加率,也就是说 |\nabla f|=\max_{|v|=1} \{\nabla_v f\},其中 \nabla_v 代表方向导数。以另一观点来看,由多变数的泰勒展开式可知,从欧几里得空间RnR函数的梯度是在Rn某一点最佳的线性近似。在这个意义上,梯度是雅可比矩阵的一个特殊情况。

在单变量的实值函数的情况,梯度只是导数,或者,对于一个线性函数,也就是线的斜率

梯度一词有时用于斜度,也就是一个曲面沿着给定方向的倾斜程度。可以通过取向量梯度和所研究的方向的内积来得到斜度。梯度的数值有时也被称为梯度。

梯度的解释[编辑]

假设有一个房间,房间内所有点的温度由一个标量场\phi给出的,即点(x,y,z)的温度是\phi(x,y,z)。假设温度不随时间改变。然后,在房间的每一点,该点的梯度将显示变热最快的方向。梯度的大小将表示在该方向上变热的速度。

考虑一座高度在(x, y)点是H(x, y)的山。H这一点的梯度是在该点坡度(或者说斜度)最陡的方向。梯度的大小告诉我们坡度到底有多陡。

梯度也可以告诉我们一个数量在不是最快变化方向的其他方向的变化速度。再次考虑山坡的例子。可以有条直接上山的路其坡度是最大的,则其坡度是梯度的大小。也可以有一条和上坡方向成一个角度的路,例如投影在水平面上是60°角。则,若最陡的坡度是40%,这条路的坡度小一点,是20%,也就是40%乘以60°的余弦。

这个现象可以如下数学的表示。山的高度函数H的梯度点积一个单位向量给出了表面在该向量的方向上的斜率。这称为方向导数

形式化定义[编辑]

一个标量函数\varphi的梯度记为:

\nabla \varphi\operatorname{grad} \varphi

其中\nablanabla)表示向量微分算子

\nabla \varphi在三维直角坐标中表示为

\nabla \varphi =\begin{pmatrix}
{\frac{\partial \varphi}{\partial x}},  
{\frac{\partial \varphi}{\partial y}}, 
{\frac{\partial \varphi}{\partial z}}
\end{pmatrix}

参看偏导数向量

虽然使用坐标表达,但结果是在正交变换下不变,从几何的观点来看,这是应该的。

范例[编辑]

函数\varphi=2x+3y^2-\sin (z)的梯度为:

\nabla \varphi = \begin{pmatrix}
{\frac{\partial \varphi}{\partial x}},  
{\frac{\partial \varphi}{\partial y}}, 
{\frac{\partial \varphi}{\partial z}}
\end{pmatrix} =
\begin{pmatrix}
{2}, 
 {6y},
 {-\cos (z)}
\end{pmatrix}

实标量函数的梯度[来源请求][编辑]

相对于n×1向量x的梯度算子记作\nabla_{\boldsymbol{x}}[来源请求],定义为

\nabla_{\boldsymbol{x}} \overset{\underset{\mathrm{def}}{}}{=} \left[ \frac{\partial }{\partial x_1}, \frac{\partial }{\partial x_2},\cdots,\frac{\partial }{\partial x_n} \right]^T=\frac{\partial }{\partial \boldsymbol{x}}[来源请求]

对向量的梯度[编辑]

以n×1实向量x为变元的实标量函数f(x)相对于x的梯度为一n×1列向量x,定义为

\nabla_{\boldsymbol{x}} f(\boldsymbol{x})\overset{\underset{\mathrm{def}}{}}{=} \left[ \frac{\partial f(\boldsymbol{x})}{\partial x_1}, \frac{\partial f(\boldsymbol{x})}{\partial x_2},\cdots,\frac{\partial f(\boldsymbol{x})}{\partial x_n} \right]^T=\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}

m维行向量函数\boldsymbol{f}(\boldsymbol{x})=[f_1(\boldsymbol{x}),f_2(\boldsymbol{x}),\cdots,f_m(\boldsymbol{x})]相对于n维实向量x的梯度为一n×m矩阵,定义为

\nabla_{\boldsymbol{x}} \boldsymbol{f}(\boldsymbol{x})\overset{\underset{\mathrm{def}}{}}{=}
\begin{bmatrix}
\frac{\partial f_1(\boldsymbol{x})}{\partial x_1} &\frac{\partial f_2(\boldsymbol{x})}{\partial x_1} & \cdots & \frac{\partial f_m(\boldsymbol{x})}{\partial x_1}      \\frac{\partial f_1(\boldsymbol{x})}{\partial x_2} &\frac{\partial f_2(\boldsymbol{x})}{\partial x_2} & \cdots & \frac{\partial f_m(\boldsymbol{x})}{\partial x_2}      \\vdots &\vdots & \ddots & \vdots \\frac{\partial f_1(\boldsymbol{x})}{\partial x_n} &\frac{\partial f_2(\boldsymbol{x})}{\partial x_n} & \cdots &\frac{\partial f_m(\boldsymbol{x})}{\partial x_n}     \\end{bmatrix}=\frac{\partial \boldsymbol{f}(\boldsymbol{x})}{\partial \boldsymbol{x}}

对矩阵的梯度[编辑]

实标量函数\boldsymbol{f}(\boldsymbol{A})相对于m×n实矩阵A的梯度为一m×n矩阵,简称梯度矩阵,定义为

\nabla_{\boldsymbol{A}} \boldsymbol f(\boldsymbol{A})\overset{\underset{\mathrm{def}}{}}{=}
\begin{bmatrix}
\frac{\partial f(\boldsymbol{A})}{\partial a_{11}} &\frac{\partial f(\boldsymbol{A})}{\partial a_{12}} & \cdots & \frac{\partial f(\boldsymbol{A})}{\partial a_{1n}}      \\frac{\partial f(\boldsymbol{A})}{\partial a_{21}} &\frac{\partial f(\boldsymbol{A})}{\partial a_{22}} & \cdots & \frac{\partial f(\boldsymbol{A})}{\partial a_{2n}}      \\vdots &\vdots & \ddots & \vdots \\frac{\partial f(\boldsymbol{A})}{\partial a_{m1}} &\frac{\partial f(\boldsymbol{A})}{\partial a_{m2}} & \cdots &\frac{\partial f(\boldsymbol{A})}{\partial a_{mn}}     \\end{bmatrix}=\frac{\partial \boldsymbol{f}(\boldsymbol{A})}{\partial \boldsymbol{A}}

法则[编辑]

以下法则适用于实标量函数对向量的梯度以及对矩阵的梯度。

  • 线性法则:若f(\boldsymbol{A})g(\boldsymbol{A})分别是矩阵A的实标量函数,c1和c2为实常数,则
\frac{\partial [c_1 f(\boldsymbol{A})+c_2 g(\boldsymbol{A})]}{\partial \boldsymbol{A}}=c_1\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}+c_2 \frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}}
  • 乘积法则:若f(\boldsymbol{A})g(\boldsymbol{A})h(\boldsymbol{A})分别是矩阵A的实标量函数,则
\frac{\partial f(\boldsymbol{A})g(\boldsymbol{A})}{\partial \boldsymbol{A}}=g(\boldsymbol{A})\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}+f(\boldsymbol{A}) \frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}}
\frac{\partial f(\boldsymbol{A})g(\boldsymbol{A})h(\boldsymbol{A})}{\partial \boldsymbol{A}}=g(\boldsymbol{A})h(\boldsymbol{A})\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}+f(\boldsymbol{A})h(\boldsymbol{A})\frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}}+f(\boldsymbol{A})g(\boldsymbol{A})\frac{\partial h(\boldsymbol{A})}{\partial \boldsymbol{A}}
  • 商法则:若g(\boldsymbol{A})\neq 0,则
\frac{\partial f(\boldsymbol{A})/ g(\boldsymbol{A})}{\partial \boldsymbol{A}}=\frac{1}{g(\boldsymbol{A})^2} \left[ g(\boldsymbol{A})\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}-f(\boldsymbol{A}) \frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}} \right]
  • 链式法则:若A为m×n矩阵,且y=f(\boldsymbol{A})g (y)分别是以矩阵A和标量y为变元的实标量函数,则
\frac{\partial g(f(\boldsymbol{A})}{\partial \boldsymbol{A}}=\frac{d g (y)}{dy} \frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}

流形上的梯度[编辑]

一个黎曼流形M上的对于任意可微函数f的梯度\nabla f是一个向量场,使得对于每个向量 \xi

\langle \nabla f, \xi \rangle := \xi f

其中\langle \cdot, \cdot \rangle代表M上的内积(度量)而 \xi f (p), p\in Mf在点p,方向为\xi (p)方向导数。换句话说,如果\varphi :U\subseteq M\mapsto \mathbb{R}^np附近的局部坐标,在此坐标下有\xi (x)=\sum_j a_j (x)\frac{\partial}{\partial x_{j} },则\xi f (p)将成为:

\xi(f \mid_{p}) := \sum_j a_j(\frac{\partial}{\partial x_{j} }(f \circ \varphi^{-1}) \mid_{\varphi (p)})

函数的梯度和外微分相关,因为\xi f = df(\xi),实际上内积容许我们可以用一种标准的方式将1-形式df和向量场\nabla f建立联系。由\nabla f的定义,df(\xi)=\langle \nabla f, \xi \rangle,这样f的梯度可以"等同"于0-形式的外微分df,这里"等同"意味着:两集合\{df \}\{\nabla f \}之间有1对1的满射

由定义可算流形\nabla f的局部坐标表达式为:

 \nabla f=\sum_{ik} g^{ik}\frac{\partial f}{\partial x^{k}}\frac{\partial}{\partial x^{i}}

请注意这是流形上对黎曼度量 ds^2=\sum_{ij}g_{ij}dx^i dx^j 的公式,跟\mathbb{R}^n 里直角坐标的公式不同。常常我们写时会省略求和\sum符号,不过为了避免混淆,在这里的公式还是加上去了。

柱坐标下的梯度(\nabla)算符[编辑]


   \nabla f(\rho,\theta,z) = \frac{\partial f}{\partial\rho} \mathbf{e}_{\rho}
                            + \frac1{\rho}\frac{\partial f}{\partial\theta} \mathbf{e}_{\theta}
                            + \frac{\partial f}{\partial z} \mathbf{e}_{z}

球坐标下的梯度(\nabla)算符[编辑]


   \nabla f(r,\theta,\phi) = \frac{\partial f}{\partial r} \mathbf{e}_{r}
                            + \frac1{r}\frac{\partial f}{\partial\theta} \mathbf{e}_{\theta}
                            + \frac1{r\sin \theta}\frac{\partial f}{\partial \phi} \mathbf{e}_{\phi}

其中\theta为极角,\phi方位角。

参考[编辑]

书籍[编辑]

  • (中文)张贤达. 矩阵分析与应用. 清华大学出版社. 2004.9. ISBN 9787302092711.

参看[编辑]

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多