分享

线性代数(高等代数)的基本思想

 小朱的读书笔记 2022-05-08 发布于上海

线性代数(或高等代数)课程是一门很重要的数学基础课程。通过这门课程的学习,可以使学生们初步掌握线性代数和多项式代数的基本知识和方法,培养基本的逻辑推理能力,并且了解代数学与几何学之间深刻的内在关联,同时为后面学习多元微积分、微分方程、概率统计、泛函分析、近世代数和数值计算等基础课程打下必要的基础。

线性代数主要研究数域上的有限维线性空间。这门课程的基本内容有行列式、线性方程组、矩阵论、二次型、线性空间、线性变换、若尔当标准形和内积空间等。线性代数的内容大致可以分为初等与高等两大部分:初等部分包括了矩阵论、行列式、线性方程组、二次型等内容,高等部分则主要包括了线性空间(或向量空间)、线性变换、欧氏空间(及酉空间)等理论。从时间上说,线性代数的初等理论在19世纪就已经发展得比较完备了,而线性代数的高等理论则要等到20世纪的上半叶才正式形成。

著名数学家丘成桐先生曾经说过:“要学好微积分和线性代数,归根结底一切高级的数学都是微积分和线性代数的各种变化。”丘成桐先生的这句话很好地说明了线性代数这门课程在大学数学课程体系中的基础地位。

在大学数学中,“线性”两字的含义一般是指一次的函数关系式。由于“以直代曲”是人们处理很多数学问题的常用思路,所以经常将复杂的数学问题归结为比较简单的线性问题,这样,线性代数的理论与方法就渗透到了现代数学的许多分支学科中。

一、行列式理论的基本思想

行列式与矩阵概念的萌芽最早主要起源于17世纪对线性方程组求解问题的研究。在17世纪之前,人们只满足于用加减消元法来求出一个具体的二、三元线性方程组的解。1693年的时候,数学家莱布尼茨在给数学家洛必达的一封信中提出了一个基本问题:要使三元齐次线性方程组存在非零解,该方程组的系数应该满足什么条件?莱布尼茨在信中用简单的加减消元法推得了方程组的9个系数应满足一个等式条件,那就是相当于今天所说的3阶系数矩阵行列式(即矩阵是奇异矩阵),从中我们就可以看到,3阶行列式概念的最早提出其实是出于描述方程组的3阶系数矩阵性质的需要,而系数矩阵的性质直接决定了线性方程组解的性质。

在1721年,数学家麦克劳林用行列式的方法求解了含有2个、3个和4个未知量的线性方程组,得到了这些线性方程组的克拉默法则。后来在1750年,数学家克拉默在求解具有5个未知量的线性方程组时,得到了该线性方程组的克拉默法则。一般的克拉默法则是由数学家贝祖在1764年证明的:

如果含有个未知量个方程的线性方程组 满足 ,则它有唯一解

其中的 是将列向量 代替 中的第 列而得到的阶行列式。尽管这个公式在线性方程组的实际求解过程中并不实用,但是它在理论上不仅给出了具有任意个未知量的线性方程组的解,而且在形式上十分整齐,相当于是彻底解决了这类线性方程组的求解问题,所以是一个极其完美的定理。贝祖还从克拉默法则推导出:如果齐次线性方程组 有非零解,那么系数矩阵行列式

阶行列式 在本质上是一个具有个自变量的多元函数(或者也可以看成以个行(列)向量作为“自变量”的元线性函数),它是从属于阶矩阵 的,反映了矩阵 本 身的基本性质。n阶行列式 其实是一个每一项的次数都相同的齐次多项式(有项),这个多元函数具有很好的性质,并由此成为了刻画矩阵性质的有力工具。

阶行列式的计算中,用得最多的是以下两个基本性质:

  • (1)将行列式中一行(列)的某个倍数加到另一行(列),行列式的值不变;
  • (2)行列式的值等于它的任意一行(列)的所有元素与它们的对应代数余子式的乘积的和。

而在运用行列式时,反复使用的基本公式是矩阵乘积的行列式公式:

如果阶矩阵,则

以及用伴随矩阵表示逆矩阵的公式(一般的克拉默法则就是通过运用这个公式而得到证明的)。

阶行列式按照它的任意一行(或列)来展开的公式后来被数学家拉普拉斯推广成了按照任意行展开的公式,即用行中所含的子式和它们的代数余子式的乘积来展开(有项)。

二、矩阵论的基本思想

矩阵的概念也是起源于对线性方程组和线性替换(或线性变换)问题的研究,只是它在历史上出现得比较晚。1858年,数学家凯莱正式引入了矩阵的定义,特别是他定义了十分重要的矩阵乘法,这个乘法综合了线性方程组、线性变换、二次型和行列式等理论中的共同性质,例如连续做两次线性替换就相当于进行一次系数矩阵的乘法。如果没有矩阵的乘法,那么对矩阵就如同对向量一样,只能作加法和数乘了。虽然矩阵的乘法有结合律,但是它却没有交换律,这是我们继向量的外积之后,又一次遇到的没有交换律的乘法。然而这种矩阵乘法又是十分有用的,从某种程度上可以说,正是因为矩阵的乘法没有了交换律,矩阵论才变得比较有意思和多姿多彩了。

凯莱在研究线性方程组的求解问题时,还提出了逆矩阵的重要概念。有了逆矩阵,个未知量个方程的线性方程组 (如果 可逆)的解就是 ,这与一元一次方程 的解 是完全类似的。这样,逆矩阵的运算就相当于是矩阵中的“除法”。如果一个线性方程组的系数矩阵是一个可逆矩阵,那么求逆矩阵的过程基本上就是解这个方程组的过程,因此计算逆矩阵的方法本质上也是高斯消元法。

人们逐渐发现,与线性方程组、二次型和行列式等经典理论相比,矩阵论后来居上成为了初等线性代数理论中的核心理论,它将线性方程组、二次型和行列式等理论贯穿了起来,并且影响了整个代数学的后续发展。

最初步的矩阵论包括了矩阵的加法、数乘、矩阵的乘法、求逆矩阵的运算、矩阵的转置、分块矩阵与初等矩阵等内容。初等矩阵和初等变换的概念来源于解线性方程组的高斯消元法,而高斯消元法是解线性方程组最经典的方法。在整个线性代数(高等代数)课程中,从高斯消元法中提炼出来的行初等变换方法是一个反复使用的基本方法,例如在后面计算逆矩阵、矩阵的秩、向量组的极大无关组和若尔当标准形时,以及在证明矩阵乘积的行列式公式时,都会用到行初等变换和初等矩阵的基本方法。

矩阵的分块也是一种常用的矩阵证明方法,它的基础就是矩阵乘法的定义。当一个矩阵中有许多零元素时,使用分块矩阵是特别方便的。在我们将一个矩阵实施分块后,就能够把小块矩阵当成普通的数那样,运用矩阵的乘法来进行计算。

三、线性方程组理论背后的几何思想

线性方程组理论的核心思想是解空间的概念,这是因为:一个线性方程组所有解的集合与该方程组的导出组的解空间有密切联系。解空间这个概念的背景是高维几何空间,而高维空间的思想则来源于人们对于几何学的长期研究与探索。在17世纪的数学家创立了解析几何之后,线性方程组的重要性更加突出,关于空间中平面和直线的位置关系的所有问题都可以归结为对线性方程组的研究。反过来,对于线性方程组理论的深入研究会很自然地突破3维空间的限制,而进入到高维的几何空间中。

例如对于一个具有两个方程的4元齐次线性方程组,它的解可以看成4维空间中两个超平面的“交线”,这是因为其中的每一个方程都代表了一个过原点的3维的超平面,这里的两个超平面的“交线”其实是4维空间中的一个2维的“平面”。虽然4维(以及4维以上的)空间不能直观想象,但却可以通过代数计算来准确地描述和把握这些高维空间中流形的几何性质。例如可以像在3维空间中一样定义两个4维向量的内积,并且内积为零同样代表了4维向量的“垂直”关系。

在20世纪以前,绝大多数的数学家都把几何空间的研究范围局限在3维之内。然而,数学家凯莱在1843年就已经有维空间的思想,他把通常的平面解析几何与空间解析几何形式地向n维进行推广。例如用元有序实数组 表示维空间中的一个点,并且写出了两点之间的距离公式、维空间中的(维)超平面方程和超球面方程。然后在19世纪的中叶,数学家格拉斯曼建立起了维向量空间的初步理论。

高维向量空间的语言,对习惯于3维空间的初学者来说是比较陌生的。在物理学中,为了建立起爱因斯坦的相对论,就需要引入4维空间,其中除了表示空间位置的3维坐标外,多加的1维表示时间。物理学家们用了很长的时间,才慢慢接受了4维空间的概念。而在我们这门课中,几何对象所在空间的维数直接就从3维一下子跳跃到了任意维(例如考虑100维、或者10000维的向量空间),这对初学者来说是一个很大的挑战。因此我们应该充分地运用类比的方法,先在比较低维数的空间(例如4维或5维)场合中来充分地熟悉n维向量空间这种十分抽象的概念和语言。

为了要描写高维向量空间是数域)中的几何关系,我们需要线性组合、线性相关、线性表示(或线性表出)、线性无关、两个向量组等价等一系列最基本的概念。线性相关的概念是3维向量组的共线与共面概念在高维空间的直接推广,而线性无关则是3维向量组不共线或不共面在高维空间的直接推广。我们要熟练地掌握用解线性方程组的方法来判别n维向量组 线性相关(或线性无关)的基本方法:

,则 线性相关的充要条件是线性方程组 有非零解。反之, 线性无关的充要条件是线性方程组只有零解。

用行列式判定维向量的线性无关的方法是:由这个向量依次组成的方阵的行列式不等于零,如果这个方阵的行列式等于零,那么这个向量线性相关。

线性相关的基本性质有:

  • (1)含有两个成比例的向量的向量组必线性相关;
  • (2)若向量组中有部分向量线性相关,则这组向量也线性相关;
  • (3)一个向量组线性相关的充要条件是其中有一个向量可以由其余线性表示。

线性无关的基本性质是:

  • (1)如果线性无关,线性相关,则 可由线性表示,并且表示方法唯一;
  • (2)如果 可以由 线性表示,并且 线性无关,则
  • (3)两个等价的线性无关的向量组必含有相同个数的向量。

矩阵的秩是线性方程组和矩阵理论中的一个关键概念。为了理解这个概念,首先要充分理解向量组的极大无关组概念。如果向量组的一个部分组线性无关,并且向量组中的每一个向量都可以由这个部分组线性表示,那么这个部分组就称为极大无关组。我们要熟练地运用行初等变换的方法来计算向量组的极大无关组。一个维向量组的极大无关组所含向量的个数称为该向量组的秩。

利用矩阵求向量组的极大无关组的方法是:将给定的向量作为列向量组成矩阵 ,对 进行行初等变换,化为简化阶梯阵 ,则 的列向量组的极大无关组所对应的 的列向量组即为所求极大无关组,而 的其余列向量的分量即为该向量对应的 的列向量由极大无关组线性表示的表示系数。

接下来我们就可以用矩阵的行(列)向量组的秩来定义矩阵的秩。一个矩阵的行向量组的秩称为行秩,它的列向量组的秩称为列秩,在证明矩阵的行秩与列秩相等时,要用到简化阶梯阵的方法。一个矩阵的秩就是它的行秩,我们可以运用行初等变换的方法来计算一个矩阵的秩。矩阵的秩除了可以用向量组的秩来定义,它也可以用行列式来进行刻画,具体来说,可以用该矩阵的一些子行列式是否为零来确定它的秩。

有了矩阵秩的精练语言,我们就可以讲清楚线性方程组解集的几何结构,特别是齐次线性方程组解空间的性质:

  • (1)齐次线性方程组解空间的结构果齐次线性方程组 的系数矩阵 的秩为 ,当 小于未知量的个数 时,该方程组有非零解,此时该方程组的基础解系含有 个向量。基础解系中这 个向量不仅是线性无关的,并且线性方程组 的解空间里的所有解都可以由这 个向量线性表示。

  • (2)非齐次线性方程组解集的结构
    ① 线性方程组 有解的充要条件是 与增广矩阵有相同的秩;
    ② 如果 有解,并且 的秩为 ,则当 等于未知量的个数 时,该方程组有唯一解,而当 时,方程组有无穷多解,此时该方程组的所有解都可以由它的一个特解和它的导出组 的基础解系来线性表示。

如果再将矩阵秩的概念与分块矩阵的方法结合起来,我们还能够进一步给出矩阵的等价(或相抵)标准形和关于分块矩阵秩的一系列定理。

四、二次型理论与矩阵对角化的基本思想

在17世纪解析几何诞生后,人们自然地就运用坐标系化简的方法来化简一般的平面二次曲线方程,数学家们发现非退化的二次曲线其实只有椭圆、双曲线和抛物线这三种曲线,并且只有二次曲线方程中的3个二次项才真正决定了一条二次曲线是何种曲线。在一个二次曲线方程中,这3个二次项合在一起的式子就是该二次曲线的二次型,于是化简二次曲线方程的问题其实就归结为如何来化简它的二次型。

接下来在18世纪中叶,数学家欧拉在研究化简二次曲面方程时,也是用空间直角坐标系平移与旋转的方法,将二次曲面的方程化简成了最简单的形式,从而知道了非退化的二次曲面其实只有椭球面、单叶双曲面、双叶双曲面、椭圆抛物面和双曲抛物面这五种曲面。欧拉发现,可以通过求解一个3次方程,得到它的3个根,而这3个根正好就是二次曲面方程化简后的新方程相关二次型的3个系数。现在我们知道,欧拉解的这个3次方程其实就是二次曲面方程中的相关二次型矩阵的特征方程,而他得到的3个根就是该特征方程的3个特征值,因此我们可以说在欧拉的这项基本工作中,已经出现了3个变量二次型的主轴定理的萌芽。

在18世纪的后期,数学家拉格朗日在研究分析力学中刚体旋转运动方程的化简问题时,明确写出了3个变量二次型

的矩阵的3次特征方程,从中解出了特征值,然后求出了它们所对应的特征向量。用今天的矩阵语言来说,拉格朗日用这些特征向量构造了一个3阶正交矩阵 ,再通过作正交线性替换

把上述二次型化成了标准形 ,这个标准形的特点是只有平方项,并且它们的系数正好是三个特征值。这就是3个变量二次型的主轴定理,其几何意义是:通过旋转3维空间的直角坐标轴(即作正交线性替换),使新的直角坐标轴与相关二次曲面的3条主轴(即对称轴)相重合,也就是将3条主轴作为了新的直角坐标轴(3条主轴的方向正好是三个特征向量的方向),从而就可以消去原二次曲面方程的二次型中所有的非平方项,使得化简后的新方程具有最简单的形式,这样就知道了原来复杂的二次曲面方程所表示的曲面到底是何种曲面。

到了19世纪的初期,数学家柯西引入了一般的个变量的二次型,并得到了个变量的主轴定理。下面我们用现在的矩阵语言来解释柯西的工作,首先他引入了个变量二次型

其中的 是对称矩阵, ,然后他写下了一个重要的线性方程组 ,再将右端移项后得到特征方程组 ,接下来为了解这个特征方程组,必须要先使它的系数矩阵的行列式等于零,也就是要先求解一个次的特征方程 ,从中得到了对称矩阵 的n个实特征值 ,并且将它们代入特征方程组后求得对应的个特征向量,然后再用这些特征向量来作正交线性替换,就将二次型化成了仅含平方项的标准形形式。因此我们可以说,柯西实际上得到了一般的主轴定理。

从上面介绍的欧拉、拉格朗日和柯西工作中,我们可以看到特征值与特征向量对于矩阵对角化所起的关键作用。完全可以这样说:他们这项非常重要的化简二次型的工作,开启了具有广泛应用价值的特征值方法的先河,这是因为在20世纪中,有相当多的基础数学与应用数学中的重要问题都是通过运用线性变换和特征值方法而得到解决的。

对于一个任意阶矩阵 来说,如果存在数 和非零向量 满足 ,则称 的一个特征值, 的属于 的一个特征向量。计算矩阵的特征值与特征向量的基本方法是:

  • (1)求出特征方程 的全部根,这些根就是 的全部特征值;
  • (2)对每个特征值 ,求出对应的齐次线性方程组 的基础解系,它们就是 的属于特征值 的线性无关的特征向量。

矩阵的对角化就是试图将所有的方阵都尽量与一个对角矩阵联系起来。对于阶矩阵 来说,如果存在可逆矩阵 ,使得

那么我们就称可对角化。上式右边对角矩阵的对角线元素都是 的特征值,并且可逆矩阵 的所有个列向量都是 的特征向量。

为了求出化简二次型所需要的正交线性替换,我们还需要运用施密特正交化方法。施密特正交化方法是用来构造正交矩阵的主要方法,它从一组线性无关的向量出发,逐步得到一组正交向量组。

对于一个实二次型 中的对称矩阵 ,在已经求得了其个特征向量的基础上,用施密特正交化方法可以得到个两两正交的特征向量,接着再对它们进行标准化(即单位化),就得到个两两正交的单位特征向量 ,然后以这个特征向量作为列向量,构造出一个阶正交矩阵 。我们从特征向量的定义可以知道  ,于是有

这样就得到了矩阵对角化等式

现在对二次型作正交线性替换 ,其中的,则由上式可得

这样我们就证明了维欧氏空间中的主轴定理:

任何一个实二次型都可以通过作正交线性替换,使所得到的新二次型是仅含平方项的标准形,并且其中每个平方项的系数都是该二次型矩阵的特征值。

并不是所有的方阵都是可以对角化的。关于矩阵可对角化的条件,我们有以下常用的结论:

  • (1)如果阶矩阵个不同的特征值,则 可以对角化;
  • (2)n阶矩阵 可对角化的充要条件是个线性无关的特征向量;
  • (3)n阶矩阵 可对角化的充要条件是:对每个 重特征值 来说,

一般的阶矩阵 的特征多项式是 ,当我们把行列式 展开后,就得到一个关于次的多项式。由此可知,个特征值的乘积等于个特征值的和等于 的迹。此外还有著名的凯莱-哈密尔顿定理,即成立矩阵等式

由矩阵可对角化的概念,还可以引入两个矩阵 相似的定义:如果存在可逆矩阵 ,使得

那么 相似。两个相似的矩阵具有完全相同的特征多项式,从而有完全相同的特征值。

另一方面,对于一般的元二次型来说,除了作正交线性替换的方法,我们也可以用非退化线性替换的方法来化简元二次型。非退化线性替换(即配方法)是化简元二次型的经典方法,其中又可以将化简所得的标准形进一步分别化为复二次型的典范形、实二次型的典范形。具体来说,任何一个复二次型总可以经过一个非退化线性替换后,化为唯一的典范形:

其中的是这个复二次型的矩阵的秩。任何一个实二次型总可以经过一个非退化线性替换后,化为唯一的典范形:

其中的 是这个实二次型的矩阵的秩。实二次型还满足著名的惯性定理:在任何一个实二次型的典范形中,正平方项的个数(即正惯性指数) 和负平方项的个数 是由该二次型唯一确定的非退化线性替换下的不变量。

关于元实正定二次型 (其中的矩阵 是正定矩阵),我们有以下基本的判定充要条件:

  • (1)正惯性指数等于
  • (2)典范形是
  • (3) 的各阶顺序主子式都大于零;
  • (4) 的特征值都是正数;
  • (5) 与单位矩阵合同。

在这里,两个矩阵 合同的定义是:如果存在可逆矩阵 ,使得

则称 合同。用非退化线性替换化简元二次型的方法,其实就是证明了:任何一个阶对称矩阵都与一个对角矩阵合同。

由于二次型的内容用到了很多之前学习过的有关线性方程组、行列式和矩阵论的知识点,所以通过学习和掌握二次型的基本理论,可以很好地提升我们对于矩阵论(或初等线性代数)综合运用的水平。

五、线性空间理论的基本思想

线性空间是一个比高维向量空间还要抽象的几何空间,在其中也定义了加法和数乘这两种运算,这两种运算要满足线性空间定义中的8条公理,并且将其中的元素还是称为向量。我们应该通过各种线性空间的例子,来熟悉线性空间这个比较抽象的基本概念。

线性空间的一个基本例子是由满足某些条件(例如在某个区域上连续)的全体函数所组成的函数空间,此时每一个函数都可以看成是一个“向量”。之所以要考虑这样的函数空间,是因为我们经常需要把复杂的函数用简单的函数表示出来,也就是把复杂函数写成简单函数的“线性组合”,例如函数的泰勒展开、幂级数展开和傅里叶级数展开都是出于这样的思路。

在数学分析(高等微积分)的理论中,有相当广泛的一类函数都可以写成简单的周期函数1,,的无穷“线性组合”:

这与在向量空间中,所有的向量都可以写成个正交基向量的线性组合是完全类似的。此时,无穷多个周期函数1,,就可以看成由这类函数所组成的线性空间的“基向量”(因此这个线性空间是无限维的)。不仅如此,我们还能够在这个函数空间中定义一种适当的“内积”,从而就可以确定其中的任意两个函数是否“正交”(即“垂直”),并且会发现这里的周期函数组1,,竟然也是两两“正交”的!这样,我们就从一个新的几何空间的角度重新认识和理解了函数的傅里叶级数展开式。在从高等微积分与线性代数发展出来的泛函分析理论中,会详细地介绍这种函数空间。

在线性空间和线性变换的理论中,实际上大幅度地提升和发展了矩阵论的基本思想。在线性空间中,可以像在向量空间那样建立起关于线性相关和线性无关的系统理论,由此就可以从几何的角度来刻画和解释线性空间的几何构造,例如将线性空间分解为不变子空间的直和。又如对相似矩阵,可以证明同一个线性变换在不同基下的矩阵一定是相似的,这样,两个相似矩阵就能够看作同一线性变换在不同基下的矩阵,这就使我们更深地理解了相似矩阵的含义,并且还能够进一步弄清楚矩阵对角化的一般结果——若尔当标准形的内在几何背景。

我们可以以前面已经学习过的维向量空间的线性相关理论作为参照,来平行地展开线性空间 中的线性相关理论,特别是关于基和维数等一系列最基本的内容。

在同一个线性空间 中,两个指定基之间有一个过渡矩阵,此时 中每一个向量在这两个基下就有两个坐标。借助于这两个基之间的过渡矩阵,可以获得两个坐标之间的转换关系。

子空间的概念可以帮助我们更深入地弄清楚一个线性空间的具体结构。下面的经典公式给出了两个子空间的交与和的维数所应满足的等式关系:

子空间的直和是一种特殊的子空间和。有了直和的概念,就可以根据需要把一个有限维线性空间分解成它的一系列子空间的直和,从而为彻底弄清楚线性空间的内部结构创造了条件。我们应该掌握子空间直和的几个判别条件,并且会证明这几个判别条件是如何等价的。

六、线性变换理论的基本思想

在历史上,一般二次型化简问题的解决逐渐引发了后续关于矩阵对角化问题的一系列研究。在20世纪初,人们在研究积分方程的求解问题及相关的泛函分析问题时,逐渐产生了线性变换的特征值的概念,这个概念是矩阵特征值的深刻推广。例如在积分方程的研究中,需要计算函数空间中线性变换

的特征值,其所对应的特征向量给出了相关积分方程的最重要的解,这些解类似于线性方程组的基础解系,可以用来表示积分方程的所有解。此时出于研究函数空间的需要,数学家们以高维欧氏空间 以及其上的线性变换为蓝本,提出了一般的线性变换的系统理论,并且把欧氏空间 中很基本的主轴定理推广到了一般的有限维欧氏空间和无限维的希尔伯特空间。

数域上线性空间 中的变换 如果满足条件:对任何 ,有

那么就称 是线性空间 中的线性变换。

如果在线性空间 中取定了一个基,那么线性空间 上的每个线性变换都对应了一个矩阵,称为该线性变换的矩阵。这样,不同线性变换之间的加法、乘法和数乘的运算就分别对应了矩阵的加法、乘法和数乘的运算。这样就确定了线性变换与矩阵之间自然的对应关系,从而为运用矩阵论的各项结论做好了准备。

接下来我们给出线性变换的核与像的概念。线性空间 上的线性变换 的核是

线性空间 上的线性变换 的像(或值域)是

可以通过线性空间  的一个基来表示 的像,并且 的核的维数与 的像的维数之和等于线性空间 的维数。

为了使线性变换的矩阵更加简单,我们还需要不变子空间的概念。如果 是线性空间 上的线性变换, 的子空间,并且对任何 ,都有 ,那么就称 的不变子空间。线性变换的不变子空间是准对角矩阵的几何表现。

线性变换的特征值与对角化问题是线性变换理论主要研究对象。如果 是线性空间 上的线性变换,若存在数 和非零向量 满足 ,则称 是 的一个特征值, 是 的属于 的一个特征向量。线性变换的特征值与特征向量的求法是:利用线性变换 的矩阵 ,先求出 的特征值与特征向量,然后以这些特征向量作为坐标,就可以写出该线性变换的特征向量。

如果 是线性空间 上的线性变换,并且存在 的一个基,使得 在这个基下的矩阵是对角矩阵,那么就称 是可对角化的线性变换。关于线性变换 的可对角化的条件,有以下常用的结论:

  • (1)如果个不同的特征值,则 可以对角化;
  • (2) 可对角化的充要条件是个线性无关的特征向量;
  • (3) 可对角化的充要条件是:对每个 重特征值 来说,它的几何重数(即 的特征子空间 的维数)也等于

这里的第(3)个条件实际上给出了矩阵对角化的几何意义,即线性变换是否可对角化完全取决于其所有特征子空间的直和是否等于全空间

当一个 上的线性变换 不可对角化时,针对 的每个特征值 ,都可以构造一个 的根子空间 ,它的维数恰好等于特征值 的代数重数。由于不同特征值的根子空间的和一定也是直和,所以线性空间 就可以分解成线性变换 的所有不同特征值的根子空间的直和。此时在各个根子空间上,如果我们将 写成线性变换 是恒等变换)的和,那么 限制在根子空间 上就是一个幂零变换,从而就导致了各个根子空间 还可以分解成循环子空间的直和,因此线性空间 进一步分解成了循环子空间的直和。于是,线性变换 在所形成的这个 的循环基下的矩阵就是一个若尔当标准形了。若尔当标准形是一类与对角矩阵最为接近的简单矩阵,当一个若尔当标准形中的所有若尔当块都是1阶矩阵时,若尔当标准形就是对角矩阵。这样,我们通过运用线性空间与线性变换的基本理论,彻底解决了矩阵对角化这一重要的经典问题。

七、欧氏空间理论的基本思想

作为对高维欧氏空间 的推广,一般的欧氏空间是一种被赋予了度量的线性空间。欧氏空间 中的度量是通过内积来实现的,由此就可以在 中引入长度和角度等涉及度量的概念。欧氏空间在现代数学与物理学中都有很重要的应用,例如希尔伯特空间就是一种无限维的欧氏空间,它已经被应用于微分方程、调和分析、数学物理和量子力学等学科中。

因为在欧氏空间中定义了向量的长度和两个向量之间的夹角,于是就有了正交向量组的概念。和在欧氏空间中一样,我们也可以用施密特正交化方法来求出有限维欧氏空间 的标准正交基。从标准正交基到标准正交基的过渡矩阵是正交矩阵。

接下来是讲 的正交补子空间的概念,可以用正交补的概念来确定欧氏空间 中任意一个向量在 的一个子空间上的正交投影。

正交变换是初等平面几何中旋转与轴反射运动的推广,它是用内积来定义的:如果 是欧氏空间 上的线性变换,并且对任何 ,有 ,那么就称 是线性空间 上的正交变换。正交变换有以下等价的判别充要条件:

  • (1) 保持向量的长度不变;
  • (2) 的任一标准正交基都变成标准正交基;
  • (3) 的任一标准正交基下的矩阵都是正交矩阵。

如果是欧氏空间上的线性变换,并且 的某个标准正交基下的矩阵是对称矩阵,就称 是欧氏空间 上的对称变换。和对称矩阵相类似,对称变换是欧氏空间上一种具有良好性质的线性变换。

是欧氏空间 上的对称变换的等价表述是:

  • (1)对任何 ,有
  • (2) 的任意一个标准正交基下的矩阵都是对称矩阵。

我们可以将欧氏空间中的主轴定理推广到一般的有限维欧氏空间:

如果维欧氏空间 上的对称变换,则存在 的一个标准正交基,使得在这个基下的矩阵是对角矩阵。

酉空间是一种常用的复内积空间,它是欧氏空间对于复数世界的自然推广。在酉空间中,酉矩阵是正交矩阵的推广,埃尔米特矩阵是对称矩阵的推广。不仅如此,我们还可以将上述正交变换推广为酉变换,将对称变换推广为埃尔米特变换,并且将有限维欧氏空间中的主轴定理进一步推广到有限维酉空间中:如果 维酉空间 上的埃尔米特变换,则存在 的一个标准正交基,使得 在这个基下的矩阵是对角矩阵。

阅 读 书 目

1.《高等代数》(第四版),北京大学数学系前代数小组,高等教育出版社,2013年。

图1:《高等代数》(第四版)

2,《线性代数与矩阵论》(第二版),许以超,高等教育出版社,2008年。

图2:《线性代数与矩阵论》(第二版)

3.《线性代数与几何(上、下)》(第2版),俞正光、鲁自群、林润亮,清华大学出版社,2014年、2015年。

图3:《线性代数与几何(下)》(第2版)

4,《高等代数与解析几何》(第二版),同济大学出版社,2016年。

图4:《高等代数与解析几何》(第二版)

5.《高等代数》(第二版),黄廷祝、何军华、李永彬,高等教育出版社,2016年。

图5:《高等代数》(第二版)

6.《高等代数》,安军、蒋娅,北京大学出版社,2016年。

图6:《高等代数》

7.《高等代数学》(第二版),姚慕生、吴泉水,复旦大学出版社,2008年。

图7:《高等代数学》(第二版)

8.《高等代数简明教程(上、下)》(第二版),蓝以中,北京大学出版社,2007年。

图8:《高等代数简明教程(上)》(第二版)

9.《Linear Algebra线性代数(英文)》(第4版),Friedberg、Insel、Spence,高等教育出版社,2005年。

图9:《LinearAlgebra线性代数(英文)》(第4版)

10.《高等代数与解析几何(上、下)》,陈跃、裴玉峰,科学出版社,2019年。

图10:《高等代数与解析几何(上)》


文稿|陈跃

编辑|朱善军

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多