若尔当标准形
正是良好的几何直觉使我们大多数人推测,对于线性变换而言,可逆与在某种意义上为零是完全相反的概念。当我们发现值域和零空间不一定不相交时,我们的失望与这一推测有关。通过放宽我们对“为零”的理解,这种情况可以得到理顺;在大多数实际应用中,某个幂为零的线性变换(即幂零变换)已经尽可能地接近于零了。虽然我们不能说一个线性变换要么是可逆的,要么是“零”(即使在推广的零的意义上),但我们可以说明任何变换是如何由这两种极端类型组成的。
定理 1. 有限维向量空间 上的每个线性变换 都是一个幂零变换和一个可逆变换的直和。
证明. 我们考虑 的 次幂的零空间;这是一个子空间 。显然有 。我们首先断言,如果一旦有 ,那么对于所有正整数 ,都有 。事实上,如果 ,那么 ,由此(根据 这一事实)可以推出 ,从而有 。换句话说, 包含在(因而等于) 中;对 进行归纳即可确立我们的断言。
由于 是有限维的,子空间 不能无限地继续增加;设 是使 成立的最小正整数。显然, 在 下是不变的(事实上每个 都是如此)。我们用 表示 的值域(因此,同样显然的是, 在 下是不变的);我们将证明 ,并且 在 上是幂零的,而在 上是可逆的。如果 是 和 的公共向量,那么对于某个 ,有 且 。由此可得 ,从而根据 的定义,有 。我们由此证明了 的值域和零空间是不相交的;维数论证(参见 章节:秩与零度 ,定理 1)表明它们张成 ,因此 是它们的直和。由 和 的定义可知, 在 上是指数为 的幂零变换。最后,如果 在 中(即对于某个 ,有 ),且如果 ,那么 ,从而有 ;这表明 在 上是可逆的。定理 1 的证明至此完成。 ◻
分解为幂零部分和可逆部分是唯一的。事实上,假设 ,使得 在 上是幂零的,而 在 上是可逆的。由于对于某个 ,有 ,因此可以推出 ,并且由于对于所有 ,有 ,因此可以推出 ;这些事实共同意味着 且 。
我们现在可以利用关于幂零变换的结果来研究任意变换的结构。从任意变换中提取出幂零变换的方法可能看起来像是一个魔术,但这是一个很有用的技巧,经常被使用。至关重要的一点是保证特征值的存在;因此,我们继续假设标量域是代数封闭的(参见 章节:重数 )。
定理 2. 如果 是有限维向量空间 上的线性变换,且如果 是 的互不相同的特征值,其代数重数分别为 ,那么 是 个子空间 的直和,这些子空间的维数分别为 ,使得每个 在 下是不变的,并且 在 上是幂零的。
证明. 任取固定的 ,并考虑线性变换 。对 我们可以应用定理 1 的分解来得到子空间 和 ,使得 在 上是幂零的,在 上是可逆的。由于 在 下是不变的,它在 下也是不变的。因此,对于每个 , 的行列式是当我们分别在 和 上考虑 时,这两个线性变换所对应的两个行列式的乘积。由于 在 上的唯一特征值是 ,且由于 在 上没有特征值 (即 在 上是可逆的),因此可以推出 的维数恰好是 ,并且每个子空间 都与其余所有子空间的张成空间不相交。维数论证证明了 ,从而完成了定理的证明。 ◻
我们接下来用矩阵语言来描述本节和前一节的主要结果。如果 是有限维向量空间 上的线性变换,那么相对于 的某个合适基, 的矩阵具有以下形式。不在主对角线上或紧下方的主对角线元素全部为零。在主对角线上出现的是 的互不相同的特征值,每个特征值出现的次数等于其代数重数。在任何特定特征值的下方只出现 和 ,且以如下方式出现:存在由若干个 组成的链,其后紧跟一个单独的 ,并且从上往下看,这些链的长度递减。这个矩阵是 的若尔当标准形或经典标准形;我们有 当且仅当 和 的经典标准形除了特征值的顺序之外完全相同。(因此,特别地,线性变换 是可对角化的,当且仅当它的经典标准形已经是对角矩阵,也就是说,如果每个由 组成的链的长度都为零。)
让我们引入一些符号。设 有 个互不相同的特征值 ,其代数重数如前所述分别为 ;设在 下由 组成的链的个数为 ,并设这些链的长度分别为 。由 定义的多项式 被称为属于特征值 的重数为 的 的初等因子。如果初等因子的重数为 (从而相应的链长度为 ),则称其为简单的;我们看到,线性变换是可对角化的当且仅当它的初等因子是简单的。
为了说明定理 2 的威力,我们做一个应用。我们可以通过说 上的变换 被多项式 零化,来表达 上的变换 是指数为 的幂零变换这一事实。由此可以推出, 上的 被这些多项式的乘积(即最高重数的初等因子的乘积)零化;这个乘积被称为 的极小多项式。
很容易看出(因为 在 上的幂零指数恰好是 ),该多项式作为零化 的次数最低的多项式是唯一确定的(在相差一个常数因子的意义下)。由于 的特征多项式是所有初等因子的乘积,因而也是极小多项式的倍数,我们得到了哈密顿-凯莱方程:每个线性变换都由其特征多项式零化。
习题
练习 1. 求 的若尔当标准形。
练习 2. 在三维向量空间上,两两不相似且每个都以 为特征多项式的线性变换的最大数量是多少?
练习 3. 每个可逆线性变换都有平方根吗?(当然,说 是 的平方根意味着 。)
练习 4.
- 证明如果 是 的立方根( ),那么矩阵 是相似的。
- 发现并证明 (a) 向更高维度的推广。
练习 5.
- 证明矩阵 是相似的。
- 发现并证明 (a) 向更高维度的推广。
练习 6.
- 证明矩阵 是相似的(例如,在复数域上)。
- 发现并证明 (a) 向更高维度的推广。
练习 7. 如果两个实矩阵在 上相似,那么它们在 上相似。
练习 8. 证明每个矩阵都与其转置矩阵相似。
练习 9. 如果 和 是 乘 矩阵,使得 乘 矩阵 相似,那么 和 相似。
练习 10. 下列哪些矩阵是可对角化的(在复数域上)?
2
- ,
- ,
- ,
- ,
- .
在实数域上又如何呢?
练习 11. 证明矩阵 在复数域上是可对角化的,但在实数域上不是。
练习 12. 设 是整数集合 的一个置换;如果 是 中的一个向量,记 。证明 是可对角化的,并求一个基,使得 关于该基的矩阵是对角矩阵。
练习 13。假设 是一个线性变换,且 是 下的一个不变子空间。证明如果 可对角化,那么 在 上的限制也是可对角化的。
练习 14。复数 满足什么条件时,矩阵 (在复数域上)是可对角化的?
练习 15。以下断言是真还是假?
- 行列式为负的实二阶矩阵相似于对角矩阵。
- 如果 是复向量空间上的线性变换,且对于某个正整数 有 ,那么 是可对角化的。
- 如果 是有限维向量空间上的幂零线性变换,那么 是可对角化的。
练习 16。如果 是代数闭域上有限维向量空间上的线性变换,且 的每个特征值的代数重数均为 ,那么 是可对角化的。
练习 17。如果 维向量空间上的线性变换 的极小多项式的次数为 ,那么 是可对角化的。
练习 18。求所有投影和所有对合的极小多项式。
练习 19。矩阵 的极小多项式是什么?
练习 20。
- 上的微分算子的极小多项式是什么?
- 由 定义的 上的变换 的极小多项式是什么?
练习 21。如果 是一个极小多项式为 的线性变换,且 是一个满足 的多项式,那么 能被 整除。
练习 22。
- 如果 和 是线性变换,如果 是一个满足 的多项式,且 ,那么 。
- 从 (a) 中可以推导出关于 和 的极小多项式之间的什么关系?
练习 23。一个线性变换是可逆的当且仅当其极小多项式的常数项不为零。