矩阵

现在让我们理清头绪;在引入了线性变换这一新概念之后,我们现在必须弄清楚它与基、线性泛函等旧概念有什么关系。

在研究有限维向量空间上的线性变换时,最重要的工具之一就是矩阵的概念。由于这一概念在无限维空间中通常没有合适的对应物,而且在大多数讨论中都可以不使用它,因此我们在证明定理时将尽量不使用它。然而,了解什么是矩阵是很重要的;我们现在进入详细的讨论。

定义 1. 𝒱 是一个 n 维向量空间,设 𝒳 = { x 1 , , x n } 𝒱 的任意一个基,并设 A 𝒱 上的一个线性变换。由于每个向量都是 x i 的线性组合,特别地,对于 j = 1 , , n ,我们有 A x j = i α i j x i 。由双下标 i , j 索引的 n 2 个标量的集合 ( α i j ) A 在坐标系 𝒳 下的矩阵;我们通常将其记为 [ A ] ,或者,如果需要指出所考虑的特定基 𝒳 ,则记为 [ A ; 𝒳 ] 。矩阵 ( α i j ) 通常写成方阵的形式: [ A ] = [ α 11 α 12 α 1 n α 21 α 22 α 2 n α n 1 α n 2 α n n ] ; 标量 ( α i 1 , , α i n ) 构成 [ A ] 的一,而 ( α 1 j , , α n j ) 构成其一

这个定义并没有定义“矩阵”本身;它定义的是“在某些条件下与线性变换相关联的矩阵”。将矩阵视为独立存在的标量方阵通常是有用的;然而,在本书中,矩阵通常会与线性变换和基绑定在一起。

我们对记号做一些说明。习惯上,矩阵和变换使用相同的符号,例如 A 。这样做的合理性可以在下面(关于矩阵性质)的讨论中找到。我们在这里不遵循这一习惯,因为我们关于矩阵的主要目的之一是强调它们依赖于坐标系(而线性变换的概念则不依赖),并研究当我们从一个坐标系过渡到另一个坐标系时,矩阵与线性变换之间的关系是如何变化的。

我们还想请大家注意矩阵 [ A ] 中元素 α i j 索引的一个独特性。基就是基,到目前为止,尽管我们通常用前 n 个正整数来索引它的元素,但其中元素的顺序是完全无关紧要的。然而,在谈到矩阵时,习惯上会提到诸如第一行或第一列。只有当我们认为基 𝒳 的元素是按特定顺序排列时,这种说法才是合理的。由于在我们的绝大多数讨论中,矩阵的行和列的顺序与基元素的顺序一样无关紧要,因此我们在定义中没有包含矩阵的这一方面。然而,重要的是要认识到,与 [ A ] 相关联的方阵的外观会随着 𝒳 的排序而改变。

因此,我们关于矩阵所要说的一切,都可以从两个不同的观点来解释;要么严格按照我们定义的字面意思,要么遵循一个修改后的定义,该定义使一个矩阵(具有有序的行和列)不仅对应于一个线性变换和一个基,而且还对应于该基的一个排序。

对知情者再多说一句。这不是作者的任性,而是大自然的怪癖,使得我们写成

A x j = i α i j x i  

而不是更常用的方程

A x i = j α i j x j .  

其原因在于,我们希望矩阵乘法以及矩阵应用于数值向量(即 n 中的向量 ( ξ 1 , , ξ n ) )的公式看起来是正常的,而在从向量过渡到其坐标的过程中,某些地方的指标发生了颠倒。明确地阐述我们的规则:将 A x j 写为 x 1 , , x n 的线性组合,并将由此得到的系数写为矩阵 [ A ] 的第 j 。( α i j 上的第一个指标总是行指标;第二个指标是列指标。)

作为一个例子,我们考虑空间 𝒫 n 上的微分变换 D ,以及由 x i ( t ) = t i 1 , i = 1 , , n 定义的基 { x 1 , , x n } 。在这个基下, D 的矩阵是什么?我们有 因此  

通过比较 (1) 和 (2),可以看到指标颠倒这一令人不快的现象。