矩阵
现在让我们理清头绪;在引入了线性变换这一新概念之后,我们现在必须弄清楚它与基、线性泛函等旧概念有什么关系。
在研究有限维向量空间上的线性变换时,最重要的工具之一就是矩阵的概念。由于这一概念在无限维空间中通常没有合适的对应物,而且在大多数讨论中都可以不使用它,因此我们在证明定理时将尽量不使用它。然而,了解什么是矩阵是很重要的;我们现在进入详细的讨论。
定义 1. 设 是一个 维向量空间,设 是 的任意一个基,并设 是 上的一个线性变换。由于每个向量都是 的线性组合,特别地,对于 ,我们有 。由双下标 , 索引的 个标量的集合 是 在坐标系 下的矩阵;我们通常将其记为 ,或者,如果需要指出所考虑的特定基 ,则记为 。矩阵 通常写成方阵的形式: 标量 构成 的一行,而 构成其一列。
这个定义并没有定义“矩阵”本身;它定义的是“在某些条件下与线性变换相关联的矩阵”。将矩阵视为独立存在的标量方阵通常是有用的;然而,在本书中,矩阵通常会与线性变换和基绑定在一起。
我们对记号做一些说明。习惯上,矩阵和变换使用相同的符号,例如 。这样做的合理性可以在下面(关于矩阵性质)的讨论中找到。我们在这里不遵循这一习惯,因为我们关于矩阵的主要目的之一是强调它们依赖于坐标系(而线性变换的概念则不依赖),并研究当我们从一个坐标系过渡到另一个坐标系时,矩阵与线性变换之间的关系是如何变化的。
我们还想请大家注意矩阵 中元素 索引的一个独特性。基就是基,到目前为止,尽管我们通常用前 个正整数来索引它的元素,但其中元素的顺序是完全无关紧要的。然而,在谈到矩阵时,习惯上会提到诸如第一行或第一列。只有当我们认为基 的元素是按特定顺序排列时,这种说法才是合理的。由于在我们的绝大多数讨论中,矩阵的行和列的顺序与基元素的顺序一样无关紧要,因此我们在定义中没有包含矩阵的这一方面。然而,重要的是要认识到,与 相关联的方阵的外观会随着 的排序而改变。
因此,我们关于矩阵所要说的一切,都可以从两个不同的观点来解释;要么严格按照我们定义的字面意思,要么遵循一个修改后的定义,该定义使一个矩阵(具有有序的行和列)不仅对应于一个线性变换和一个基,而且还对应于该基的一个排序。
对知情者再多说一句。这不是作者的任性,而是大自然的怪癖,使得我们写成
而不是更常用的方程
其原因在于,我们希望矩阵乘法以及矩阵应用于数值向量(即 中的向量 )的公式看起来是正常的,而在从向量过渡到其坐标的过程中,某些地方的指标发生了颠倒。明确地阐述我们的规则:将 写为 的线性组合,并将由此得到的系数写为矩阵 的第 列。( 上的第一个指标总是行指标;第二个指标是列指标。)
作为一个例子,我们考虑空间 上的微分变换 ,以及由 , 定义的基 。在这个基下, 的矩阵是什么?我们有
通过比较 (1) 和 (2),可以看到指标颠倒这一令人不快的现象。