勾股定理


 

1.1 引言

1.1.1 探索毕达哥拉斯定理:历史与意义

在这第一讲中,我们考察数学中最重要的定理之一——毕达哥拉斯定理。该定理的历史渊源令人着迷:诸如 5 2 + 12 2 = 13 2 这样的恒等式最早出现于苏美尔数学中。像 ( 5 , 12 , 13 ) 这样的数三元组被称为毕达哥拉斯三元组。而定理本身远不止于此。该定理不仅列举了若干例子作为佐证,还陈述并证明了:对所有三角形而言,关系式 a 2 + b 2 = c 2 成立当且仅当该三角形是直角三角形。毫不夸张地说,毕达哥拉斯定理是最优美、最重要的定理之一。它在数学的许多其他分支中都有亮相。例如,在调和分析中,它告诉我们周期函数的长度平方等于其傅里叶系数的平方和。在概率论中,它告诉我们如果两个随机变量 X , Y 不相关,那么 X + Y 的方差等于 X Y 的方差之和。

图 1. 该图片出自《最伟大民族的故事》(1910年),展示了毕达哥拉斯正在教授数学的场景。

1.1.2 重新定义向量

我们在此也利用该定理引入向量和线性空间。矩阵语言不仅是一种符号表示,它还允许采用一种稍微更精细的向量微积分方法,其中可以区分别向量和行向量。这与标准向量分析课程不同,当工作更接近线性代数时,这是可能的。传统上,许多资料将向量定义为具有“大小”和“方向”的量。这很有问题,因为一部“电影”也符合这一概念:它有长度(时长),也有导演(director)。但我们不必用双关语来调侃:零向量 0 就是一种不符合向量定义的量,因为零向量没有方向。由于这类问题,人们通常将向量定义为由空间中的两点 A , B 定义的量,记作 A B ,并将该向量视为从 A B 的平移,或一个始于 A 终于 B 的“箭头”。现在,又面临一个困难:两个平行且等长的向量被视为相同。实际上,人们需要使用等价类从仿射空间得到线性空间。现代的观点是,可以在每一点附加一个向量的线性空间,并将 A B 视为附加在点 A 的一个向量。例如,我们将见到梯度场的概念,它在每一点附加一个行向量。力场就是例子。

1.1.3 数据分析中的矩阵基础

无论如何,在数据分析被公认为重要工具的时代,尽早引入矩阵空间也有其优势。关系型数据库建立在矩阵的概念之上。最熟悉的是电子表格,即组织数据的二维阵列。最近,这类概念也被更复杂的数据结构(如图数据库)所取代。然而,图也可以用矩阵来描述。给定网络的两个节点 x , y ,在矩阵元素 A x y 中写入它们之间的关联方式。最简单的情形是,若节点相连则填 1 ,不相连则填 0 。无论如何,数据始终是由更基本的量构成的阵列。计算机的存储结构就是按数组组织的。正如艾伦·图灵所证,我们能形式化的所有计算都可以在一个只有 0 1 的一维磁带上完成。现代计算机存储设备本质上就是这种图灵带,但以更复杂的方式组织,利用分区或扇区,类似于矩阵按行和列组织的方式。

1.2 讲座

1.2.1 矩阵基础

一个由实数构成的有限矩形阵列 A 称为矩阵。如果 A n 行和 m 列,则称为一个 n × m 矩阵。我们用 A i j 表示第 i 行第 j 列的元素。一个 n × 1 矩阵是列向量,一个 1 × n 矩阵是行向量。一个 1 × 1 矩阵称为标量。给定一个 n × p 矩阵 A 和一个 p × m 矩阵 B n × m 矩阵 A B 定义为 ( A B ) i j = k = 1 p A i k B k j . 它称为矩阵乘积。一个 n × m 矩阵 A 的转置是 m × n 矩阵 A i j T = A j i 。列向量的转置是行向量。

1.2.2 矩阵的向量空间

M ( n , m ) n × m 矩阵的集合。它包含零矩阵 O ,其中 O i j = 0 。当 m = 1 时,它就是零向量。 M ( n , m ) 中两矩阵的加法 A + B 定义为 ( A + B ) i j = A i j + B i j . 标量乘法 λ A 定义为 ( λ A ) i j = λ A i j λ 是实数。这些运算使 M ( n , m ) 成为一个向量空间 = 线性空间:加法满足结合律、交换律,存在唯一的加法逆元 A 满足 A A = 0. 乘法满足分配律: A ( B + C ) = A B + A C λ ( A + B ) = λ A + λ B 以及 λ ( μ A ) = ( λ μ ) A .

1.2.3 欧几里得空间、点积与长度

空间 M ( n , 1 ) 也称为 n 。它是 𝒏 维欧几里得空间。向量空间 2 是平面, 3 是物理空间。这些空间对我们来说很亲切,因为我们在纸上作画并生活在空间中。两个列向量 v , w n 之间的点积是矩阵乘积 v w = v T w . 因为点积是一个标量,该乘积也称为标量积。在两个矩阵 A , B 的矩阵乘积中, ( i , j ) 位置的元素是 A 的第 i 行与 B 的第 j 列的点积。更一般地,两个任意 n × m 矩阵之间的点积可以定义为 A B = tr ( A T B ) , 其中矩阵的是其对角线元素之和。这意味着 tr ( A T B ) = i , j A i j B i j . 我们只需将所有矩阵元素相乘后相加。点积满足分配律 ( u + v ) w = u w + v w 和交换律 v w = w v . 我们可以用它来定义向量的长度 | v | = v v 或矩阵的长度 | A | ,我们取正平方根。平方和为零当且仅当所有分量为零。因此,唯一满足 | v | = 0 的向量是 v = 0

1.2.4 柯西-施瓦茨不等式

一个重要的关键结果是柯西-施瓦茨不等式。

定理 1. | v w | | v | | w |

证明. w = 0 ,则无需证明,因为两边均为零。若 w 0 ,则我们可以将方程两边同除以 | w | ,从而不妨设 | w | = 1 。定义 a = v w 。现在, 这意味着 a 2 | v | 2 v w | v | = | v | | w | 。 ◻

1.2.5 两向量之间的夹角

由柯西-施瓦茨不等式可知,对任意两个非零向量 v , w ,数值 ( v w ) / ( | v | | w | ) 落在闭区间 [ 1 , 1 ] 内: 1 u w | v | | w | 1. 因此存在唯一的角 α [ 0 , π ] 使得 cos ( α ) = v w | v | | w | 如果 v w 之间的这个夹角等于 α = π / 2 ,则两向量正交。如果 α = 0 π ,则两向量称为平行。此时存在实数 λ 使得 v = λ w 零向量既被认为与任何其他向量正交,也被认为与任何其他向量平行。

1.2.6 余弦定理

两个向量 v , w 在欧几里得空间 n 中定义了一个(可能退化的)三角形 { 0 , v , w } 。上述公式在点 0 处定义了一个角 α (可能是零角)。三角形的边长 a = | v | , b = | w | , c = | v w | 满足下列余弦公式。这也称为阿尔-卡西恒等式。

推论 1. c 2 = a 2 + b 2 2 a b cos ( α )

证明. 我们利用定义及分配律(展开即得): ◻

1.2.7 理解毕达哥拉斯定理:余弦定理的特例

特别重要的是 α = π / 2 的情况。它就是毕达哥拉斯定理:

定理 2. 在一个直角三角形中,有 c 2 = a 2 + b 2

1.3 示例

示例 1. 点积 [ 1 3 1 ] [ 1 2 1 ] [ 1 , 3 , 1 ] [ 1 2 1 ] = 1 6 1 = 6. 我们有 | v | = 11 , | w | = 6 ,夹角 α = arccos ( 6 / 66 )

示例 2. A = [ 3 1 2 1 ] B = [ 2 2 4 1 ] 的点积为 tr ( A T B ) = 6 + 2 + 8 + ( 1 ) = 15. A 的长度为 tr ( A T A ) = 12 B 的长度为 tr ( B T B ) = 5 A B 之间的夹角为 α = arccos 15 5 12 = arccos 3 2 = π 6 .

示例 3. A = [ 1 2 1 2 ] B = [ 1 1 1 1 ] 是垂直的,因为 tr ( A T B ) = 0. 它们之间的夹角为 π 2 A 的长度为 a = 10 B 的长度为 b = 4 = 2 A + B = [ 2 1 0 3 ] 的长度为 c = 14 。我们验证 a 2 + b 2 = c 2 . 注意 A B B A 。乘法不满足交换律。

示例 4. 求边长 a = 4 , b = 5 c = 6 的三角形的各个角。

答案:由阿尔-卡西定理得 2 4 5 cos ( γ ) = 4 2 + 5 2 6 2 = 5 所以 γ = arccos ( 5 / 40 ) . 类似地 2 4 6 cos ( β ) = 27 所以 γ = arccos ( 27 / 48 ) ,且 2 5 6 cos ( α ) = 45 所以 α = arccos ( 45 / 60 ) .

1.4 图示

图 2. 一个边长均为整数的长方体,其边长 a , b c 满足 a 2 + b 2 , a 2 + c 2 , b 2 + c 2 均为平方数,则称为欧拉砖。其面对角线长度现在也是整数。最小的一个 ( a , b , c ) = ( 44 , 117 , 24 ) 于1719年被发现。如果 a 2 + b 2 + c 2 也是平方数,即空间对角线也是整数,则称为完美欧拉砖。至今无人发现。这是欧拉提出的一个著名未解问题,即是否存在完美欧拉砖。
图 3. 这个 Povray 场景是通过一种涉及大量向量微积分和线性代数的方法生成的:这个开源的 光线追踪器在虚拟场景中反弹光线并计算反射。然后相机捕捉光子,就像真实相机一样。纹理通过图像实现,这里是一张1930年哈佛广场的明信片。它是一个图像文件,编码了三个 1688 × 1104 矩阵 R、G、B,即每个像素的红、绿、蓝值。该场景是对托马斯·沃尔夫小说《时间与河流》的“致敬”,沃尔夫于1920-1922年在此就读哈佛本科(注意22!)

1.4.1 数学中的无限视野

数学不仅是永恒的,也是无限的。为了说明这一点,请看“永恒者”问题1 定义巴比伦图 B ,其中正整数为顶点,如果 a 2 + b 2 是完全平方数,则 ( a , b ) 相连。 B 中的每条边都属于一个毕达哥拉斯三元组 a 2 + b 2 = c 2 。我们可以问会出现哪种类型的子图,有多少个连通分量,直径是否无限,或者闭合回路可以有多大。可以提出成百上千个问题。嵌入三角形 K 3 例如就是欧拉砖!是否存在嵌入四面体 K 4 ,即数字 ( a , b , c , d ) 的团,其中每一对都是毕达哥拉斯三元组?这将是一个欧拉超立方体。存在吗?在证明任何东西之前,我们有一个数据问题。做实验!

 
图 4. 左侧我们看到最大连通分量 B 1000 。一个实验如 ListPlot[Table[GraphDiameter[Babylonian[n]],n,1000]] 给出了 B ( n ) 的最大连通分量 B 1 ( n ) 的直径。我们有 Diam ( B 1 ( 5000 ) ) = 18 , Diam ( B 1 ( 10000 ) ) = 29

练习

练习 1. 使用定义求 6 中向量 v = [ 1 , 1 , 0 , 3 , 2 , 1 ] T w = [ 1 , 1 , 9 , 3 , 5 , 3 ] T 之间的夹角 α 。如果将 v , w 视为数据,则值 cos ( α ) 是两个数据点 v w 之间的相关性。若余弦为正,则数据正相关;若余弦为负,则负相关。

练习 2. 给定矩阵 A = [ 1 2 3 4 5 6 7 8 9 ]

  1. A T ,然后构造 B = A + A T C = A A T 。第一个矩阵称为对称矩阵,第二个称为反对称矩阵。
  2. 计算 A A T A T A 。然后求 tr ( A T A ) tr ( A A T )
  3. 为什么 b) 中计算出的这两个数相同?对于两个 n × m 矩阵,一般是否有 tr ( A T B ) = tr ( B T A ) ?(用求和符号可简短验证)。

练习 3.

  1. 通过展开 ( v w ) ( v w ) 验证一般情况下的三角不等式 | v w | | v | + | w | ,然后构造平面 2 中两个整数坐标向量的例子,并应用此不等式。画出该情形。
  2. 验证:若 v w 长度相等,则 ( v w ) ( v + w ) 垂直。用一句话几何描述 b) 中的情形。

练习 4. 将向量 F = [ 2 , 3 , 4 ] T 写为一个平行于 v = [ 1 , 1 , 1 ] T 的向量与一个垂直于 v 的向量之和。若将 F 解释为作用在质量为 1 的风筝上的力, v 为速度,则 F v 可解释为功率,即风筝能量的变化率。根据牛顿定律,平行于 v 的向量将是风筝的加速度。

练习 5.

  1. 2 中找出两个向量,其所有坐标分量均为 1 1 ,且互相垂直。
  2. 4 中设计四个向量,其所有坐标分量均为 1 1 ,且两两互相垂直。

选做:能否发明一种策略,例如在 16 中找到 16 个两两垂直且分量仍属于 { 1 , 1 } 的向量?


  1. 此问题由 Ajak 传达给我们,他知晓数千年的数学。↩︎