引言
线性如何帮助费曼攻克立方根
据传说,理查德·费曼曾接受挑战,与算盘计算比赛计算 的立方根。通过使用线性近似和一点运气,他用纸笔得到了 。实际的立方根是 。费曼是如何做到的?秘密就在于线性近似。这意味着我们用线性函数来近似像 这样的函数。同样的方法也适用于多变量函数。线性近似的形式为 。
图1. 电影《无穷》中的算盘场景。 超越线性近似
我们也可以进行更高阶的近似。例如,函数 在 处的线性近似为 ,二次近似为 。要得到二次项,我们只需确保在 处的一阶和二阶导数一致。这给出了公式 确实,你可以验证 和 在 处具有相同的一阶导数和相同的二阶导数。一个 次近似就是 多项式 例如,对于函数 ,我们有 阶近似
多变量近似
同样的方法可以推广到更高维度。一切都是一样的。我们只需使用导数 而不是通常的导数 。这里我们只考虑函数 的线性和二次近似。线性近似为 其中 是雅可比矩阵,它是一个行向量。现在,由于我们可以将 视为,二阶导数是一个矩阵 。它被称为海森矩阵。它编码了所有的二阶导数 。
讲座
给定一个函数 ,其导数 是雅可比矩阵。对于每个 ,我们可以使用矩阵 和向量 得到 。对于固定的 ,这定义了一个映射 ,类似于原来的 。因为 是 上的一个映射,我们称之为 算子。泰勒公式 在任意维度都成立:
定理 1.
证明. 这是单变量泰勒公式在直线 上的应用。方向导数 在这里就是通常的导数,因为 从技术上讲,我们还需要级数收敛:比如由多项式、、、 构成的函数。 ◻
张量与多维泰勒级数表示
泰勒公式也可以使用逐次导数 、、 来书写,这些导数被称为 张量。在标量情况 下,一阶导数 导出梯度 ,二阶导数 导出 海森矩阵 ,它是一个作用在向量对上的双线性形式。三阶导数 则作用在向量三元组上,等等。我们仍然可以像一维情况那样写
如果我们记 。对于多项式,这意味着我们先写出常数项,然后所有线性项,然后所有二次项,然后所有三次项,等等。
通过线性化进行局部近似
假设 并在泰勒级数的第一步后停止。我们得到 习惯上将其写为 ,,即 这个函数称为 的 线性化。 的核是一个线性流形,它近似于曲面 如果 ,那么刚才所说的可以应用于 的每个分量 ,其中 。这种线性化的重要性怎么强调都不为过。
更进一步:使用海森矩阵的二次近似
如果我们在泰勒级数的两步后停止,我们得到函数 矩阵 称为点 处的 海森矩阵。这里也习惯通过写 来消去 。 称为 的 二次近似。 的核是 二次流形 其中 ,。它比线性近似更好地逼近曲面 。如果 是 阶的,那么 是 阶的,而 是 阶的。这由精确的 带余项的泰勒公式 得出。
曲面的切平面
要得到曲面 的 切平面,我们可以直接考虑线性流形 。然而,有一个更好的方法:
曲面 在 处的切平面为 ,其中 ,。
梯度如何帮助找到曲面的切平面
这由 梯度的基本定理 得出:
定理 3. 函数 的梯度 在 处垂直于曲面 。
证明. 设 是 上的一条曲线,且 。链式法则保证 但因为 是常数,所以该式为零,从而保证 垂直于梯度。由于这对任何曲线都成立,证毕。 ◻
示例
示例 1. 设 由 给出。在 处的二次近似是什么?我们有 以及
线性化为 二次近似为 这就是图 (17.2) 左侧所示的情况。对于 ,方向导数 开头给出的泰勒展开是一个有限级数,因为 是一个多项式:
示例 2. 对于 ,梯度和海森矩阵为
线性化为 二次近似 是图 (17.2) 右侧所示的情况。
示例 3. 曲面 在点 处的切平面是什么?其中 梯度为 切平面方程为 ,其中常数 通过代入该点得到。我们最终得到 。线性化为 。
图2.练习
练习 1. 设 是一条曲线,且 是一个坐标变换。
- 计算 在 处的值,然后计算 和 以及 。
- 先计算 ,然后求 。它应该与 a) 一致。
练习 2.
- 曲面 是一个椭球面。使用隐函数微分法则,在点 处计算 。(使用公式)。
- 从 开始,应用牛顿迭代法 3 次来求解方程 。
练习 3. 不使用技术工具,利用二次近似计算 的立方根。特别要看看你离真实值有多接近。
练习 4.
- 求曲面 在 处的切平面。
- 使用线性近似估计 (计算 而不是 )。
练习 5. 通过计算梯度向量 和海森矩阵 ,求函数 在点 处的二次近似 。向量 是一个 矩阵(行向量),而海森矩阵 是一个 矩阵。