链式法则

16.1 引言

16.1.1 从基本函数构建复杂函数

在微积分中，我们可以从基本函数构建更一般的函数。一种方法是相加，如 $f (x) + g (x) = x^{2} + \sin (x)$ 。另一种可能性是相乘，如 $f (x) g (x) = x^{2} \sin (x)$ 。第三种方法是组合函数，如 $f \circ g (x) = f (g (x)) = \sin^{2} (x)$ 。函数复合是非交换的： $f \circ g \neq g \circ f$ 。实际上，我们有 $g \circ f (x) = \sin (x^{2})$ ，它与 $f \circ g (x) = \sin^{2} (x)$ 完全不同。

**图 1.** $f : ℝ^{p} \to ℝ^{n}$ 和 $g : ℝ^{m} \to ℝ^{p}$ 可以组合为 $f (g) : ℝ^{m} \to ℝ^{n}$ 。

16.1.2 链式法则：从单变量到高维

我们如何用构成它的基本函数来表示复合函数的变化率？对于两个函数的和，我们有加法规则 ，对于乘法，我们有乘积规则 。我们通常简写为或，并不总写出自变量。正如你从单变量微积分中所知，复合函数的导数由链式法则给出。这就是。更详细地写出自变量，我们可以写。我们将其推广到高维。我们直接写 $d f$ 而不是 $\frac{d}{d x} f$ 。这就是我们所知的雅可比矩阵。现在，同样的规则成立： $d f (g (x)) = d f (g (x)) d g (x)$ ，这称为高维空间中的链式法则。在右边，我们有两个矩阵的乘积。

16.1.3 维度与链式法则

让我们看看这在维度上为什么合理： $g : ℝ^{m} \to ℝ^{p}$ 且 $f :$ $ℝ^{p} \to ℝ^{n}$ ，那么 $d g (x) \in M (p, m)$ 且 $d f (g (x)) \in M (n, p)$ ，而 $d f (g (x)) d g (x) \in M (n, m)$ ，这与 $d (f \circ g)$ 属于同一类矩阵，因为 $f \circ g (x)$ 将 $ℝ^{m} \to ℝ^{n}$ 映射，所以也有 $d (f \circ g) (x) \in M (n, m)$ 。链式法则 这个名字的由来是因为它处理的是链接在一起的函数。

16.2 讲座

16.2.1 多元链式法则

给定一个可微函数 $r : ℝ^{m} \to ℝ^{p}$ ，它在 $x$ 处的导数是雅可比矩阵 $d r (x) \in M (p, m)$ 。如果 $f : ℝ^{p} \to ℝ^{n}$ 是另一个函数，其 $d f (y) \in M (n, p)$ ，我们可以将它们组合并形成 $f \circ r (x) = f (r (x)) : ℝ^{m} \to ℝ^{n}$ 。矩阵 $d f (y) \in$ $M (n, p)$ 和 $d r (x) \in M (p, m)$ 在一点处组合为矩阵乘积 $d f d r$ 。这个矩阵属于 $M (n, m)$ 。多元链式法则 是：

定理 1. $d (f \circ r) (x) = d f (r (x)) d r (x)$ 。

16.2.2 标量函数与梯度

对于 $m = n = p = 1$ ，即单变量微积分的情况，我们有和。一般而言， $d f$ 现在是一个矩阵而非一个数。通过检查单个矩阵元素，我们归约为情形 $n = m = 1$ 。在这种情况下， $f : ℝ^{p} \to ℝ$ 是标量函数。而 $d f$ 是行向量，我们定义列向量 $\nabla f = d f^{T} = [f_{x_{1}}, f_{x_{2}}, \dots f_{x_{p}}]^{T} .$ 如果 $r : ℝ \to ℝ^{p}$ 是一条曲线，我们写而不是 $d r (t)$ 。符号 $\nabla$ 也读作 "nabla"。¹ 特殊情况 $n = m = 1$ 是：

定理 2. 。

证明. $\frac{d}{d t} f (x_{1} (t), x_{2} (t), \dots, x_{p} (t))$ 是当 $h \to 0$ 时下面表达式的极限在极限 $h \to 0$ 下这就是（一维链式法则）的和。

一般情况的证明： 令 $h = f \circ r$ 。雅可比矩阵 $d h (x)$ 的 $i j$ 元素是 $d h_{i j} (x) = \partial_{x_{j}} h_{i} (x) = \partial_{x_{j}} f_{i} (r (x))$ 。元素 $i j$ 的情形，令 $t = x_{j}$ 且 $h_{i} = f$ ，便归约为当 $r (t)$ 是曲线且 $f (x)$ 是标量函数的情形。这就是我们已经证明过的情形。 ◻

16.3 示例

示例 1. 假设一只瓢虫在圆 $r (t) = [\begin{matrix} \cos (t) \\ \sin (t) \end{matrix}]$ 上行走，且 $f (x, y) = x^{2} - y^{2}$ 是位置 $(x, y)$ 处的温度，那么 $f (r (t))$ 是温度的变化率。我们可以写 $f (r (t)) = \cos^{2} (t) - \sin^{2} (t) = \cos (2 t) .$ 现在， $d / d t f (r (t)) = - 2 \sin (2 t)$ 。 $f$ 的梯度和速度分别是现在

**图 2.** 如果 $f (x, y)$ 是高度，那么变化率 $d / d t f (r (t))$ 是瓢虫单位时间内爬升的高度增量。它取决于瓢虫行走的速度以及相对于梯度 $\nabla f$ 的方向。

16.4 图解

16.4.1 势能与功率：链式法则的联系

情形 $n = m = 1$ 极其重要。链式法则告诉我们，在位置 $r (t)$ 处势能 $f (r (t))$ 的变化率是力 $F = \nabla f (r (t))$ 在该点与运动速度的点积。右边是功率 $=$ 力乘以速度。我们稍后将在曲线积分的基本定理中使用这一点。

16.4.2 通过导数看混沌：迭代映射中的李雅普诺夫指数与熵

如果 $f, g : ℝ^{m} \to ℝ^{m}$ ，那么 $f \circ g$ 又是一个从 $ℝ^{m}$ 到 $ℝ^{n}$ 的映射。我们还可以迭代一个映射，如 $x \to f (x) \to f (f (x)) \to f (f (f (x))) \dots$ 导数 $d f^{n} (x)$ 由链式法则等于雅可比矩阵的乘积 $d f (f^{n - 1} (x)) \dots d f (f (x)) d f (x)$ 。数字 $λ (x) = \underset{n \to \infty}{lim sup} (1 / n) \log (| d f^{n} (x) |)$ 称为映射 $f$ 在点 $x$ 处的李雅普诺夫指数。它度量了混沌的程度，即 $f$ 对初始条件的敏感依赖性。这些数字在数学上难以估计。即使对于像 Chirikov 映射这样的简单例子 $f ([x, y]) = [2 x - y + c \sin (x), x],$ 人们也能测量到正熵 $S (c)$ 。Sinai 的一个猜想指出，对于大的 $c$ ，该映射的熵为正。测量表明这个熵 $S (c) = \int_{0}^{2 π} \int_{0}^{2 π} λ (x, y) d x d y / (4 π^{2})$ 满足 $S (x) \geq \log (c / 2)$ 。该猜想仍未解决。²

16.4.3 哈密顿方程与能量守恒

如果 $H (x, y)$ 是一个称为哈密顿量的函数，且 $- H_{x} (x, y)$ ，那么 $d / d t H (x (t), y (t)) = 0$ 。这可以解释为能量守恒。我们看到哈密顿微分方程总是保持能量守恒。对于摆， $H (x, y) = y^{2} / 2 - \cos (x)$ ，我们有或。

**图 3.** 映射 $f ([x, y]) = [x^{2} - x / 2 - y, x]$ 是一个 **Henon 映射**。我们看到一些轨道。右侧的映射 $f ([x, y]) = [2 x - y + 4 \sin (x), x]$ 出现在第一个小时。环面 $𝕋^{2} = ℝ^{2} / (2 π ℤ)^{2}$ 充满了蓝色的“随机海”，其中包含红色的“稳定岛屿”。

16.4.4 链式法则解开反函数之谜

链式法则有助于求反函数的导数。比如，这随后给出

16.4.5 隐函数微分：寻找神秘斜率

假设 $f (x, y) = x^{3} y + x^{5} y^{4} - 2 - \sin (x - y) = 0$ 是一条曲线。我们无法解出 $y$ 。但我们仍可以假定 $f (x, y (x)) = 0$ 。利用链式法则求导给出因此在上面的例子中，点 $(x, y) = (1, 1)$ 在曲线上。现在 $g_{x} (x, y) =$ $3 + 5 - 1 = 7$ 和 $g_{y} (x, y) = 1 + 4 + 1 = 6$ 。所以，。这称为隐函数微分。我们可以用它计算一个未知函数的导数。

16.4.6 保证解的存在：隐函数定理

隐函数定理保证在可微函数 $f (x, y)$ 的根 $(a, b)$ 附近存在可微隐函数 $g (x)$ 。

定理 3. 若 $f (a, b) = 0$ ， $f_{y} (a, b) \neq 0$ ，则存在 $c > 0$ 及函数 $g \in C^{1} ([b - c, b + c])$ 使得 $f (x, g (x)) = 0$ 。

证明。 令 $c$ 如此小，使得对于固定的 $x \in [a - c, a + c]$ ，函数 $y \in [b - c, b + c] \to h (y) = f (x, y)$ 具有性质 $h (b - c) < 0$ 且 $h (b + c) > 0$ ，并且在 $[b - c, b + c]$ 内。对于 $h$ 的介值定理现在保证了 $h$ 在 $b$ 附近有唯一的根 $z = g (x)$ 。上面的链式法则公式然后保证，对于 $a - c < x < a + c$ ，为 $g$ 写出的差商 $[g (x + h) - g (x)] / h$ 有极限 $- f_{x} (x, g (x)) / f_{y} (x, g (x))$ 。 ◻

附注：我们可以通过应用牛顿步 来求得 $h$ 的根。泰勒（下节课会讲到）表明每一步的误差都被平方。牛顿步 $T (y) = y - d h (y)^{- 1} h (y)$ 在任意维数中也适用。可以通过建立 Id $- T = d h^{- 1} h$ 是压缩映射，然后使用巴拿赫不动点定理来得到 $Id - T$ 的不动点，该点即为 $h$ 的根，从而证明隐函数定理。

**图 5.** 如果我们反复应用映射 $f ([x, y]) = [x^{2} - x^{4} - y, x]$ 并绘制点，我们就会得到一条轨道。这样简单的动力系统在很大程度上仍未被理解。哪些点不会逃逸到无穷远？这个集合的边界是什么。证明存在保持有界的区域是困难的，并且需要“硬隐函数定理”。牛顿方法使我们能够掌握证明这一点，其中牛顿步被应用于函数空间。人类为处理数学问题而发明的一些最难的分析方法，都在这个看似简单的映射 $f : ℝ^{2} \to ℝ^{2}$ 中发挥了作用。

第 16 和第 17 单元都在周三讲授。作业全部在第 17 单元。

词源学告诉我们，这个符号的灵感来源于埃及或腓尼基的竖琴。↩︎
要生成轨道，请参阅 http://www.math.harvard.edu/k̃nill/technology/chirikov/。↩︎

目录