链式法则


 

16.1 引言

16.1.1 从基本函数构建复杂函数

在微积分中,我们可以从基本函数构建更一般的函数。一种方法是相加,如 f ( x ) + g ( x ) = x 2 + sin ( x ) 。另一种可能性是相乘,如 f ( x ) g ( x ) = x 2 sin ( x ) 。第三种方法是组合函数,如 f g ( x ) = f ( g ( x ) ) = sin 2 ( x ) 。函数复合是非交换的: f g g f 。实际上,我们有 g f ( x ) = sin ( x 2 ) ,它与 f g ( x ) = sin 2 ( x ) 完全不同。

图 1. f : p n g : m p 可以组合为 f ( g ) : m n

16.1.2 链式法则:从单变量到高维

我们如何用构成它的基本函数来表示复合函数的变化率?对于两个函数的和,我们有加法规则 ,对于乘法,我们有乘积规则 。我们通常简写为 ,并不总写出自变量。正如你从单变量微积分中所知,复合函数的导数由链式法则给出。这就是 。更详细地写出自变量,我们可以写 。我们将其推广到高维。我们直接写 d f 而不是 d d x f 。这就是我们所知的雅可比矩阵。现在,同样的规则成立: d f ( g ( x ) ) = d f ( g ( x ) ) d g ( x ) ,这称为高维空间中的链式法则。在右边,我们有两个矩阵的乘积。

16.1.3 维度与链式法则

让我们看看这在维度上为什么合理: g : m p f : p n ,那么 d g ( x ) M ( p , m ) d f ( g ( x ) ) M ( n , p ) ,而 d f ( g ( x ) ) d g ( x ) M ( n , m ) ,这与 d ( f g ) 属于同一类矩阵,因为 f g ( x ) m n 映射,所以也有 d ( f g ) ( x ) M ( n , m ) 链式法则 这个名字的由来是因为它处理的是链接在一起的函数。

16.2 讲座

16.2.1 多元链式法则

给定一个可微函数 r : m p ,它在 x 处的导数是雅可比矩阵 d r ( x ) M ( p , m ) 。如果 f : p n 是另一个函数,其 d f ( y ) M ( n , p ) ,我们可以将它们组合并形成 f r ( x ) = f ( r ( x ) ) : m n 。矩阵 d f ( y ) M ( n , p ) d r ( x ) M ( p , m ) 在一点处组合为矩阵乘积 d f d r 。这个矩阵属于 M ( n , m ) 多元链式法则 是:

定理 1. d ( f r ) ( x ) = d f ( r ( x ) ) d r ( x )

16.2.2 标量函数与梯度

对于 m = n = p = 1 ,即单变量微积分的情况,我们有 。一般而言, d f 现在是一个矩阵而非一个数。通过检查单个矩阵元素,我们归约为情形 n = m = 1 。在这种情况下, f : p 标量函数。而 d f 行向量,我们定义列向量 f = d f T = [ f x 1 , f x 2 , f x p ] T . 如果 r : p 是一条曲线,我们写 而不是 d r ( t ) 。符号 也读作 "nabla"。1 特殊情况 n = m = 1 是:

定理 2.

证明. d d t f ( x 1 ( t ) , x 2 ( t ) , , x p ( t ) ) 是当 h 0 时下面表达式的极限 在极限 h 0 下这就是(一维链式法则)的和

一般情况的证明: h = f r 。雅可比矩阵 d h ( x ) i j 元素是 d h i j ( x ) = x j h i ( x ) = x j f i ( r ( x ) ) 。元素 i j 的情形,令 t = x j h i = f ,便归约为当 r ( t ) 是曲线且 f ( x ) 是标量函数的情形。这就是我们已经证明过的情形。 ◻

16.3 示例

示例 1. 假设一只瓢虫在圆 r ( t ) = [ cos ( t ) sin ( t ) ] 上行走,且 f ( x , y ) = x 2 y 2 是位置 ( x , y ) 处的温度,那么 f ( r ( t ) ) 是温度的变化率。我们可以写 f ( r ( t ) ) = cos 2 ( t ) sin 2 ( t ) = cos ( 2 t ) . 现在, d / d t f ( r ( t ) ) = 2 sin ( 2 t ) f 的梯度和速度分别是 现在

图 2. 如果 f ( x , y ) 是高度,那么变化率 d / d t f ( r ( t ) ) 是瓢虫单位时间内爬升的高度增量。它取决于瓢虫行走的速度以及相对于梯度 f 的方向。

16.4 图解

16.4.1 势能与功率:链式法则的联系

情形 n = m = 1 极其重要。链式法则 告诉我们,在位置 r ( t ) 势能 f ( r ( t ) ) 的变化率是 F = f ( r ( t ) ) 在该点与运动速度的点积。右边是功率 = 乘以 速度。我们稍后将在曲线积分的基本定理中使用这一点。

16.4.2 通过导数看混沌:迭代映射中的李雅普诺夫指数与熵

如果 f , g : m m ,那么 f g 又是一个从 m n 的映射。我们还可以迭代一个映射,如 x f ( x ) f ( f ( x ) ) f ( f ( f ( x ) ) ) 导数 d f n ( x ) 由链式法则等于雅可比矩阵的乘积 d f ( f n 1 ( x ) ) d f ( f ( x ) ) d f ( x ) 。数字 λ ( x ) = lim sup n ( 1 / n ) log ( | d f n ( x ) | ) 称为映射 f 在点 x 处的李雅普诺夫指数。它度量了混沌的程度,即 f 对初始条件的敏感依赖性。这些数字在数学上难以估计。即使对于像 Chirikov 映射这样的简单例子 f ( [ x , y ] ) = [ 2 x y + c sin ( x ) , x ] , 人们也能测量到正熵 S ( c ) 。Sinai 的一个猜想指出,对于大的 c ,该映射的为正。测量表明这个熵 S ( c ) = 0 2 π 0 2 π λ ( x , y ) d x d y / ( 4 π 2 ) 满足 S ( x ) log ( c / 2 ) 。该猜想仍未解决。2

16.4.3 哈密顿方程与能量守恒

如果 H ( x , y ) 是一个称为哈密顿量的函数,且 H x ( x , y ) ,那么 d / d t H ( x ( t ) , y ( t ) ) = 0 。这可以解释为能量守恒。我们看到哈密顿微分方程总是保持能量守恒。对于 H ( x , y ) = y 2 / 2 cos ( x ) ,我们有

图 3. 映射 f ( [ x , y ] ) = [ x 2 x / 2 y , x ] 是一个 Henon 映射。我们看到一些轨道。右侧的映射 f ( [ x , y ] ) = [ 2 x y + 4 sin ( x ) , x ] 出现在第一个小时。环面 𝕋 2 = 2 / ( 2 π ) 2 充满了蓝色的“随机海”,其中包含红色的“稳定岛屿”。

16.4.4 链式法则解开反函数之谜

链式法则有助于求反函数的导数。比如, 这随后给出

16.4.5 隐函数微分:寻找神秘斜率

假设 f ( x , y ) = x 3 y + x 5 y 4 2 sin ( x y ) = 0 是一条曲线。我们无法解出 y 。但我们仍可以假定 f ( x , y ( x ) ) = 0 。利用链式法则求导给出 因此 在上面的例子中,点 ( x , y ) = ( 1 , 1 ) 在曲线上。现在 g x ( x , y ) = 3 + 5 1 = 7 g y ( x , y ) = 1 + 4 + 1 = 6 。所以, 。这称为隐函数微分。我们可以用它计算一个未知函数的导数。

16.4.6 保证解的存在:隐函数定理

隐函数定理保证在可微函数 f ( x , y ) 的根 ( a , b ) 附近存在可微隐函数 g ( x )

定理 3. f ( a , b ) = 0 f y ( a , b ) 0 ,则存在 c > 0 及函数 g C 1 ( [ b c , b + c ] ) 使得 f ( x , g ( x ) ) = 0

证明。 c 如此小,使得对于固定的 x [ a c , a + c ] ,函数 y [ b c , b + c ] h ( y ) = f ( x , y ) 具有性质 h ( b c ) < 0 h ( b + c ) > 0 ,并且在 [ b c , b + c ] 。对于 h 介值定理现在保证了 h b 附近有唯一的根 z = g ( x ) 。上面的链式法则公式然后保证,对于 a c < x < a + c ,为 g 写出的差商 [ g ( x + h ) g ( x ) ] / h 有极限 f x ( x , g ( x ) ) / f y ( x , g ( x ) ) 。 ◻

附注:我们可以通过应用牛顿步 来求得 h 的根。泰勒(下节课会讲到)表明每一步的误差都被平方。牛顿步 T ( y ) = y d h ( y ) 1 h ( y ) 在任意维数中也适用。可以通过建立 Id T = d h 1 h 是压缩映射,然后使用巴拿赫不动点定理来得到 Id T 的不动点,该点即为 h 的根,从而证明隐函数定理。

图 4. 牛顿步。
图 5. 如果我们反复应用映射 f ( [ x , y ] ) = [ x 2 x 4 y , x ] 并绘制点,我们就会得到一条轨道。这样简单的动力系统在很大程度上仍未被理解。哪些点不会逃逸到无穷远?这个集合的边界是什么。证明存在保持有界的区域是困难的,并且需要“硬隐函数定理”。牛顿方法使我们能够掌握证明这一点,其中牛顿步被应用于函数空间。人类为处理数学问题而发明的一些最难的分析方法,都在这个看似简单的映射 f : 2 2 中发挥了作用。

第 16 和第 17 单元都在周三讲授。作业全部在第 17 单元。


  1. 词源学告诉我们,这个符号的灵感来源于埃及或腓尼基的竖琴。↩︎
  2. 要生成轨道,请参阅 http://www.math.harvard.edu/k̃nill/technology/chirikov/↩︎