Regla de la cadena


 

16.1 INTRODUCCIÓN

16.1.1 Construcción de funciones complejas a partir de funciones básicas

En cálculo, podemos construir funciones más generales a partir de funciones básicas. Una posibilidad es sumar funciones como f ( x ) + g ( x ) = x 2 + sin ( x ) . Otra posibilidad es multiplicar funciones como f ( x ) g ( x ) = x 2 sin ( x ) . Una tercera posibilidad es componer funciones como f g ( x ) = f ( g ( x ) ) = sin 2 ( x ) . La composición de funciones no es conmutativa: f g g f . De hecho, tenemos g f ( x ) = sin ( x 2 ) que es completamente diferente de f g ( x ) = sin 2 ( x ) .

Figura 1. f : p n y g : m p se pueden combinar para obtener f ( g ) : m n .

16.1.2 La regla de la cadena: de una variable a dimensiones superiores

¿Cómo podemos expresar la tasa de cambio de una función compuesta en términos de las funciones básicas que la componen? Para la suma de dos funciones, tenemos la regla de la suma (f+g)^{\prime}(x)=f^{\prime}(x)+g^{\prime}(x), para la multiplicación tenemos la regla del producto (f g)^{\prime}(x)=f^{\prime}(x) g(x)+f(x) g(x). Normalmente escribimos (f+g)^{\prime}=f^{\prime}+g^{\prime} o (f g)^{\prime}=f^{\prime} g+f g^{\prime} y no siempre escribimos el argumento. Como sabes del cálculo de una variable, la derivada de la función compuesta se da mediante la regla de la cadena. Esta es (f \circ g)^{\prime}=f^{\prime}(g) g^{\prime}. Escrito con más detalle con el argumento, podemos escribir \frac{d}{d x} f(g(x))=\frac{d}{d x} f^{\prime}(g(x)) g^{\prime}(x). Generalizamos esto aquí a dimensiones superiores. En lugar de d d x f simplemente escribimos d f . Esta es la matriz jacobiana que conocemos. Ahora, la misma regla se cumple como antes d f ( g ( x ) ) = d f ( g ( x ) ) d g ( x ) y esto se llama la regla de la cadena en dimensiones superiores. En el lado derecho, tenemos el producto matricial de dos matrices.

16.1.3 Dimensiones y la regla de la cadena

Veamos por qué esto tiene sentido en términos de dimensiones: g : m p y f : p n , entonces d g ( x ) M ( p , m ) y d f ( g ( x ) ) M ( n , p ) y d f ( g ( x ) ) d g ( x ) M ( n , m ) que es el mismo tipo de matriz que d ( f g ) porque f g ( x ) mapea m n de modo que también d ( f g ) ( x ) M ( n , m ) . El nombre regla de la cadena proviene de que trata con funciones que están encadenadas.

16.2 LECCIÓN

16.2.1 La regla de la cadena multivariable

Dada una función diferenciable r : m p , su derivada en x es la matriz jacobiana d r ( x ) M ( p , m ) . Si f : p n es otra función con d f ( y ) M ( n , p ) , podemos combinarlas y formar f r ( x ) = f ( r ( x ) ) : m n . Las matrices d f ( y ) M ( n , p ) y d r ( x ) M ( p , m ) se combinan en el producto matricial d f d r en un punto. Esta matriz está en M ( n , m ) . La regla de la cadena multivariable es:

Teorema 1. d ( f r ) ( x ) = d f ( r ( x ) ) d r ( x ) .

16.2.2 Funciones escalares y el gradiente

Para m = n = p = 1 , el caso de cálculo de una variable, tenemos d f(x)=f^{\prime}(x) y (f \circ r)^{\prime}(x)=f^{\prime}(r(x)) r^{\prime}(x). En general, d f ahora es una matriz en lugar de un número. Al verificar una sola entrada de la matriz, nos reducimos al caso n = m = 1 . En ese caso, f : p es una función escalar. Mientras que d f es un vector fila, definimos el vector columna f = d f T = [ f x 1 , f x 2 , f x p ] T . Si r : p es una curva, escribimos r^{\prime}(t)= [x_{1}^{\prime}(t), \cdots, x_{p}^{\prime}(t)]^{T} en lugar de d r ( t ) . El símbolo también se llama "nabla".1 El caso especial n = m = 1 es:

Teorema 2. \frac{d}{d t} f(r(t))=\nabla f(r(t)) \cdot r^{\prime}(t).

Demostración. d d t f ( x 1 ( t ) , x 2 ( t ) , , x p ( t ) ) es el límite h 0 de \begin{aligned} & \big[f\big(x_{1}(t+h), x_{2}(t+h), \ldots, x_{p}(t+h)\big)-f\big(x_{1}(t), x_{2}(t), \ldots, x_{p}(t)\big)\big] / h \\ = & \big[f\big(x_{1}(t+h), x_{2}(t+h), \ldots, x_{p}(t+h)\big)-f\big(x_{1}(t), x_{2}(t+h), \ldots, x_{p}(t+h)\big)\big] / h \\ + & \big[f\big(x_{1}(t), x_{2}(t+h), \ldots, x_{p}(t+h)\big)-f\big(x_{1}(t), x_{2}(t), \ldots, x_{p}(t+h)\big)\big] / h+\cdots \\ + & \big[f\big(x_{1}(t), x_{2}(t), \ldots, x_{p}(t+h)\big)-f\big(x_{1}(t), x_{2}(t), \ldots, x_{p}(t)\big)\big] / h \end{aligned} que es (regla de la cadena en 1D) en el límite h 0 la suma f_{x_{1}}(x) x_{1}^{\prime}(t)+\cdots+f_{x_{p}}(x) x_{p}^{\prime}(t).

Demostración del caso general: Sea h = f r . La entrada i j de la matriz jacobiana d h ( x ) es d h i j ( x ) = x j h i ( x ) = x j f i ( r ( x ) ) . El caso de la entrada i j se reduce con t = x j y h i = f al caso en que r ( t ) es una curva y f ( x ) es una función escalar. Este es el caso que ya hemos demostrado. ◻

16.3 EJEMPLOS

Ejemplo 1. Supongamos que una mariquita camina sobre un círculo r ( t ) = [ cos ( t ) sin ( t ) ] y f ( x , y ) = x 2 y 2 es la temperatura en la posición ( x , y ) , entonces f ( r ( t ) ) es la tasa de cambio de la temperatura. Podemos escribir f ( r ( t ) ) = cos 2 ( t ) sin 2 ( t ) = cos ( 2 t ) . Ahora, d / d t f ( r ( t ) ) = 2 sin ( 2 t ) . El gradiente de f y la velocidad son \nabla f(x, y)=\left[\begin{array}{r}2 x \\ -2 y\end{array}\right], \quad r^{\prime}(t)=\left[\begin{array}{r}-\sin (t) \\ \cos (t)\end{array}\right]. Ahora \begin{aligned} \nabla f(r(t)) \cdot r^{\prime}(t)&=\left[\begin{array}{r} 2 \cos (t) \\ -2 \sin (t) \end{array}\right] \cdot\left[\begin{array}{r} -\sin (t) \\ \cos (t) \end{array}\right]\\ &=-4 \cos (t) \sin (t)\\ &=-2 \sin (2 t). \end{aligned}

Figura 2. Si f ( x , y ) es una altura, la tasa de cambio d / d t f ( r ( t ) ) es la ganancia de altura que el insecto sube por unidad de tiempo. Depende de qué tan rápido camina el insecto y en qué dirección relativa al gradiente f camina.

16.4 ILUSTRACIONES

16.4.1 Potencia a partir del potencial: una conexión con la regla de la cadena

El caso n = m = 1 es extremadamente importante. La regla de la cadena d / d t f ( r ( t ) ) = \nabla f(r(t)) \cdot r^{\prime}(t) dice que la tasa de cambio de la energía potencial f ( r ( t ) ) en la posición r ( t ) es el producto punto de la fuerza F = f ( r ( t ) ) en el punto y la velocidad con la que nos movemos. El lado derecho es potencia = fuerza por velocidad. Usaremos esto más adelante en el teorema fundamental de las integrales de línea.

16.4.2 Caos mediante derivadas: exponentes de Lyapunov y entropía en mapas iterados

Si f , g : m m , entonces f g es nuevamente un mapa de m a n . También podemos iterar un mapa como x f ( x ) f ( f ( x ) ) f ( f ( f ( x ) ) ) La derivada d f n ( x ) es por la regla de la cadena el producto d f ( f n 1 ( x ) ) d f ( f ( x ) ) d f ( x ) de matrices jacobianas. El número λ ( x ) = lim sup n ( 1 / n ) log ( | d f n ( x ) | ) se llama el exponente de Lyapunov del mapa f en el punto x . Mide la cantidad de caos, la "dependencia sensible de las condiciones iniciales" de f . Estos números son difíciles de estimar matemáticamente. Ya para ejemplos simples como el mapa de Chirikov f ( [ x , y ] ) = [ 2 x y + c sin ( x ) , x ] , se puede medir entropía positiva S ( c ) . Una conjetura de Sinai dice que la entropía del mapa es positiva para c grande. Mediciones muestran que esta entropía S ( c ) = 0 2 π 0 2 π λ ( x , y ) d x d y / ( 4 π 2 ) satisface S ( x ) log ( c / 2 ) . La conjetura sigue abierta.2

16.4.3 Ecuaciones de Hamilton y conservación de la energía

Si H ( x , y ) es una función llamada el hamiltoniano y x^{\prime}(t)=H_{y}(x, y), y^{\prime}(t)= H x ( x , y ) , entonces d / d t H ( x ( t ) , y ( t ) ) = 0 . Esto se puede interpretar como conservación de la energía. Vemos que una ecuación diferencial hamiltoniana siempre conserva la energía. Para el péndulo, H ( x , y ) = y 2 / 2 cos ( x ) , tenemos x^{\prime}=y, y^{\prime}=-\sin (x) o x^{\prime \prime}=-\sin (x).

Figura 3. El mapa f ( [ x , y ] ) = [ x 2 x / 2 y , x ] es un mapa de Henon. Vemos algunas órbitas. El mapa f ( [ x , y ] ) = [ 2 x y + 4 sin ( x ) , x ] a la derecha apareció en la primera hora. El toro 𝕋 2 = 2 / ( 2 π ) 2 está lleno de un "mar estocástico" azul que contiene "islas estables" rojas.

16.4.4 La regla de la cadena desbloquea las inversas

La regla de la cadena es útil para obtener derivadas de funciones inversas. Como \begin{aligned} 1=\frac{d}{d x} x&=\frac{d}{d x} \sin (\arcsin (x))\\ &=\cos (\arcsin (x)) \arcsin ^{\prime}(x) \end{aligned} lo que luego da \begin{aligned} \arcsin ^{\prime}(x)&=1 / \sqrt{1-\sin ^{2}(\arcsin (x))}\\ &=1 / \sqrt{1-x^{2}}. \end{aligned}

16.4.5 Derivación implícita: encontrar la pendiente misteriosa

Supongamos que f ( x , y ) = x 3 y + x 5 y 4 2 sin ( x y ) = 0 es una curva. No podemos despejar y . Sin embargo, podemos suponer f ( x , y ( x ) ) = 0 . La derivación usando la regla de la cadena da f_{x}(x, y(x))+f_{y}(x, y(x)) y^{\prime}(x)=0. Por lo tanto y^{\prime}(x)=-\frac{f_{x}(x, y(x))}{f_{y}(x, y(x))} En el ejemplo anterior, el punto ( x , y ) = ( 1 , 1 ) está en la curva. Ahora g x ( x , y ) = 3 + 5 1 = 7 y g y ( x , y ) = 1 + 4 + 1 = 6 . Entonces, g^{\prime}(1)=-7 / 6. Esto se llama derivación implícita. Podríamos calcular con ella la derivada de una función que no se conocía.

16.4.6 Soluciones garantizadas: el teorema de la función implícita

El teorema de la función implícita asegura que existe una función implícita diferenciable g ( x ) cerca de una raíz ( a , b ) de una función diferenciable f ( x , y ) .

Teorema 3. Si f ( a , b ) = 0 , f y ( a , b ) 0 existe c > 0 y una función g C 1 ( [ b c , b + c ] ) con f ( x , g ( x ) ) = 0 .

Demostración. Sea c tan pequeño que para un x [ a c , a + c ] fijo, la función y [ b c , b + c ] h ( y ) = f ( x , y ) tiene la propiedad h ( b c ) < 0 y h ( b + c ) > 0 y h^{\prime}(y) \neq 0 en [ b c , b + c ] . El teorema del valor intermedio para h asegura ahora una raíz única z = g ( x ) de h cerca de b . La fórmula de la regla de la cadena anterior asegura entonces que para a c < x < a + c , el cociente diferencial [ g ( x + h ) g ( x ) ] / h escrito para g tiene un límite f x ( x , g ( x ) ) / f y ( x , g ( x ) ) . ◻

P.D. Podemos obtener la raíz de h aplicando pasos de Newton T(y)=y-h(y) / h^{\prime}(y). Taylor (que se verá en la próxima clase) muestra que el error se eleva al cuadrado en cada paso. El paso de Newton T ( y ) = y d h ( y ) 1 h ( y ) funciona también en dimensiones arbitrarias. Se puede demostrar el teorema de la función implícita simplemente estableciendo que Id T = d h 1 h es una contracción y luego usar el teorema del punto fijo de Banach para obtener un punto fijo de Id T que es una raíz de h .

Figura 4. El paso de Newton.
Figura 5. Si aplicamos el mapa f ( [ x , y ] ) = [ x 2 x 4 y , x ] una y otra vez y trazamos puntos, obtenemos una órbita. Tales sistemas dinámicos simples son en gran parte no comprendidos. ¿Qué puntos no escapan al infinito? ¿Cuál es la frontera de este conjunto? Demostrar que hay regiones que permanecen acotadas es difícil y necesita "teoremas de la función implícita difíciles". El método de Newton permite abordar la demostración de esto, donde el paso de Newton se aplica en espacios de funciones. Algunos de los análisis más difíciles que los humanos han inventado para abordar problemas matemáticos entran en juego en este mapa aparentemente simple f : 2 2 .

Las unidades 16 y 17 se enseñan juntas el miércoles. La tarea está toda en la unidad 17.


  1. La etimología dice que el símbolo está inspirado en un arpa egipcia o fenicia.↩︎
  2. Para generar órbitas, consulte http://www.math.harvard.edu/k̃nill/technology/chirikov/.↩︎