Aproximación de Taylor


 

17.1 INTRODUCCIÓN

17.1.1 Cómo la linealidad ayudó a Feynman a conquistar la raíz cúbica

Según la leyenda1, Richard Feynman aceptó el desafío de calcular la raíz cúbica de 1729.03 compitiendo contra un ábaco. Usando aproximación lineal y un poco de suerte, pudo obtener 12.002384 con papel y lápiz. La raíz cúbica real es 12.002383785691718123057 . ¿Cómo lo hizo Feynman? El secreto está en la aproximación lineal. Esto significa que aproximamos una función como f ( x ) = x 1 / 3 con una función lineal. Lo mismo se puede hacer con funciones de varias variables. La aproximación lineal es de la forma L(x)=f(a)+f^{\prime}(a)(x-a).

Figura 1. La escena del ábaco en la película "Infinity".

17.1.2 Más allá de las aproximaciones lineales

También se pueden hacer aproximaciones de orden superior. La función f ( x ) = e x , por ejemplo, tiene la aproximación lineal L ( x ) = 1 + x en a = 0 y la aproximación cuadrática Q ( x ) = 1 + x + x 2 / 2 en a = 0 . Para obtener el término cuadrático, solo necesitamos asegurarnos de que la primera y segunda derivada en x = a coincidan. Esto da la fórmula Q(x)=f(a)+f^{\prime}(a)(x-a)+f^{\prime \prime}(a)(x-a)^{2} / 2. De hecho, se puede comprobar que f ( x ) y Q ( x ) tienen las mismas primeras derivadas y las mismas segundas derivadas en x = a . Una aproximación de grado n es entonces el polinomio P n ( x ) = k = 0 n f ( k ) ( a ) ( x a ) k k ! . Para la función e x , por ejemplo, tenemos la aproximación de orden m e x = 1 + x + x 2 / 2 ! + x 3 / 3 ! + + x n / n ! .

17.1.3 Aproximaciones multivariables

Lo mismo se puede hacer en dimensiones superiores. Todo es igual. Solo tenemos que usar la derivada d f en lugar de la derivada usual f^{\prime}. Aquí consideramos solo la aproximación lineal y cuadrática de funciones n . La aproximación lineal es entonces L ( x ) = f ( a ) + f ( a ) ( x a ) donde f ( a ) = d f ( a ) = [ f x 1 ( a ) , , f x n ( a ) ] es la matriz jacobiana, que es un vector fila. Ahora, dado que podemos ver d f ( x ) : n n , la segunda derivada es una matriz d 2 f ( x ) = H ( x ) . Se llama el hessiano. Codifica todas las segundas derivadas H i j ( x ) = f x i x j .

17.2 LECCIÓN

17.2.1 Revelando la fórmula de Taylor multidimensional

Dada una función f : m n , su derivada d f ( x ) es la matriz jacobiana. Para cada x m , podemos usar la matriz d f ( x ) y un vector v m para obtener D v f ( x ) = d f ( x ) v m . Para v fijo, esto define una aplicación x m d f ( x ) v n , como la f original. Debido a que D v es una aplicación en 𝒳 = { todas las funciones de  m n } , se le llama un operador. La fórmula de Taylor f ( x + t ) = e D t f ( x ) se cumple en dimensiones arbitrarias:

Teorema 1. f ( x + t v ) = e D v t f = f ( x ) + D v t f ( x ) 1 ! + D v 2 t 2 f ( x ) 2 ! +

Demostración. Es el Taylor de una variable en la línea x + t v . La derivada direccional D v f es allí la derivada usual como lim t 0 [ f ( x + t v ) f ( x ) ] / t = D v f ( x ) . Técnicamente, necesitamos que la suma también converja: como funciones construidas a partir de polinomios, sin , cos , exp . ◻

17.2.2 Tensores y la representación de la serie de Taylor multidimensional

La fórmula de Taylor se puede escribir usando derivadas sucesivas d f , d 2 f , d 3 f también, que entonces se llaman tensores. En el caso escalar n = 1 , la primera derivada d f ( x ) conduce al gradiente f ( x ) , la segunda derivada d 2 f ( x ) a la matriz hessiana H ( x ) que es una forma bilineal que actúa sobre pares de vectores. La tercera derivada d 3 f ( x ) actúa entonces sobre ternas de vectores, etc. Todavía se puede escribir como en una dimensión

Teorema 2. f(x)=f(x_{0})+f^{\prime}(x_{0})(x-x_{0})+f^{\prime \prime}(x_{0}) \frac{(x-x_{0})^{2}}{2 !}+\cdots

si escribimos f ( k ) = d k f . Para un polinomio, esto simplemente significa que primero escribimos el término constante, luego todos los términos lineales, luego todos los términos cuadráticos, luego todos los términos cúbicos, etc.

17.2.3 La aproximación local mediante linealización

Supongamos f : m y detengamos la serie de Taylor después del primer paso. Obtenemos L ( x 0 + v ) = f ( x 0 ) + f ( x 0 ) v . Es costumbre escribir esto con x = x 0 + v , v = x x 0 como L ( x ) = f ( x 0 ) + f ( x 0 ) ( x x 0 ) Esta función se llama la linealización de f . El núcleo de L f ( x 0 ) es una variedad lineal que aproxima la superficie { x f ( x ) f ( x 0 ) = 0 } . Si f : m n , entonces lo dicho se puede aplicar a cada componente f i de f , con 1 i n . No se puede enfatizar lo suficiente la importancia de esta linealización.2

17.2.4 Acercándose aún más: aproximaciones cuadráticas con hessianos

Si detenemos la serie de Taylor después de dos pasos, obtenemos la función Q ( x + v ) = f ( x ) + d f ( x ) v + v d 2 f ( x ) v / 2. La matriz H ( x ) = d 2 f ( x ) se llama la matriz hessiana en el punto x . También aquí es costumbre eliminar v escribiendo x = x 0 + v . Q ( x ) = f ( x 0 ) + f ( x 0 ) ( x x 0 ) + ( x x 0 ) H ( x 0 ) ( x x 0 ) / 2 se llama la aproximación cuadrática de f . El núcleo de Q f ( x 0 ) es la variedad cuadrática Q ( x ) f ( x 0 ) = x B x + A x = 0 , donde A = d f y B = d 2 f / 2 . Aproxima la superficie { x f ( x ) f ( x 0 ) = 0 } incluso mejor que la lineal. Si | x x 0 | es del orden ϵ , entonces | f ( x ) L ( x ) | es del orden ϵ 2 y | f ( x ) Q ( x ) | es del orden ϵ 3 . Esto se sigue de la fórmula exacta de Taylor con resto.3

17.2.5 El plano tangente a una superficie

Para obtener el plano tangente a una superficie f ( x ) = C , uno puede simplemente mirar la variedad lineal L ( x ) = C . Sin embargo, hay un método mejor:

El plano tangente a una superficie f ( x , y , z ) = C en ( x 0 , y 0 , z 0 ) es a x + b y + c z = d , donde [ a , b , c ] T = f ( x 0 , y 0 , z 0 ) y d = a x 0 + b y 0 + c z 0 .

17.2.6 Cómo los gradientes ayudan a encontrar planos tangentes a superficies

Esto se sigue del teorema fundamental de los gradientes:

Teorema 3. El gradiente f ( x 0 ) de f : m es perpendicular a la superficie S = { f ( x ) = f ( x 0 ) = C } en x 0 .

Demostración. Sea r ( t ) una curva en S con r ( 0 ) = x 0 . La regla de la cadena asegura d / d t f(r(t))=\nabla f(r(t)) \cdot r^{\prime}(t). Pero como f ( r ( t ) ) = c es constante, esto es cero, lo que asegura que r^{\prime}(t) es perpendicular al gradiente. Como esto funciona para cualquier curva, hemos terminado. ◻

17.3 EJEMPLOS

Ejemplo 1. Sea f : 2 dada como f ( x , y ) = x 3 y 2 + x + y 3 . ¿Cuál es la aproximación cuadrática en ( x 0 , y 0 ) = ( 1 , 1 ) ? Tenemos d f ( 1 , 1 ) = [ 4 , 5 ] y \begin{aligned} \nabla f(1,1)&=\left[\begin{array}{l} f_{x} \\ f_{y} \end{array}\right]=\left[\begin{array}{l} 4 \\ 5 \end{array}\right],\\ H(1,1)&=\left[\begin{array}{ll} f_{x x} & f_{x y} \\ f_{y x} & f_{y y} \end{array}\right]=\left[\begin{array}{ll} 6 & 6 \\ 6 & 8 \end{array}\right]. \end{aligned}

La linealización es L ( x , y ) = 4 ( x 1 ) + 5 ( y 1 ) + 3. La aproximación cuadrática es Q ( x , y ) = 3 + 4 ( x 1 ) + 5 ( y 1 ) + 6 ( x 1 ) 2 / 2 + 12 ( x 1 ) ( y 1 ) / 2 + 8 ( y 1 ) 2 / 2. Esta es la situación mostrada a la izquierda en la Figura (17.2). Para v = [ 7 , 2 ] T , la derivada direccional \begin{aligned} D_{v} f(1,1)&=\nabla f(1,1) \cdot v\\ &=[4,5]^{T} \cdot[7,2]=38. \end{aligned} La expansión de Taylor dada al principio es una serie finita porque f era un polinomio: \begin{aligned} f([1,1]+t[7,2])&=f(1+7 t, 1+2 t)\\ &=3+38 t+247 t^{2}+1023 t^{3}+1960 t^{4}+1372 t^{5}. \end{aligned}

Ejemplo 2. Para f ( x , y , z ) = x 4 + x 2 + y 2 + z 2 , el gradiente y el hessiano son \begin{aligned} \nabla f(1,1,1)&=\left[\begin{array}{l} f_{x} \\ f_{y} \\ f_{z} \end{array}\right]=\left[\begin{array}{l} 2 \\ 2 \\ 2 \end{array}\right],\\ H(1,1,1)&=\left[\begin{array}{lll} f_{x x} & f_{x y} & f_{x z} \\ f_{y x} & f_{y y} & f_{y z} \\ f_{z x} & f_{z y} & f_{z z} \end{array}\right]=\left[\begin{array}{ccc} -10 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 2 \end{array}\right]. \end{aligned}

La linealización es L ( x , y , z ) = 2 2 ( x 1 ) + 2 ( y 1 ) + 2 ( z 1 ) . La aproximación cuadrática Q ( x , y , z ) = 2 2 ( x 1 ) + 2 ( y 1 ) + 2 ( z 1 ) + ( 10 ( x 1 ) 2 + 2 ( y 1 ) 2 + 2 ( z 1 ) 2 ) / 2 es la situación mostrada a la derecha en la Figura (17.2).

Ejemplo 3. ¿Cuál es el plano tangente a la superficie f ( x , y , z ) = 1 / 10 para \begin{aligned} f(x, y, z)&=10 z^{2}-x^{2}-y^{2}+100 x^{4}-200 x^{6}+100 x^{8}-200 x^{2} y^{2}+200 x^{4} y^{2}+100 y^{4}\\ &=1 / 10 \end{aligned} en el punto ( x , y , z ) = ( 0 , 0 , 1 / 10 ) ? El gradiente es f ( 0 , 0 , 1 / 10 ) = [ 0 0 2 ] . La ecuación del plano tangente es 2 z = d , donde la constante d se obtiene sustituyendo el punto. Terminamos con 2 z = 2 / 10 . La linealización es L ( x , y , z ) = 1 / 20 + 2 ( z 1 / 10 ) .

EJERCICIOS

Ejercicio 1. Sea r ( t ) = [ 3 t + cos ( t ) , t + 4 sin ( t ) ] T una curva y f ( [ x , y ] T ) = [ x 3 + y , x + 2 y + y 3 ] T un cambio de coordenadas.

  1. Calcule v=r^{\prime}(0) en t = 0 , luego d f ( x , y ) y A = d f ( r ( 0 ) ) y d f(r(0)) r^{\prime}(0)=A v.
  2. Calcule R ( t ) = f ( r ( t ) ) primero, luego encuentre w=R^{\prime}(0). Debe coincidir con a).

Ejercicio 2.

  1. La superficie f ( x , y , z ) = x 2 + y 2 4 + z 2 9 = 4 + 1 / 4 + 1 / 9 es un elipsoide. Calcule z x ( x , y ) en el punto ( x , y , z ) = ( 2 , 1 , 1 ) usando la regla de diferenciación implícita. (Use la fórmula).
  2. Aplique el paso de Newton 3 veces comenzando con x = 2 para resolver la ecuación x 2 2 = 0 .

Ejercicio 3. Evalúe sin tecnología la raíz cúbica de 1002 usando aproximación cuadrática. Especialmente observe qué tan cerca está del valor real.

Ejercicio 4.

  1. Encuentre el plano tangente a la superficie f ( x , y , z ) = x y z = 60 en ( x , y , z ) = ( 100 , 36 , 1 ) .
  2. Estime 100.1 36.1 0.999 usando aproximación lineal (calcule L ( x , y , z ) en lugar de f ( x , y , z ) .)

Ejercicio 5. Encuentre la aproximación cuadrática Q ( x , y ) de f ( x , y ) = x 3 + x 2 y + x 2 + y 2 2 x + 3 x y en el punto ( 1 , 2 ) calculando el vector gradiente f ( 1 , 2 ) y la matriz hessiana H ( 1 , 2 ) . El vector f ( 1 , 2 ) es una matriz 1 × 2 (vector fila) y la matriz hessiana H ( 1 , 2 ) es una matriz 2 × 2 .


  1. El libro de Feynman "What do you care what other people think".↩︎
  2. De nuevo: la idea de linealización es sumamente importante porque introduce el álgebra lineal.↩︎
  3. Si f C n + 1 , f ( x + t ) = k = 0 n f ( k ) ( x ) t k / k ! + 0 t ( t s ) n f ( n + 1 ) ( x + s ) / n ! d s . (¡demuestre esto por inducción!)↩︎