Aproximação de Taylor


 

17.1 INTRODUÇÃO

17.1.1 Como a Linearidade Ajudou Feynman a Conquistar a Raiz Cúbica

Segundo a lenda1, Richard Feynman aceitou o desafio de calcular a raiz cúbica de 1729 , 03 contra um ábaco. Usando aproximação linear e um pouco de sorte, ele conseguiu obter 12 , 002384 com papel e lápis. A raiz cúbica verdadeira é 12 , 002383785691718123057 . Como Feynman fez isso? O segredo está na aproximação linear. Isso significa que aproximamos uma função como f ( x ) = x 1 / 3 com uma função linear. O mesmo pode ser feito com funções de várias variáveis. A aproximação linear tem a forma L(x)=f(a)+f^{\prime}(a)(x-a).

Figura 1. A cena do ábaco no filme "Infinity".

17.1.2 Além das Aproximações Lineares

Também é possível fazer aproximações de ordem superior. A função f ( x ) = e x , por exemplo, tem a aproximação linear L ( x ) = 1 + x em a = 0 e a aproximação quadrática Q ( x ) = 1 + x + x 2 / 2 em a = 0 . Para obter o termo quadrático, basta garantir que a primeira e a segunda derivada em x = a coincidam. Isso fornece a fórmula Q(x)=f(a)+f^{\prime}(a)(x-a)+f^{\prime \prime}(a)(x-a)^{2} / 2. De fato, você pode verificar que f ( x ) e Q ( x ) têm as mesmas primeiras derivadas e as mesmas segundas derivadas em x = a . Uma aproximação de grau n é então o polinômio P n ( x ) = k = 0 n f ( k ) ( a ) ( x a ) k k ! . Para a função e x , por exemplo, temos a aproximação de ordem m e x = 1 + x + x 2 / 2 ! + x 3 / 3 ! + + x n / n ! .

17.1.3 Aproximações Multivariáveis

O mesmo pode ser feito em dimensões superiores. Tudo é análogo. Apenas temos que usar a derivada d f em vez da derivada usual f^{\prime}. Aqui, analisamos apenas a aproximação linear e quadrática de funções n . A aproximação linear é então L ( x ) = f ( a ) + f ( a ) ( x a ) onde f ( a ) = d f ( a ) = [ f x 1 ( a ) , , f x n ( a ) ] é a matriz Jacobiana, que é um vetor linha. Agora, como podemos ver d f ( x ) : n n , a segunda derivada é uma matriz d 2 f ( x ) = H ( x ) . Ela é chamada de Hessiano. Ela codifica todas as segundas derivadas H i j ( x ) = f x i x j .

17.2 AULA

17.2.1 Revelando a Fórmula de Taylor Multidimensional

Dada uma função f : m n , sua derivada d f ( x ) é a matriz Jacobiana. Para todo x m , podemos usar a matriz d f ( x ) e um vetor v m para obter D v f ( x ) = d f ( x ) v m . Para v fixo, isso define uma aplicação x m d f ( x ) v n , como a f original. Como D v é uma aplicação em 𝒳 = { todas as funções de  m n } , chamamos isso de operador. A fórmula de Taylor f ( x + t ) = e D t f ( x ) vale em dimensões arbitrárias:

Teorema 1. f ( x + t v ) = e D v t f = f ( x ) + D v t f ( x ) 1 ! + D v 2 t 2 f ( x ) 2 ! +

Demonstração. É a fórmula de Taylor univariada na reta x + t v . A derivada direcional D v f é, nesse caso, a derivada usual, pois lim t 0 [ f ( x + t v ) f ( x ) ] / t = D v f ( x ) . Tecnicamente, também precisamos que a soma convirja: como funções construídas a partir de polinômios, sin , cos , exp . ◻

17.2.2 Tensores e a Representação da Série de Taylor Multidimensional

A fórmula de Taylor também pode ser escrita usando derivadas sucessivas d f , d 2 f , d 3 f , que são então chamadas de tensores. No caso escalar n = 1 , a primeira derivada d f ( x ) leva ao gradiente f ( x ) , a segunda derivada d 2 f ( x ) leva à matriz Hessiana H ( x ) , que é uma forma bilinear que atua em pares de vetores. A terceira derivada d 3 f ( x ) atua então em triplas de vetores, etc. Ainda podemos escrever como em uma dimensão

Teorema 2. f(x)=f(x_{0})+f^{\prime}(x_{0})(x-x_{0})+f^{\prime \prime}(x_{0}) \frac{(x-x_{0})^{2}}{2 !}+\cdots

se escrevermos f ( k ) = d k f . Para um polinômio, isso significa simplesmente que primeiro escrevemos o termo constante, depois todos os termos lineares, depois todos os termos quadráticos, depois todos os termos cúbicos, etc.

17.2.3 A Aproximação Local por Linearização

Suponha f : m e interrompa a série de Taylor após o primeiro passo. Obtemos L ( x 0 + v ) = f ( x 0 ) + f ( x 0 ) v . É costume escrever isso com x = x 0 + v , v = x x 0 como L ( x ) = f ( x 0 ) + f ( x 0 ) ( x x 0 ) Essa função é chamada de linearização de f . O núcleo de L f ( x 0 ) é uma variedade linear que aproxima a superfície { x f ( x ) f ( x 0 ) = 0 } . Se f : m n , então o que foi dito pode ser aplicado a cada componente f i de f , com 1 i n . Não se pode enfatizar demais a importância dessa linearização.2

17.2.4 Chegando Ainda Mais Perto: Aproximações Quadráticas com Hessianos

Se interrompermos a série de Taylor após dois passos, obtemos a função Q ( x + v ) = f ( x ) + d f ( x ) v + v d 2 f ( x ) v / 2. A matriz H ( x ) = d 2 f ( x ) é chamada de matriz Hessiana no ponto x . Também aqui é costume eliminar v escrevendo x = x 0 + v . Q ( x ) = f ( x 0 ) + f ( x 0 ) ( x x 0 ) + ( x x 0 ) H ( x 0 ) ( x x 0 ) / 2 é chamada de aproximação quadrática de f . O núcleo de Q f ( x 0 ) é a variedade quadrática Q ( x ) f ( x 0 ) = x B x + A x = 0 , onde A = d f e B = d 2 f / 2 . Ela aproxima a superfície { x f ( x ) f ( x 0 ) = 0 } ainda melhor do que a linear. Se | x x 0 | for da ordem de ϵ , então | f ( x ) L ( x ) | é da ordem de ϵ 2 e | f ( x ) Q ( x ) | é da ordem de ϵ 3 . Isso decorre da exata fórmula de Taylor com resto.3

17.2.5 O Plano Tangente a uma Superfície

Para obter o plano tangente a uma superfície f ( x ) = C , podemos simplesmente olhar para a variedade linear L ( x ) = C . No entanto, existe um método melhor:

O plano tangente a uma superfície f ( x , y , z ) = C em ( x 0 , y 0 , z 0 ) é a x + b y + c z = d , onde [ a , b , c ] T = f ( x 0 , y 0 , z 0 ) e d = a x 0 + b y 0 + c z 0 .

17.2.6 Como os Gradientes Ajudam a Encontrar Planos Tangentes a Superfícies

Isso decorre do teorema fundamental dos gradientes:

Teorema 3. O gradiente f ( x 0 ) de f : m é perpendicular à superfície S = { f ( x ) = f ( x 0 ) = C } em x 0 .

Demonstração. Seja r ( t ) uma curva sobre S com r ( 0 ) = x 0 . A regra da cadeia garante d / d t f(r(t))=\nabla f(r(t)) \cdot r^{\prime}(t). Mas, como f ( r ( t ) ) = c é constante, isso é zero, garantindo que r^{\prime}(t) seja perpendicular ao gradiente. Como isso vale para qualquer curva, está provado. ◻

17.3 EXEMPLOS

Exemplo 1. Seja f : 2 dada por f ( x , y ) = x 3 y 2 + x + y 3 . Qual é a aproximação quadrática em ( x 0 , y 0 ) = ( 1 , 1 ) ? Temos d f ( 1 , 1 ) = [ 4 , 5 ] e \begin{aligned} \nabla f(1,1)&=\left[\begin{array}{l} f_{x} \\ f_{y} \end{array}\right]=\left[\begin{array}{l} 4 \\ 5 \end{array}\right],\\ H(1,1)&=\left[\begin{array}{ll} f_{x x} & f_{x y} \\ f_{y x} & f_{y y} \end{array}\right]=\left[\begin{array}{ll} 6 & 6 \\ 6 & 8 \end{array}\right]. \end{aligned}

A linearização é L ( x , y ) = 4 ( x 1 ) + 5 ( y 1 ) + 3. A aproximação quadrática é Q ( x , y ) = 3 + 4 ( x 1 ) + 5 ( y 1 ) + 6 ( x 1 ) 2 / 2 + 12 ( x 1 ) ( y 1 ) / 2 + 8 ( y 1 ) 2 / 2. Esta é a situação exibida à esquerda na Figura (17.2). Para v = [ 7 , 2 ] T , a derivada direcional \begin{aligned} D_{v} f(1,1)&=\nabla f(1,1) \cdot v\\ &=[4,5]^{T} \cdot[7,2]=38. \end{aligned} A expansão de Taylor dada no início é uma série finita porque f era um polinômio: \begin{aligned} f([1,1]+t[7,2])&=f(1+7 t, 1+2 t)\\ &=3+38 t+247 t^{2}+1023 t^{3}+1960 t^{4}+1372 t^{5}. \end{aligned}

Exemplo 2. Para f ( x , y , z ) = x 4 + x 2 + y 2 + z 2 , o gradiente e o Hessiano são \begin{aligned} \nabla f(1,1,1)&=\left[\begin{array}{l} f_{x} \\ f_{y} \\ f_{z} \end{array}\right]=\left[\begin{array}{l} 2 \\ 2 \\ 2 \end{array}\right],\\ H(1,1,1)&=\left[\begin{array}{lll} f_{x x} & f_{x y} & f_{x z} \\ f_{y x} & f_{y y} & f_{y z} \\ f_{z x} & f_{z y} & f_{z z} \end{array}\right]=\left[\begin{array}{ccc} -10 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 2 \end{array}\right]. \end{aligned}

A linearização é L ( x , y , z ) = 2 2 ( x 1 ) + 2 ( y 1 ) + 2 ( z 1 ) . A aproximação quadrática Q ( x , y , z ) = 2 2 ( x 1 ) + 2 ( y 1 ) + 2 ( z 1 ) + ( 10 ( x 1 ) 2 + 2 ( y 1 ) 2 + 2 ( z 1 ) 2 ) / 2 é a situação exibida à direita na Figura (17.2).

Exemplo 3. Qual é o plano tangente à superfície f ( x , y , z ) = 1 / 10 para \begin{aligned} f(x, y, z)&=10 z^{2}-x^{2}-y^{2}+100 x^{4}-200 x^{6}+100 x^{8}-200 x^{2} y^{2}+200 x^{4} y^{2}+100 y^{4}\\ &=1 / 10 \end{aligned} no ponto ( x , y , z ) = ( 0 , 0 , 1 / 10 ) ? O gradiente é f ( 0 , 0 , 1 / 10 ) = [ 0 0 2 ] . A equação do plano tangente é 2 z = d , onde a constante d é obtida substituindo o ponto. Obtemos 2 z = 2 / 10 . A linearização é L ( x , y , z ) = 1 / 20 + 2 ( z 1 / 10 ) .

EXERCÍCIOS

Exercício 1. Seja r ( t ) = [ 3 t + cos ( t ) , t + 4 sin ( t ) ] T uma curva e f ( [ x , y ] T ) = [ x 3 + y , x + 2 y + y 3 ] T uma mudança de coordenadas.

  1. Calcule v=r^{\prime}(0) em t = 0 , depois d f ( x , y ) e A = d f ( r ( 0 ) ) e d f(r(0)) r^{\prime}(0)=A v.
  2. Calcule R ( t ) = f ( r ( t ) ) primeiro, depois encontre w=R^{\prime}(0). Deve coincidir com a).

Exercício 2.

  1. A superfície f ( x , y , z ) = x 2 + y 2 4 + z 2 9 = 4 + 1 / 4 + 1 / 9 é um elipsoide. Calcule z x ( x , y ) no ponto ( x , y , z ) = ( 2 , 1 , 1 ) usando a regra de derivação implícita. (Use a fórmula).
  2. Aplique o passo de Newton 3 vezes começando com x = 2 para resolver a equação x 2 2 = 0 .

Exercício 3. Avalie, sem usar tecnologia, a raiz cúbica de 1002 usando aproximação quadrática. Observe especialmente quão próximo você fica do valor real.

Exercício 4.

  1. Encontre o plano tangente à superfície f ( x , y , z ) = x y z = 60 em ( x , y , z ) = ( 100 , 36 , 1 ) .
  2. Estime 100 , 1 36 , 1 0 , 999 usando aproximação linear (calcule L ( x , y , z ) em vez de f ( x , y , z ) ).

Exercício 5. Encontre a aproximação quadrática Q ( x , y ) de f ( x , y ) = x 3 + x 2 y + x 2 + y 2 2 x + 3 x y no ponto ( 1 , 2 ) calculando o vetor gradiente f ( 1 , 2 ) e a matriz Hessiana H ( 1 , 2 ) . O vetor f ( 1 , 2 ) é uma matriz 1 × 2 (vetor linha) e a matriz Hessiana H ( 1 , 2 ) é uma matriz 2 × 2 .


  1. Livro de Feynman "What do you care what other people think".↩︎
  2. Novamente: a ideia de linearização é extremamente importante porque traz a álgebra linear.↩︎
  3. Se f C n + 1 , f ( x + t ) = k = 0 n f ( k ) ( x ) t k / k ! + 0 t ( t s ) n f ( n + 1 ) ( x + s ) / n ! d s . (prove isso por indução!)↩︎