Aproximação de Taylor

Índice

17.1 INTRODUÇÃO
17.2 AULA
17.3 EXEMPLOS
EXERCÍCIOS

17.1 INTRODUÇÃO

17.1.1 Como a Linearidade Ajudou Feynman a Conquistar a Raiz Cúbica

Segundo a lenda¹, Richard Feynman aceitou o desafio de calcular a raiz cúbica de $1729, 03$ contra um ábaco. Usando aproximação linear e um pouco de sorte, ele conseguiu obter $12, 002384$ com papel e lápis. A raiz cúbica verdadeira é $12, 002383785691718123057$ . Como Feynman fez isso? O segredo está na aproximação linear. Isso significa que aproximamos uma função como $f (x) = x^{1 / 3}$ com uma função linear. O mesmo pode ser feito com funções de várias variáveis. A aproximação linear tem a forma L(x)=f(a)+f^{\prime}(a)(x-a).

**Figura 1.** A cena do ábaco no filme "Infinity".

17.1.2 Além das Aproximações Lineares

Também é possível fazer aproximações de ordem superior. A função $f (x) = e^{x}$ , por exemplo, tem a aproximação linear $L (x) = 1 + x$ em $a = 0$ e a aproximação quadrática $Q (x) = 1 + x + x^{2} / 2$ em $a = 0$ . Para obter o termo quadrático, basta garantir que a primeira e a segunda derivada em $x = a$ coincidam. Isso fornece a fórmula Q(x)=f(a)+f^{\prime}(a)(x-a)+f^{\prime \prime}(a)(x-a)^{2} / 2. De fato, você pode verificar que $f (x)$ e $Q (x)$ têm as mesmas primeiras derivadas e as mesmas segundas derivadas em $x = a$ . Uma aproximação de grau $n$ é então o polinômio $P_{n} (x) = \sum_{k = 0}^{n} f^{(k)} (a) \frac{(x - a)^{k}}{k!} .$ Para a função $e^{x}$ , por exemplo, temos a aproximação de ordem $m$ $e^{x} = 1 + x + x^{2} / 2! + x^{3} / 3! + \dots + x^{n} / n! .$

17.1.3 Aproximações Multivariáveis

O mesmo pode ser feito em dimensões superiores. Tudo é análogo. Apenas temos que usar a derivada $d f$ em vez da derivada usual f^{\prime}. Aqui, analisamos apenas a aproximação linear e quadrática de funções $ℝ^{n} \to ℝ$ . A aproximação linear é então $L (x) = f (a) + \nabla f (a) (x - a)$ onde $\nabla f (a) = d f (a) = [f_{x_{1}} (a), \dots, f_{x_{n}} (a)]$ é a matriz Jacobiana, que é um vetor linha. Agora, como podemos ver $d f (x) : ℝ^{n} \to ℝ^{n}$ , a segunda derivada é uma matriz $d^{2} f (x) = H (x)$ . Ela é chamada de Hessiano. Ela codifica todas as segundas derivadas $H_{i j} (x) =$ $f_{x_{i} x_{j}}$ .

17.2 AULA

17.2.1 Revelando a Fórmula de Taylor Multidimensional

Dada uma função $f : ℝ^{m} \to ℝ^{n}$ , sua derivada $d f (x)$ é a matriz Jacobiana. Para todo $x \in ℝ^{m}$ , podemos usar a matriz $d f (x)$ e um vetor $v \in ℝ^{m}$ para obter $D_{v} f (x) =$ $d f (x) v \in ℝ^{m}$ . Para $v$ fixo, isso define uma aplicação $x \in ℝ^{m} \to d f (x) v \in ℝ^{n}$ , como a $f$ original. Como $D_{v}$ é uma aplicação em $𝒳 = {todas as funções de ℝ^{m} \to ℝ^{n}},$ chamamos isso de operador. A fórmula de Taylor $f (x + t) = e^{D t} f (x)$ vale em dimensões arbitrárias:

Teorema 1. $f (x + t v) = e^{D_{v} t} f = f (x) + \frac{D_{v} t f (x)}{1!} + \frac{D_{v}^{2} t^{2} f (x)}{2!} + \dots$

Demonstração. É a fórmula de Taylor univariada na reta $x + t v$ . A derivada direcional $D_{v} f$ é, nesse caso, a derivada usual, pois $lim_{t \to 0} [f (x + t v) - f (x)] / t = D_{v} f (x) .$ Tecnicamente, também precisamos que a soma convirja: como funções construídas a partir de polinômios, $\sin$ , $\cos$ , $\exp$ . ◻

17.2.2 Tensores e a Representação da Série de Taylor Multidimensional

A fórmula de Taylor também pode ser escrita usando derivadas sucessivas $d f$ , $d^{2} f$ , $d^{3} f$ , que são então chamadas de tensores. No caso escalar $n = 1$ , a primeira derivada $d f (x)$ leva ao gradiente $\nabla f (x)$ , a segunda derivada $d^{2} f (x)$ leva à matriz Hessiana $H (x)$ , que é uma forma bilinear que atua em pares de vetores. A terceira derivada $d^{3} f (x)$ atua então em triplas de vetores, etc. Ainda podemos escrever como em uma dimensão

Teorema 2. f(x)=f(x_{0})+f^{\prime}(x_{0})(x-x_{0})+f^{\prime \prime}(x_{0}) \frac{(x-x_{0})^{2}}{2 !}+\cdots

se escrevermos $f^{(k)} = d^{k} f$ . Para um polinômio, isso significa simplesmente que primeiro escrevemos o termo constante, depois todos os termos lineares, depois todos os termos quadráticos, depois todos os termos cúbicos, etc.

17.2.3 A Aproximação Local por Linearização

Suponha $f : ℝ^{m} \to ℝ$ e interrompa a série de Taylor após o primeiro passo. Obtemos $L (x_{0} + v) = f (x_{0}) + \nabla f (x_{0}) \cdot v .$ É costume escrever isso com $x = x_{0} + v$ , $v = x - x_{0}$ como $L (x) = f (x_{0}) + \nabla f (x_{0}) \cdot (x - x_{0})$ Essa função é chamada de linearização de $f$ . O núcleo de $L - f (x_{0})$ é uma variedade linear que aproxima a superfície ${x ∣ f (x) - f (x_{0}) = 0} .$ Se $f : ℝ^{m} \to ℝ^{n}$ , então o que foi dito pode ser aplicado a cada componente $f_{i}$ de $f$ , com $1 \leq i \leq n$ . Não se pode enfatizar demais a importância dessa linearização.²

17.2.4 Chegando Ainda Mais Perto: Aproximações Quadráticas com Hessianos

Se interrompermos a série de Taylor após dois passos, obtemos a função $Q (x + v) = f (x) + d f (x) \cdot v + v \cdot d^{2} f (x) \cdot v / 2.$ A matriz $H (x) = d^{2} f (x)$ é chamada de matriz Hessiana no ponto $x$ . Também aqui é costume eliminar $v$ escrevendo $x = x_{0} + v$ . $Q (x) = f (x_{0}) + \nabla f (x_{0}) \cdot (x - x_{0}) + (x - x_{0}) \cdot H (x_{0}) (x - x_{0}) / 2$ é chamada de aproximação quadrática de $f$ . O núcleo de $Q - f (x_{0})$ é a variedade quadrática $Q (x) - f (x_{0}) = x \cdot B x + A x = 0,$ onde $A = d f$ e $B = d^{2} f / 2$ . Ela aproxima a superfície ${x ∣ f (x) - f (x_{0}) = 0}$ ainda melhor do que a linear. Se $| x - x_{0} |$ for da ordem de $ϵ$ , então $| f (x) - L (x) |$ é da ordem de $ϵ^{2}$ e $| f (x) - Q (x) |$ é da ordem de $ϵ^{3}$ . Isso decorre da exata fórmula de Taylor com resto.³

17.2.5 O Plano Tangente a uma Superfície

Para obter o plano tangente a uma superfície $f (x) = C$ , podemos simplesmente olhar para a variedade linear $L (x) = C$ . No entanto, existe um método melhor:

O plano tangente a uma superfície $f (x, y, z) = C$ em $(x_{0}, y_{0}, z_{0})$ é $a x + b y + c z =$ $d$ , onde $[a, b, c]^{T} = \nabla f (x_{0}, y_{0}, z_{0})$ e $d = a x_{0} + b y_{0} + c z_{0}$ .

17.2.6 Como os Gradientes Ajudam a Encontrar Planos Tangentes a Superfícies

Isso decorre do teorema fundamental dos gradientes:

Teorema 3. O gradiente $\nabla f (x_{0})$ de $f : ℝ^{m} \to ℝ$ é perpendicular à superfície $S = {f (x) = f (x_{0}) = C}$ em $x_{0}$ .

Demonstração. Seja $r (t)$ uma curva sobre $S$ com $r (0) = x_{0}$ . A regra da cadeia garante d / d t f(r(t))=\nabla f(r(t)) \cdot r^{\prime}(t). Mas, como $f (r (t)) = c$ é constante, isso é zero, garantindo que r^{\prime}(t) seja perpendicular ao gradiente. Como isso vale para qualquer curva, está provado. ◻

17.3 EXEMPLOS

Exemplo 1. Seja $f : ℝ^{2} \to ℝ$ dada por $f (x, y) = x^{3} y^{2} + x + y^{3}$ . Qual é a aproximação quadrática em $(x_{0}, y_{0}) = (1, 1)$ ? Temos $d f (1, 1) = [4, 5]$ e \begin{aligned} \nabla f(1,1)&=\left[\begin{array}{l} f_{x} \\ f_{y} \end{array}\right]=\left[\begin{array}{l} 4 \\ 5 \end{array}\right],\\ H(1,1)&=\left[\begin{array}{ll} f_{x x} & f_{x y} \\ f_{y x} & f_{y y} \end{array}\right]=\left[\begin{array}{ll} 6 & 6 \\ 6 & 8 \end{array}\right]. \end{aligned}

A linearização é $L (x, y) = 4 (x - 1) + 5 (y - 1) + 3.$ A aproximação quadrática é $Q (x, y) = 3 + 4 (x - 1) + 5 (y - 1) + 6 (x - 1)^{2} / 2 + 12 (x - 1) (y - 1) / 2 + 8 (y - 1)^{2} / 2.$ Esta é a situação exibida à esquerda na Figura (17.2). Para $v = [7, 2]^{T}$ , a derivada direcional \begin{aligned} D_{v} f(1,1)&=\nabla f(1,1) \cdot v\\ &=[4,5]^{T} \cdot[7,2]=38. \end{aligned} A expansão de Taylor dada no início é uma série finita porque $f$ era um polinômio: \begin{aligned} f([1,1]+t[7,2])&=f(1+7 t, 1+2 t)\\ &=3+38 t+247 t^{2}+1023 t^{3}+1960 t^{4}+1372 t^{5}. \end{aligned}

Exemplo 2. Para $f (x, y, z) = - x^{4} + x^{2} + y^{2} + z^{2}$ , o gradiente e o Hessiano são \begin{aligned} \nabla f(1,1,1)&=\left[\begin{array}{l} f_{x} \\ f_{y} \\ f_{z} \end{array}\right]=\left[\begin{array}{l} 2 \\ 2 \\ 2 \end{array}\right],\\ H(1,1,1)&=\left[\begin{array}{lll} f_{x x} & f_{x y} & f_{x z} \\ f_{y x} & f_{y y} & f_{y z} \\ f_{z x} & f_{z y} & f_{z z} \end{array}\right]=\left[\begin{array}{ccc} -10 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 2 \end{array}\right]. \end{aligned}

A linearização é $L (x, y, z) = 2 - 2 (x - 1) + 2 (y - 1) + 2 (z - 1) .$ A aproximação quadrática $Q (x, y, z) = 2 - 2 (x - 1) + 2 (y - 1) + 2 (z - 1) + (- 10 (x - 1)^{2} + 2 (y - 1)^{2} + 2 (z - 1)^{2}) / 2$ é a situação exibida à direita na Figura (17.2).

Exemplo 3. Qual é o plano tangente à superfície $f (x, y, z) = 1 / 10$ para \begin{aligned} f(x, y, z)&=10 z^{2}-x^{2}-y^{2}+100 x^{4}-200 x^{6}+100 x^{8}-200 x^{2} y^{2}+200 x^{4} y^{2}+100 y^{4}\\ &=1 / 10 \end{aligned} no ponto $(x, y, z) = (0, 0, 1 / 10)$ ? O gradiente é $\nabla f (0, 0, 1 / 10) = [\begin{array}{l} 0 \\ 0 \\ 2 \end{array}] .$ A equação do plano tangente é $2 z = d$ , onde a constante $d$ é obtida substituindo o ponto. Obtemos $2 z = 2 / 10$ . A linearização é $L (x, y, z) = 1 / 20 + 2 (z - 1 / 10)$ .

EXERCÍCIOS

Exercício 1. Seja $r (t) = [3 t + \cos (t), t + 4 \sin (t)]^{T}$ uma curva e $f ([x, y]^{T}) = {[x^{3} + y, x + 2 y + y^{3}]}^{T}$ uma mudança de coordenadas.

Calcule v=r^{\prime}(0) em $t = 0$ , depois $d f (x, y)$ e $A = d f (r (0))$ e d f(r(0)) r^{\prime}(0)=A v.
Calcule $R (t) = f (r (t))$ primeiro, depois encontre w=R^{\prime}(0). Deve coincidir com a).

Exercício 2.

A superfície $f (x, y, z) = x^{2} + \frac{y^{2}}{4} + \frac{z^{2}}{9} = 4 + 1 / 4 + 1 / 9$ é um elipsoide. Calcule $z_{x} (x, y)$ no ponto $(x, y, z) = (2, 1, 1)$ usando a regra de derivação implícita. (Use a fórmula).
Aplique o passo de Newton 3 vezes começando com $x = 2$ para resolver a equação $x^{2} - 2 = 0$ .

Exercício 3. Avalie, sem usar tecnologia, a raiz cúbica de $1002$ usando aproximação quadrática. Observe especialmente quão próximo você fica do valor real.

Exercício 4.

Encontre o plano tangente à superfície $f (x, y, z) =$ $\sqrt{x y z} = 60$ em $(x, y, z) = (100, 36, 1)$ .
Estime $\sqrt{100, 1 \cdot 36, 1 \cdot 0, 999}$ usando aproximação linear (calcule $L (x, y, z)$ em vez de $f (x, y, z)$ ).

Exercício 5. Encontre a aproximação quadrática $Q (x, y)$ de $f (x, y) = x^{3} + x^{2} y + x^{2} + y^{2} - 2 x + 3 x y$ no ponto $(1, 2)$ calculando o vetor gradiente $\nabla f (1, 2)$ e a matriz Hessiana $H (1, 2)$ . O vetor $\nabla f (1, 2)$ é uma matriz $1 \times 2$ (vetor linha) e a matriz Hessiana $H (1, 2)$ é uma matriz $2 \times 2$ .

Livro de Feynman "What do you care what other people think".↩︎
Novamente: a ideia de linearização é extremamente importante porque traz a álgebra linear.↩︎
Se $f \in C^{n + 1}$ , $f (x + t) = \sum_{k = 0}^{n} f^{(k)} (x) t^{k} / k! + \int_{0}^{t} (t - s)^{n} f^{(n + 1)} (x + s) / n! d s .$ (prove isso por indução!)↩︎