Approximation de Taylor


 

17.1 INTRODUCTION

17.1.1 Comment la linéarité a aidé Feynman à conquérir la racine cubique

Selon la légende1, Richard Feynman s'est lancé le défi de calculer la racine cubique de 1729.03 contre un calcul à l'abaque. En utilisant l'approximation linéaire et un peu de chance, il a pu obtenir 12.002384 avec du papier et un crayon. La véritable racine cubique est 12.002383785691718123057 . Comment Feynman a-t-il fait ? Le secret réside dans l'approximation linéaire. Cela signifie que l'on approxime une fonction comme f ( x ) = x 1 / 3 par une fonction linéaire. On peut faire la même chose avec des fonctions de plusieurs variables. L'approximation linéaire est de la forme L(x)=f(a)+f^{\prime}(a)(x-a).

Figure 1. La scène de l'abaque dans le film « Infinity ».

17.1.2 Au-delà des approximations linéaires

On peut également faire des approximations d'ordre supérieur. La fonction f ( x ) = e x par exemple a pour approximation linéaire L ( x ) = 1 + x en a = 0 et pour approximation quadratique Q ( x ) = 1 + x + x 2 / 2 en a = 0 . Pour obtenir le terme quadratique, il suffit de s'assurer que les dérivées première et seconde en x = a coïncident. Cela donne la formule Q(x)=f(a)+f^{\prime}(a)(x-a)+f^{\prime \prime}(a)(x-a)^{2} / 2. En effet, on peut vérifier que f ( x ) et Q ( x ) ont les mêmes dérivées premières et les mêmes dérivées secondes en x = a . Une approximation de degré n est alors le polynôme P n ( x ) = k = 0 n f ( k ) ( a ) ( x a ) k k ! . Pour la fonction e x par exemple, on a l'approximation d'ordre m e x = 1 + x + x 2 / 2 ! + x 3 / 3 ! + + x n / n ! .

17.1.3 Approximations multivariables

On peut faire la même chose en dimensions supérieures. Tout est identique. Il faut simplement utiliser la dérivée d f plutôt que la dérivée usuelle f^{\prime}. Nous ne considérons ici que l'approximation linéaire et quadratique des fonctions n . L'approximation linéaire est alors L ( x ) = f ( a ) + f ( a ) ( x a ) f ( a ) = d f ( a ) = [ f x 1 ( a ) , , f x n ( a ) ] est la matrice jacobienne, qui est un vecteur ligne. Maintenant, puisque l'on peut voir d f ( x ) : n n , la dérivée seconde est une matrice d 2 f ( x ) = H ( x ) . On l'appelle la Hessienne. Elle encode toutes les dérivées secondes H i j ( x ) = f x i x j .

17.2 COURS

17.2.1 Dévoilement de la formule de Taylor multidimensionnelle

Étant donnée une fonction f : m n , sa dérivée d f ( x ) est la matrice jacobienne. Pour tout x m , on peut utiliser la matrice d f ( x ) et un vecteur v m pour obtenir D v f ( x ) = d f ( x ) v m . Pour v fixé, cela définit une application x m d f ( x ) v n , comme le f original. Parce que D v est une application sur 𝒳 = { toutes les fonctions de  m n } , on l'appelle un opérateur. La formule de Taylor f ( x + t ) = e D t f ( x ) est valable en dimensions arbitraires :

Théorème 1. f ( x + t v ) = e D v t f = f ( x ) + D v t f ( x ) 1 ! + D v 2 t 2 f ( x ) 2 ! +

Preuve. C'est le développement de Taylor à une variable sur la droite x + t v . La dérivée directionnelle D v f y est la dérivée usuelle car lim t 0 [ f ( x + t v ) f ( x ) ] / t = D v f ( x ) . Techniquement, il faut aussi que la somme converge : comme les fonctions construites à partir de polynômes, sin , cos , exp . ◻

17.2.2 Tenseurs et représentation en série de Taylor multidimensionnelle

La formule de Taylor peut également s'écrire à l'aide des dérivées successives d f , d 2 f , d 3 f , que l'on appelle alors des tenseurs. Dans le cas scalaire n = 1 , la dérivée première d f ( x ) conduit au gradient f ( x ) , la dérivée seconde d 2 f ( x ) à la matrice Hessienne H ( x ) qui est une forme bilinéaire agissant sur des paires de vecteurs. La dérivée troisième d 3 f ( x ) agit alors sur des triplets de vecteurs, etc. On peut toujours écrire comme en une dimension

Théorème 2. f(x)=f(x_{0})+f^{\prime}(x_{0})(x-x_{0})+f^{\prime \prime}(x_{0}) \frac{(x-x_{0})^{2}}{2 !}+\cdots

si l'on écrit f ( k ) = d k f . Pour un polynôme, cela signifie simplement que l'on écrit d'abord la constante, puis tous les termes linéaires, puis tous les termes quadratiques, puis tous les termes cubiques, etc.

17.2.3 L'approximation locale par linéarisation

Supposons f : m et arrêtons la série de Taylor après le premier pas. On obtient L ( x 0 + v ) = f ( x 0 ) + f ( x 0 ) v . Il est d'usage d'écrire cela avec x = x 0 + v , v = x x 0 comme L ( x ) = f ( x 0 ) + f ( x 0 ) ( x x 0 ) Cette fonction est appelée la linéarisation de f . Le noyau de L f ( x 0 ) est une variété linéaire qui approxime la surface { x f ( x ) f ( x 0 ) = 0 } . Si f : m n , alors ce qui vient d'être dit peut être appliqué à chaque composante f i de f , avec 1 i n . On ne saurait trop insister sur l'importance de cette linéarisation.2

17.2.4 Encore plus près : approximations quadratiques avec les Hessiennes

Si l'on arrête la série de Taylor après deux pas, on obtient la fonction Q ( x + v ) = f ( x ) + d f ( x ) v + v d 2 f ( x ) v / 2. La matrice H ( x ) = d 2 f ( x ) est appelée la matrice Hessienne au point x . Il est également d'usage ici d'éliminer v en écrivant x = x 0 + v . Q ( x ) = f ( x 0 ) + f ( x 0 ) ( x x 0 ) + ( x x 0 ) H ( x 0 ) ( x x 0 ) / 2 est appelée l'approximation quadratique de f . Le noyau de Q f ( x 0 ) est la variété quadratique Q ( x ) f ( x 0 ) = x B x + A x = 0 , A = d f et B = d 2 f / 2 . Elle approxime la surface { x f ( x ) f ( x 0 ) = 0 } encore mieux que la variété linéaire. Si | x x 0 | est de l'ordre de ϵ , alors | f ( x ) L ( x ) | est de l'ordre de ϵ 2 et | f ( x ) Q ( x ) | est de l'ordre de ϵ 3 . Cela découle de la formule de Taylor avec reste exacte.3

17.2.5 Le plan tangent à une surface

Pour obtenir le plan tangent à une surface f ( x ) = C , on peut simplement regarder la variété linéaire L ( x ) = C . Cependant, il existe une meilleure méthode :

Le plan tangent à une surface f ( x , y , z ) = C en ( x 0 , y 0 , z 0 ) est a x + b y + c z = d , où [ a , b , c ] T = f ( x 0 , y 0 , z 0 ) et d = a x 0 + b y 0 + c z 0 .

17.2.6 Comment les gradients aident à trouver les plans tangents aux surfaces

Cela découle du théorème fondamental des gradients :

Théorème 3. Le gradient f ( x 0 ) de f : m est perpendiculaire à la surface S = { f ( x ) = f ( x 0 ) = C } en x 0 .

Preuve. Soit r ( t ) une courbe sur S avec r ( 0 ) = x 0 . La règle de dérivation en chaîne assure d / d t f(r(t))=\nabla f(r(t)) \cdot r^{\prime}(t). Mais comme f ( r ( t ) ) = c est constante, ceci est nul, ce qui assure que r^{\prime}(t) est perpendiculaire au gradient. Comme cela fonctionne pour toute courbe, nous avons terminé. ◻

17.3 EXEMPLES

Exemple 1. Soit f : 2 donnée par f ( x , y ) = x 3 y 2 + x + y 3 . Quelle est l'approximation quadratique en ( x 0 , y 0 ) = ( 1 , 1 ) ? On a d f ( 1 , 1 ) = [ 4 , 5 ] et \begin{aligned} \nabla f(1,1)&=\left[\begin{array}{l} f_{x} \\ f_{y} \end{array}\right]=\left[\begin{array}{l} 4 \\ 5 \end{array}\right],\\ H(1,1)&=\left[\begin{array}{ll} f_{x x} & f_{x y} \\ f_{y x} & f_{y y} \end{array}\right]=\left[\begin{array}{ll} 6 & 6 \\ 6 & 8 \end{array}\right]. \end{aligned}

La linéarisation est L ( x , y ) = 4 ( x 1 ) + 5 ( y 1 ) + 3. L'approximation quadratique est Q ( x , y ) = 3 + 4 ( x 1 ) + 5 ( y 1 ) + 6 ( x 1 ) 2 / 2 + 12 ( x 1 ) ( y 1 ) / 2 + 8 ( y 1 ) 2 / 2. C'est la situation représentée à gauche dans la Figure (17.2). Pour v = [ 7 , 2 ] T , la dérivée directionnelle \begin{aligned} D_{v} f(1,1)&=\nabla f(1,1) \cdot v\\ &=[4,5]^{T} \cdot[7,2]=38. \end{aligned} Le développement de Taylor donné au début est une série finie car f était un polynôme : \begin{aligned} f([1,1]+t[7,2])&=f(1+7 t, 1+2 t)\\ &=3+38 t+247 t^{2}+1023 t^{3}+1960 t^{4}+1372 t^{5}. \end{aligned}

Exemple 2. Pour f ( x , y , z ) = x 4 + x 2 + y 2 + z 2 , le gradient et la Hessienne sont \begin{aligned} \nabla f(1,1,1)&=\left[\begin{array}{l} f_{x} \\ f_{y} \\ f_{z} \end{array}\right]=\left[\begin{array}{l} 2 \\ 2 \\ 2 \end{array}\right],\\ H(1,1,1)&=\left[\begin{array}{lll} f_{x x} & f_{x y} & f_{x z} \\ f_{y x} & f_{y y} & f_{y z} \\ f_{z x} & f_{z y} & f_{z z} \end{array}\right]=\left[\begin{array}{ccc} -10 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 2 \end{array}\right]. \end{aligned}

La linéarisation est L ( x , y , z ) = 2 2 ( x 1 ) + 2 ( y 1 ) + 2 ( z 1 ) . L'approximation quadratique Q ( x , y , z ) = 2 2 ( x 1 ) + 2 ( y 1 ) + 2 ( z 1 ) + ( 10 ( x 1 ) 2 + 2 ( y 1 ) 2 + 2 ( z 1 ) 2 ) / 2 est la situation représentée à droite dans la Figure (17.2).

Exemple 3. Quel est le plan tangent à la surface f ( x , y , z ) = 1 / 10 pour \begin{aligned} f(x, y, z)&=10 z^{2}-x^{2}-y^{2}+100 x^{4}-200 x^{6}+100 x^{8}-200 x^{2} y^{2}+200 x^{4} y^{2}+100 y^{4}\\ &=1 / 10 \end{aligned} au point ( x , y , z ) = ( 0 , 0 , 1 / 10 ) ? Le gradient est f ( 0 , 0 , 1 / 10 ) = [ 0 0 2 ] . L'équation du plan tangent est 2 z = d , où la constante d est obtenue en substituant le point. On aboutit à 2 z = 2 / 10 . La linéarisation est L ( x , y , z ) = 1 / 20 + 2 ( z 1 / 10 ) .

EXERCICES

Exercice 1. Soit r ( t ) = [ 3 t + cos ( t ) , t + 4 sin ( t ) ] T une courbe et f ( [ x , y ] T ) = [ x 3 + y , x + 2 y + y 3 ] T un changement de coordonnées.

  1. Calculez v=r^{\prime}(0) en t = 0 , puis d f ( x , y ) et A = d f ( r ( 0 ) ) et d f(r(0)) r^{\prime}(0)=A v.
  2. Calculez d'abord R ( t ) = f ( r ( t ) ) , puis trouvez w=R^{\prime}(0). Cela devrait correspondre à a).

Exercice 2.

  1. La surface f ( x , y , z ) = x 2 + y 2 4 + z 2 9 = 4 + 1 / 4 + 1 / 9 est un ellipsoïde. Calculez z x ( x , y ) au point ( x , y , z ) = ( 2 , 1 , 1 ) en utilisant la règle de dérivation implicite. (Utilisez la formule).
  2. Appliquez le pas de Newton 3 fois en partant de x = 2 pour résoudre l'équation x 2 2 = 0 .

Exercice 3. Évaluez sans technologie la racine cubique de 1002 en utilisant l'approximation quadratique. Regardez en particulier à quel point vous êtes proche de la valeur réelle.

Exercice 4.

  1. Trouvez le plan tangent à la surface f ( x , y , z ) = x y z = 60 en ( x , y , z ) = ( 100 , 36 , 1 ) .
  2. Estimez 100.1 36.1 0.999 en utilisant l'approximation linéaire (calculez L ( x , y , z ) plutôt que f ( x , y , z ) .)

Exercice 5. Trouver lʼapproximation quadratique Q ( x , y ) de f ( x , y ) = x 3 + x 2 y + x 2 + y 2 2 x + 3 x y au point ( 1 , 2 ) en calculant le vecteur gradient f ( 1 , 2 ) et la matrice hessienne H ( 1 , 2 ) . Le vecteur f ( 1 , 2 ) est une matrice 1 × 2 (vecteur ligne) et la matrice hessienne H ( 1 , 2 ) est une matrice 2 × 2 .


  1. Le livre de Feynman « Quʼest-ce que ça peut vous faire ce que pensent les autres ? ».↩︎
  2. Encore une fois : lʼidée de linéarisation est extrêmement importante car elle fait intervenir lʼalgèbre linéaire.↩︎
  3. Si f C n + 1 , f ( x + t ) = k = 0 n f ( k ) ( x ) t k / k ! + 0 t ( t s ) n f ( n + 1 ) ( x + s ) / n ! d s . (prouvez ceci par récurrence !)↩︎