Contraintes


 

20.1 INTRODUCTION

20.1.1 Gradients pour des solutions optimales avec contraintes

Il n’y a rarement de « repas gratuit ». Si nous voulons maximiser une quantité, nous devons souvent travailler avec des contraintes. Les obstacles peuvent nous empêcher de modifier les paramètres arbitrairement. Le gradient peut toujours être utilisé comme principe directeur. Bien que nous ne puissions pas obtenir que f soit nul, nous pouvons chercher des points où le gradient est perpendiculaire à la contrainte. Cela nous donne un point optimal sous la contrainte. Si vous randonnez sur un chemin de montagne, vous atteignez souvent un maximum local sans être au sommet de la montagne. Ce qui se produit en de tels points x est que f ( x ) est perpendiculaire à la courbe, ce qui signifie que f ( x ) est parallèle à g ( x ) .

Figure 1. La situation où une fonction f ( x , y ) est optimisée le long d’une courbe g ( x , y ) = c est un cadre qui peut être abordé avec Lagrange. La condition d’être maximal signifie que le gradient de f est perpendiculaire à la courbe. Cela signifie que les gradients de f et g sont parallèles. f = λ g .

20.1.2 La magie de Lagrange : plusieurs contraintes, une solution

La méthode de Lagrange est bien plus générale. Nous pouvons travailler avec un nombre arbitraire de contraintes et utiliser le même principe. Le gradient de f : n est alors perpendiculaire à la surface de contrainte, ce qui signifie qu’il est une combinaison linéaire des gradients de toutes les m contraintes : ce sont n équations f = j = 1 m λ j g j car les vecteurs ont n composantes. Avec les m équations g j = c j , nous avons n + m équations pour n + n variables x 1 , , x n , λ 1 , , λ m .

20.2 COURS

20.2.1 Trouver le maximum dans des espaces confinés

Si nous voulons maximiser une fonction f : m sous la contrainte S = { x m g ( x ) = c } , alors les gradients de f et de g importent. Nous appelons deux vecteurs v , w parallèles si v = λ w ou w = λ v pour un réel λ . Le vecteur nul est parallèle à tout. Voici une variante de Fermat :

Théorème 1. Si x 0 est un maximum de f sous la contrainte g = c , alors f ( x 0 ) et g ( x 0 ) sont parallèles.

Preuve. Par l'absurde : supposons que f ( x 0 ) et g ( x 0 ) ne sont pas parallèles et que x 0 est un maximum local. Soit T le plan tangent à S = { g = c } en x 0 . Puisque f ( x 0 ) n’est pas perpendiculaire à T nous pouvons le projeter sur T pour obtenir un vecteur non nul v dans T qui n’est pas perpendiculaire à f . En réalité, l’angle entre f et v est aigu de sorte que cos ( α ) > 0 . Prenons une courbe r ( t ) dans S avec r ( 0 ) = x 0 et r^{\prime}(0)=v. Nous avons \begin{aligned} d / d t f(r(0))&=\nabla f(r(0)) \cdot r^{\prime}(0)\\ &=|\nabla f(x_{0})||v| \cos (\alpha)\\ &>0. \end{aligned} Par approximation linéaire, nous savons que f ( r ( t ) ) > f ( r ( 0 ) ) pour t > 0 assez petit. Ceci est une contradiction avec le fait que f était maximale en x 0 = r ( 0 ) sur S . ◻

Figure 2. Un problème de Lagrange

20.2.2 Exploration des multiplicateurs de Lagrange et conditions nécessaires

Cela implique immédiatement : (distinguer g 0 et g = 0 )

Théorème 2. Pour un maximum de f sur S = { g = c } , soit les équations de Lagrange f ( x 0 ) = λ g ( x 0 ) , g = c sont vérifiées, soit alors g ( x 0 ) = 0 , g = c .

Pour des fonctions f ( x , y ) , g ( x , y ) de deux variables, cela signifie que nous devons résoudre un système de trois équations à trois inconnues : \begin{aligned} f_{x}(x_{0}, y_{0}) & =\lambda g_{x}(x_{0}, y_{0}) \\ f_{y}(x_{0}, y_{0}) & =\lambda g_{y}(x_{0}, y_{0}) \\ g(x, y) & =c \end{aligned}

20.2.3 Trouver le véritable maximum

Pour trouver un maximum, résoudre les équations de Lagrange et ajouter une liste de points critiques de g sur la contrainte. Ensuite, choisir un point où f est maximale parmi tous les points. Nous ne nous soucions pas du test de la dérivée seconde. Mais voici un énoncé possible : d 2 d t 2 D t v D t v f ( x 0 ) | t = 0 < 0 pour tout v perpendiculaire à g ( x 0 ) , alors x 0 est un maximum local.

Bien sûr, les cas des maxima et minima sont analogues. Si f a un maximum sur g = c , alors f a un minimum sur g = c . Nous pouvons avoir un maximum de f sous une contrainte lisse S = { g = c } sans que les équations de Lagrange soient satisfaites. Un exemple est f ( x , y ) = x et g ( x , y ) = x 3 y 2 montré dans la Figure (20.3).

Figure 3. Un exemple de fonction où les équations de Lagrange ne donnent pas le minimum, ici ( 0 , 0 ) . C’est un cas où g = 0 .

20.2.4 L'ascension de Lagrange : maximiser avec plusieurs contraintes

La méthode de Lagrange peut maximiser des fonctions f sous plusieurs contraintes. Montrons cela dans le cas d’une fonction f ( x , y , z ) de trois variables et deux contraintes g ( x , y , z ) = c et h ( x , y , z ) = d . L’analogue du principe de Fermat est qu’en un maximum de f , le gradient de f est dans le plan engendré par g et h . Cela conduit aux équations de Lagrange pour 5 inconnues x , y , z , λ , μ . \begin{aligned} f_{x}(x_{0}, y_{0}, z_{0}) & =\lambda g_{x}(x_{0}, y_{0}, z_{0})+\mu h_{x}(x_{0}, y_{0}, z_{0}) \\ f_{y}(x_{0}, y_{0}, z_{0}) & =\lambda g_{y}(x_{0}, y_{0}, z_{0})+\mu h_{y}(x_{0}, y_{0}, z_{0}) \\ f_{z}(x_{0}, y_{0}, z_{0}) & =\lambda g_{z}(x_{0}, y_{0}, z_{0})+\mu h_{z}(x_{0}, y_{0}, z_{0}) \\ g(x, y, z) & =c \\ h(x, y, z) & =d \end{aligned}

Par exemple, si \begin{aligned} f(x, y, z)&=x^{2}+y^{2}+z^{2},\\ g(x, y, z)&=x^{2}+y^{2}=1,\\ h(x, y, z)&=x+y+z=4, \end{aligned} alors nous trouvons des points sur l’ellipse g = 1 , h = 4 avec une distance minimale ou maximale à 0 .

Figure 4. Nous voyons une situation où nous essayons de maximiser une fonction f sous deux contraintes. Dans ce cas, l’intersection g = c , h = d est une ellipse.

20.3 EXEMPLES

Exemple 1. Problème : Minimiser f ( x , y ) = x 2 + 2 y 2 sous la contrainte g ( x , y ) = x + y 2 = 1 .
Solution : Les équations de Lagrange sont 2 x = λ , 4 y = λ 2 y . Si y = 0 alors x = 1 . Si y 0 nous pouvons diviser la deuxième équation par y et obtenir 2 x = λ , 4 = λ 2 ce qui montre à nouveau x = 1 . Le point x = 1 , y = 0 est la seule solution.

Exemple 2. Problème : Quelle canette de soda cylindrique de hauteur h et de rayon r a une surface A minimale pour un volume V fixé ?
Solution : Nous avons V ( r , h ) = h π r 2 = 1 et A ( r , h ) = 2 π r h + 2 π r 2 . Avec x = h π , y = r , vous devez optimiser f ( x , y ) = 2 x y + 2 π y 2 sous la contrainte g ( x , y ) = x y 2 = 1 . Nous le ferons en classe.

Exemple 3. Problème : Si 0 p k 1 est la probabilité qu’un dé montre k , alors nous avons g ( p ) = p 1 + p 2 + + p 6 = 1 . Ce vecteur p est appelé une distribution de probabilité. L’entropie de Shannon de p est définie comme \begin{aligned} S(p)&=-\sum_{i=1}^{6} p_{i} \log (p_{i})\\ &=-p_{1} \log (p_{1})-p_{2} \log (p_{2})-\cdots-p_{6} \log (p_{6}) \end{aligned}

Trouver la distribution p qui maximise l’entropie S .
Solution : f = ( 1 log ( p 1 ) , , 1 log ( p n ) ) , g = ( 1 , , 1 ) . Les équations de Lagrange sont 1 log ( p i ) = λ , p 1 + + p 6 = 1 , d’où nous tirons p i = e ( λ + 1 ) . La dernière équation 1 = i exp ( ( λ + 1 ) ) = 6 exp ( ( λ + 1 ) ) fixe λ = log ( 1 / 6 ) 1 de sorte que p 1 = p 2 = = p 6 = 1 / 6 . C’est le dé équitable qui a l’entropie maximale. L’entropie maximale signifie le moindre contenu d’information.

Exemple 4. Supposons que la probabilité qu’un système physique ou chimique soit dans un état k est p k et que l’énergie de l’état k est E k . La nature minimise l’énergie libre F ( p 1 , , p n ) = i [ p i log ( p i ) E i p i ] si les énergies E i sont fixées. La distribution de probabilité p i satisfaisant i p i = 1 qui minimise l’énergie libre est appelée une distribution de Gibbs. Trouver cette distribution en général si les E i sont donnés.
Solution : f = ( 1 log ( p 1 ) E 1 , , 1 log ( p n ) E n ) , g = ( 1 , , 1 ) . Les équations de Lagrange sont log ( p i ) = 1 λ E i , ou p i = exp ( E i ) C , où C = exp ( 1 λ ) . La contrainte p 1 + + p n = 1 donne C ( i exp ( E i ) ) = 1 de sorte que C = 1 / ( i e E i ) . La solution de Gibbs est p k = exp ( E k ) / i exp ( E i ) .1

Exemple 5. Si f est une fonction quadratique sur m et g est linéaire, c’est-à-dire f ( x ) = B x x / 2 avec B M ( m , m ) et si la contrainte g ( x ) = A x = c est linéaire A M ( 1 , m ) , alors f ( x ) = B x et g ( x ) = A T . Appelons b = A T M ( m , 1 ) m . Les équations de Lagrange sont alors B x = λ b , A x = c . Nous voyons en général que pour f quadratique et g linéaire, nous aboutissons à un système d’équations linéaires.

Exemple 6. En lien avec la remarque précédente, voici l’observation suivante. Il est souvent possible de réduire le problème de Lagrange à un problème sans contrainte. C’est un point de vue souvent adopté en économie. Regardons cela en dimension 2 , où nous extremisons f ( x , y ) sous la contrainte g ( x , y ) = 0 . Définissons F ( x , y , λ ) = f ( x , y ) λ g ( x , y ) . Les équations de Lagrange pour f , g sont maintenant équivalentes à F ( x , y , λ ) = 0 en trois dimensions.

EXERCICES

Exercice 1. Trouvez le panier cylindrique ouvert en haut qui a le plus grand volume pour une aire fixée π . Si x est le rayon et y la hauteur, nous devons maximiser f ( x , y ) = π x 2 y sous la contrainte g ( x , y ) = 2 π x y + π x 2 = π . Utilisez la méthode des multiplicateurs de Lagrange.

Exercice 2. Étant donnée une matrice symétrique n × n B , nous considérons la fonction f ( x ) = x B x et cherchons les extrema de f sous la contrainte g ( x ) = x x = 1 . Cela conduit à l'équation B x = λ x . Une solution x est appelée un vecteur propre. La constante de Lagrange λ est une valeur propre. Trouvez les solutions de B x = λ x , | x | = 1 si B est une matrice 2 × 2 , où f ( x , y ) = a x 2 + ( b + c ) x y + d y 2 , g ( x , y ) = x 2 + y 2 . Résolvez ensuite le problème avec a = 4 , b = 1 , c = 1 , d = 4 .

Exercice 3. Quelle pyramide de hauteur h sur un carré [ a , a ] × [ a , a ] dont l'aire de surface est 4 a h 2 + a 2 + 4 a 2 = 4 a un volume maximal V ( h , a ) = 4 h a 2 / 3 ? En utilisant de nouvelles variables ( x , y ) et en multipliant V par une constante, on obtient le problème équivalent de maximiser f ( x , y ) = y x 2 sous la contrainte g ( x , y ) = x y 2 + x 2 + x 2 = 1. Utilisez ces dernières variables.

Exercice 4. Motivés par le film Disney « Raiponce », nous voulons construire une montgolfière avec un maillage cuboïde de dimensions x , y , z qui, avec les renforts du haut et du bas, utilise des câbles de longueur totale g ( x , y , z ) = 6 x + 6 y + 4 z = 32. Trouvez le ballon de volume maximal f ( x , y , z ) = x y z .

Exercice 5. Une balle solide composée d'une demi-sphère et d'un cylindre a un volume V = 2 π r 3 / 3 + π r 2 h et une aire de surface A = 2 π r 2 + 2 π r h + π r 2 . Le Docteur Manhattan conçoit une balle de volume fixé et d'aire minimale. Avec g = 3 V / π = 1 et f = A / π , il minimise donc f ( h , r ) = 3 r 2 + 2 r h sous la contrainte g ( h , r ) = 2 r 3 + 3 r 2 h = 1. Utilisez la méthode de Lagrange pour trouver un minimum local de f sous la contrainte g = 1 .

Annexe : Illustration de données : Cobb Douglas

20.3.1 Cobb-Douglas : Une formule pour la croissance économique

Le mathématicien et économiste Charles W. Cobb du Amherst College et l'économiste et politicien Paul H. Douglas, qui enseignait également à Amherst, ont trouvé en 1928 empiriquement une formule F ( K , L ) = L α K β qui correspond à la production totale F d'un système économique en fonction de l'investissement en capital K et du travail L . Les deux auteurs ont utilisé des variables logarithmiques et supposé la linéarité pour trouver α , β . Voici les données normalisées de sorte que la valeur pour l'année 1899 soit 100 .

Année K L P
1899100100100
1900107105101
1901114110112
1902122118122
1903131123124
1904138116122
1905149125143
1906163133152
1907176138151
1908185121126
1909198140155
1910208144159
1911216145153
1912226152177
1913236154184
1914244149169
1915266154189
1916298182225
1917335196227
1918366200223
1919387193218
1920407193231
1921417147179
1922431161240
Figure 5. Le graphique de F ( L , K ) = L 3 / 4 K 1 / 4 correspond assez bien à cet ensemble de données. On peut voir dans les données qu'il y a une valeur aberrante.

20.3.2 Visualisation des limites de production

Supposons que le travail et l'investissement en capital soient liés par la contrainte supplémentaire G ( L , K ) = L 3 / 4 + K 1 / 4 = 50 . (Cette fonction G n'est pas liée à la fonction F ( L , K ) car nous sommes dans un problème de Lagrange.) Où la production P est-elle maximale sous cette contrainte ? Tracez les deux fonctions F ( L , K ) et G ( L , K ) .


  1. Cet exemple est tiré de Rufus Bowen, Lecture Notes in Math, 470, 1978↩︎