Contraintes

Table des matières

20.1 INTRODUCTION
- 20.1.1 Gradients pour des solutions optimales avec contraintes
- 20.1.2 La magie de Lagrange : plusieurs contraintes, une solution
20.2 COURS
20.3 EXEMPLES
EXERCICES
Annexe : Illustration de données : Cobb Douglas
- 20.3.1 Cobb-Douglas : une formule pour la croissance économique
- 20.3.2 Visualiser les limites de production

20.1 INTRODUCTION

20.1.1 Gradients pour des solutions optimales avec contraintes

Il n’y a rarement de « repas gratuit ». Si nous voulons maximiser une quantité, nous devons souvent travailler avec des contraintes. Les obstacles peuvent nous empêcher de modifier les paramètres arbitrairement. Le gradient peut toujours être utilisé comme principe directeur. Bien que nous ne puissions pas obtenir que $\nabla f$ soit nul, nous pouvons chercher des points où le gradient est perpendiculaire à la contrainte. Cela nous donne un point optimal sous la contrainte. Si vous randonnez sur un chemin de montagne, vous atteignez souvent un maximum local sans être au sommet de la montagne. Ce qui se produit en de tels points $x$ est que $\nabla f (x)$ est perpendiculaire à la courbe, ce qui signifie que $\nabla f (x)$ est parallèle à $\nabla g (x)$ .

**Figure 1.** La situation où une fonction $f (x, y)$ est optimisée le long d’une courbe $g (x, y) = c$ est un cadre qui peut être abordé avec Lagrange. La condition d’être maximal signifie que le gradient de $f$ est perpendiculaire à la courbe. Cela signifie que les gradients de $f$ et $g$ sont parallèles. $\nabla f = λ \nabla g$ .

20.1.2 La magie de Lagrange : plusieurs contraintes, une solution

La méthode de Lagrange est bien plus générale. Nous pouvons travailler avec un nombre arbitraire de contraintes et utiliser le même principe. Le gradient de $f : ℝ^{n} \to ℝ$ est alors perpendiculaire à la surface de contrainte, ce qui signifie qu’il est une combinaison linéaire des gradients de toutes les $m$ contraintes : ce sont $n$ équations $\nabla f = \sum_{j = 1}^{m} λ_{j} \nabla g_{j}$ car les vecteurs ont $n$ composantes. Avec les $m$ équations $g_{j} = c_{j}$ , nous avons $n + m$ équations pour $n + n$ variables $x_{1}, \dots, x_{n}$ , $λ_{1}, \dots, λ_{m}$ .

20.2 COURS

20.2.1 Trouver le maximum dans des espaces confinés

Si nous voulons maximiser une fonction $f : ℝ^{m} \to ℝ$ sous la contrainte $S = {x \in ℝ^{m} ∣ g (x) = c},$ alors les gradients de $f$ et de $g$ importent. Nous appelons deux vecteurs $v$ , $w$ parallèles si $v = λ w$ ou $w = λ v$ pour un réel $λ$ . Le vecteur nul est parallèle à tout. Voici une variante de Fermat :

Théorème 1. Si $x_{0}$ est un maximum de $f$ sous la contrainte $g = c$ , alors $\nabla f (x_{0})$ et $\nabla g (x_{0})$ sont parallèles.

Preuve. Par l'absurde : supposons que $\nabla f (x_{0})$ et $\nabla g (x_{0})$ ne sont pas parallèles et que $x_{0}$ est un maximum local. Soit $T$ le plan tangent à $S = {g = c}$ en $x_{0}$ . Puisque $\nabla f (x_{0})$ n’est pas perpendiculaire à $T$ nous pouvons le projeter sur $T$ pour obtenir un vecteur non nul $v$ dans $T$ qui n’est pas perpendiculaire à $\nabla f$ . En réalité, l’angle entre $\nabla f$ et $v$ est aigu de sorte que $\cos (α) > 0$ . Prenons une courbe $r (t)$ dans $S$ avec $r (0) = x_{0}$ et r^{\prime}(0)=v. Nous avons \begin{aligned} d / d t f(r(0))&=\nabla f(r(0)) \cdot r^{\prime}(0)\\ &=|\nabla f(x_{0})||v| \cos (\alpha)\\ &>0. \end{aligned} Par approximation linéaire, nous savons que $f (r (t)) > f (r (0))$ pour $t > 0$ assez petit. Ceci est une contradiction avec le fait que $f$ était maximale en $x_{0} = r (0)$ sur $S$ . ◻

20.2.2 Exploration des multiplicateurs de Lagrange et conditions nécessaires

Cela implique immédiatement : (distinguer $\nabla g \neq 0$ et $\nabla g = 0$ )

Théorème 2. Pour un maximum de $f$ sur $S = {g = c}$ , soit les équations de Lagrange $\nabla f (x_{0}) = λ \nabla g (x_{0})$ , $g = c$ sont vérifiées, soit alors $\nabla g (x_{0}) = 0$ , $g = c$ .

Pour des fonctions $f (x, y), g (x, y)$ de deux variables, cela signifie que nous devons résoudre un système de trois équations à trois inconnues : \begin{aligned} f_{x}(x_{0}, y_{0}) & =\lambda g_{x}(x_{0}, y_{0}) \\ f_{y}(x_{0}, y_{0}) & =\lambda g_{y}(x_{0}, y_{0}) \\ g(x, y) & =c \end{aligned}

20.2.3 Trouver le véritable maximum

Pour trouver un maximum, résoudre les équations de Lagrange et ajouter une liste de points critiques de $g$ sur la contrainte. Ensuite, choisir un point où $f$ est maximale parmi tous les points. Nous ne nous soucions pas du test de la dérivée seconde. Mais voici un énoncé possible : $\frac{d^{2}}{d t^{2}} D_{t v} D_{t v} f (x_{0}) |_{t = 0} < 0$ pour tout $v$ perpendiculaire à $\nabla g (x_{0})$ , alors $x_{0}$ est un maximum local.

Bien sûr, les cas des maxima et minima sont analogues. Si $f$ a un maximum sur $g = c$ , alors $- f$ a un minimum sur $g = c$ . Nous pouvons avoir un maximum de $f$ sous une contrainte lisse $S = {g = c}$ sans que les équations de Lagrange soient satisfaites. Un exemple est $f (x, y) = x$ et $g (x, y) = x^{3} - y^{2}$ montré dans la Figure (20.3).

**Figure 3.** Un exemple de fonction où les équations de Lagrange ne donnent pas le minimum, ici $(0, 0)$ . C’est un cas où $\nabla g = 0$ .

20.2.4 L'ascension de Lagrange : maximiser avec plusieurs contraintes

La méthode de Lagrange peut maximiser des fonctions $f$ sous plusieurs contraintes. Montrons cela dans le cas d’une fonction $f (x, y, z)$ de trois variables et deux contraintes $g (x, y, z) = c$ et $h (x, y, z) = d$ . L’analogue du principe de Fermat est qu’en un maximum de $f$ , le gradient de $f$ est dans le plan engendré par $\nabla g$ et $\nabla h$ . Cela conduit aux équations de Lagrange pour $5$ inconnues $x, y, z, λ, μ$ . \begin{aligned} f_{x}(x_{0}, y_{0}, z_{0}) & =\lambda g_{x}(x_{0}, y_{0}, z_{0})+\mu h_{x}(x_{0}, y_{0}, z_{0}) \\ f_{y}(x_{0}, y_{0}, z_{0}) & =\lambda g_{y}(x_{0}, y_{0}, z_{0})+\mu h_{y}(x_{0}, y_{0}, z_{0}) \\ f_{z}(x_{0}, y_{0}, z_{0}) & =\lambda g_{z}(x_{0}, y_{0}, z_{0})+\mu h_{z}(x_{0}, y_{0}, z_{0}) \\ g(x, y, z) & =c \\ h(x, y, z) & =d \end{aligned}

Par exemple, si \begin{aligned} f(x, y, z)&=x^{2}+y^{2}+z^{2},\\ g(x, y, z)&=x^{2}+y^{2}=1,\\ h(x, y, z)&=x+y+z=4, \end{aligned} alors nous trouvons des points sur l’ellipse $g = 1$ , $h = 4$ avec une distance minimale ou maximale à $0$ .

**Figure 4.** Nous voyons une situation où nous essayons de maximiser une fonction $f$ sous deux contraintes. Dans ce cas, l’intersection $g = c$ , $h = d$ est une ellipse.

20.3 EXEMPLES

Exemple 1. Problème : Minimiser $f (x, y) = x^{2} + 2 y^{2}$ sous la contrainte $g (x, y) = x + y^{2} = 1$ .
Solution : Les équations de Lagrange sont $2 x = λ$ , $4 y = λ 2 y$ . Si $y = 0$ alors $x = 1$ . Si $y \neq 0$ nous pouvons diviser la deuxième équation par $y$ et obtenir $2 x = λ$ , $4 = λ 2$ ce qui montre à nouveau $x = 1$ . Le point $x = 1$ , $y = 0$ est la seule solution.

Exemple 2. Problème : Quelle canette de soda cylindrique de hauteur $h$ et de rayon $r$ a une surface $A$ minimale pour un volume $V$ fixé ?
Solution : Nous avons $V (r, h) = h π r^{2} = 1$ et $A (r, h) =$ $2 π r h + 2 π r^{2}$ . Avec $x = h π$ , $y = r$ , vous devez optimiser $f (x, y) = 2 x y + 2 π y^{2}$ sous la contrainte $g (x, y) = x y^{2} = 1$ . Nous le ferons en classe.

Exemple 3. Problème : Si $0 \leq p_{k} \leq 1$ est la probabilité qu’un dé montre $k$ , alors nous avons $g (p) = p_{1} + p_{2} + \dots + p_{6} = 1$ . Ce vecteur $p$ est appelé une distribution de probabilité. L’entropie de Shannon de $p$ est définie comme \begin{aligned} S(p)&=-\sum_{i=1}^{6} p_{i} \log (p_{i})\\ &=-p_{1} \log (p_{1})-p_{2} \log (p_{2})-\cdots-p_{6} \log (p_{6}) \end{aligned}

Trouver la distribution $p$ qui maximise l’entropie $S$ .
Solution : $\nabla f = (- 1 - \log (p_{1}), \dots, - 1 - \log (p_{n})), \nabla g = (1, \dots, 1) .$ Les équations de Lagrange sont $- 1 - \log (p_{i}) = λ, p_{1} + \dots + p_{6} = 1,$ d’où nous tirons $p_{i} = e^{- (λ + 1)}$ . La dernière équation $1 = \sum_{i} \exp (- (λ + 1)) = 6 \exp (- (λ + 1))$ fixe $λ = - \log (1 / 6) - 1$ de sorte que $p_{1} = p_{2} = \dots = p_{6} = 1 / 6$ . C’est le dé équitable qui a l’entropie maximale. L’entropie maximale signifie le moindre contenu d’information.

Exemple 4. Supposons que la probabilité qu’un système physique ou chimique soit dans un état $k$ est $p_{k}$ et que l’énergie de l’état $k$ est $E_{k}$ . La nature minimise l’énergie libre $F (p_{1}, \dots, p_{n}) = - \sum_{i} [p_{i} \log (p_{i}) - E_{i} p_{i}]$ si les énergies $E_{i}$ sont fixées. La distribution de probabilité $p_{i}$ satisfaisant $\sum_{i} p_{i} = 1$ qui minimise l’énergie libre est appelée une distribution de Gibbs. Trouver cette distribution en général si les $E_{i}$ sont donnés.
Solution : $\nabla f = (- 1 - \log (p_{1}) - E_{1}, \dots, - 1 - \log (p_{n}) - E_{n}), \nabla g = (1, \dots, 1) .$ Les équations de Lagrange sont $\log (p_{i}) = - 1 - λ - E_{i}$ , ou $p_{i} = \exp (- E_{i}) C$ , où $C = \exp (- 1 - λ)$ . La contrainte $p_{1} + \dots + p_{n} = 1$ donne $C (\sum_{i} \exp (- E_{i})) = 1$ de sorte que $C = 1 / (\sum_{i} e^{- E_{i}})$ . La solution de Gibbs est $p_{k} = \exp (- E_{k}) / \sum_{i} \exp (- E_{i})$ .¹

Exemple 5. Si $f$ est une fonction quadratique sur $ℝ^{m}$ et $g$ est linéaire, c’est-à-dire $f (x) = B x \cdot x / 2$ avec $B \in M (m, m)$ et si la contrainte $g (x) = A x = c$ est linéaire $A \in M (1, m)$ , alors $\nabla f (x) = B x$ et $\nabla g (x) = A^{T}$ . Appelons $b = A^{T} \in M (m, 1) \sim ℝ^{m}$ . Les équations de Lagrange sont alors $B x = λ b$ , $A x = c$ . Nous voyons en général que pour $f$ quadratique et $g$ linéaire, nous aboutissons à un système d’équations linéaires.

Exemple 6. En lien avec la remarque précédente, voici l’observation suivante. Il est souvent possible de réduire le problème de Lagrange à un problème sans contrainte. C’est un point de vue souvent adopté en économie. Regardons cela en dimension $2$ , où nous extremisons $f (x, y)$ sous la contrainte $g (x, y) = 0$ . Définissons $F (x, y, λ) = f (x, y) - λ g (x, y)$ . Les équations de Lagrange pour $f, g$ sont maintenant équivalentes à $\nabla F (x, y, λ) = 0$ en trois dimensions.

EXERCICES

Exercice 1. Trouvez le panier cylindrique ouvert en haut qui a le plus grand volume pour une aire fixée $π$ . Si $x$ est le rayon et $y$ la hauteur, nous devons maximiser $f (x, y) = π x^{2} y$ sous la contrainte $g (x, y) = 2 π x y + π x^{2} = π .$ Utilisez la méthode des multiplicateurs de Lagrange.

Exercice 2. Étant donnée une matrice symétrique $n \times n$ $B$ , nous considérons la fonction $f (x) = x \cdot B x$ et cherchons les extrema de $f$ sous la contrainte $g (x) = x \cdot x = 1$ . Cela conduit à l'équation $B x = λ x .$ Une solution $x$ est appelée un vecteur propre. La constante de Lagrange $λ$ est une valeur propre. Trouvez les solutions de $B x = λ x$ , $| x | = 1$ si $B$ est une matrice $2 \times 2$ , où $f (x, y) = a x^{2} + (b + c) x y + d y^{2}, g (x, y) = x^{2} + y^{2} .$ Résolvez ensuite le problème avec $a = 4$ , $b = 1$ , $c = 1$ , $d = 4$ .

Exercice 3. Quelle pyramide de hauteur $h$ sur un carré $[- a, a] \times [- a, a]$ dont l'aire de surface est $4 a \sqrt{h^{2} + a^{2}} + 4 a^{2} = 4$ a un volume maximal $V (h, a) =$ $4 h a^{2} / 3$ ? En utilisant de nouvelles variables $(x, y)$ et en multipliant $V$ par une constante, on obtient le problème équivalent de maximiser $f (x, y) = y x^{2}$ sous la contrainte $g (x, y) = x \sqrt{y^{2} + x^{2}} + x^{2} = 1.$ Utilisez ces dernières variables.

Exercice 4. Motivés par le film Disney « Raiponce », nous voulons construire une montgolfière avec un maillage cuboïde de dimensions $x$ , $y$ , $z$ qui, avec les renforts du haut et du bas, utilise des câbles de longueur totale $g (x, y, z) = 6 x + 6 y + 4 z = 32.$ Trouvez le ballon de volume maximal $f (x, y, z) = x y z$ .

Exercice 5. Une balle solide composée d'une demi-sphère et d'un cylindre a un volume $V = 2 π r^{3} / 3 + π r^{2} h$ et une aire de surface $A = 2 π r^{2} + 2 π r h + π r^{2}$ . Le Docteur Manhattan conçoit une balle de volume fixé et d'aire minimale. Avec $g = 3 V / π = 1$ et $f = A / π$ , il minimise donc $f (h, r) = 3 r^{2} + 2 r h$ sous la contrainte $g (h, r) = 2 r^{3} + 3 r^{2} h = 1.$ Utilisez la méthode de Lagrange pour trouver un minimum local de $f$ sous la contrainte $g = 1$ .

Annexe : Illustration de données : Cobb Douglas

20.3.1 Cobb-Douglas : Une formule pour la croissance économique

Le mathématicien et économiste Charles W. Cobb du Amherst College et l'économiste et politicien Paul H. Douglas, qui enseignait également à Amherst, ont trouvé en 1928 empiriquement une formule $F (K, L) = L^{α} K^{β}$ qui correspond à la production totale $F$ d'un système économique en fonction de l'investissement en capital $K$ et du travail $L$ . Les deux auteurs ont utilisé des variables logarithmiques et supposé la linéarité pour trouver $α, β$ . Voici les données normalisées de sorte que la valeur pour l'année 1899 soit $100$ .

Année	$K$	$L$	$P$
1899	100	100	100
1900	107	105	101
1901	114	110	112
1902	122	118	122
1903	131	123	124
1904	138	116	122
1905	149	125	143
1906	163	133	152
1907	176	138	151
1908	185	121	126
1909	198	140	155
1910	208	144	159
1911	216	145	153
1912	226	152	177
1913	236	154	184
1914	244	149	169
1915	266	154	189
1916	298	182	225
1917	335	196	227
1918	366	200	223
1919	387	193	218
1920	407	193	231
1921	417	147	179
1922	431	161	240

**Figure 5.** Le graphique de $F (L, K) = L^{3 / 4} K^{1 / 4}$ correspond assez bien à cet ensemble de données. On peut voir dans les données qu'il y a une valeur aberrante.

20.3.2 Visualisation des limites de production

Supposons que le travail et l'investissement en capital soient liés par la contrainte supplémentaire $G (L, K) = L^{3 / 4} + K^{1 / 4} = 50$ . (Cette fonction $G$ n'est pas liée à la fonction $F (L, K)$ car nous sommes dans un problème de Lagrange.) Où la production $P$ est-elle maximale sous cette contrainte ? Tracez les deux fonctions $F (L, K)$ et $G (L, K)$ .

Cet exemple est tiré de Rufus Bowen, Lecture Notes in Math, 470, 1978↩︎