Restricciones

Tabla de Contenidos

20.1 INTRODUCCIÓN
- 20.1.1 Gradientes para Soluciones Óptimas con Restricciones
- 20.1.2 La Magia de Lagrange: Muchas Restricciones, Una Solución
20.2 LECCIÓN
20.3 EJEMPLOS
EJERCICIOS
Apéndice: Ilustración de datos: Cobb Douglas
- 20.3.1 Cobb-Douglas: Una Fórmula para el Crecimiento Económico
- 20.3.2 Visualizando los Límites de Producción

20.1 INTRODUCCIÓN

20.1.1 Gradientes para Soluciones Óptimas con Restricciones

Rara vez hay un "almuerzo gratis". Si queremos maximizar una cantidad, a menudo tenemos que trabajar con restricciones. Los obstáculos pueden impedirnos cambiar los parámetros arbitrariamente. El gradiente aún puede usarse como principio guía. Aunque no podemos lograr que $\nabla f$ sea cero, podemos buscar puntos donde el gradiente sea perpendicular a la restricción. Esto nos da un punto óptimo bajo el confinamiento. Si caminas por un sendero en las montañas, a menudo alcanzas un máximo local sin estar en la cima de la montaña. Lo que sucede en tales puntos $x$ es que $\nabla f (x)$ es perpendicular a la curva, lo que significa que $\nabla f (x)$ es paralelo a $\nabla g (x)$ .

**Figura 1.** La situación, donde una función $f (x, y)$ se optimiza a lo largo de una curva $g (x, y) = c$ es un marco que puede abordarse con Lagrange. La condición de ser máximo significa que el gradiente de $f$ es perpendicular a la curva. Esto significa que los gradientes de $f$ y $g$ son paralelos. $\nabla f = λ \nabla g$ .

20.1.2 La Magia de Lagrange: Muchas Restricciones, Una Solución

El método de Lagrange es mucho más general. Podemos trabajar con un número arbitrario de restricciones y aún usar el mismo principio. El gradiente de $f : ℝ^{n} \to ℝ$ es entonces perpendicular a la superficie de restricción, lo que significa que es una combinación lineal de los gradientes de todas las $m$ restricciones: estas son $n$ ecuaciones $\nabla f = \sum_{j = 1}^{m} λ_{j} \nabla g_{j}$ porque los vectores tienen $n$ componentes. Junto con las $m$ ecuaciones $g_{j} = c_{j}$ tenemos $n + m$ ecuaciones para $n + n$ variables $x_{1}, \dots, x_{n}$ , $λ_{1}, \dots, λ_{m}$ .

20.2 LECCIÓN

20.2.1 Encontrando el Máximo en Espacios Confinados

Si queremos maximizar una función $f : ℝ^{m} \to ℝ$ en la restricción $S = {x \in ℝ^{m} ∣ g (x) = c},$ entonces importan tanto los gradientes de $f$ como de $g$ . Llamamos a dos vectores $v$ , $w$ paralelos si $v = λ w$ o $w = λ v$ para algún $λ$ real. El vector cero es paralelo a todo. Aquí hay una variante de Fermat:

Teorema 1. Si $x_{0}$ es un máximo de $f$ bajo la restricción $g = c$ , entonces $\nabla f (x_{0})$ y $\nabla g (x_{0})$ son paralelos.

Demostración. Por contradicción: supongamos que $\nabla f (x_{0})$ y $\nabla g (x_{0})$ no son paralelos y $x_{0}$ es un máximo local. Sea $T$ el plano tangente a $S = {g = c}$ en $x_{0}$ . Como $\nabla f (x_{0})$ no es perpendicular a $T$ podemos proyectarlo sobre $T$ para obtener un vector no nulo $v$ en $T$ que no es perpendicular a $\nabla f$ . De hecho, el ángulo entre $\nabla f$ y $v$ es agudo, por lo que $\cos (α) > 0$ . Tomemos una curva $r (t)$ en $S$ con $r (0) = x_{0}$ y r^{\prime}(0)=v. Tenemos \begin{aligned} d / d t f(r(0))&=\nabla f(r(0)) \cdot r^{\prime}(0)\\ &=|\nabla f(x_{0})||v| \cos (\alpha)\\ &>0. \end{aligned} Por aproximación lineal, sabemos que $f (r (t)) > f (r (0))$ para $t > 0$ suficientemente pequeño. Esto contradice el hecho de que $f$ era máximo en $x_{0} = r (0)$ en $S$ . ◻

20.2.2 Explorando los Multiplicadores de Lagrange y las Condiciones Necesarias

Esto implica inmediatamente: (distinguir $\nabla g \neq 0$ y $\nabla g = 0$ )

Teorema 2. Para un máximo de $f$ en $S = {g = c}$ o bien se cumplen las ecuaciones de Lagrange $\nabla f (x_{0}) = λ \nabla g (x_{0})$ , $g = c$ , o bien $\nabla g (x_{0}) = 0$ , $g = c$ .

Para funciones $f (x, y), g (x, y)$ de dos variables, esto significa que tenemos que resolver un sistema con tres ecuaciones y tres incógnitas: \begin{aligned} f_{x}(x_{0}, y_{0}) & =\lambda g_{x}(x_{0}, y_{0}) \\ f_{y}(x_{0}, y_{0}) & =\lambda g_{y}(x_{0}, y_{0}) \\ g(x, y) & =c \end{aligned}

20.2.3 Encontrando el Verdadero Máximo

Para encontrar un máximo, resuelve las ecuaciones de Lagrange y añade una lista de puntos críticos de $g$ en la restricción. Luego elige un punto donde $f$ sea máximo entre todos los puntos. No nos preocupamos por una prueba de segunda derivada. Pero aquí hay una posible afirmación: $\frac{d^{2}}{d t^{2}} D_{t v} D_{t v} f (x_{0}) |_{t = 0} < 0$ para todo $v$ perpendicular a $\nabla g (x_{0})$ , entonces $x_{0}$ es un máximo local.

Por supuesto, el caso de máximos y mínimos es análogo. Si $f$ tiene un máximo en $g = c$ , entonces $- f$ tiene un mínimo en $g = c$ . Podemos tener un máximo de $f$ bajo una restricción suave $S = {g = c}$ sin que se satisfagan las ecuaciones de Lagrange. Un ejemplo es $f (x, y) = x$ y $g (x, y) = x^{3} - y^{2}$ mostrado en la Figura (20.3).

**Figura 3.** Un ejemplo de una función, donde las ecuaciones de Lagrange no dan el mínimo, aquí $(0, 0)$ . Es un caso, donde $\nabla g = 0$ .

20.2.4 La Escalada de Lagrange: Maximizando con Múltiples Restricciones

El método de Lagrange puede maximizar funciones $f$ bajo varias restricciones. Mostremos esto en el caso de una función $f (x, y, z)$ de tres variables y dos restricciones $g (x, y, z) = c$ y $h (x, y, z) = d$ . El análogo del principio de Fermat es que en un máximo de $f$ , el gradiente de $f$ está en el plano generado por $\nabla g$ y $\nabla h$ . Esto conduce a las ecuaciones de Lagrange para $5$ incógnitas $x, y, z, λ, μ$ . \begin{aligned} f_{x}(x_{0}, y_{0}, z_{0}) & =\lambda g_{x}(x_{0}, y_{0}, z_{0})+\mu h_{x}(x_{0}, y_{0}, z_{0}) \\ f_{y}(x_{0}, y_{0}, z_{0}) & =\lambda g_{y}(x_{0}, y_{0}, z_{0})+\mu h_{y}(x_{0}, y_{0}, z_{0}) \\ f_{z}(x_{0}, y_{0}, z_{0}) & =\lambda g_{z}(x_{0}, y_{0}, z_{0})+\mu h_{z}(x_{0}, y_{0}, z_{0}) \\ g(x, y, z) & =c \\ h(x, y, z) & =d \end{aligned}

Por ejemplo, si \begin{aligned} f(x, y, z)&=x^{2}+y^{2}+z^{2},\\ g(x, y, z)&=x^{2}+y^{2}=1,\\ h(x, y, z)&=x+y+z=4, \end{aligned} entonces encontramos puntos en la elipse $g = 1$ , $h = 4$ con distancia mínima o máxima a $0$ .

**Figura 4.** Vemos una situación donde intentamos maximizar una función $f$ bajo dos restricciones. En este caso la intersección $g = c$ , $h = d$ es una elipse.

20.3 EJEMPLOS

Ejemplo 1. Problema: Minimizar $f (x, y) = x^{2} + 2 y^{2}$ bajo la restricción $g (x, y) = x + y^{2} = 1$ .
Solución: Las ecuaciones de Lagrange son $2 x = λ$ , $4 y = λ 2 y$ . Si $y = 0$ entonces $x = 1$ . Si $y \neq 0$ podemos dividir la segunda ecuación por $y$ y obtener $2 x = λ$ , $4 = λ 2$ mostrando nuevamente $x = 1$ . El punto $x = 1$ , $y = 0$ es la única solución.

Ejemplo 2. Problema: ¿Qué lata cilíndrica de refresco de altura $h$ y radio $r$ tiene superficie mínima $A$ para un volumen fijo $V$ ?
Solución: Tenemos $V (r, h) = h π r^{2} = 1$ y $A (r, h) =$ $2 π r h + 2 π r^{2}$ . Con $x = h π$ , $y = r$ , necesitas optimizar $f (x, y) = 2 x y + 2 π y^{2}$ bajo la restricción $g (x, y) = x y^{2} = 1$ . Lo haremos en clase.

Ejemplo 3. Problema: Si $0 \leq p_{k} \leq 1$ es la probabilidad de que un dado muestre $k$ , entonces tenemos $g (p) = p_{1} + p_{2} + \dots + p_{6} = 1$ . Este vector $p$ se llama una distribución de probabilidad. La entropía de Shannon de $p$ se define como \begin{aligned} S(p)&=-\sum_{i=1}^{6} p_{i} \log (p_{i})\\ &=-p_{1} \log (p_{1})-p_{2} \log (p_{2})-\cdots-p_{6} \log (p_{6}) \end{aligned}

Encuentra la distribución $p$ que maximiza la entropía $S$ .
Solución: $\nabla f = (- 1 - \log (p_{1}), \dots, - 1 - \log (p_{n})), \nabla g = (1, \dots, 1) .$ Las ecuaciones de Lagrange son $- 1 - \log (p_{i}) = λ, p_{1} + \dots + p_{6} = 1,$ de donde obtenemos $p_{i} = e^{- (λ + 1)}$ . La última ecuación $1 = \sum_{i} \exp (- (λ + 1)) = 6 \exp (- (λ + 1))$ fija $λ = - \log (1 / 6) - 1$ de modo que $p_{1} = p_{2} = \dots = p_{6} = 1 / 6$ . Es el dado justo que tiene entropía máxima. Entropía máxima significa menor contenido de información.

Ejemplo 4. Supongamos que la probabilidad de que un sistema físico o químico esté en un estado $k$ es $p_{k}$ y que la energía del estado $k$ es $E_{k}$ . La naturaleza minimiza la energía libre $F (p_{1}, \dots, p_{n}) = - \sum_{i} [p_{i} \log (p_{i}) - E_{i} p_{i}]$ si las energías $E_{i}$ están fijas. La distribución de probabilidad $p_{i}$ que satisface $\sum_{i} p_{i} = 1$ y minimiza la energía libre se llama una distribución de Gibbs. Encuentra esta distribución en general si se dan $E_{i}$ .
Solución: $\nabla f = (- 1 - \log (p_{1}) - E_{1}, \dots, - 1 - \log (p_{n}) - E_{n}), \nabla g = (1, \dots, 1) .$ Las ecuaciones de Lagrange son $\log (p_{i}) = - 1 - λ - E_{i}$ , o $p_{i} = \exp (- E_{i}) C$ , donde $C = \exp (- 1 - λ)$ . La restricción $p_{1} + \dots + p_{n} = 1$ da $C (\sum_{i} \exp (- E_{i})) = 1$ de modo que $C = 1 / (\sum_{i} e^{- E_{i}})$ . La solución de Gibbs es $p_{k} = \exp (- E_{k}) / \sum_{i} \exp (- E_{i})$ .¹

Ejemplo 5. Si $f$ es una función cuadrática en $ℝ^{m}$ y $g$ es lineal, es decir $f (x) = B x \cdot x / 2$ con $B \in M (m, m)$ y si la restricción $g (x) = A x = c$ es lineal $A \in M (1, m)$ , entonces $\nabla f (x) = B x$ y $\nabla g (x) = A^{T}$ . Llamemos $b = A^{T} \in M (m, 1) \sim ℝ^{m}$ . Las ecuaciones de Lagrange son entonces $B x = λ b$ , $A x = c$ . Vemos en general que para $f$ cuadrática y $g$ lineal, terminamos con un sistema lineal de ecuaciones.

Ejemplo 6. Relacionada con la observación anterior está la siguiente observación. A menudo es posible reducir el problema de Lagrange a un problema sin restricción. Este es un punto de vista a menudo adoptado en economía. Veámoslo en dimensión $2$ , donde extremizamos $f (x, y)$ bajo la restricción $g (x, y) = 0$ . Definimos $F (x, y, λ) = f (x, y) - λ g (x, y)$ . Las ecuaciones de Lagrange para $f, g$ son ahora equivalentes a $\nabla F (x, y, λ) = 0$ en tres dimensiones.

EJERCICIOS

Ejercicio 1. Encuentre la cesta cilíndrica abierta por arriba que tiene el mayor volumen para un área fija $π$ . Si $x$ es el radio y $y$ es la altura, tenemos que maximizar $f (x, y) = π x^{2} y$ bajo la restricción $g (x, y) = 2 π x y + π x^{2} = π .$ Use el método de los multiplicadores de Lagrange.

Ejercicio 2. Dada una matriz simétrica $n \times n$ $B$ , consideramos la función $f (x) = x \cdot B x$ y buscamos los extremos de $f$ bajo la restricción de que $g (x) = x \cdot x = 1$ . Esto conduce a una ecuación $B x = λ x .$ Una solución $x$ se llama un vector propio. La constante de Lagrange $λ$ es un valor propio. Encuentre las soluciones de $B x = λ x$ , $| x | = 1$ si $B$ es una matriz $2 \times 2$ , donde $f (x, y) = a x^{2} + (b + c) x y + d y^{2}, g (x, y) = x^{2} + y^{2} .$ Luego resuelva el problema con $a = 4$ , $b = 1$ , $c = 1$ , $d = 4$ .

Ejercicio 3. ¿Qué pirámide de altura $h$ sobre un cuadrado $[- a, a] \times [- a, a]$ con área superficial $4 a \sqrt{h^{2} + a^{2}} + 4 a^{2} = 4$ tiene volumen máximo $V (h, a) =$ $4 h a^{2} / 3$ ? Usando nuevas variables $(x, y)$ y multiplicando $V$ por una constante, obtenemos el problema equivalente de maximizar $f (x, y) = y x^{2}$ bajo la restricción $g (x, y) = x \sqrt{y^{2} + x^{2}} + x^{2} = 1.$ Use las últimas variables.

Ejercicio 4. Motivados por la película de Disney "Enredados", queremos construir un globo aerostático con una malla ortoédrica de dimensiones $x$ , $y$ , $z$ que, junto con los refuerzos superior e inferior, utiliza alambres de una longitud total $g (x, y, z) = 6 x + 6 y + 4 z = 32.$ Encuentre el globo con volumen máximo $f (x, y, z) = x y z$ .

Ejercicio 5. Una bala sólida formada por una semiesfera y un cilindro tiene el volumen $V = 2 π r^{3} / 3 + π r^{2} h$ y el área superficial $A = 2 π r^{2} + 2 π r h + π r^{2}$ . El Doctor Manhattan diseña una bala con volumen fijo y área mínima. Con $g = 3 V / π = 1$ y $f = A / π$ , entonces minimiza $f (h, r) = 3 r^{2} + 2 r h$ bajo la restricción $g (h, r) = 2 r^{3} + 3 r^{2} h = 1.$ Use el método de Lagrange para encontrar un mínimo local de $f$ bajo la restricción $g = 1$ .

Apéndice: Ilustración de datos: Cobb Douglas

20.3.1 Cobb-Douglas: Una fórmula para el crecimiento económico

El matemático y economista Charles W. Cobb del Amherst College y el economista y político Paul H. Douglas, quien también enseñaba en Amherst, encontraron en 1928 empíricamente una fórmula $F (K, L) = L^{α} K^{β}$ que se ajusta a la producción total $F$ de un sistema económico en función de la inversión de capital $K$ y el trabajo $L$ . Los dos autores usaron variables logarítmicas y asumieron linealidad para encontrar $α, β$ . A continuación se presentan los datos normalizados de modo que el valor del año 1899 es $100$ .

Año	$K$	$L$	$P$
1899	100	100	100
1900	107	105	101
1901	114	110	112
1902	122	118	122
1903	131	123	124
1904	138	116	122
1905	149	125	143
1906	163	133	152
1907	176	138	151
1908	185	121	126
1909	198	140	155
1910	208	144	159
1911	216	145	153
1912	226	152	177
1913	236	154	184
1914	244	149	169
1915	266	154	189
1916	298	182	225
1917	335	196	227
1918	366	200	223
1919	387	193	218
1920	407	193	231
1921	417	147	179
1922	431	161	240

**Figura 5.** La gráfica de $F (L, K) = L^{3 / 4} K^{1 / 4}$ se ajusta bastante bien a ese conjunto de datos. Se puede ver en los datos que hay un valor atípico.

20.3.2 Visualizando los límites de producción

Suponga que el trabajo y la inversión de capital están sujetos a la restricción adicional $G (L, K) = L^{3 / 4} + K^{1 / 4} = 50$ . (Esta función $G$ no está relacionada con la función $F (L, K)$ ya que estamos en un problema de Lagrange). ¿Dónde es máxima la producción $P$ bajo esta restricción? Grafique las dos funciones $F (L, K)$ y $G (L, K)$ .

Este ejemplo es de Rufus Bowen, Lecture Notes in Math, 470, 1978↩︎