Restricciones


 

20.1 INTRODUCCIÓN

20.1.1 Gradientes para Soluciones Óptimas con Restricciones

Rara vez hay un "almuerzo gratis". Si queremos maximizar una cantidad, a menudo tenemos que trabajar con restricciones. Los obstáculos pueden impedirnos cambiar los parámetros arbitrariamente. El gradiente aún puede usarse como principio guía. Aunque no podemos lograr que f sea cero, podemos buscar puntos donde el gradiente sea perpendicular a la restricción. Esto nos da un punto óptimo bajo el confinamiento. Si caminas por un sendero en las montañas, a menudo alcanzas un máximo local sin estar en la cima de la montaña. Lo que sucede en tales puntos x es que f ( x ) es perpendicular a la curva, lo que significa que f ( x ) es paralelo a g ( x ) .

Figura 1. La situación, donde una función f ( x , y ) se optimiza a lo largo de una curva g ( x , y ) = c es un marco que puede abordarse con Lagrange. La condición de ser máximo significa que el gradiente de f es perpendicular a la curva. Esto significa que los gradientes de f y g son paralelos. f = λ g .

20.1.2 La Magia de Lagrange: Muchas Restricciones, Una Solución

El método de Lagrange es mucho más general. Podemos trabajar con un número arbitrario de restricciones y aún usar el mismo principio. El gradiente de f : n es entonces perpendicular a la superficie de restricción, lo que significa que es una combinación lineal de los gradientes de todas las m restricciones: estas son n ecuaciones f = j = 1 m λ j g j porque los vectores tienen n componentes. Junto con las m ecuaciones g j = c j tenemos n + m ecuaciones para n + n variables x 1 , , x n , λ 1 , , λ m .

20.2 LECCIÓN

20.2.1 Encontrando el Máximo en Espacios Confinados

Si queremos maximizar una función f : m en la restricción S = { x m g ( x ) = c } , entonces importan tanto los gradientes de f como de g . Llamamos a dos vectores v , w paralelos si v = λ w o w = λ v para algún λ real. El vector cero es paralelo a todo. Aquí hay una variante de Fermat:

Teorema 1. Si x 0 es un máximo de f bajo la restricción g = c , entonces f ( x 0 ) y g ( x 0 ) son paralelos.

Demostración. Por contradicción: supongamos que f ( x 0 ) y g ( x 0 ) no son paralelos y x 0 es un máximo local. Sea T el plano tangente a S = { g = c } en x 0 . Como f ( x 0 ) no es perpendicular a T podemos proyectarlo sobre T para obtener un vector no nulo v en T que no es perpendicular a f . De hecho, el ángulo entre f y v es agudo, por lo que cos ( α ) > 0 . Tomemos una curva r ( t ) en S con r ( 0 ) = x 0 y r^{\prime}(0)=v. Tenemos \begin{aligned} d / d t f(r(0))&=\nabla f(r(0)) \cdot r^{\prime}(0)\\ &=|\nabla f(x_{0})||v| \cos (\alpha)\\ &>0. \end{aligned} Por aproximación lineal, sabemos que f ( r ( t ) ) > f ( r ( 0 ) ) para t > 0 suficientemente pequeño. Esto contradice el hecho de que f era máximo en x 0 = r ( 0 ) en S . ◻

Figura 2. Un problema de Lagrange

20.2.2 Explorando los Multiplicadores de Lagrange y las Condiciones Necesarias

Esto implica inmediatamente: (distinguir g 0 y g = 0 )

Teorema 2. Para un máximo de f en S = { g = c } o bien se cumplen las ecuaciones de Lagrange f ( x 0 ) = λ g ( x 0 ) , g = c , o bien g ( x 0 ) = 0 , g = c .

Para funciones f ( x , y ) , g ( x , y ) de dos variables, esto significa que tenemos que resolver un sistema con tres ecuaciones y tres incógnitas: \begin{aligned} f_{x}(x_{0}, y_{0}) & =\lambda g_{x}(x_{0}, y_{0}) \\ f_{y}(x_{0}, y_{0}) & =\lambda g_{y}(x_{0}, y_{0}) \\ g(x, y) & =c \end{aligned}

20.2.3 Encontrando el Verdadero Máximo

Para encontrar un máximo, resuelve las ecuaciones de Lagrange y añade una lista de puntos críticos de g en la restricción. Luego elige un punto donde f sea máximo entre todos los puntos. No nos preocupamos por una prueba de segunda derivada. Pero aquí hay una posible afirmación: d 2 d t 2 D t v D t v f ( x 0 ) | t = 0 < 0 para todo v perpendicular a g ( x 0 ) , entonces x 0 es un máximo local.

Por supuesto, el caso de máximos y mínimos es análogo. Si f tiene un máximo en g = c , entonces f tiene un mínimo en g = c . Podemos tener un máximo de f bajo una restricción suave S = { g = c } sin que se satisfagan las ecuaciones de Lagrange. Un ejemplo es f ( x , y ) = x y g ( x , y ) = x 3 y 2 mostrado en la Figura (20.3).

Figura 3. Un ejemplo de una función, donde las ecuaciones de Lagrange no dan el mínimo, aquí ( 0 , 0 ) . Es un caso, donde g = 0 .

20.2.4 La Escalada de Lagrange: Maximizando con Múltiples Restricciones

El método de Lagrange puede maximizar funciones f bajo varias restricciones. Mostremos esto en el caso de una función f ( x , y , z ) de tres variables y dos restricciones g ( x , y , z ) = c y h ( x , y , z ) = d . El análogo del principio de Fermat es que en un máximo de f , el gradiente de f está en el plano generado por g y h . Esto conduce a las ecuaciones de Lagrange para 5 incógnitas x , y , z , λ , μ . \begin{aligned} f_{x}(x_{0}, y_{0}, z_{0}) & =\lambda g_{x}(x_{0}, y_{0}, z_{0})+\mu h_{x}(x_{0}, y_{0}, z_{0}) \\ f_{y}(x_{0}, y_{0}, z_{0}) & =\lambda g_{y}(x_{0}, y_{0}, z_{0})+\mu h_{y}(x_{0}, y_{0}, z_{0}) \\ f_{z}(x_{0}, y_{0}, z_{0}) & =\lambda g_{z}(x_{0}, y_{0}, z_{0})+\mu h_{z}(x_{0}, y_{0}, z_{0}) \\ g(x, y, z) & =c \\ h(x, y, z) & =d \end{aligned}

Por ejemplo, si \begin{aligned} f(x, y, z)&=x^{2}+y^{2}+z^{2},\\ g(x, y, z)&=x^{2}+y^{2}=1,\\ h(x, y, z)&=x+y+z=4, \end{aligned} entonces encontramos puntos en la elipse g = 1 , h = 4 con distancia mínima o máxima a 0 .

Figura 4. Vemos una situación donde intentamos maximizar una función f bajo dos restricciones. En este caso la intersección g = c , h = d es una elipse.

20.3 EJEMPLOS

Ejemplo 1. Problema: Minimizar f ( x , y ) = x 2 + 2 y 2 bajo la restricción g ( x , y ) = x + y 2 = 1 .
Solución: Las ecuaciones de Lagrange son 2 x = λ , 4 y = λ 2 y . Si y = 0 entonces x = 1 . Si y 0 podemos dividir la segunda ecuación por y y obtener 2 x = λ , 4 = λ 2 mostrando nuevamente x = 1 . El punto x = 1 , y = 0 es la única solución.

Ejemplo 2. Problema: ¿Qué lata cilíndrica de refresco de altura h y radio r tiene superficie mínima A para un volumen fijo V ?
Solución: Tenemos V ( r , h ) = h π r 2 = 1 y A ( r , h ) = 2 π r h + 2 π r 2 . Con x = h π , y = r , necesitas optimizar f ( x , y ) = 2 x y + 2 π y 2 bajo la restricción g ( x , y ) = x y 2 = 1 . Lo haremos en clase.

Ejemplo 3. Problema: Si 0 p k 1 es la probabilidad de que un dado muestre k , entonces tenemos g ( p ) = p 1 + p 2 + + p 6 = 1 . Este vector p se llama una distribución de probabilidad. La entropía de Shannon de p se define como \begin{aligned} S(p)&=-\sum_{i=1}^{6} p_{i} \log (p_{i})\\ &=-p_{1} \log (p_{1})-p_{2} \log (p_{2})-\cdots-p_{6} \log (p_{6}) \end{aligned}

Encuentra la distribución p que maximiza la entropía S .
Solución: f = ( 1 log ( p 1 ) , , 1 log ( p n ) ) , g = ( 1 , , 1 ) . Las ecuaciones de Lagrange son 1 log ( p i ) = λ , p 1 + + p 6 = 1 , de donde obtenemos p i = e ( λ + 1 ) . La última ecuación 1 = i exp ( ( λ + 1 ) ) = 6 exp ( ( λ + 1 ) ) fija λ = log ( 1 / 6 ) 1 de modo que p 1 = p 2 = = p 6 = 1 / 6 . Es el dado justo que tiene entropía máxima. Entropía máxima significa menor contenido de información.

Ejemplo 4. Supongamos que la probabilidad de que un sistema físico o químico esté en un estado k es p k y que la energía del estado k es E k . La naturaleza minimiza la energía libre F ( p 1 , , p n ) = i [ p i log ( p i ) E i p i ] si las energías E i están fijas. La distribución de probabilidad p i que satisface i p i = 1 y minimiza la energía libre se llama una distribución de Gibbs. Encuentra esta distribución en general si se dan E i .
Solución: f = ( 1 log ( p 1 ) E 1 , , 1 log ( p n ) E n ) , g = ( 1 , , 1 ) . Las ecuaciones de Lagrange son log ( p i ) = 1 λ E i , o p i = exp ( E i ) C , donde C = exp ( 1 λ ) . La restricción p 1 + + p n = 1 da C ( i exp ( E i ) ) = 1 de modo que C = 1 / ( i e E i ) . La solución de Gibbs es p k = exp ( E k ) / i exp ( E i ) .1

Ejemplo 5. Si f es una función cuadrática en m y g es lineal, es decir f ( x ) = B x x / 2 con B M ( m , m ) y si la restricción g ( x ) = A x = c es lineal A M ( 1 , m ) , entonces f ( x ) = B x y g ( x ) = A T . Llamemos b = A T M ( m , 1 ) m . Las ecuaciones de Lagrange son entonces B x = λ b , A x = c . Vemos en general que para f cuadrática y g lineal, terminamos con un sistema lineal de ecuaciones.

Ejemplo 6. Relacionada con la observación anterior está la siguiente observación. A menudo es posible reducir el problema de Lagrange a un problema sin restricción. Este es un punto de vista a menudo adoptado en economía. Veámoslo en dimensión 2 , donde extremizamos f ( x , y ) bajo la restricción g ( x , y ) = 0 . Definimos F ( x , y , λ ) = f ( x , y ) λ g ( x , y ) . Las ecuaciones de Lagrange para f , g son ahora equivalentes a F ( x , y , λ ) = 0 en tres dimensiones.

EJERCICIOS

Ejercicio 1. Encuentre la cesta cilíndrica abierta por arriba que tiene el mayor volumen para un área fija π . Si x es el radio y y es la altura, tenemos que maximizar f ( x , y ) = π x 2 y bajo la restricción g ( x , y ) = 2 π x y + π x 2 = π . Use el método de los multiplicadores de Lagrange.

Ejercicio 2. Dada una matriz simétrica n × n B , consideramos la función f ( x ) = x B x y buscamos los extremos de f bajo la restricción de que g ( x ) = x x = 1 . Esto conduce a una ecuación B x = λ x . Una solución x se llama un vector propio. La constante de Lagrange λ es un valor propio. Encuentre las soluciones de B x = λ x , | x | = 1 si B es una matriz 2 × 2 , donde f ( x , y ) = a x 2 + ( b + c ) x y + d y 2 , g ( x , y ) = x 2 + y 2 . Luego resuelva el problema con a = 4 , b = 1 , c = 1 , d = 4 .

Ejercicio 3. ¿Qué pirámide de altura h sobre un cuadrado [ a , a ] × [ a , a ] con área superficial 4 a h 2 + a 2 + 4 a 2 = 4 tiene volumen máximo V ( h , a ) = 4 h a 2 / 3 ? Usando nuevas variables ( x , y ) y multiplicando V por una constante, obtenemos el problema equivalente de maximizar f ( x , y ) = y x 2 bajo la restricción g ( x , y ) = x y 2 + x 2 + x 2 = 1. Use las últimas variables.

Ejercicio 4. Motivados por la película de Disney "Enredados", queremos construir un globo aerostático con una malla ortoédrica de dimensiones x , y , z que, junto con los refuerzos superior e inferior, utiliza alambres de una longitud total g ( x , y , z ) = 6 x + 6 y + 4 z = 32. Encuentre el globo con volumen máximo f ( x , y , z ) = x y z .

Ejercicio 5. Una bala sólida formada por una semiesfera y un cilindro tiene el volumen V = 2 π r 3 / 3 + π r 2 h y el área superficial A = 2 π r 2 + 2 π r h + π r 2 . El Doctor Manhattan diseña una bala con volumen fijo y área mínima. Con g = 3 V / π = 1 y f = A / π , entonces minimiza f ( h , r ) = 3 r 2 + 2 r h bajo la restricción g ( h , r ) = 2 r 3 + 3 r 2 h = 1. Use el método de Lagrange para encontrar un mínimo local de f bajo la restricción g = 1 .

Apéndice: Ilustración de datos: Cobb Douglas

20.3.1 Cobb-Douglas: Una fórmula para el crecimiento económico

El matemático y economista Charles W. Cobb del Amherst College y el economista y político Paul H. Douglas, quien también enseñaba en Amherst, encontraron en 1928 empíricamente una fórmula F ( K , L ) = L α K β que se ajusta a la producción total F de un sistema económico en función de la inversión de capital K y el trabajo L . Los dos autores usaron variables logarítmicas y asumieron linealidad para encontrar α , β . A continuación se presentan los datos normalizados de modo que el valor del año 1899 es 100 .

Año K L P
1899100100100
1900107105101
1901114110112
1902122118122
1903131123124
1904138116122
1905149125143
1906163133152
1907176138151
1908185121126
1909198140155
1910208144159
1911216145153
1912226152177
1913236154184
1914244149169
1915266154189
1916298182225
1917335196227
1918366200223
1919387193218
1920407193231
1921417147179
1922431161240
Figura 5. La gráfica de F ( L , K ) = L 3 / 4 K 1 / 4 se ajusta bastante bien a ese conjunto de datos. Se puede ver en los datos que hay un valor atípico.

20.3.2 Visualizando los límites de producción

Suponga que el trabajo y la inversión de capital están sujetos a la restricción adicional G ( L , K ) = L 3 / 4 + K 1 / 4 = 50 . (Esta función G no está relacionada con la función F ( L , K ) ya que estamos en un problema de Lagrange). ¿Dónde es máxima la producción P bajo esta restricción? Grafique las dos funciones F ( L , K ) y G ( L , K ) .


  1. Este ejemplo es de Rufus Bowen, Lecture Notes in Math, 470, 1978↩︎