约束
目录
20.1 引言
20.1.1 约束条件下最优解的梯度
很少有“免费的午餐”。如果我们想最大化一个量,通常需要处理约束条件。障碍可能会阻止我们随意改变参数。梯度仍然可以作为指导原则。虽然我们无法使 为零,但可以寻找梯度与约束垂直的点。这给出了在限制下的最优点。如果你在山间小径上徒步,常常会在没有到达山顶时就达到局部最大值。在这样的点 处, 垂直于曲线,这意味着 平行于 。


20.1.2 拉格朗日的魔法:多约束,一解法
拉格朗日方法更为通用。我们可以处理任意多个约束,并仍然使用相同的原理。此时 的梯度垂直于约束曲面,这意味着它是所有 个约束的梯度的线性组合:即 个方程 ,因为向量有 个分量。再加上 个方程 ,我们共有 个方程,对应 个变量 , 。
20.2 讲座
20.2.1 在受限空间中寻找最大值
如果我们想在约束 下最大化函数 ,那么 和 的梯度都很重要。如果存在某个实数 使得 或 ,则称两个向量 、 平行。零向量与任何向量平行。以下是费马原理的一个变体:
定理 1. 如果 是 在约束 下的最大值点,那么 和 平行。
证明. 反证法:假设 和 不平行,且 是局部最大值。设 为 在 处的切平面。因为 不垂直于 ,我们可以将其投影到 上,得到 中的一个非零向量 ,该向量不垂直于 。实际上, 与 之间的夹角是锐角,因此 。取 中的一条曲线 ,满足 且

20.2.2 探索拉格朗日乘子与必要条件
这立即意味着:(区分 和 )
定理 2. 对于 在 上的最大值,要么拉格朗日方程 、 成立,要么 、 成立。
对于两个变量的函数 ,这意味着我们必须求解一个包含三个方程和三个未知数的方程组:
20.2.3 寻找真正的最大值
要找到最大值,解拉格朗日方程,并加上约束上 的临界点列表。然后在所有点中选择 最大的点。我们不用二阶导数检验。但这里有一个可能的陈述:如果对于所有垂直于 的 ,有 ,那么 是局部最大值。
当然,最大值和最小值的情况是类似的。如果 在 上有最大值,那么 在 上有最小值。我们可能在光滑约束 下得到 的最大值,而拉格朗日方程并不满足。一个例子是 和 ,如图 (20.3) 所示。

20.2.4 拉格朗日的攀登:多约束下的最大化
拉格朗日方法可以在多个约束下最大化函数 。我们以三个变量的函数 和两个约束 与 为例进行说明。费马原理的类似表述是:在 的最大值点处, 的梯度位于由 和 张成的平面内。这导出了关于 个未知数 的 拉格朗日方程。
例如,如果

20.3 示例
例 1. 问题:在约束 下最小化 。
解:拉格朗日方程为 ,。如果 ,则 。如果 ,我们可以将第二个方程除以 ,得到 ,,再次表明 。点 , 是唯一解。
例 2. 问题:对于固定体积 ,高度为 、半径为 的圆柱形汽水罐,何时表面积 最小?
解:我们有 和 。令 ,,则需要在约束 下优化 。我们将在课堂上完成。
例 3. 问题:如果 是骰子显示 的概率,那么我们有 。这个向量 称为一个 概率分布。 的香农熵定义为
找出使熵 最大化的分布 。
解: 拉格朗日方程为 由此得到 。最后一个方程 确定 ,因此 。这是一个公平的骰子,具有最大熵。最大熵意味着 最少的信息量。
例 4. 假设一个物理或化学系统处于状态 的概率为 ,且状态 的能量为 。如果能量 固定,自然界会最小化 自由能 。满足 且使自由能最小化的概率分布 称为 吉布斯分布。在给定 的一般情况下,找出这个分布。
解: 拉格朗日方程为 ,或 ,其中 。约束 给出 ,因此 。吉布斯解 为 。1
例 5. 如果 是 上的二次函数,而 是线性的,即 ,其中 ,且约束 是线性的,,那么 ,。记 。拉格朗日方程则为 ,。我们看到,对于二次的 和线性的 ,最终会得到一个 线性方程组。
例 6. 与前述评论相关的是以下观察。通常可以将拉格朗日问题简化为无约束问题。这是经济学中常采用的观点。我们以二维情况为例,在约束 下求 的极值。定义 。此时 的拉格朗日方程等价于三维中的 。
练习
练习 1. 求顶部敞开的圆柱形篮子,在固定面积为 时具有最大体积。设 为半径, 为高,我们需要在约束条件下最大化 使用拉格朗日乘数法。
练习 2. 给定一个 对称矩阵 ,考察函数 ,并在约束条件 下求 的极值。这引出一个方程 解 称为特征向量。拉格朗日常数 是特征值。若 是一个 矩阵,求 、 的解,其中 然后求解 、、、 时的问题。
练习 3. 一个高为 、底面为正方形 的棱锥,其表面积为 ,何时体积最大 ?通过引入新变量 并将 乘以一个常数,我们得到等价问题:在约束条件下最大化 使用后面的变量。
练习 4. 受迪士尼电影《魔发奇缘》的启发,我们想建造一个热气球,其长方体框架尺寸为 、、,加上顶部和底部的加固,使用的金属丝总长为 求体积最大时的气球,体积为 。
练习 5. 一颗由半球和圆柱组成的实心子弹,体积为 ,表面积为 。曼哈顿博士设计了一颗体积固定而表面积最小的子弹。设 且 ,因此他在约束条件下最小化 使用拉格朗日方法求 在约束条件 下的局部最小值。
附录:数据示例:柯布-道格拉斯生产函数
20.3.1 柯布-道格拉斯:经济增长的一个公式
阿默斯特学院的数学家、经济学家查尔斯·W·柯布与同样在阿默斯特任教的经济学家、政治家保罗·H·道格拉斯于1928年根据经验发现了一个公式 ,该公式将经济体系的总产出 拟合为资本投入 和劳动力 的函数。两位作者使用了对数变量并假设线性关系来求 。以下数据已归一化,使得1899年的数据值为 。
| 年份 | |||
|---|---|---|---|
| 1899 | 100 | 100 | 100 |
| 1900 | 107 | 105 | 101 |
| 1901 | 114 | 110 | 112 |
| 1902 | 122 | 118 | 122 |
| 1903 | 131 | 123 | 124 |
| 1904 | 138 | 116 | 122 |
| 1905 | 149 | 125 | 143 |
| 1906 | 163 | 133 | 152 |
| 1907 | 176 | 138 | 151 |
| 1908 | 185 | 121 | 126 |
| 1909 | 198 | 140 | 155 |
| 1910 | 208 | 144 | 159 |
| 1911 | 216 | 145 | 153 |
| 1912 | 226 | 152 | 177 |
| 1913 | 236 | 154 | 184 |
| 1914 | 244 | 149 | 169 |
| 1915 | 266 | 154 | 189 |
| 1916 | 298 | 182 | 225 |
| 1917 | 335 | 196 | 227 |
| 1918 | 366 | 200 | 223 |
| 1919 | 387 | 193 | 218 |
| 1920 | 407 | 193 | 231 |
| 1921 | 417 | 147 | 179 |
| 1922 | 431 | 161 | 240 |

20.3.2 可视化生产限制
假设劳动力和资本投入受到额外约束 。(此函数 与函数 无关,因为我们是在处理拉格朗日问题。)在该约束下,产出 在何处最大?绘制两个函数 和 的图像。
- 此例来自鲁弗斯·鲍恩,《数学讲义笔记》,470,1978年↩︎