高等数学(下)期末复习:14.8 拉格朗日乘子
14.8 拉格朗日乘子 1
拉格朗日乘子是一种用来找到限制条件下函数的最值的方法。
受约束的 2 最大值与最小值
例题 1
求平面 \(2y-z-5=0\) 上离原点最近的点。
这个很简单,就是把 \(z=2y-5\) 代入 \(\sqrt{x^2+y^2+z^2}\),转化为二元函数,再利用之前的 知识求解就行。但是代换法并不是每次都能使用得很 smooth.
另一个例子则能很好说明代换法的局限性。
例题 2
求 hyperbolic cylinder \(x^2-z^2-1=0\) 上离原点最近的点。
如果采用代换法,将 \(z^2=x^2-1\) 代入 \(x^2+y^2+z^2\) 中,得到 \(h(x,y)=2x^2+y^2-1\),要求 最小值,就有
\[ \begin{cases} h_x=4x=0 \\ h_y=2y=0 \end{cases} \Rightarrow x=y=0 \]
也就是原点本身,这个答案肯定很滑稽。之所以会这样,是因为我们需要的点是是在 hyperbolic cylinder 上的,而代换之后找目标点是以整个 \(x\text{-}y\) 平面为范围的。
能够避开对于范围的讨论而得到结果的另一种方法,则是考虑一个以原点为球心,\(a\) 为半 径的 “泡泡”。这个 “泡泡” 不断地变大,它刚好碰到 hyperbolic cylinder 的时候,那个交点 肯定就是到原点距离最小的点,距离为 \(a\)。
“泡泡” 与 hyperbolic cylinder 的方程分别为:
\[ \begin{cases} f(x,y,z)=x^2+y^2+z^2-a^2 \\ g(x,y,z)=x^2-z^2-1 \end{cases} \]
临界条件是它们相切,也就是切平面方向平行,也就是法线方向平行,也就是梯度向量平行 …… 也就是:
\[ \nabla f = \lambda \nabla g \]
也就是
\[ <2x,2y,2z>=\lambda<2x,0,-2z> \Rightarrow \begin{cases} 2x = 2\lambda x \\ 2y = 0 \\ 2z = -2\lambda z \end{cases} \Rightarrow \begin{cases} x = \\ y = 0 \\ z = \\ \lambda = \end{cases} \]
显然 \(x\neq0\),所以 \(\lambda = 1\),\(z=0\)。回带进限制方程 \(x^2-z^2-1=0\),得 到 \(x=\pm1\)。
REMARK:以上即为使用拉格朗日乘子法的一般形式
拉格朗日乘子法
利用上面这个式子找到最值点的方法,就叫拉格朗日乘子法,\(\lambda\) 称为拉格朗 日乘子。
定理 12:正交梯度定理
假设 \(f(x,y,z)\) 在区域上可微,在其内部有光滑曲线
\[ C:\mathbf{r}(t) = x(t)\mathbf{i}+y(t)\mathbf{j}+z(t)\mathbf{k} \]
若 \(f\) 在 \(C\) 上一点 \(P_0\) 处取得局域最大值或最小值,则 \(\nabla f\) 在 \(P_0\) 处正交 于 \(C\)。
原因是
\[ \frac{df}{dt} = \frac{\partial f}{\partial x} \frac{dx}{dt} + \frac{\partial f}{\partial y} \frac{dy}{dt} + \frac{\partial f}{\partial z} \frac{dz}{dt} = \nabla f \cdot \mathbf{r}' \]
这个定理很 trivial,有前面几节的铺垫就懂。定理 12 是拉格朗日乘子法的关键所在。
拉格朗日乘子法 >\(f(x,y,z)\) 和 \(g(x,y,z)\) 可微且 当 \(g(x,y,z)=0\) 时 \(\nabla g\neq0\)。要找到 \(f\) 受限制与 \(g=0\) 的区域最大值、最小值, 需要找到 \(x,y,z,\lambda\) 同时满足
\[ \begin{cases} \]
\nabla f = \lambda \nabla g \\
g(x,y,z) = 0
\end{cases}
$$
双重限制的拉格朗日乘子
有的问题要求有更多的限制,可以引入两个拉格朗日乘子。
\[ \begin{cases} \nabla f = \lambda \nabla g_1 + \mu \nabla g_2 \\ g_1(x,y,z) = 0 \\ g_2(x,y,z) = 0 \\ \end{cases} \]
从几何上解释,根据定理 12,要找到的是正交于 \(C\) 的 \(\nabla f\)。由于 \(C\) 位 于 \(g_1=0\) 与 \(g_2=0\) 上,而梯度向量与平面是正交的,所以 \(\nabla g_1\) 与 \(\nabla g_2\) 也 与 \(C\) 正交。这样,通过把 \(\nabla f\) 表示为 \(\nabla g_1\) 和 \(\nabla g_2\) 的线性组合,就 达到了目的。
REMARK:这个地方有点 tricky,一开始我还真没怎么想清楚到底是怎么回事。
REMARK:概括拉格朗日乘子法的使用
- 找到限制条件,表示为某函数等于 0 的形式
- 找到目标函数,表示为一个三元函数
- 分别求出梯度向量,列等式
- 将结果回带进限制条件,解出坐标
- 最后记得检验结论是否合理正确
这节的内容听起来很好像简单,但是真正做题的时候可能是另一回事,并且每个定理和每个 推导的背后都有很强的逻辑性。感谢写这篇文章让我认真把这些问题考虑清楚ヾ (^▽^*)))