牛顿方法求解方程根
|字数总计:1.4k|阅读时长:5分钟|阅读量:21
牛顿法求极小值和方程根
牛顿法求解函数的极小值,用二阶泰勒展开近似目标函数:
要求原函数 的极小值,可以用求近似函数 的极小值来近似。因为 是关于 的二次函数,所以令 求极小值点:
即
得到迭代公式:
对此公式的解释:
求解函数 的极小值,相当于求解导函数 的零点。对于求函数的零点可以用切线的与 轴的交点来迭代计算。首先,选择一个接近函数 零点的 ,计算相应的 和切线斜率 。然后我们计算穿过点 并且斜率为 的直线和 轴的交点的横坐标,也就是求如下方程的解:
我们将求得的点的 坐标命名为 ,通常 会比 更接近方程 的解。因此我们现在可以利用 开始下一轮迭代。迭代公式可以化简为如下所示:
转化成求极值点就是上面的导数形式。
对于多元函数的牛顿法:
基本牛顿法(还有阻尼牛顿法以及修正牛顿法)
设 具有连续的二阶偏导数,当前迭代点是 。 在 处的Taylor展开为
其中 , 是梯度方向, 是黑塞矩阵。. 在点 的邻域内,用二次函数
近似,求解问题
若 正定,对向量 求导,则方程组
的解 为上式的唯一解,我们称上式为Newton方程, 为牛顿方向。用牛顿方向作为迭代方向的最优化方法称为牛顿方法。
基本牛顿方法指取步长 的牛顿方法。在不引起混淆的情况下,基本牛顿方法简称为牛顿方法。在牛顿方法中,只要黑塞矩阵(Hessian Matrix) 正定,牛顿方向 就是下降方向,因为
算法(基本牛顿法)
步1 给出 ;
步2 若终止准则满足,则输出有关信息,停止迭代;
步3 由牛顿方程计算 ;
步4 ,转步2.
牛顿方法的优缺点:
牛顿方法的收敛性依赖于初始点的选择。当初始点接近极小点时,迭代序列收敛于极小点,并且收敛很快;否则就会出现迭代序列收敛到铵点或极大点的情形,或者在迭代过程中出现矩阵奇异或病态的情形,使线性方程组不能求解或不能很好地求解,导致迭代失败。
定理(基本牛顿方法的收敛性)设 , 的黑塞矩阵 满足 Lipschitz 条件,即存在 ,对任给的 与 ,有 若 充分接近 的局部极小点 ,且 正定,则牛顿方法对所有的 有定义,并以二阶收敛速度收敛。
该定理说,只有当迭代点充分接近 时,基本牛顿方法的收敛性才能保证。
优点:
1, 当 充分接近问题的极小点 时,方法以二阶收敛速度收敛;
2, 方法具有二次终止性。
缺点:
1, 当 没有充分接近问题的极小点 时, 会出现不正定或奇异的情形,使 不能收敛到 ,或使迭代无法进行;即使 正定,也不能保证 单调下降;
2, 每步迭代需要计算黑塞矩阵,即计算 个二阶偏导数;
3, 每步迭代需要解一个线性方程组,计算量为 .
阻尼牛顿方法
为了改善牛顿方法的局部收敛性,我们可以采用带一维搜索的牛顿方法,即
其中,是一维搜索的结果。该方法称为阻尼牛顿方法,此方法能够保证对正定的, 单调下降,即使离稍远,该方法产生的点列仍可能收敛至 。 对严格凸函数,采用 Wolfe 准则的阻尼牛顿方法具有全局收敛性。