用Python實現牛頓法求極值

對於一個多元函數f(x)=f(x1,x2,,xn) ,用牛頓法求其極小值的迭代格式爲

xk+1=xkG1kgk

其中g(x)=f(x) 爲函數f(x) 的梯度向量,G(x) 爲函數f(x) 的Hesse(Hessian)矩陣。

上述牛頓法不是全局收斂的。爲此可以引入阻尼牛頓法(又稱帶步長的牛頓法)。

我們知道,求極值的一般迭代格式爲

xk+1=xk+αkpk

其中αk 爲搜索步長,pk 爲搜索方向(注意所有的迭代格式都是先計算搜索方向,再計算搜索步長,如同瞎子下山一樣,先找到哪個方向可行下降,再決定下幾步)。

取下降方向pk=G1kgk 即得阻尼牛頓法,只不過搜索步長αk 不確定,需要用線性搜索技術確定一個較優的值,比如精確線性搜索或者Goldstein搜索、Wolfe搜索等。特別地,當αk 一直取爲常數1時,就是普通的牛頓法。

以Rosenbrock函數爲例,即有

f(x)=100(x2x21)2+(1x1)2

於是可得函數的梯度

g(x)=f(x)=(400(x2x21)x12(1x1),200(x2x21))T

函數f(x) 的Hesse矩陣爲

(400(x23x21)+2400x1400x1200)

編寫Python代碼如下(使用版本爲Python3.3):

"""
Newton法
Rosenbrock函數
函數 f(x)=100*(x(2)-x(1).^2).^2+(1-x(1)).^2
梯度 g(x)=(-400*(x(2)-x(1)^2)*x(1)-2*(1-x(1)),200*(x(2)-x(1)^2))^(T)
"""

import numpy as np
import matplotlib.pyplot as plt

def jacobian(x):
    return np.array([-400*x[0]*(x[1]-x[0]**2)-2*(1-x[0]),200*(x[1]-x[0]**2)])

def hessian(x):
    return np.array([[-400*(x[1]-3*x[0]**2)+2,-400*x[0]],[-400*x[0],200]])

X1=np.arange(-1.5,1.5+0.05,0.05)
X2=np.arange(-3.5,2+0.05,0.05)
[x1,x2]=np.meshgrid(X1,X2)
f=100*(x2-x1**2)**2+(1-x1)**2; # 給定的函數
plt.contour(x1,x2,f,20) # 畫出函數的20條輪廓線


def newton(x0):

    print('初始點爲:')
    print(x0,'\n')
    W=np.zeros((2,10**3))
    i = 1
    imax = 1000
    W[:,0] = x0 
    x = x0
    delta = 1
    alpha = 1

    while i<imax and delta>10**(-5):
        p = -np.dot(np.linalg.inv(hessian(x)),jacobian(x))
        x0 = x
        x = x + alpha*p
        W[:,i] = x
        delta = sum((x-x0)**2)
        print('第',i,'次迭代結果:')
        print(x,'\n')
        i=i+1
    W=W[:,0:i]  # 記錄迭代點
    return W

x0 = np.array([-1.2,1])
W=newton(x0)

plt.plot(W[0,:],W[1,:],'g*',W[0,:],W[1,:]) # 畫出迭代點收斂的軌跡
plt.show()

上述代碼中jacobian(x)返回函數的梯度,hessian(x)返回函數的Hesse矩陣,用W矩陣記錄迭代點的座標,然後畫出點的搜索軌跡。

可得輸出結果爲

初始點爲:
[-1.2  1. ] 

第 1 次迭代結果:
[-1.1752809   1.38067416] 

第 2 次迭代結果:
[ 0.76311487 -3.17503385] 

第 3 次迭代結果:
[ 0.76342968  0.58282478] 

第 4 次迭代結果:
[ 0.99999531  0.94402732] 

第 5 次迭代結果:
[ 0.9999957   0.99999139] 

第 6 次迭代結果:
[ 1.  1.] 

即迭代了6次得到了最優解,畫出的迭代點的軌跡如下:
牛頓法搜索軌跡

由於主要使用了Python的Numpy模塊來進行計算,可以看出,代碼和最終的圖與Matlab是很相像的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章