下降方法

下降方法

原創

2023-11-29 13:13

在這一部分我們的目標是求出凸函數的最小值。一般來說，只要我們能解出方程\(\nabla f(x)=0\)我們就能求出最小值點。然而很多時候這一方程的封閉解是不存在的，這要求我們用其它的手段來求最小值。在線性規劃的單純形法中我們注意到每次移動到一個更優值最終能保證我們找到最優解，那在非線性的凸優化中是否存在一個類似的方法？這就是下降方法，我們每次都找到一個更小的值，期待我們最終找到最優值。

梯度下降

在\(f(x_0)\)處，\(-\nabla f(x_0)\)的方向是函數值下降最快的方向，因此我們能保證每次往負梯度方向移動一小步函數值是一定會下降的，因此我們期待反覆迭代這一過程最終得到最小值。然而步長的確定是一個困難的工作，步長太長會導致反覆橫跳，步長太短會導致無法收斂到最小值。我們無法對於任意函數給出一個選取最優步長的公式，但我們可以討論當函數滿足一些特殊的性質時，我們能給出步長選取的方法。

當函數滿足對於任意\(x,y\)有\(\|\nabla f(x)-\nabla f(y)\| \leq L\|x-y\|\)時稱\(f\)爲\(L-\)smooth函數（這個條件還等價於\(\nabla^2 f(x)\)的最大特徵值的絕對值不超過\(L\)，也等價於\(|f(y)-f(x)-\lang \nabla f(x),y-x\rang| \leq \dfrac{L}{2}\|y-x\|^2\)恆成立），此時它的一階導變化不會太快。此時取步長\(\eta \leq \dfrac{1}{L}\)，我們能夠證明取\(x_{k+1}=x_k-\eta\nabla f(x_k)\)，則有\(f(x_{k+1})\leq f(x_k)-\dfrac{t}{2}\|\nabla f(x_k)\|^2\)成立。這稱爲下降引理，選取這樣的步長我們能保證函數值不斷下降，收斂到最小值。

（沒寫完）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

梯度下降

釘釘打卡速度慢

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Python 潮流週刊#51：用 Python 繪製美觀的圖表

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Zorn's Lemma

單純形法的平滑分析

羣的直積

高斯信道

微分熵

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結