常用算法思想二(動態規劃)

一、基本概念

    動態規劃過程是:每次決策依賴於當前狀態,又隨即引起狀態的轉移。一個決策序列就是在變化的狀態中產生出來的,所以,這種多階段最優化決策解決問題的過程就稱爲動態規劃。

二、基本思想與策略

    基本思想與分治法類似,也是將待求解的問題分解爲若干個子問題(階段),按順序求解子階段,前一子問題的解,爲後一子問題的求解提供了有用的信息。在求解任一子問題時,列出各種可能的局部解,通過決策保留那些有可能達到最優的局部解,丟棄其他局部解。依次解決各子問題,最後一個子問題就是初始問題的解。

    由於動態規劃解決的問題多數有重疊子問題這個特點,爲減少重複計算,對每一個子問題只解一次,將其不同階段的不同狀態保存在一個二維數組中。

    與分治法最大的差別是:適合於用動態規劃法求解的問題,經分解後得到的子問題往往不是互相獨立的(即下一個子階段的求解是建立在上一個子階段的解的基礎上,進行進一步的求解)

 


三、適用的情況

能採用動態規劃求解的問題的一般要具有3個性質:

    (1) 最優化原理:如果問題的最優解所包含的子問題的解也是最優的,就稱該問題具有最優子結構,即滿足最優化原理。

    (2) 無後效性:即某階段狀態一旦確定,就不受這個狀態以後決策的影響。也就是說,某狀態以後的過程不會影響以前的狀態,只與當前狀態有關。

   (3)有重疊子問題:即子問題之間是不獨立的,一個子問題在下一階段決策中可能被多次使用到。(該性質並不是動態規劃適用的必要條件,但是如果沒有這條性質,動態規劃算法同其他算法相比就不具備優勢

 


四、求解的基本步驟

     動態規劃所處理的問題是一個多階段決策問題,一般由初始狀態開始,通過對中間階段決策的選擇,達到結束狀態。這些決策形成了一個決策序列,同時確定了完成整個過程的一條活動路線(通常是求最優的活動路線)。如圖所示。動態規劃的設計都有着一定的模式,一般要經歷以下幾個步驟。

   初始狀態→│決策1│→│決策2│→…→│決策n│→結束狀態

                      圖1 動態規劃決策過程示意圖

    (1)劃分階段:按照問題的時間或空間特徵,把問題分爲若干個階段。在劃分階段時,注意劃分後的階段一定要是有序的或者是可排序的,否則問題就無法求解。

    (2)確定狀態和狀態變量:將問題發展到各個階段時所處於的各種客觀情況用不同的狀態表示出來。當然,狀態的選擇要滿足無後效性。

    (3)確定決策並寫出狀態轉移方程:因爲決策和狀態轉移有着天然的聯繫,狀態轉移就是根據上一階段的狀態和決策來導出本階段的狀態。所以如果確定了決策,狀態轉移方程也就可寫出。但事實上常常是反過來做,根據相鄰兩個階段的狀態之間的關係來確定決策方法和狀態轉移方程

    (4)尋找邊界條件:給出的狀態轉移方程是一個遞推式,需要一個遞推的終止條件或邊界條件。

    一般,只要解決問題的階段狀態狀態轉移決策確定了,就可以寫出狀態轉移方程(包括邊界條件)。

實際應用中可以按以下幾個簡化的步驟進行設計:

    (1)分析最優解的性質,並刻畫其結構特徵。

    (2)遞歸的定義最優解。

    (3)以自底向上或自頂向下的記憶化方式(備忘錄法)計算出最優值

    (4)根據計算最優值時得到的信息,構造問題的最優解

 


五、算法實現的說明

    動態規劃的主要難點在於理論上的設計,也就是上面4個步驟的確定,一旦設計完成,實現部分就會非常簡單。

     使用動態規劃求解問題,最重要的就是確定動態規劃三要素

    (1)問題的階段 (2)每個階段的狀態

    (3)從前一個階段轉化到後一個階段之間的遞推關係

     遞推關係必須是從次小的問題開始到較大的問題之間的轉化,從這個角度來說,動態規劃往往可以用遞歸程序來實現,不過因爲遞推可以充分利用前面保存的子問題的解來減少重複計算,所以對於大規模問題來說,有遞歸不可比擬的優勢,這也是動態規劃算法的核心之處

    確定了動態規劃的這三要素,整個求解過程就可以用一個最優決策表來描述最優決策表是一個二維表,其中行表示決策的階段,列表示問題狀態,表格需要填寫的數據一般對應此問題的在某個階段某個狀態下的最優值(如最短路徑,最長公共子序列,最大價值等),填表的過程就是根據遞推關係,從1行1列開始,以行或者列優先的順序,依次填寫表格,最後根據整個表格的數據通過簡單的取捨或者運算求得問題的最優解。

五、算法應用示例

用一個實際例子來體現動態規劃的算法思想——硬幣找零問題。

硬幣找零問題描述:現存在一堆面值爲 V1、V2、V3 … 個單位的硬幣,問最少需要多少個硬幣才能找出總值爲 T 個單位的零錢?假設這一堆面值分別爲 1、2、5、21、25 元,需要找出總值 T 爲 63 元的零錢。

很明顯,只要拿出 3 個 21 元的硬幣就湊夠了 63 元了。

基於上述動態規劃的思想,我們可以從 1 元開始計算出最少需要幾個硬幣,然後再求 2 元、3元…每一次求得的結果都保存在一個數組中,以後需要用到時則直接取出即可。那麼我們什麼時候需要這些子問題的解呢?如何體現出由子問題的解得到較大問題的解呢?

其實,在我們從 1 元開始依次找零時,可以嘗試一下當前要找零的面值(這裏指 1 元)是否能夠被分解成另一個已求解的面值的找零需要的硬幣個數再加上這一堆硬幣中的某個面值之和,如果這樣分解之後最終的硬幣數是最少的,那麼問題就得到答案了。

單是上面的文字描述太抽象,先假定以下變量:

values[] : 保存每一種硬幣的幣值的數組
valueKinds :幣值不同的硬幣種類數量,即values[]數組的大小
money : 需要找零的面值
coinsUsed[] : 保存面值爲 i 的紙幣找零所需的最小硬幣數

算法描述:

當求解總面值爲 i 的找零最少硬幣數 coinsUsed[ i ] 時,將其分解成求解 coinsUsed[ i – cents]和一個面值爲 cents 元的硬幣,由於 i – cents < i , 其解 coinsUsed[ i – cents] 已經存在,如果面值爲 cents 的硬幣滿足題意,那麼最終解 coinsUsed[ i ] 則等於 coinsUsed[ i – cents] 再加上 1(即面值爲 cents)的這一個硬幣。

下面用代碼實現並測試一下:

  1. public class CoinsChange {    
  2.     /**   
  3.      * 硬幣找零:動態規劃算法   
  4.      *    
  5.      * @param values   
  6.      *            :保存每一種硬幣的幣值的數組   
  7.      * @param valueKinds   
  8.      *            :幣值不同的硬幣種類數量,即coinValue[]數組的大小   
  9.      * @param money   
  10.      *            :需要找零的面值   
  11.      * @param coinsUsed   
  12.      *            :保存面值爲i的紙幣找零所需的最小硬幣數   
  13.      */   
  14.     public static void makeChange(int[] values, int valueKinds, int money,    
  15.             int[] coinsUsed) {    
  16.    
  17.         coinsUsed[0] = 0;    
  18.         // 對每一分錢都找零,即保存子問題的解以備用,即填表    
  19.         for (int cents = 1; cents <= money; cents++) {    
  20.    
  21.             // 當用最小幣值的硬幣找零時,所需硬幣數量最多    
  22.             int minCoins = cents;    
  23.    
  24.             // 遍歷每一種面值的硬幣,看是否可作爲找零的其中之一    
  25.             for (int kind = 0; kind < valueKinds; kind++) {                 
  26.                 // 若當前面值的硬幣小於當前的cents則分解問題並查表    
  27.                 if (values[kind] <= cents) {    
  28.                     int temp = coinsUsed[cents - values[kind]] + 1;    
  29.                     if (temp < minCoins) {    
  30.                         minCoins = temp;    
  31.                     }    
  32.                 }    
  33.             }    
  34.             // 保存最小硬幣數    
  35.             coinsUsed[cents] = minCoins;    
  36.    
  37.             System.out.println("面值爲 " + (cents) + " 的最小硬幣數 : "   
  38.                     + coinsUsed[cents]);    
  39.         }    
  40.     }    
  41.         
  42.     public static void main(String[] args) {    
  43.    
  44.         // 硬幣面值預先已經按降序排列    
  45.         int[] coinValue = new int[] { 25211051 };    
  46.         // 需要找零的面值    
  47.         int money = 63;    
  48.         // 保存每一個面值找零所需的最小硬幣數,0號單元捨棄不用,所以要多加1    
  49.         int[] coinsUsed = new int[money + 1];    
  50.    
  51.         makeChange(coinValue, coinValue.length, money, coinsUsed);    
  52.     }    
  53. }   
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章