【LeetCode】486.預測贏家(遞歸、DP)

題目鏈接

486. 預測贏家

同一類型的題目:877. 石子游戲

題目描述

給定一個表示分數的非負整數數組。 玩家 1 從數組任意一端拿取一個分數,隨後玩家 2 繼續從剩餘數組任意一端拿取分數,然後玩家 1 拿,…… 。每次一個玩家只能拿取一個分數,分數被拿取之後不再可取。直到沒有剩餘分數可取時遊戲結束。最終獲得分數總和最多的玩家獲勝。

給定一個表示分數的數組,預測玩家1是否會成爲贏家。你可以假設每個玩家的玩法都會使他的分數最大化。

示例 1:
輸入:[1, 5, 2]
輸出:False
解釋:一開始,玩家1可以從1和2中進行選擇。
如果他選擇 2(或者 1 ),那麼玩家 2 可以從 1(或者 2 )和 5 中進行選擇。如果玩家 2 選擇了 5 ,那麼玩家 1 則只剩下 1(或者 2 )可選。
所以,玩家 1 的最終分數爲 1 + 2 = 3,而玩家 2 爲 5 。
因此,玩家 1 永遠不會成爲贏家,返回 False 。

示例 2:
輸入:[1, 5, 233, 7]
輸出:True
解釋:玩家 1 一開始選擇 1 。然後玩家 2 必須從 5 和 7 中進行選擇。無論玩家 2 選擇了哪個,玩家 1 都可以選擇 233 。
    最終,玩家 1(234 分)比玩家 2(12 分)獲得更多的分數,所以返回 True,表示玩家 1 可以成爲贏家。
 

提示:
1 <= 給定的數組長度 <= 20.
數組裏所有分數都爲非負數且不會大於 10000000 。
如果最終兩個玩家的分數相等,那麼玩家 1 仍爲贏家。

解題思路

先理解遞歸再去理解動態規劃

1.遞歸

「手畫圖解」三種寫法:遞歸、記憶化遞歸、動態規劃

2.動態規劃

可以通過簡單的例子[1,5]、[1,2,5]對動態規劃進行理解

DP動態規劃是從下往上,填表的順序也能反映出來。

解釋1.1

對於偶數個數字的數組,玩家1一定獲勝。因爲如果玩家1選擇拿法A,玩家2選擇拿法B,玩家1輸了。則玩家1換一種拿法選擇拿法B,因爲玩家1是先手,所以玩家1一定可以獲勝。

  • 對於只有一個數字的子數組,即i=jdp[i,i] = num[i],因爲玩家1先手拿了這一個分數,玩家2就沒得拿了,所以是最優拿法。
  • 對於兩個數字的子數組,即j-i=1dp[i,j]=abs(num[i]-num[j]),玩家1先手拿兩個數中大的一個,所以玩家1一定比玩家2多兩個數字差的絕對值,爲最優拿法。
  • 對於j-i>1的子數組,如果玩家1先手拿了i,則玩家1手裏有num[i]分,則玩家2一定會按照[i+1..j]這個子數組中的最優拿法去拿,於是玩家2此時手裏相當於有dp[i+1,j]分,於是玩家1比玩家2多num[i]-dp[i+1,j]分。如果玩家1先手拿了j,則玩家1手裏有num[j]分,則玩家2一定會按照[i..j-1]這個子數組中的最優拿法去拿,於是玩家2此時手裏相當於有dp[i,j-1]分,於是玩家1比玩家2多num[j]-dp[i,j-1]分。數組的填充方向是從下往上,從左到右。

解釋1.2

甲乙比賽,甲先手面對區間[i...j]時,dp[i][j]表示甲對乙的淨勝分。

最終求的就是,甲先手面對區間[0...n-1]時,甲對乙的淨勝分dp[0][n-1]是否>=0

甲先手面對區間[i...j]時,

  • 如果甲拿nums[i],那麼變成乙先手面對區間[i+1...j],這段區間內乙對甲的淨勝分爲dp[i+1][j];那麼甲對乙的淨勝分就應該是nums[i] - dp[i+1][j]
  • 如果甲拿nums[j],同理可得甲對乙的淨勝分爲是nums[j] - dp[i][j-1]

以上兩種情況二者取大即可。

綜上所述,狀態轉移方程如下:

狀態轉移方程:dp[i][j] = max(nums[i] - dp[i + 1][j], nums[j] - dp[i][j - 1])

解釋1.3

  • 初始化時,dp[i,i] =nums[i]; 意味着如果只有一個nums[i]可以拿,先手玩家拿走了,nums[i] 也就是多出來的分數

  • dp[i,j]表示先手玩家從nums[i]拿到nums[j]時,比後手玩家多的最大分數

  • 對於dp[i,j]來說,先手玩家有兩種拿法,一種是拿開頭的數,一種是拿結尾的數

  • 如果先拿了nums[i],也就是意味着先手玩家目前的分數是nums[i]+後手玩家獲得的最大分數的相反值,也就是dp[i,j] = nums[i]+(-dp[i+1,j])這裏的dp[i+1,j]表示是後手玩家比先手玩家多的最大分數,

  • 同理如果先拿了nums[j],也就是意味着先手玩家目前的分數是nums[j]+後手玩家獲得的最大分數的相反值,也就是dp[i][j] = nums[j]+(-dp[i,j-1])這裏的dp[i,j-1]表示是後手玩家比先手玩家多的最大分數

  • 而每一步,先手玩家都想拿到最大的分數,最後纔有機會贏,所以最終的轉移方程是:dp[i][j] =max{nums[i]+(-dp[i+1,j]), nums[j]+(-dp[i,j-1])}

  • 最後要求的值時dp[0,n-1]也就是dp的右上角的數,判斷這個數是否大於0,大於0意味着先手玩家比後手玩家多,會贏

寫出狀態轉移方程之後該如何填表呢?

AC代碼

public class Solution {

    // 狀態轉移方程:dp[i][j] = max(nums[i] - dp[i + 1][j], nums[j] - dp[i][j - 1])

    public boolean PredictTheWinner(int[] nums) {
        int len = nums.length;
        int[][] dp = new int[len][len];
        
        // dp[i][j]:作爲先手,在區間 nums[i..j] 裏進行選擇可以獲得的相對分數
        for (int i = 0; i < len; i++) {
            dp[i][i] = nums[i];
        }

        for (int j = 1; j < len; j++) {
            for (int i = j - 1; i >= 0; i--) {
                dp[i][j] = Math.max(nums[i] - dp[i + 1][j], nums[j] - dp[i][j - 1]);
            }
        }
        return dp[0][len - 1] >= 0;
    }
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章