stone game 887

leetcode 887

亞歷克斯和李用幾堆石子在做遊戲。偶數堆石子排成一行,每堆都有正整數顆石子 piles[i] 。

遊戲以誰手中的石子最多來決出勝負。石子的總數是奇數,所以沒有平局。

亞歷克斯和李輪流進行,亞歷克斯先開始。 每回合,玩家從行的開始或結束處取走整堆石頭。 這種情況一直持續到沒有更多的石子堆爲止,此時手中石子最多的玩家獲勝。

假設亞歷克斯和李都發揮出最佳水平,當亞歷克斯贏得比賽時返回 true ,當李贏得比賽時返回 false 。

 

示例:

輸入:[5,3,4,5]
輸出:true
解釋:
亞歷克斯先開始,只能拿前 5 顆或後 5 顆石子 。
假設他取了前 5 顆,這一行就變成了 [3,4,5] 。
如果李拿走前 3 顆,那麼剩下的是 [4,5],亞歷克斯拿走後 5 顆贏得 10 分。
如果李拿走後 5 顆,那麼剩下的是 [3,4],亞歷克斯拿走後 4 顆贏得 9 分。
這表明,取前 5 顆石子對亞歷克斯來說是一個勝利的舉動,所以我們返回 true 。

提示:


    2 <= piles.length <= 500
    piles.length 是偶數。
    1 <= piles[i] <= 500
    sum(piles) 是奇數

 

暴力求解,每次奇偶轉換,每次是不同的人取前後端的值,最終start==end ,判斷兩個人取得的值的大小

但超時

public: 
   bool helper(vector<int>& piles, int start,int end,int& p1,int& p2)//這裏使用引用,在java裏要換成全局變量
{
    if(start == end)
        return p1 > p2 ? true : false;
    
    int sum1,sum2;
    if((start+end)%2 == 0)//第二個人取值
    {
        sum1 = p2+piles[start];
        sum2 = p2+piles[end];
        return helper(piles,start+1,end,p1,sum1) ||
               helper(piles,start,end-1,p1,sum2);
    }
    else //alex取值
    {
        sum1 = p1+piles[start];
        sum2 = p1+piles[end];
        return helper(piles,start+1,end,sum1,p2) ||
               helper(piles,start,end-1,sum2,p2);
    }
    
}
bool stoneGame(vector<int>& piles) {
    int p1,p2;
    p1=p2=0;
    return helper(piles,0,piles.size()-1,p1,p2);
}

找數學邏輯規律

/*
    由於是偶數堆,奇數個石頭,所以總有人多拿,有人少拿到
    由於兩個人都是聰明的,用最優秀策略,只要有一種可能使得A最終win,就返回true.所以先手拿的的人可以通過看所有情況,選擇對自己最有利的。例如 一直選偶數位值或奇數位的值
     */
    public boolean stoneGame1(int[] piles){
        return true;
    }
/*
方法2 先排序,每次都選最大的值給alex
*/

public boolean stoneGame2(int[] piles) {

        int Alex = 0;
        int Lee = 0;

        Arrays.sort(piles);
        int i=piles.length-1;
        while(i >=0){
            Alex += piles[i--];
            Lee += piles[i--];
        }

        return Alex > Lee;
    }
//動態規劃,更加通用的解法

  /*
    我們每次只能拿兩端的石頭堆的石頭,但我們又不知道拿完後剩下的石頭堆的情況,因此我們考慮先解決子問題。例如我們求出2個相鄰石頭堆的勝負情況,
    我們可以根據求出的數據求出相鄰3個石頭堆的勝負情況,以此類推,我們可以根據n-1個相鄰石頭堆的勝負情況,求出n個相鄰石頭堆的勝負情況,
    即我們的原問題。
根據我們的類推我們可以設dp[i][j]爲piles[i]~piles[j]Alex最多可以贏Lee的分數。每次取石頭堆只能從兩端取,
因此:dp[i][j] = max(piles[i] - dp[i+1][j], piles[j] - dp[i][j-1])。其中
piles[i] - dp[i+1][j]表示Alex取走i上的石頭堆,piles[j] - dp[i][j-1]表示Alex取走的是j上的石頭堆。
注意,爲什麼dp[i+1][j]表示piles[i+1]~piles[j]之間Alex最多可以贏Lee的分數,而piles[i]要減去該值而不是加上該值呢?由於我們的要求是每一步Alex和Lee採取的都是最優策略,當取piles[i]時,piles[i+1]~piles[j]中Alex和Lee的走法會調換。意即Lee走Alex的走法,Alex走Lee的走法,因此這裏要做減法。

    比如說有4個石頭堆 1 3 3 4
    1 3, 3 3,3 4
    1 3 3, 3 3 4
    1 3 3 4
     */
    public boolean stoneGame(int[] piles) {
        int len=piles.length;
        int dp[][]=new int[len][len];
        for(int i=0;i<len;i++){
            dp[i][i]=piles[i];////初始化只有i一個石頭堆的情形
        }
        for(int i=1;i<len;i++){
            for(int j=0;j<len-i;j++){
                dp[j][j+i]=Math.max(piles[j]-dp[j+1][j+i],piles[j+i]-dp[i][j+i-1]);//依次計算相鄰2個石頭堆到n個石頭堆的情形
            }
        }
        return dp[0][len-1]>0;
    }

    

動態規劃的解釋可以看這個鏈接是圖像化解釋,其中還有空間優化的解釋

//空間優化
    public boolean stoneGame_0(int[] piles) {
        int len=piles.length;
        int dp[]=new int[len];
        for(int i=0;i<len;i++){
            dp[i]=piles[i];
        }
        for(int i=1;i<len;i++) {
            for (int j = 0; j < len - i; j++) {
                dp[j] = Math.max(piles[j] - dp[j + 1], piles[j + i] - dp[i]);
            }
        }
            return dp[len-1]>0;
    }

另外 動態規劃,

/*思路
讓我們改變遊戲規則,使得每當李得分時,都會從亞歷克斯的分數中扣除。
令 dp(i, j) 爲亞歷克斯可以獲得的最大分數,其中剩下的堆中的石子數是 piles[i], piles[i+1], ..., piles[j]。
這在比分遊戲中很自然:我們想知道遊戲中每個位置的值。
我們可以根據 dp(i + 1,j) 和 dp(i,j-1) 來制定 dp(i,j) 的遞歸,我們可以使用動態編程以不重複這個遞歸中的工作。該方法可以輸出正確的答案,因爲狀態形成一個DAG(有向無環圖)。
算法
當剩下的堆的石子數是 piles[i], piles[i+1], ..., piles[j] 時,輪到的玩家最多有 2 種行爲。
可以通過比較 j-i和 N modulo 2 來找出輪到的人。
如果玩家是亞歷克斯,那麼她將取走 piles[i] 或 piles[j] 顆石子,增加她的分數。
之後,總分爲 piles[i] + dp(i+1, j) 或 piles[j] + dp(i, j-1);我們想要其中的最大可能得分。
如果玩家是李,那麼他將取走 piles[i] 或 piles[j] 顆石子,減少亞歷克斯這一數量的分數。
之後,總分爲 -piles[i] + dp(i+1, j) 或 -piles[j] + dp(i, j-1);我們想要其中的最小可能得分。
*/

public boolean stoneGame(int[] piles) {
        int N = piles.length;

        // dp[i+1][j+1] = the value of the game [piles[i], ..., piles[j]].
        int[][] dp = new int[N+2][N+2];
        for (int size = 1; size <= N; ++size)
            for (int i = 0; i + size <= N; ++i) {
                int j = i + size - 1;
                int parity = (j + i + N) % 2;  // j - i - N; but +x = -x (mod 2)
                if (parity == 1)
                    dp[i+1][j+1] = Math.max(piles[i] + dp[i+2][j+1], piles[j] + dp[i+1][j]);
                else
                    dp[i+1][j+1] = Math.min(-piles[i] + dp[i+2][j+1], -piles[j] + dp[i+1][j]);
            }

        return dp[1][N] > 0;
    }

用dp[i][j]表示alex獲得的剩餘的值

 

遞歸+記憶

通過,比上面的遞歸快很多

 private int[] sum;
    private int[][] hash;

    public boolean stoneGame(int[] piles) {
        int n = piles.length;
        sum = new int[n+1];
        for (int i = n - 1; i >= 0; i--)
            sum[i] = sum[i+1] + piles[i];
        hash = new int[n][n];
        int max = helper(piles, 0, n-1);
        return max > sum[0] - max;
    }

    private int helper(int[] piles, int start, int end) {
        if (start == end) return piles[start];
        if (hash[start][end] != 0) return hash[start][end];
        int all = sum[start] - sum[end+1];
        int left = all - helper(piles, start+1, end);
        int right = all - helper(piles, start, end-1);
        hash[start][end] = Math.max(left, right);
        return hash[start][end];
    }

進階 stone game ii

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章