算法-动态规划-新21点

算法-动态规划-新21点

1 题目概述

1.1 题目出处

https://leetcode-cn.com/problems/new-21-game/

1.2 题目描述

爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下:

爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是独立的,其结果具有相同的概率。

当爱丽丝获得不少于 K 分时,她就停止抽取数字。 爱丽丝的分数不超过 N 的概率是多少?

示例 1:

输入:N = 10, K = 1, W = 10
输出:1.00000
说明:爱丽丝得到一张卡,然后停止。
示例 2:

输入:N = 6, K = 1, W = 10
输出:0.60000
说明:爱丽丝得到一张卡,然后停止。
在 W = 10 的 6 种可能下,她的得分不超过 N = 6 分。
示例 3:

输入:N = 21, K = 17, W = 10
输出:0.73278
提示:

0 <= K <= N <= 10000
1 <= W <= 10000
如果答案与正确答案的误差不超过 10^-5,则该答案将被视为正确答案通过。
此问题的判断限制时间已经减少。

2 动态规划

2.1 思路

dp表示当前分数为i的时候的符合规则的概率

因为要求停止时机为分数不小于K,所以最后一项是K-1+W,最小是0

dp[i]很难找到和dp[i-1]的关系,反而可以找和dp[i+1],dp[i+2],…的关系

当分数达到i时,1/W的均等机会到达 [i+1, K-1+W]各个分数,所以有:

(1)dp[i] = 1/W * (dp[i+1] + dp[i+2] + ... + dp[i+W]),且i<K

而dp[K]到dp[i+W]可以直接计算符合规则概率为,即分数小于等于N就是1,大于N就是0。但每次这样递推计算的话存在很多重复计算,再考虑

(2)dp[i-1] = 1/W * (dp[i] + dp[i+1] + ... + dp[i+W-1]),且i<K

两式相减可得

(3)dp[i-1] = dp[i] + 1/W * (dp[i] - dp[i+W]]),且i<K

因为i < K,所以(3)可以推出0到K-1-1即0到K-2。

而dp[K-1]可由(1)计算 dp[K-1] = 1/W * (dp[K] + dp[K+1] + … + dp[K-1+W])

2.2 代码

class Solution {
    public double new21Game(int N, int K, int W) {
        // dp表示当前分数为i的时候的符合规则的概率
        // 因为要求停止时机为分数不小于K,所以最后一项是K-1+W,最小是0
        // dp[i]很难找到和dp[i-1]的关系,反而可以找和dp[i+1],dp[i+2],...的关系
        // 当分数达到i时,1/W的均等机会到达 [i+1, K-1+W]各个分数,所以有:
        // (1)dp[i] = 1/W * (dp[i+1] + dp[i+2] + ... + dp[i+W]),且i<K
        // 而dp[K]到dp[i+W]可以直接计算符合规则概率为,即分数小于等于N就是1,大于N就是0
        // 但每次这样递推计算的话存在很多重复计算,再考虑
        // (2)dp[i-1] = 1/W * (dp[i] + dp[i+1] + ... + dp[i+W-1]),且i<K
        // 两式相减可得
        // (3)dp[i-1] = dp[i] + 1/W * (dp[i] - dp[i+W]]),且i<K
        // 因为i < K,所以(3)可以推出0到K-1-1即0到K-2
        // 而dp[K-1]可由(1)计算  dp[K-1] = 1/W * (dp[K] + dp[K+1] + ... + dp[K-1+W])
        double[] dp = new double[K + W];
        double tmp = 0d;
        // for(int i = K; i <= K-1+W; i++){
        //     dp[i] = i <= N? 1 : 0;
        //     tmp += dp[i];
        // }

        int max = Math.min(K-1+W, N);

        for(int i = K; i <= max; i++){
            dp[i] = 1;
            tmp += dp[i];
        }

        // 计算dp[K-1]
        if(K > 0 && W > 0){
            dp[K-1] = tmp / W;
        }
        
        // 计算dp[K-2] -> dp[0]
        for(int i = K-2; i >= 0; i--){
            dp[i] = dp[i+1] + (dp[i+1] - dp[i+1+W]) / W;
        }
        return dp[0];
    }
}

2.3 时间复杂度

在这里插入图片描述
O(N)

2.4 空间复杂度

O(K + W)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章