算法-动态规划-新21点
1 题目概述
1.1 题目出处
https://leetcode-cn.com/problems/new-21-game/
1.2 题目描述
爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下:
爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是独立的,其结果具有相同的概率。
当爱丽丝获得不少于 K 分时,她就停止抽取数字。 爱丽丝的分数不超过 N 的概率是多少?
示例 1:
输入:N = 10, K = 1, W = 10
输出:1.00000
说明:爱丽丝得到一张卡,然后停止。
示例 2:
输入:N = 6, K = 1, W = 10
输出:0.60000
说明:爱丽丝得到一张卡,然后停止。
在 W = 10 的 6 种可能下,她的得分不超过 N = 6 分。
示例 3:
输入:N = 21, K = 17, W = 10
输出:0.73278
提示:
0 <= K <= N <= 10000
1 <= W <= 10000
如果答案与正确答案的误差不超过 10^-5,则该答案将被视为正确答案通过。
此问题的判断限制时间已经减少。
2 动态规划
2.1 思路
dp表示当前分数为i的时候的符合规则的概率
因为要求停止时机为分数不小于K,所以最后一项是K-1+W,最小是0
dp[i]很难找到和dp[i-1]的关系,反而可以找和dp[i+1],dp[i+2],…的关系
当分数达到i时,1/W的均等机会到达 [i+1, K-1+W]各个分数,所以有:
(1)dp[i] = 1/W * (dp[i+1] + dp[i+2] + ... + dp[i+W]),且i<K
而dp[K]到dp[i+W]可以直接计算符合规则概率为,即分数小于等于N就是1,大于N就是0。但每次这样递推计算的话存在很多重复计算,再考虑
(2)dp[i-1] = 1/W * (dp[i] + dp[i+1] + ... + dp[i+W-1]),且i<K
两式相减可得
(3)dp[i-1] = dp[i] + 1/W * (dp[i] - dp[i+W]]),且i<K
因为i < K,所以(3)可以推出0到K-1-1即0到K-2。
而dp[K-1]可由(1)计算 dp[K-1] = 1/W * (dp[K] + dp[K+1] + … + dp[K-1+W])
2.2 代码
class Solution {
public double new21Game(int N, int K, int W) {
// dp表示当前分数为i的时候的符合规则的概率
// 因为要求停止时机为分数不小于K,所以最后一项是K-1+W,最小是0
// dp[i]很难找到和dp[i-1]的关系,反而可以找和dp[i+1],dp[i+2],...的关系
// 当分数达到i时,1/W的均等机会到达 [i+1, K-1+W]各个分数,所以有:
// (1)dp[i] = 1/W * (dp[i+1] + dp[i+2] + ... + dp[i+W]),且i<K
// 而dp[K]到dp[i+W]可以直接计算符合规则概率为,即分数小于等于N就是1,大于N就是0
// 但每次这样递推计算的话存在很多重复计算,再考虑
// (2)dp[i-1] = 1/W * (dp[i] + dp[i+1] + ... + dp[i+W-1]),且i<K
// 两式相减可得
// (3)dp[i-1] = dp[i] + 1/W * (dp[i] - dp[i+W]]),且i<K
// 因为i < K,所以(3)可以推出0到K-1-1即0到K-2
// 而dp[K-1]可由(1)计算 dp[K-1] = 1/W * (dp[K] + dp[K+1] + ... + dp[K-1+W])
double[] dp = new double[K + W];
double tmp = 0d;
// for(int i = K; i <= K-1+W; i++){
// dp[i] = i <= N? 1 : 0;
// tmp += dp[i];
// }
int max = Math.min(K-1+W, N);
for(int i = K; i <= max; i++){
dp[i] = 1;
tmp += dp[i];
}
// 计算dp[K-1]
if(K > 0 && W > 0){
dp[K-1] = tmp / W;
}
// 计算dp[K-2] -> dp[0]
for(int i = K-2; i >= 0; i--){
dp[i] = dp[i+1] + (dp[i+1] - dp[i+1+W]) / W;
}
return dp[0];
}
}
2.3 时间复杂度
O(N)
2.4 空间复杂度
O(K + W)