【算法】leetcode 837. 新21点(理清思路,动态规划)

问题来源

837.21点
爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下:

爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是独立的,其结果具有相同的概率。

当爱丽丝获得不少于 K 分时,她就停止抽取数字。 爱丽丝的分数不超过 N 的概率是多少?



示例 1:

输入:N = 10, K = 1, W = 10
输出:1.00000
说明:爱丽丝得到一张卡,然后停止。
示例 2:

输入:N = 6, K = 1, W = 10
输出:0.60000
说明:爱丽丝得到一张卡,然后停止。
在 W = 106 种可能下,她的得分不超过 N = 6 分。
示例 3:

输入:N = 21, K = 17, W = 10
输出:0.73278


提示:

0 <= K <= N <= 10000
1 <= W <= 10000
如果答案与正确答案的误差不超过 10^-5,则该答案将被视为正确答案通过。
此问题的判断限制时间已经减少。


大佬解析


代码


"""
需求分析:
    爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下:
        爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是独立的,其结果具有相同的概率。
        当爱丽丝获得不少于 K 分时,她就停止抽取数字。 
    爱丽丝的分数不超过 N 的概率是多少?
    
思路:
    假设 dp[x] 为她手上牌面为x时,能获胜的概率,那么这个概率应该是:dp[x]=1/w * (dp[x+1]+dp[x+2]+dp[x+3]...+dp[x+w])
    因为抽取的牌面机会都是均等的,她能抽取的面值在 [1,W] 之间,所以将概率之和平均一下就是 dp[x] 的概率。

    强插一段解释:
        x代表爱丽丝手上的牌面值,dp[x]代表爱丽丝手上持有的牌面值为x时,她获胜的概率(游戏结束时她所持牌面值小于等于N的概率)。
        这个概率是怎么来的?x分2种情况:

        当x>=K时,爱丽丝会停止抽牌,这个时候游戏已经结束了,她是赢是输也已经确定了,所以此时赢的概率要么1,要么0
        当x<K时,爱丽丝会继续抽牌,抽牌是有概率的,所以她是赢是输也有概率。
        她能抽到的牌面值在 [1,W] 之间,所以抽完后她的牌面在[x+1,x+w]之间,因为每张牌机率均等,所以抽完后牌面在[x+1,x+w]之间的每个面值概率都是相等的,而假如我们已知当牌面是[x+1,x+w]的胜率(即dp[x+1]...dp[x+w]的值),那么可以推导:
        dp[x]=1/w * dp[x+1]+ 1/w * dp[x+2] + 1/w * dp[x+3]...+ 1/w * dp[x+w]
        这个实际上就是动态规划的状态转移方程,不过本例是反着来转移的。
        
    x 最多能到 K-1,因为当大于等于 K 时,爱丽丝会停止抽牌,所以当游戏结束时,即爱丽丝停止抽牌时,她可能达到的最大牌面是 K+W-1,而一开始她的牌面是 0,所以我们用一个长度为 K+W 的 dp 数组来保存她在所有面值下的胜率。
    最后 dp[0],也就是最开始爱丽丝还没有抽牌,她的牌面为 0 时的胜率,这个就是我们的答案。

"""


class Solution:
    def new21Game(self, N: int, K: int, W: int) -> float:
        dp_arr = [-1] * (K + W)
        s = 0
        for i in range(K, K + W):
            dp_arr[i] = 1 if i <= N else 0
            s += dp_arr[i]

        for i in range(K - 1, -1, -1):
            dp_arr[i] = s / W
            s = s - dp_arr[i + W] + dp_arr[i]
        return dp_arr[0]
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章