骰子【概率dp】

題目鏈接 P1409 骰子


  因爲會有人被彈出隊列,所以我設置的期望dp爲dp[i][j],表示當現在隊列中有i個人的時候,第j個人獲勝的概率。

  於是有當只剩一個人的時候,那個人必勝,dp[1][1] = 1

  再往下,先看它在隊首的情況,dp[i][1] = \frac{1}{6} + \frac{3}{6} *dp[i][i]也就是直接獲勝的概率加上它被彈到隊尾時候的概率。

  其他的情況呢,也就是不在隊首的時候呢,dp[i][j] = \frac{2}{6} * dp[i - 1][j - 1] + \frac{3}{6} * dp[i][j - 1],表示的是如果第一個被彈出隊列,或者第一個被彈到隊尾時候,第j-1個獲勝,也就是現在的j獲勝,因爲j的位置就變成了j-1。

  於是,連立這兩個方程組,可以得到dp[i][1]的求解方式,因爲這裏i比較的不清晰,接下去的式子我用x代替i表示。

dp[x][1] = \frac{1}{3} * \frac{1}{2^x - 1} * (2^{x - 1} + 2^{x - 1} * dp[x - 1][x - 1] + \cdots + 2^{k} * dp[x - 1][k] + \cdots + 2^1 * dp[x - 1][1])

所以,就可以利用一個pow來處理double型來解決這個問題了。

#include <iostream>
#include <cstdio>
#include <cmath>
#include <string>
#include <cstring>
#include <algorithm>
#include <limits>
#include <vector>
#include <stack>
#include <queue>
#include <set>
#include <map>
#include <bitset>
//#include <unordered_map>
//#include <unordered_set>
#define lowbit(x) ( x&(-x) )
#define pi 3.141592653589793
#define e 2.718281828459045
#define INF 0x3f3f3f3f
#define HalF (l + r)>>1
#define lsn rt<<1
#define rsn rt<<1|1
#define Lson lsn, l, mid
#define Rson rsn, mid+1, r
#define QL Lson, ql, qr
#define QR Rson, ql, qr
#define myself rt, l, r
using namespace std;
typedef unsigned long long ull;
typedef unsigned int uit;
typedef long long ll;
const int maxN = 1e3 + 7;
int N, M;
double dp[maxN][maxN];
signed main()
{
    scanf("%d%d", &N, &M);
    dp[1][1] = 1.;
    double tmp;
    for(int i=2; i<=N; i++)
    {
        tmp = 1. / 3. / (pow(2., i) - 1.);
        dp[i][1] = tmp * pow(2., i - 1);
        for(int j=i-1; j>=1; j--) dp[i][1] += tmp * pow(2, j) * dp[i - 1][j];
        for(int j=2; j<=i; j++)
        {
            dp[i][j] = dp[i - 1][j - 1] / 3. + dp[i][j - 1] / 2.;
        }
    }
    printf("%.9lf\n", dp[N][M]);
    return 0;
}

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章