zoj 3329 One Person Game(有環的概率dp)

http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=3754


開始看錯題意了,以爲沒翻到a,b,c時要在原來的基礎上加a+b+c,按我的意思推出來一個公式,沒想到樣例還過了,簡直無法debug。


公式很好推,設dp[i]表示當前爲i分時到達目標狀態需要投擲的期望,可轉移到兩個狀態dp[0]和dp[i+k]。設轉移到dp[0]

的概率是p0,轉移到dp[i+k]的概率是pk。那麼可得dp[i] = p0*dp[0] + pk*dp[i+k] + 1。發現所有的dp[i]都與dp[0]有關。

下面的推導參考:http://www.cnblogs.com/kuangbin/archive/2012/10/03/2710648.html

設dp[i]=A[i]*dp[0]+B[i];
代入上述方程右邊得到:
dp[i]=∑(pk*A[i+k]*dp[0]+pk*B[i+k])+dp[0]*p0+1
     =(∑(pk*A[i+k])+p0)dp[0]+∑(pk*B[i+k])+1;
     明顯A[i]=(∑(pk*A[i+k])+p0)
     B[i]=∑(pk*B[i+k])+1
     先遞推求得A[0]和B[0].
     那麼  dp[0]=B[0]/(1-A[0]);

然後逆推出A[0]和B[0]。

#include <stdio.h>
#include <iostream>
#include <map>
#include <set>
#include <list>
#include <stack>
#include <vector>
#include <math.h>
#include <string.h>
#include <queue>
#include <string>
#include <stdlib.h>
#include <algorithm>
//#define LL __int64
#define LL long long
#define eps 1e-8
#define PI acos(-1.0)
using namespace std;
const int INF = 0x3f3f3f3f;
const int maxn = 4010;

double dp[10010];
double A[600],B[600];
double p[100];

int main()
{
	int test;
	int n,a,b,c;
	int k1,k2,k3;
	scanf("%d",&test);
	while(test--)
	{
		scanf("%d %d %d %d %d %d %d",&n,&k1,&k2,&k3,&a,&b,&c);
		double p0 = 1.0/(k1*k2*k3);
		memset(p,0,sizeof(p));
		for(int i = 1; i <= k1; i++)
		{
		    for(int j = 1; j <= k2; j++)
		    {
		        for(int k = 1; k <= k3; k++)
		        {
		            if(i != a || j != b || k != c)
                        p[i+j+k] += p0;
		        }
		    }
		}
		memset(A,0,sizeof(A));
		memset(B,0,sizeof(B));
		for(int i = n; i >= 0; i--)
		{
		    A[i] = p0,B[i] = 1;
		    for(int j = 1; j <= k1+k2+k3; j++)
		    {
		        A[i] += p[j]*A[i+j];
		        B[i] += p[j]*B[i+j];
		    }
		}
		printf("%.15lf\n",B[0]/(1-A[0]));
	}
	return 0;
}



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章