1076: [SCOI2008]獎勵關

1076: [SCOI2008]獎勵關

Time Limit: 10 Sec  Memory Limit: 162 MB
Submit: 1245  Solved: 704
[Submit][Status][Discuss]

Description

你正在玩你最喜歡的電子遊戲,並且剛剛進入一個獎勵關。在這個獎勵關裏,系統將依次隨機拋出k次寶物,每次你都可以選擇吃或者不吃(必須在拋出下一個寶物之前做出選擇,且現在決定不吃的寶物以後也不能再吃)。 寶物一共有n種,系統每次拋出這n種寶物的概率都相同且相互獨立。也就是說,即使前k-1次系統都拋出寶物1(這種情況是有可能出現的,儘管概率非常小),第k次拋出各個寶物的概率依然均爲1/n。 獲取第i種寶物將得到Pi分,但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過一次,才能吃第i種寶物(如果系統拋出了一個目前不能吃的寶物,相當於白白的損失了一次機會)。注意,Pi可以是負數,但如果它是很多高分寶物的前提,損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。 假設你採取最優策略,平均情況你一共能在獎勵關得到多少分值?

Input

第一行爲兩個正整數k和n,即寶物的數量和種類。以下n行分別描述一種寶物,其中第一個整數代表分值,隨後的整數依次代表該寶物的各個前提寶物(各寶物編號爲1到n),以0結尾。

Output

輸出一個實數,保留六位小數,即在最優策略下平均情況的得分。

Sample Input

1 2
1 0
2 0

Sample Output

1.500000

HINT

【數據規模】

1<=k<=100,1<=n<=15,分值爲[-10^6,10^6]內的整數。



題解:

n=15,大概就是給定了一個狀態壓縮的方向

逆推(白書上貌似特別喜歡逆推)

code:

#include<cstdio>
#include<iostream>
using namespace std;
double F[101][65536];
int N,K,t;
int v[20],d[20],p[20];
int main()
{
scanf("%d%d",&N,&K);
for(int i=1;i<=K+1;i++)p[i]=1<<(i-1);
for(int i=1;i<=K;i++)
{
scanf("%d%d",&v[i],&t);
while(t)
{
d[i]+=p[t];
scanf("%d",&t);
}
}
for(int i=N;i;i--)
for(int j=0;j<=p[K+1]-1;j++)
{
for(int k=1;k<=K;k++)
if((d[k]&j)==d[k])
   F[i][j]+=max(F[i+1][j],F[i+1][j|p[k]]+v[k]);
else F[i][j]+=F[i+1][j];
F[i][j]/=K;
}
printf("%.6lf",F[1][0]);
return 0;
}
 


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章