ZOJ-3329-One Person Game[7th 절강성 경기][확률 dp]

4975 단어 dpZOJ3329

ZOJ-3329-One Person Game

            Time Limit: 1 Second      Memory Limit: 32768 KB      Special Judge

There is a very simple and interesting one-person game. You have 3 dice, namely Die1, Die2 and Die3. Die1 has K1 faces. Die2 has K2 faces. Die3 has K3 faces. All the dice are fair dice, so the probability of rolling each value, 1 to K1, K2, K3 is exactly 1/K1, 1/K2 and 1/K3. You have a counter, and the game is played as follow:
Set the counter to 0 at first. Roll the 3 dice simultaneously. If the up-facing number of Die1 is a, the up-facing number of Die2 is b and the up-facing number of Die3 is c, set the counter to 0. Otherwise, add the counter by the total value of the 3 up-facing numbers. If the counter’s number is still not greater than n, go to step 2. Otherwise the game is ended. Calculate the expectation of the number of times that you cast dice before the end of the game.
Input
There are multiple test cases. The first line of input is an integer T (0 < T <= 300) indicating the number of test cases. Then T test cases follow. Each test case is a line contains 7 non-negative integers n, K1, K2, K3, a, b, c (0 <= n <= 500, 1 < K1, K2, K3 <= 6, 1 <= a <= K1, 1 <= b <= K2, 1 <= c <= K3).
Output
For each test case, output the answer in a single line. A relative error of 1e-8 will be accepted.
Sample Input 2 0 2 2 2 1 1 1 0 6 6 6 1 1 1
Sample Output 1.142857142857143 1.004651162790698
제목 링크: ZOJ-3329
제목 대의: 주사위가 세 개 있는데 각각 k1, k2, k3개의 면이 있다.매번 주사위를 던질 때마다 만약 세 면이 각각 a, b, c라면 점수는 0으로 하고 그렇지 않으면 세 개의 주사위의 점수의 합을 더한다.점수가 n보다 크면 끝난다.게임의 기대 보수를 구하다.초기 점수는 0입니다.
제목 사고방식: (이런 제목은 아직도 납득이 안 가는 것 같아...(繵 繹)
가령 dp[i]가 점수를 가지고 있다고 가정하면 i가 게임이 끝날 때까지 기대하는 걸음수를 나타낸다
그러면 dp[i]=SUM(p[k]*dp[i+k])+p[0]*dp[0]+1;//p[k]는 점수가 k로 증가할 확률을, p[0]는 점수가 0이 될 확률을 나타낸다 ①
dp[i]=A[i]*dp[0]+B[i]로 가정합니다.②
그러면 dp[i+k]=A[i+k]*dp[0]+B[i+k];③
③를 ①에 대입하여 (4): dp[i]=(SUM(p[k]*A[i+k])+p[0])*dp[0]+SUM(p[k]*B[i+k])+1;④
4와 2를 비교한 결과:
A[i]=(SUM(p[k]*A[i+k])+p[0]);
B[i]=SUM(p[k]*B[i+k])+1;
i+k>n시 A[i+k]=B[i+k]=0 알 수 있습니다
그래서 dp[0]=B[0]/(1-A[0])는 구할 수 있다.
참조 블로그:here
다음은 코드입니다.
#include <bits/stdc++.h>
using namespace std;
double p[500];
int main(){
    int t;
    cin >> t;
    while(t--)
    {
        int n,k1,k2,k3,a,b,c;
        cin >> n >> k1 >> k2 >> k3 >> a >> b >> c;
        int ks = k1 * k2 * k3;
        double p0 = 1.0 / ks;
        memset(p,0,sizeof(p));
        for (int i = 1; i <= k1; i++)
        {
            for (int j = 1; j <= k2; j++)
            {
                for (int k = 1; k<= k3; k++)
                {
                    p[i + j + k] += p0;
                }
            }
        }
        p[a + b + c] -= p0; //      a,b,c   
        double x[1000] = {0},y[1000] = {0};
        for (int i = n; i >= 0; i--)
        {
            for (int k = 3; k <= ks && (i + k) <= n; k++)
            {
                x[i] += x[i + k] * p[k];
                y[i] += y[i + k] * p[k];
            }
            x[i] += p0;
            y[i] += 1;
        }
        printf("%.15lf
"
, y[0]/(1 - x[0])); } return 0; }

좋은 웹페이지 즐겨찾기