ZOJ-3329-One Person Game[7th 절강성 경기][확률 dp]
ZOJ-3329-One Person Game
Time Limit: 1 Second Memory Limit: 32768 KB Special Judge
There is a very simple and interesting one-person game. You have 3 dice, namely Die1, Die2 and Die3. Die1 has K1 faces. Die2 has K2 faces. Die3 has K3 faces. All the dice are fair dice, so the probability of rolling each value, 1 to K1, K2, K3 is exactly 1/K1, 1/K2 and 1/K3. You have a counter, and the game is played as follow:
Set the counter to 0 at first. Roll the 3 dice simultaneously. If the up-facing number of Die1 is a, the up-facing number of Die2 is b and the up-facing number of Die3 is c, set the counter to 0. Otherwise, add the counter by the total value of the 3 up-facing numbers. If the counter’s number is still not greater than n, go to step 2. Otherwise the game is ended. Calculate the expectation of the number of times that you cast dice before the end of the game.
Input
There are multiple test cases. The first line of input is an integer T (0 < T <= 300) indicating the number of test cases. Then T test cases follow. Each test case is a line contains 7 non-negative integers n, K1, K2, K3, a, b, c (0 <= n <= 500, 1 < K1, K2, K3 <= 6, 1 <= a <= K1, 1 <= b <= K2, 1 <= c <= K3).
Output
For each test case, output the answer in a single line. A relative error of 1e-8 will be accepted.
Sample Input 2 0 2 2 2 1 1 1 0 6 6 6 1 1 1
Sample Output 1.142857142857143 1.004651162790698
제목 링크: ZOJ-3329
제목 대의: 주사위가 세 개 있는데 각각 k1, k2, k3개의 면이 있다.매번 주사위를 던질 때마다 만약 세 면이 각각 a, b, c라면 점수는 0으로 하고 그렇지 않으면 세 개의 주사위의 점수의 합을 더한다.점수가 n보다 크면 끝난다.게임의 기대 보수를 구하다.초기 점수는 0입니다.
제목 사고방식: (이런 제목은 아직도 납득이 안 가는 것 같아...(繵 繹)
가령 dp[i]가 점수를 가지고 있다고 가정하면 i가 게임이 끝날 때까지 기대하는 걸음수를 나타낸다
그러면 dp[i]=SUM(p[k]*dp[i+k])+p[0]*dp[0]+1;//p[k]는 점수가 k로 증가할 확률을, p[0]는 점수가 0이 될 확률을 나타낸다 ①
dp[i]=A[i]*dp[0]+B[i]로 가정합니다.②
그러면 dp[i+k]=A[i+k]*dp[0]+B[i+k];③
③를 ①에 대입하여 (4): dp[i]=(SUM(p[k]*A[i+k])+p[0])*dp[0]+SUM(p[k]*B[i+k])+1;④
4와 2를 비교한 결과:
A[i]=(SUM(p[k]*A[i+k])+p[0]);
B[i]=SUM(p[k]*B[i+k])+1;
i+k>n시 A[i+k]=B[i+k]=0 알 수 있습니다
그래서 dp[0]=B[0]/(1-A[0])는 구할 수 있다.
참조 블로그:here
다음은 코드입니다.
#include <bits/stdc++.h>
using namespace std;
double p[500];
int main(){
int t;
cin >> t;
while(t--)
{
int n,k1,k2,k3,a,b,c;
cin >> n >> k1 >> k2 >> k3 >> a >> b >> c;
int ks = k1 * k2 * k3;
double p0 = 1.0 / ks;
memset(p,0,sizeof(p));
for (int i = 1; i <= k1; i++)
{
for (int j = 1; j <= k2; j++)
{
for (int k = 1; k<= k3; k++)
{
p[i + j + k] += p0;
}
}
}
p[a + b + c] -= p0; // a,b,c
double x[1000] = {0},y[1000] = {0};
for (int i = n; i >= 0; i--)
{
for (int k = 3; k <= ks && (i + k) <= n; k++)
{
x[i] += x[i + k] * p[k];
y[i] += y[i + k] * p[k];
}
x[i] += p0;
y[i] += 1;
}
printf("%.15lf
", y[0]/(1 - x[0]));
}
return 0;
}
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
【경쟁 프로 전형적인 90문】008의 해설(python)의 해설 기사입니다. 해설의 이미지를 봐도 모르는 (이해력이 부족한) 것이 많이 있었으므로, 나중에 다시 풀었을 때에 확인할 수 있도록 정리했습니다. ※순차적으로, 모든 문제의 해설 기사를 들어갈 예정입니다. 문자열...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.