Problema de La Ruina Jugador

problema de la Ruina Jugador Considere la posibilidad de un jugador que en cada jugada del partido tiene una probabilida

Views 260 Downloads 9 File size 150KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

problema de la Ruina Jugador Considere la posibilidad de un jugador que en cada jugada del partido tiene una probabilidad p de ganar una unidad y la probabilidad q = 1 - p de perder una unidad. Suponiendo que sucesiva jugadas del partido son independientes , ¿cuál es la probabilidad de que , a partir de i unidades , la fortuna del jugador llegará a N antes de llegar a 0 ? Si permitimos que Xn denotan la fortuna del jugador en el tiempo n , entonces el proceso { Xn , n =0 , 1 , 2 , . . . } Es una cadena de Markov con probabilidades de transición P00 = PNN = 1 , Pi, i = 1 p = 1 - Pi , i- 1 , i = 1 , 2 , . . . , N -1 Esta cadena de Markov tiene tres clases, a saber , { 0 } , { 1 , 2 , . . . , N -1 } y {N } , el primera y tercera clase que es recurrente y el segundo transitorio. Dado que cada transitorio estado es visitado sólo un número finito menudo , se deduce que , después de una cierta cantidad finita de tiempo , el jugador o bien alcanzar su meta de N o ir a la quiebra . Vamos Pi , i = 0 , 1 , . . . , N, denota la probabilidad de que , a partir de i , el jugador de fortuna llegará a alcanzar N. Al condicionar el resultado de la juego inicial del juego se obtiene Pi = PPI 1 + QPI- 1 , i = 1 , 2 , . . . , N -1 o de forma equivalente , ya que p + q = 1 ,

pPi + qPi = pPi 1 + qPi- 1 o Pi +1 - Pi = q/p( Pi - Pi - 1 ) , i = 1 , 2 , . . . , N - 1 Por lo tanto , desde P0 = 0 , se obtiene a partir de la línea anterior que

Adición de la primera i -1 de estas ecuaciones rendimientos

Ahora, usando el hecho de que P_N = 1, se obtiene que

y por lo tanto

(1) Tenga en cuenta que, N → ∞,

Por lo tanto, si p> 12, hay una probabilidad positiva de que la fortuna del jugador aumentará indefinidamente, mientras que si el jugador tendrá, con probabilidad 1, ir a la quiebra contra un adversario infinitamente rico. Ejemplo 1. Supongamos Max y Patty decide voltear centavos, el que viene más cercano a la pared gana. Patty, al ser el mejor jugador, tiene una probabilidad de 0,6 de ganar en cada tapa. (a) Si Patty comienza con cinco centavos y Max con diez, ¿cuál es la probabilidad de que Patty se limpie a Max? (b) ¿Qué pasa si Patty comienza con 10 y Max con 20? Solución: (a) La probabilidad deseada se obtiene a partir de la ecuación (1) por dejar que i = 5, N = 15, y p = 0,6. Por lo tanto, la probabilidad deseada es

(b) La probabilidad deseada es

. Para una aplicación de problema de la ruina del jugador a pruebas de drogas, supongamos que dos nuevos medicamentos han sido desarrollados para el tratamiento de una determinada enfermedad. Drogas i tiene una tasa de curación del Pi, i = 1, 2, en el sentido de que cada paciente tratado con drogas i se puede curar con Pi probabilidad. Estas tasas de curación, sin embargo, no son conocidos, y supongamos que estamos interesados en un procedimiento para decidir si P1> P2 y P2> P1. Para decidir sobre una de estas alternativas, considere la siguiente prueba: Los pares de

los pacientes son tratados secuencialmente con un miembro de la pareja receptora fármaco 1 y el otro fármaco 2. Los resultados para cada par se determinan, y la prueba se detiene cuando el número acumulado de curas usando uno de los fármacos supera el número acumulado de cura cuando el uso de la otra por un número fijo predeterminado. Más formalmente, y mucho

si el paciente en la j ª par recibir el número de fármaco 1 se cura en otro caso si el paciente en la j ª par recibir el número de fármaco 2 se cura en otro caso Para un número entero positivo predeterminado M la prueba se detiene después de par N, donde N es el primer valor de n de tal manera que ya sea X1 + · · · + Xn - (Y1 + · · · + Yn) = M o X1 + · · · + Xn - (Y1 + · · · + Yn) =-M En el primer caso, a continuación, afirmamos que P1> P2, y en este último el que P2> P1. Para ayudar a determinar si el anterior es una buena prueba, una cosa que nos gustaría saber es la probabilidad de que conduce a una decisión incorrecta. Es decir, para P1 y P2 dado que P1> P2, ¿cuál es la probabilidad de que la prueba incorrectamente afirmar que P2> P1? Para determinar esta probabilidad, tenga en cuenta que después de cada par se comprueba la diferencia acumulada de curas con drogas 1 versus 2 drogas ni subirá en 1 con probabilidad P1 (1 - P2), ya que esta es la probabilidad de que las drogas 1 conduce a una cura drogas y 2 no-o bajar en 1 con probabilidad (1-P1) P2, o siguen siendo los mismos, con una probabilidad P1P2 + (1-P1) (1-P2). Por lo tanto, si sólo tenemos en cuenta las parejas en las que los cambios acumulados diferencia, la diferencia va a subir 1 con probabilidad p = P {hacia arriba 1 | hacia arriba 1 o hacia abajo 1}

y abajo 1 con probabilidad

Por lo tanto, la probabilidad de que la prueba se afirmar que P2> P1 es igual a la probabilidad que un jugador que gana cada uno (una unidad) apuesta con probabilidad p bajará M antes de subir M. Pero la ecuación (1) con i = M, N = 2M, muestra que esta probabilidad viene dada por

P {prueba afirma que P2> P1}

Por lo tanto, por ejemplo, si P1 = P2 = 0.6 y 0.4 a continuación, la probabilidad de un incorrecto decisión es 0,017 cuando M = 5 y se reduce a 0,0003 cuando M = 10.