Citation preview

DILEMA DEL PRISIONERO Recibe este nombre el juego que ilustra la siguiente anécdota. Una pareja de individuos son sorprendidos por la policía en un mercado vendiendo bienes robados. Por tal motivo la policía los detiene y encierra en calabozos distintos. La policía sospecha que se trata de vulgares ladrones, pero carece de la suficiente evidencia para condenarlos; necesita que uno de ellos, al menos, confiese la autoría del robo. La policía les toma declaracióna ambos por separado en las siguientes condiciones: si los dos detenidos se declaran culpables, ambos serán condenados a dos años de prisión; si ninguno de ellos se declara culpable, ambos serán condenados por poseer bienes robados a seis meses de prisión; si sólo uno de ellos se declara culpable, él quedará libre, mientras que el otro, por mentir además de robar, será condenado a la pena máxima de cinco años.

Es de interés para ambos prisioneros que ninguno se declare culpable, ya que de este modo la cárcel para cada uno será tan sólo de seis meses. Pero ante el riesgo de que el otro le traicione, los dos se declararán culpables para asegurarse de que el máximotiempo que van a permanecer en la cárcel cada uno de ellos va a ser de dos años y no cinco.

El Dilema del prisionero se suele tomar como ejemplo para ilustrar la divergencia entre la racionalidad individual y la racionalidad colectiva o social.

(En inglés: the prisioner's dilema )

Situación en la que dos o más personas físicas o jurídicas, intentando elegir de manera independiente la mejor alternativa a seguir, terminan en una posición peor que la que hubieran alcanzado si hubiesen cooperado desde un principio. Cuando se trata deempresas oligopolistas, esta situación se conoce con el nombre de teoría de juegos.

LA TEORÍA DE JUEGOS La Economía, a través de la llamada "Teoría de Juegos", explica que en la búsqueda del éxito (en este caso empresarial o estratégico) además de nuestras propias decisiones tienen una relevancia fundamental las decisiones que toman los demás. No sólo eso, sino que mis propias decisiones estarán condicionadas a las decisiones que yo crea que van a tomar el resto de agentes del mercado, especialmente cuando hablamos de mis competidores directos. Es decir, la "Teoría de Juegos" trata de estudiar y explicar el comportamiento y la interacción de los diversos agentes de un mercado, así como los incentivos que llevan a éstos a realizar sus procesos de decisión. El objetivo: dar con la estrategia óptima adelantándose y previendo a la estrategia del resto.

Esta teoría cobra especial relevancia en mercados en los que existen competidores muy directos que luchan por hacerse con una mayor cuota de mercado, por ejemplo en los oligopolios o en determinados sectores de gran consumo donde la competencia es feroz. En la "Teoría de Juegos" lo relevante es tomar una vía de actuación teniendo en cuenta lo que pensamos que harán los demás, sabiendo que ellos actuarán a su vez pensando en lo que creen que nosotros vamos a hacer. Este modelo se utiliza en el mundo de la empresa, en la economía en general, en psicología o incluso en juegos como el póker.

La "Teoría de Juegos" se suele representar gráficamente a través de matrices y árboles de decisión.

EL DILEMA DEL PRISIONERO Y EL "EQUILIBRIO DE NASH" La "Teoría de Juegos" clasifica a los diferentes tipos de juegos en categorías en función del método que hay que aplicar para resolverlos. De esta forma existen: - Juegos simétricos y asimétricos. - Juegos de suma cero y de suma no cero. - Criterios "maximin" y "minimax". - "Equilibrio de Nash" (o "equilibrio de Nash-Cournot"). - Juegos cooperativos. - Juegos simultáneos y secuenciales. - Juegos de información perfecta. - Juegos de información infinita ("Superjuegos"). El llamado "Dilema del prisionero" es uno de los ejemplos más conocidos dentro de la categoría de juegos del tipo "Equilibrio de Nash" (economista que desarrolló esta teoría, y cuya vida fue por cierto llevada al cine en la película "Una Mente Maravillosa" siendo interpretado por Russel Crowe). En él se analizan los incentivos que tienen 2 presos encarcelados por un delito menor para delatar al otro a la policía y acceder así a beneficios penitenciarios, teniendo siempre en cuenta la decisión que podría tomar el otro:

Este ejercicio considera el supuesto de que cada prisionero está encarcelado por separado, de tal forma que no pueden comunicarse entre ellos, ponerse de acuerdo, pactar sus decisiones o saber qué hace el otro. Las posibilidades de condena en función de la decisión tomada por ambos son las siguientes: a) NADIE DELATA: si ninguno de los dos delatase al otro a la policía, entonces cada uno recibiría una condena de 2 años: (-2, -2). b) UNO DELATA AL OTRO: si uno de los prisioneros delatase al otro, pero este otro no delatase al uno, entonces el prisionero que delata reduciría su condena hasta solo 1 año, mientras que el prisionero delatado vería incrementada su condena hasta 10 años: posibilidades (-10, -1) y (-1, -10). c) AMBOS SE DELATAN MUTUAMENTE: si ambos deciden delatar al otro, entonces recibirán una condena de 6 años de cárcel para cada uno (-6, -6).

La conclusión que explica este ejercicio, es que el pensamiento lógico por separado de cada prisionero hace que al final cada uno tome por separado la decisión que es mejor para él individualmente y no la que sería la mejor decisión para el bien común. Si nos ponemos en la piel de uno de los dos prisioneros, sabemos que nuestra mejor decisión será la de delatar al otro en cualquier caso, pues así siempre minimizaremos nuestra condena, independientemente de lo que el otro haga. Y dado que el otro prisionero es igual de inteligente y razonará de la misma manera, lo que al final ocurrirá es que ambos acabarán pasando 6 años entre rejas (-6, -6), mientras que si hubieran cooperado hubieran sido condenados sólo 2 (-2, -2). La situación alcanzada finalmente es un "equilibrio de Nash": situación en la que cada jugador individual no gana nada modificando su estrategia mientras que los otros mantengan las suyas. En este caso concreto, ambas partes no pueden cambiar su decisión individual sin empeorar (si uno de los presos decidiera no delatar al otro, su situación sería aun peor, pues le caerían más años de condena, mientras que el otro preso siga teniendo incentivos a delatar). De esta forma, cada jugador ejecuta el mejor movimiento que pueda dados los movimientos de los demás jugadores.

Es decir, un "equilibrio de Nash" es una situación en la que todos los jugadores ponen en práctica una estrategia que maximiza sus ganancias individuales, dadas las estrategias de los otros. Como consecuencia ningún jugador tiene incentivos para modificar individualmente su estrategia. En el "equilibrio de Nash" se logra el mejor resultado individualmente para cada jugador, pero no el mejor resultado para todos en su conjunto. Es posible que el resultado fuera mejor para todos los jugadores si éstos coordinasen su actuación (situación que ocurre en los oligopolios). Aplicado a la economía, el "equilibrio de Nash" es un tipo de equilibrio de competencia imperfecta que describe la situación de varias empresas compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizas sus ganancias.

DILEMA DEL PRISIONERO Blasco Torrejón, Begoña I. CONCEPTO El dilema del prisionero es un tipo de modelo utilizado en la teoría de juegos, para explicar el comportamiento de las empresas competidoras en mercados oligopolísticos. Partimos de un equilibrio de Nash, que es un equilibrio no cooperativo, es decir, una situación en la cual cada empresa toma sus decisiones estratégicas de producción y precios dadas las decisiones tomadas por las otras empresas competidoras. En realidad el equilibrio de Nash permite obtener unos beneficios mayores de los que obtendría la empresa si actuara bajo los principios del equilibrio competitivo, pero unos beneficios menores que si las empresas decidieran actuar en coalición o colusión. Sucede, sin embargo, que la mayor parte de las legislaciones de los países prohíben la colusión. Sin embargo, ¿por qué no llegar a algún tipo de acuerdo secreto o implícito para burlar la ley si los beneficios pueden ser mayores para ambas empresas competidoras? La solución a este problema se conoce como "dilema del prisionero", que permite explicar por qué aunque una empresa se sitúe al precio al que se situarían ambas bajo colusión, la otra empresa tiene incentivos a vender su producción a un precio más bajo que aquel. Según el dilema del prisionero supongamos dos prisioneros incomunicados que deben decidir si confiesan un delito o no confiesan. Si uno de los prisioneros confiesa el crimen tendría una condena menor que el otro prisionero que no ha confesado. Si no confiesan ninguno de los dos, las condenas son menores y si confiesan los dos las condenas son mayores. Se trata de un juego no cooperativo con información imperfecta, de un único período. Por ejemplo, supongamos que en caso de confesar, el prisionero es castigado con 2 años de cárcel y el que no ha confesado con 6; si confiesan ambos son castigados con 4 años y si no confiesa ninguno, ambos son castigados con 3. Claramente, dado que están incomunicados y no pueden pactar lo que han de decir, A se encuentra con que tanto si B confiesa como si no, al individuo A le interesa confesar, porque la pena es menor que si no lo hace. Este es un equilibrio de Nash, porque sea cual sea la estrategia de los demás jugadores, no puede mejorar eligiendo una estrategia distinta que la de confesar. Al individuo B le pasa lo mismo, de ahí que probablemente ambos confiesen y sean castigados con 4 años de cárcel. Es interesante señalar que aunque la mejor estrategia conjunta es la de no confesar, esa no es la estrategia dominante, pues los prisioneros no pueden comunicarse ni fiarse de lo que va a hacer el otro. B confiesa

B no confiesa

A confiesa

-4,-4

-2,-6

A no confiesa

-6,-2

-3,-3

Si pudieran comunicarse, el problema está en fiarse de la palabra del otro, pues acordarán no confesar, que es la mejor opción para ambos, (3 años para cada uno de cárcel), pero el que no confiesa debe fiarse de que el otro tampoco lo haga, pues si lo hace (y tiene incentivos para ello), el que no confiese será castigado con 6 años, frente a los dos años del otro prisionero que le ha engañado.

II. APLICACIONES El dilema del prisionero puede aplicarse a empresas oligopolísticas. Por ejemplo, una empresa puede decidir coludir o cooperar con la otra, por ejemplo limitando la producción a fin de llegar a unos precios más elevados que aumenten el beneficio para ambas empresas, pero al mismo tiempo pueden decidir no coludir y competir abiertamente. Si decide coludir bajando su producción para que los precios se eleven en el mercado, temerá que la otra empresa venda una producción algo mayor que la pactada burlando el acuerdo y obteniendo mayores beneficios a su costa. Aunque lo mejor para ambas conjuntamente es respetar los acuerdos y coludir (en el ejemplo no confesar ninguna de las dos), ambas tienen incentivos para burlar el acuerdo y sobre todo, ser la primera en burlarlo (en el ejemplo del dilema del prisionero, ser el primero en confesar). Como ninguna de las empresas acaba de fiarse de la otra, al final la cooperación es muy difícil. Sin embargo, podemos refinar el modelo incluyendo la repetición: en nuestro modelo, los prisioneros tenían una única oportunidad de confesar, pero en la realidad, las empresas tienen multitud de oportunidades de burlar o cumplir los acuerdos y eso les labra una determinada reputación. Por ejemplo, si dos empresas oligopolísticas tienen una larga tradición de cooperación, es más probable que mantengan el acuerdo (en el ejemplo, que ninguna confiese, que es la mejor solución para ambas). Sin embargo, si un prisionero ya ha engañado repetidamente al otro es mucho más improbable que se produzca la cooperación, pues ya existe un problema de desconfianza. Al mismo tiempo, como son juegos repetidos, los jugadores procurarán no burlar la confianza de su competidor desde el principio, pues serían castigados con una competencia feroz. Esto es lo que explica que, aunque la cooperación sea difícil y existan incentivos para romperla, también hay ejemplos de mercados que la han practicado con éxito. En muchos casos, las empresas saben que vender a un precio menor al pactado puede dar lugar a unos beneficios efímeros que acabarán en una guerra de precios o en una competencia feroz que va a acabar reduciendo el beneficio para todas las productoras. Por último, si el juego se repite un número de períodos que es conocido por ambas empresas, es muy probable que en el último período ambas burlen el acuerdo. Por ejemplo supongamos que se otorga una concesión de explotación de un cierto servicio a dos empresas durante 10 años. Lo más probable es que si han cooperado durante 9 años, al 10º año ambas traten de burlar el acuerdo, pues ya se carece de incentivos para mantener la reputación de formalidad en los pactos y ambas empresas tienen fuertes incentivos a buscar por separado sus beneficios, al margen de los compromisos alcanzados. Por esa razón, es más probable la colusión cuando el juego se repite y lo hace de forma indefinida.

¿Qué son el equilibrio de Nash y el dilema del prisionero? El equilibrio de Nash y el dilema del prisionero son conceptos que se estudian, generalmente, dentro de la teoría de juegos que a su vez hace parte delanálisis de competencia y estrategia en economía y en negociación. En un juego se alcanza el equilibrio de Nash cuando cada jugador selecciona la estrategia que maximiza su ganancia, dada la estrategia de los otros; el dilema del prisionero, es un juego en el que los jugadores deciden, incentivados entre una disyuntiva, su beneficio personal o el perjuicio al otro, obteniendo un resultado peor que en la alternativa. A continuación una breve exploración bibliográfica que busca ampliar y explicar los dos conceptos.

Equilibrio de Nash El equilibrio de Nash, también conocido como el equilibrio no cooperativo, es el resultado del juego cuando cada jugador elige la acción que maximiza su pago, tomando como dadas las decisiones de los otros jugadores, y sin tener en cuenta los efectos que su decisión pueda tener en los pagos de los demás. (Krugman, Wells y Olney, p.306) En la teoría de juegos es el conjunto de estrategias de los jugadores en las que ninguno de ellos puede mejorar sus ganancias, dada la estrategia del otro. Es decir, dada la estrategia del jugador A, el jugador B no puede obtener mejores resultados y, dada la estrategia de B, A tampoco puede. (Greco, p.229) El concepto puede describirse de la forma siguiente: Imaginemos un perfil de estrategias que tiene la propiedad de que ninguna persona puede mejorar su bienestar eligiendo otra estrategia, suponiendo que todos los demás jugadores eligen la estrategia descrita por el perfil de estrategias. Esta propiedad debe aplicarse simultáneamente a todos los jugadores dentro del mismo perfil de estrategias. En ese caso, ese perfil de estrategias se denomina equilibrio de Nash.(Ray, p.741) Es una combinación de estrategias en la que la opción elegida por cada jugador es óptima dada la opción elegida por los demás. Por tanto, si se encuentran en un equilibrio de Nash, ninguno de los jugadores tendrá incentivos individuales para variar de estrategia. (Aguado, p.77) Una manera de fundamentar la definición del equilibrio de Nash es el argumento de que si la teoría de juegos ofrece una solución única a un determinado problema, esta solución debe ser un equilibrio de Nash en el siguiente sentido: Supongamos que la teoría de juegos hace una única predicción sobre las estrategias elegidas por los jugadores. Para que esta predicción sea correcta es necesario que cada jugador esté dispuesto a elegir la estrategia predicha por la teoría. Por ello, la estrategia predicha de cada

jugador debe ser la mejor respuesta de cada jugador a las estrategias predichas de los otros jugadores. Tal predicción puede denominarse estratégicamente estable o self-enforcing, puesto que ningún jugador va a querer desviarse de la estrategia predicha para él. (Gibbons, p.175)

El dilema del prisionero El dilema del prisionero es un juego que se basa en dos supuestos: (1) Cada jugador tiene incentivos para elegir una alternativa que le beneficie a él, pero que perjudica al contrario. (2) Cuando ambos jugadores actúan de este modo, acaban en una situación peor que si hubieran decidido alternativas diferentes. (Krugman, Wells y Olney, p.304) Es un modelo de juego construido en torno a las habilidades policiales rutinarias para hacer confesar a los detenidos, cuyo equilibrio de Nash (o resultado estable), determinado por la concurrencia de las mejores estrategias individuales a disposición de cada jugador, es ineficiente, es decir, existen otros resultados posibles en el mismo juego que proporcionarían mayor beneficio a los jugadores. Hay que tener en cuenta, para entender su funcionamiento, que se trata de un juego de turno estrictamente simultáneo (cada jugador juega sin haber podido observar la jugada del otro), que se juega una sola vez, con información completa y simétrica para ambos jugadores, sin comunicación posible entre ellos y sin que se puedan establecer acuerdos previos ni prever castigos ulteriores. (Font, p.60)

En el siguiente video se explican de manera sencilla, tanto el dilema del prisionero como el equilibrio de Nash.