Вы находитесь на странице: 1из 2

EL DILEMA DEL PRISIONERO

Muchos politlogos, economistas, matemticos y psiclogos han sentido fascinacin por un juego de azar llamado el
Dilema del Prisionero. Numerosas mentes privilegiadas creen que contiene las claves para la paz mundial y que su estudio
puede prevenir desde discusiones entre amigos a divorcios, hasta ayudar a paliar el egosmo inherente al ser humano.
El juego es el siguiente. Hay una banca que adjudica y paga beneficios a dos jugadores. Cada uno tiene dos cartas,
etiquetadas como COOPERAR y DESERTAR. Cada jugador elige una de las cartas y la coloca boca abajo sobre la mesa. Se hace
as para que ninguno est influenciado por la jugada del otro, ya que se juega simultneamente. En tensin, se espera a que la
banca de la vuelta a las cartas. El suspense se debe a que las ganancias no dependen slo de la carta que se juegue, sino tambin
de la del contrario.
Al existir 2 x 2 cartas, hay cuatro resultados posibles.
Cooperar

Desertar

Cooperar

300 euros

Multa de 100 euros

Desertar

500 euros

Multa de 10 euros

Por qu es un dilema? Para averiguarlo slo hay que ponerse en la mente de uno de los jugadores. Si el contrario escoge
DESERTAR, la mejor opcin es tambin DESERTAR. Ambos sufriremos el castigo de la desercin mutua (- 10 euros), pero
siempre ser mejor eso que no obtener la multa de (- 100 euros). Y si el contrario elige COOPERAR, de nuevo DESERTAR es la
mejor carta. De haber cooperado, podra obtener 300 euros. Pero la tentacin de desertar reporta 500 euros. La conclusin es que,
sea cual sea la carta que juegue el oponente, la mejor estrategia es siempre desertar. Si se enfrentan dos jugadores racionales,
desertarn siempre, aunque cada uno sabe perfectamente que si ambos hubieran jugado COOPERAR, habran obtenido una
recompensa relativamente elevada por su mutua cooperacin. ste es el motivo por el que el juego se considera un dilema. Ah
radica la terrible paradoja y se ha dicho que tendra que haber una ley contra l.
Prisionero viene de un ejemplo imaginario particular. La moneda, en este caso, no es dinero, sino sentencias de crcel.
Dos hombres -llammosles Ticio y Casio- estn en prisin sospechosos de colaborar en un delito. Cada uno de los prisioneros, en
su celda aislada, es invitado a traicionar a su colega (DESERTAR) convirtindose en un arrepentido. Lo que suceda depende de
lo que hagan ambos prisioneros, y ninguno sabe lo que ha hecho el otro. Si Ticio echa la culpa a Casio y ste hace que la historia
parezca verosmil permaneciendo en silencio (cooperando con su antiguo y, ahora, traicionero amigo), a Casio se le impondr una
larga condena de crcel, mientras que Ticio quedar libre, tras sucumbir a la Tentacin de Desertar- Si cada uno traiciona al otro,
ambos son convictos del delito, pero reciben cierto crdito y se les aplica una sentencia, rgida, pero ms reducida (la multa por
desercin mutua). Si ambos cooperan (entre s, no con las autoridades) negndose a hablar, no hay suficientes pruebas para
condenarles por el delito principal y se les impone una sentencia ms baja por un delito menor (la recompensa por la mutua
cooperacin). Aunque puede parecer absurdo llamar recompensa a una pena de crcel, es as como lo veran Ticio y Casio si la
alternativa fuera pasarse un largo periodo entre rejas. Las caractersticas del juego se mantienen (orden de rangos). Si alguien se
coloca en el puesto de cada uno de los prisioneros, suponiendo que ambos estn motivados por el propio inters racional y
recordando que no pueden hablar entre s para pactan la nica eleccin que tienen es acusarse mutuamente.
Hay alguna manera de salir del dilema? Ambos jugadores saben que cualquier cosa que haga su oponente, ellos no pueden
hacer ms que DESERTAR. Aunque saben que slo si ambos hubieran cooperado, les habra ido mejor a los dos. Si slo... s
slo.., si slo pudieran encontrar el modo de llegar a un acuerdo, de garantizarse cada jugador que el otro no le va a dejar en la
estacada, de algn tipo de poltica de pacto.
En un juego tan simple como el Dilema del Prisionero no hay manera de garantizar la confianza. A menos que uno de los
jugadores sea un bendito incauto, demasiado bueno para el mundo real, el juego est predestinado a finalizar en mutua desercin,
con su resultado paradjicamente malo para ambos jugadores.
Pero hay otra versin del juego. Se conoce como el Dilema del Prisionero repetido. En l radica la esperanza, ya que
sus enseanzas pueden extrapolarse a las relaciones de pareja, de padre-hijo, de amistad, de profesor-alumno, de negocios,
etctera. El juego es el normal, pero repetido un nmero indefinido de veces con los mismos jugadores.
Las sucesivas partidas del mismo juego dan la oportunidad de confiar o desconfiar, de intercambiar o aplacar, de olvidar o
vengarse. Es un juego indefinidamente largo, cuya relevancia radica en que ambos jugadores pueden ganar a expensas de la
banca ms que a costa uno del otro. Tras diez partidas, tericamente Ticio podra haber ganado 5.000 euros, pero slo si Casio ha
sido extraordinariamente tonto o santurrn y ha jugado COOPERAR todas las veces, a pesar de que Ticio estuviese desertando.
De manera ms realista es fcil para Ticio y Casio sacar 3.000 euros del dinero de la banca si ambos juegan COOPERAR en las
diez partidas. Para ello no es necesario ser especialmente santos, ya las cartas del contrario nos muestran si se puede confiar en l.
Otro escenario con muchas probabilidades de suceder es que ni Ticio ni Casio confien en el otro: tras DESERTAR diez partidas,
la banca obtendr 100 euros de multa de cada uno de ellos.
Pero lo ms probable (como en la vida misma) es que Ticio y Casio confen parcialmente el uno en el otro, y que cada uno
juegue una secuencia mixta de COOPERAR y DESERTAR, acabando con una suma intermedia de dinero. A diferencia de la
versin simple, bastante predecible por cuanto DESERTAR es la nica estrategia racional, la versin repetida ofrece multitud de

enfoques estratgicos. En el juego sencillo slo hay dos posibles estrategias, COOPERAR y DESERTAR. Sin embargo, la
repeticin permite infinidad de estrategias concebibles y deja de ser evidente qu tctica es la mejor.
Las maniobras disponibles en el juego repetido slo estn limitadas por la ingenuidad de los jugadores. Puede averiguarse
cul es la mejor? sa fue la misin que se marc el politlogo estadounidense Robert Axelrod, que organiz una competicin
entre los mayores expertos en teoras de juegos, cada uno con su estrategia elaborada en lenguaje de ordenador Se presentaron
catorce estrategias, a las que Axelrod incorpor una decimoquinta, llamada aleatoria, que simplemente jugaba COOPERAR y
DESERTAR al azar y que serva como lnea de base sin estrategia: si un modelo no poda ser mejor que aleatoria", deba ser
bastante malo.
Axelrod tradujo las 15 estrategias a un lenguaje de programacin comn y las compar en una computadora de gran
capacidad. Cada una de ellas fue enfrentada a otra (incluyendo una copia de s misma) para jugar el Dilema del Prisionero
Repetido. Puesto que haba 15 estrategias, se jugaron 225 juegos(15 x 15) distintos en la computadora. Cada uno de ellos
partcip en 200 partidas. Se totalizaron las ganancias y se proclam el vencedor. Hay que tener en cuenta que los jugadores
del torneo no eran seres humanos, sino programas de ordenador.
La estrategia ganadora fue la ms simple de todas y, aparentemente, la menos ingeniosa. Se llamaba Donde las Dan las
Toman y la envi el profesor Anatol Rapoport, conocido psiclogo y terico del juego de Toronto. Donde las Dan las Toman
comienza cooperando en la primera partida y despus,simplemente, copia el movimiento previo del otro jugador.
Cmo funcionara un juego con Donde las Dan las Toman? Supongamos que se enfrenta a s misma. Los dos
jugadores comenzaran cooperando. A partir de ah copiaran el movimiento previo del otro, por lo que acabaran ambos con
muy buena puntuacin. Imaginemos que Donde las Dan las Toman se enfrentara despes a otra estrategia denominada
Cndido Probador. Bsicamente son idnticas, salvo que Cndido Probador deserta gratuitamente al azar una de cada diez
partidas, obteniendo la elevada puntuacin de Tentacin. Pero, luego, Donde las Dan las Toman se venga y recupera los puntos
perdidos. Y a partir de ah se traicionan mutuamente, obteniendo al final una puntuacin regular.
Otra estrategia curiosa fue la del Probador Arrepentido. Es igual al Cndido Probador, excepto en que realiza pasos
activos para romper la serie de recriminaciones alternativas.
Para hacerlo necesita una memoria ligeramente mejor que la de Donde las Dan las Toman o Cndido Probador.
Probador Arrepentido recuerda si ha desertado espontneamente o s el resultado fue una venganza rpida. Si es as, lleno de
remordimiento permite a su oponente una tirada libre de venganza. Esto significa que se cortan de raz las recriminaciones
mutuas.
Algunas de las estrategias que participaron en el torneo de Axelrod fueron mucho ms sofisticadas, pero tambin acabaron
con menos puntos de promedio que el simple Donde las Dan las Toman.
En realidad, de todas ellas (excepto Aleatoria) la que menos xito tuvo fue la ms elaborada. La present un annimo y se
especul sobre si se trataba de una eminencia gris del Pentgono, el jefe de la CIA, Henry Kissinger.. Nunca se supo.
Con los resultados obtenidos del campeonato, Axelrod clasific las estrategias conforme a ciertas categoras para as
examinar el xito en trminos generales.
La categora ms importe fue la amable. Una estrategia amable es aquella que nunca es la primera en desertar Donde las
Dan las Toman es capaz de desertar, pero slo como venganza. Tanto Cndido Probador como Probador Arrepentido son
estrategias sucias, porque a veces desertan. De las 15 estrategias registradas en el torneo, 8 eran amables. Y resulta significativo
que todas quedaron por delante de las otras 7 estrategias sucias.
Otra categora es clemente. Lo es una estrategia que puede vengarse, pero tiene mala memoria y tiende a pasar por alto
antiguas ofensas. Donde las Dan las Toman es clemente. Se venga inmediatamente de un desertor, pero despus olvida lo
pasado.
Axelrod descubri as dos caractersticas de estrategias ganadoras: amables y clementes. Esta conclusin, que suena casi
utpica -vale la pena ser amables y clementes- result una sorpresa para muchos de los expertos, que haban tratado de ser
demasiado astutos presentando estrategias sucias.
Una nueva categora elaborada fue envidioso. Ser envidioso, en la terminologa de Axelrod, significa desear ms dinero
que el otro jugador en lugar de una cantidad grande en trminos absolutos del dinero de la banca. No ser envidioso significa
sentirse feliz si el otro jugador gana tanto dinero como uno, siempre que ambos consigan as ms de la banca. Donde las Dan las
Toman no es envidiosa. Realmente nunca gana un juego. Lo ms que puede hacer es empatan ya que nunca deserta, excepto
como venganza. Pero tiende a conseguir cada empate con una alta puntuacin compartida. En lo que respecta a Donde las Dan
las Toman y otras estrategias amables, la misma palabra oponente resulta inadecuada. Pero, por desgracia, cuando los
psiclogos organizan juegos del Dilema del Prisionero repetido entre seres humanos reales, casi todos los jugadores sucumben a
la envidia y, por tanto, les va relativamente mal en trminos de dinero. Parece que mucha gente, quiz sin pensarlo, preferira
vencer al otro jugador en lugar de cooperar con l para vencer a la banca. Las investigaciones de Axelrod han demostrado cun
equivocados estn.
Conclusin: la mejor estrategia en la vida es ser amable (no desertar el primero), clemente (vengarse de inmediato de un
desertor, para despus olvidar el pasado) y no envidioso (aliarse con el oponente para exprimir a la banca).

Вам также может понравиться