Академический Документы
Профессиональный Документы
Культура Документы
1. Introduccin
La teora de juegos es la rama de las matemticas que estudia los juegos. Un juego es una re-
presentacin formal de una situacin en la que hay interaccin estratgica. Esto es, una situacin
en que un grupo de agentes que toman decisiones estn conscientes de que su bienestar depende de
la decisin tomada por cada uno de los integrantes del grupo y actan en consecuencia. Llamamos
jugadores a los agentes que participan en la situacin de interaccin estratgica de inters. Cada
jugador tiene un conjunto de acciones o estrategias disponibles y su problema de decisin consiste
en elegir una de stas alternativas. Los jugadores tienen una relacin de preferencias definida sobre
el conjunto de resultados, la consecuencia de las decisiones tomadas por todos los agentes. As, cada
jugador trata de anticipar lo que harn los dems al momento de elegir su propia accin y su propio
comportamiento entonces, depende de lo que l piensa que harn los dems.
En la mayora de los modelos que hemos estudiamos hasta el momento, no haba interaccin
estratgica por dos razones: asumamos que haba un nico agente, o asumamos que haba muchos
agentes, pero que stos no eran conscientes de que sus pagos dependan tambin de las acciones
tomadas por los dems agentes. Por ejemplo, en todos los modelos de monopolio, el nico agente
tomador de decisiones era una nica firma y, como no haban otras firmas, simplemente no haba
interaccin estratgica. Cuando estudiamos competencia perfecta, asumimos que cada firma era to-
madora de precios; es decir, asumimos que la firma no era consciente de que sus propias decisiones
de produccin afectan el precio y a travs del precio, las decisiones de produccin de las dems firmas.
2. Existe conocimiento comn de las reglas del juego y la racionalidad de los agentes.
Aunque estos supuestos constituyen la base de la teora de juegos, en muchos juegos se relajan
algunos de estos supuestos. Por ejemplo, hay juegos donde se asume que algunos jugadores no son
racionales.
Existen muchos tipos de juegos y, en general, los podemos clasificar en base al orden en que los
jugadores toman decisiones y a la estructura de la informacin que manejan los jugadores. Cuando
en un juego todos los jugadores eligen en forma simultnea, decimos que el juego es esttico y si por
el contrario, los jugadores eligen en algn orden, decimos que el juego es extensivo o dinmico. Por
otra parte, si todos los jugadores conocen todo en un juego, decimos que el juego tiene informacin
1
completa, mientras que si algn jugador no conoce los pagos de algn otro jugador, decimos que
el juego tiene informacin incompleta. De esta manera podemos agrupar los juegos bsicamente en
cuatro categoras:
En este curso nos centraremos especialmente en los juegos estticos y extensivos con informacin
completa.
S = S1 Sn
Habitualmente, supondremos que las preferencias de cada jugador pueden ser representadas me-
diante una funcin de pagos ui : S R. De manera que ui (s) > ui (s0 ) si y slo si el jugador i N
prefiere el perfil de estrategias s al perfil s0 .
En este contexto, nos referiremos a un perfil de estrategias jugado s S como el resultado del
juego.
2
Definicin 2.2 (Juego finito). Si el conjunto de acciones de cada jugador es finito, entonces diremos
que el juego es finito.
Escribiremos a partir de ahora, si para referirnos a las acciones jugadas por todos los jugadores,
excepto a la accin del jugador i. Explcitamente, si s S, entonces s = (si , si ). Adems, el
conjunto de estrategias factibles para los jugadores diferentes de i es:
Y
Si = Sj . (1)
jN
j6=i
De esta manera,
s = (si , si ) Si Si = S. (2)
Ahora, vamos a ilustrar la representacin de un juego en forma normal con algunos ejemplos
clsicos.
Ejemplo 2.3 (Dilema del prisionero). Dos sospechosos, a los que llamaremos 1 y 2 son detenidos
y acusados de un delito. La polica no tiene evidencia suficiente para condenar a los sospechosos,
al menos que alguno confiese. La polica encierra a los dos sospechosos en celdas separadas y les
explica a ambos que pueden confesar (c) el delito o no confesar (nc) y les explica las consecuencias
de las decisiones que tomen:
si ninguno confiesa, ambos sern condenados por un delito menor y sentenciados a un ao de
crcel;
finalmente, si uno confiesa y el otro no, el que confiesa ser puesto en libertad por cooperar
con la investigacin y el otro ser sentenciado a 8 aos de prisin, 5 aos por el delito y tres
ms por obstruccin a la justicia.
Podemos describir esta situacin mediante un juego en forma normal donde:
N = {1, 2}
S1 = S2 = {c, nc}, con lo que S = {(c, c), (c, nc), (nc, c), (nc, nc)}
El juego puede ser representado mediante una matriz de pagos, en la cual cada fila corresponde
a las estrategias disponibles para el jugador 1 y cada columna corresponde a las estrategias disponibles
para el jugador 2. Adems, en esta matriz se incluyen los pagos asociados a cada combinacin s S
de estrategias de los jugadores 1 y 2, en la forma (u1 (s), u2 (s)). La matriz de pagos del Dilema del
prisionero se puede ver en la Figura 1.
3
Jugador 2
c nc
c 1, 1 0, 8
Jugador 1
nc 8, 0 5, 5
Ejemplo 2.4 (Bach o Stravinsky). Dos individuos deben elegir entre dos conciertos de msica cl-
sica. Cada individuo prefiere ir acompaado al concierto que ir solo, pero el individuo H prefiere ir
al concierto de msica de Bach (Ba), mientras que el individuo M prefiere ir al concierto de msica
de Stravinsky (St).
N = {H, M }
SH = SM = {Ba, St} con lo que S = {(Ba, Ba), (St, St), (Ba, St), (St, Ba)}
Podemos representar las preferencias de cada jugador mediante las siguientes funciones de pago:
2 si s = (Ba, Ba)
2 si s = (St, St)
uH (s) = 1 si s = (St, St) uM (s) = 1 si s = (Ba, Ba)
0 si s {(Ba, St), (St, Ba)} 0 si s {(St, Ba), (Ba, St)}
M
Ba St
Ba 2, 1 0, 0
H
St 0, 0 1, 2
Ejemplo 2.5 (Polica y Ladrn). Un ladrn, L, y un polica, P deben elegir una ubicacin I o
D en la ciudad para ejercer sus respectivos oficios. Si ambos eligen la misma ubicacin, entonces
el polica atrapa al ladrn; y si eligen localizaciones diferentes, el ladrn puede robar y escapar sin
consecuencias. Podemos describir esta situacin como juego en forma normal con:
N = {P, L}
SP = SL = {I, D} con lo que S = {(I, I), (D, D), (I, D), (D, I)}
4
Preferencias de L: (D, I) L (I, D) L (I, I) P (D, D)
Podemos representar las preferencias cada jugador mediante las funciones de utilidad uP y uL
definidas como:
( (
1 si sP = sL 1 si sL 6= sP
uP (s) = uL (s) =
1 si sP 6= sL 1 si sL = sP
Jugador L
I D
I 1, 1 1, 1
Jugador P
D 1, 1 1, 1
Ejemplo 2.6 (Juego de Cournot). En un mercado de un bien homogneo, hay dos firmas que deben
elegir cunto producir. La firma i {1, 2} produce con costos totales de produccin Ci : R+ R+ .
La produccin total va al mercado y se vende. El precio de venta se determina segn la cantidad
total producida. La funcin inversa de demanda es la funcin P : R+ R+ . Cada firma quiere
tener los beneficios ms altos posibles. Podemos describir este juego como:
N = {1, 2}
S1 = S2 = R+
Las preferencias de las firmas quedan directamente representadas por sus funciones de benefi-
cio. Esto es, para i {1, 2} la funcin de pago ui : S1 S2 R est definida por:
Definicin 2.7 (Estrategia estrictamente dominada). En un juego etratgico N, (Si )iN , (ui )iN ,
una estrategia s0i Si de un jugador i N , es estrictamente dominada por otra estrategia s00i Si
si:
5
Notemos que una estrategia s0i de un jugador i N es estrictamente dominada, si existe alguna
estrategia s00i tal que, independiente de lo que hagan los rivales, el jugador obtiene mejores resulta-
dos jugando s00i . Bajo el supuesto de racionalidad, una estrategia estrictamente dominada no debera
jugarse. Adems, bajo el supuesto de conocimiento comn, todos los jugadores saben que de existir
estrategias estrictamente dominadas, stas no deberan jugarse. En definitiva, cada jugador puede
predecir qu estrategias de cualquier jugador no sern jugadas.
Ejemplo 2.8 (EIEED). Consideremos un juego con dos jugadores, donde el primer jugador debe
escoger entre jugar arriba (U ) o abajo (D) y donde el jugador 2 debe elegir entre jugar izquierda
(L), centro (C) o derecha (R). En este juego la siguiente matriz resume los pagos que obtiene cada
jugador:
Jugador 2
L C R
U 1, 0 1, 2 0, 1
Jugador 1
D 0, 3 0, 1 2, 0
Notemos que el jugador 1 tiene dos estrategias posibles, S1 = {U, D}, y el jugador 2 tiene tres
estrategias factibles, S2 = {L, C, R}. Podemos observar que para el jugador 1 no hay estrategias
estrictamente dominadas, ya que
Jugador 2
L C
U 1, 0 1, 2
Jugador 1
D 0, 3 0, 1
Ahora, la estrategia D est estrictamente dominada para el jugador 1 por la estrategia U dado que
Como el jugador 2 tambin es racional, sabe que 1 sabe que l nunca jugar R y por lo tanto 2 sabe
que 1 nunca jugar D. Luego, el juego queda:
6
Jugador 2
L C
Jugador 1 U 1, 0 1, 2
Finalmente, para el jugador 2 la estrategia I est estrictamente dominada por C, dado que
Con lo que podemos concluir que en este juego, se jugar el perfil (U, C).
2. En este nuevo juego, buscar una nueva estrategia estrictamente dominada y, de encontrar,
eliminarla.
Como ilustra el ejemplo, la EIEED nos permite, en algunas ocasiones, reducir el espacio factible de
estrategias. Incluso, podra darse el caso de que en algn juego, nicamente una estrategia de cada
jugador sobreviva al proceso de EIEED, de manera que en ese juego podamos obtener el perfil de
estrategias que ser jugado. Sin embargo, este proceso tiene la desventaja de que en muchos juegos
no hay estrategias estrictamente dominadas y, en consecuencia, no podemos descartar ninguna es-
trategia y la EIEED no ayudar a obtener una idea de lo que eligen hacer los jugadores.
Observacin 1. Una estrategia estrictamente dominada no puede ser una mejor respuesta (por
qu?), pero una estrategia que nunca es mejor respuesta no necesariamente est estrictamente do-
minada.
Dado un jugador i N la Funcin de mejor respuesta del jugador i, denotada por Bri , es aquella
que asocia a cada perfil de estrategias del resto de los jugadores si , el conjunto de acciones ptimas
del jugador i respecto de ese perfil.
7
Definicin 2.10 (Funcin de mejor respuesta). La funcin de mejor respuesta del jugador i, Bri :
Si Si est dada por:
Bri (si ) := argmaxs0i Si ui (s0i , si )
Si si Bri (si ) diremos que si es una mejor respuesta a si . Podemos hacer dos razonamientos
sobre las mejores respuestas:
Si i N cree que sus rivales juegan si Si entonces i N debera escoger una estrategia
en el conjunto Bri (si ).
Es razonable pensar que un jugador no elegir una estrategia que nunca es mejor respuesta
(pues siempre puede mejorar su pago eligiendo una mejor respuesta).
Estos dos razonamientos nos llevan a considerar un nuevo proceso de eliminacin de estrategias: la
Eliminacin Iterada de Nunca Mejores Respuestas (EINMR).
Considerando lo anterior, podemos concluir que los perfiles de estrategias posibles no son todos
los que estn en S, si no ms bien los formados por estrategias que no hayan sido eliminadas;
es decir, por cada jugador i N una estrategia en su conjunto Ri1 . Consideramos entonces el
conjunto R1 S, definido como Y
R1 := Ri1 .
iN
Como este razonamiento lo pueden hacer todos los jugadores, todos pueden deducir que los
perfiles de estrategias estarn en R1 y, por lo tanto, todos saben que las estrategias posibles
de cada jugador i N son en realidad mejores respuestas a algn perfil en Ri 1 S .
i
1 Ri1 Si .
Esto nos lleva a quedarnos, para cada jugador i N , con el conjunto Bri Ri
2
Llamamos a este conjunto Ri . Es decir,
Ri2 := Bri Ri
1
.
Considerando lo anterior, podemos concluir que los perfiles de estrategias posibles no son todos
los que estn en R1 , si no ms bien los formados por estrategias que no hayan sido eliminadas;
es decir, por cada jugador i N una estrategia en su conjunto Ri2 . Consideramos entonces el
conjunto R2 S, definido como Y
R2 := Ri2 .
iN
8
Podemos seguir haciendo el mismo razonamiento en cada etapa t 1. Es decir, dado un
conjunto de perfiles de estrategias Rt , para cada jugador i N , nos quedamos con el conjunto
Rit+1 := Bri Ri
t
Rit Si
Ejemplo 2.12 (Funcin de mejor respuesta y EINMR). Consideremos el juego descrito en la Figura
5.
J2
b1 b2 b3 b4
a1 0, 7 5, 2 7, 0 6, 6
a2 2, 5 3, 3 2, 5 2, 2
J1
a3 7, 0 5, 2 0, 7 4, 4
a4 6, 6 2, 2 4, 4 10, 3
Notemos que si J2 juega b1 , la mejor respuesta de J1 es jugar a3 ; si J2 juega b2 , J1 tiene dos mejores
respuestas: a1 y a3 ; si J2 juega b3 , lo mejor para J1 es jugar a1 y, finalmente, si J2 juega b4 , la
mejor respuesta para J1 es a4 . Podemos escribir la funcin de mejor respuesta del jugador J1 como:
a3 si s2 = b1
a1 , a3 si s = b2
2
Br1 (s2 ) = 1
(3)
a si s2 = b3
a4
si s2 = b4
9
Realizando un anlisis anlogo para J2, obtenemos que la funcin de mejor respuesta para el jugador
J2 es:
1 si s1 a1 , a4
b
b1 , b3 si s1 = a2
Br2 (s1 ) = (4)
3
b si s1 = a3
Ahora observemos en la funcin de mejor respuesta del jugador J1 que la estrategia a2 nunca es
mejor respuesta. Similarmente, en la funcin de mejor respuesta para J2 podemos observar que las
estrategias b2 y b4 nunca son mejores respuestas. Por lo tanto, cada jugador sabe que dichas estra-
tegias no sern jugadas y pueden descartarlas como posibles resultados del juego. El conjunto R1 y
sus respectivos pagos quedan representados en la Figura 6.
J2
b1 b3
a1 0, 7 7, 0
J1 a3 7, 0 0, 7
a4 6, 6 4, 4
De (3) y (4) podemos observar que, dado que nadie juega a2 , b2 b4 , entonces a4 pasa a ser nunca
mejor respuesta, con lo que obtenemos R2 representado junto a sus pagos en la Figura 7.
J2
b1 b3
a1 0, 7 7, 0
J1
a3 7, 0 0, 7
Llegado a este punto somos incapaces de seguir eliminando estrategias, puesto que no quedan estra-
tegias que no sean nunca mejor respuesta; con lo que R3 = R2 y el proceso se acaba.
10
Observacin 2. De la Observacin 1 obtenemos que el conjunto de perfiles de estrategias racionali-
zables es un subconjunto del conjunto de perfiles que resulta de la EIEED.
Ejemplo 2.13. Consideremos el juego de la Figura 8 en que el jugador 1 elige filas y el jugador 2
elige columnas.
L M R
U 2,0 3,5 4,4
D 0,3 2,1 5,2
Vemos que en este juego no hay estrategias estrictamente dominadas y por lo tanto la EIEED
entrega todo el conjunto de perfiles de estrategias.
Sin embargo, la estrategia R del jugador 2 nunca es mejor respuesta, por lo que no es raciona-
lizable. Si la eliminamos, obtenemos que ahora la estrategia D del jugador 1 no es mejor respuesta
(pues slo era mejor respuesta a la estrategia R del jugador 2) y en consecuencia tampoco es racio-
nalizable. Una vez que la eliminamos, tenemos que ahora la estrategia L del jugador 2 no es mejor
respuesta, con lo que obtenemos que el nico perfil de estrategias racionalizables es el perfil (D, M ).
1. Cada jugador sostiene un expectativa correcta de lo que juega el resto de los jugadores.
2. Cada jugador acta de manera racional con respecto a esta expectativa. En este sentido su
decisin maximiza su funcin de pagos dada su expectativa.
11
Un juego puede no tener equilibrio de Nash (Ver ejemplo 2.17).
Un equilibrio de Nash es un Perfil de estrategias, lo cual No es lo mismo que los pagos que
reciben los jugadores en equilibrio.
Tal como dijimos arriba, en un equilibrio de Nash no hay incentivo a cambiar de estrategia. Esto
nos entrega un mtodo de verificacin de si un perfil es o no un equilibrio de Nash:
Dado un perfil de estrategias s S, si existe un jugador i N para el cual hay una estrategia
si Si tal que
ui (si , si ) > ui (s)
entonces el perfil s no es un equilibrio de Nash.
Esta observacin nos permite ver que en el Ejemplo 2.12 no hay equilibrio de Nash, mientras
que en el Ejemplo 2.13 el nico equilibrio de Nash es el perfil (U, M ).
Ejemplo 2.15 (Dilema del prisionero). En el juego descrito en el Ejemplo 2.3, tenemos que el perfil
(c, c) es un EN del juego, puesto que:
u1 (c, c) = 1 > 8 =u1 (nc, c)
u2 (c, c) = 1 > 8 =u2 (nc, c)
Ninguno de los otros perfiles es un EN. Notemos que para (nc, nc) cualquiera de los dos prisioneros
querr desviarse y delatar al compaero, pues de esa manera tienen penas menores. Por otra parte,
notemos que para (nc, c) y (c, nc), el prisionero que no confiesa tiene incentivos para desviarse y
confesar tambin, puesto que si persistiera en no confesar tendra una pena an mayor. De esta
forma, podemos concluir que para el Dilema del prisionero, (c, c) es el nico EN.
Ejemplo 2.16 (BoS). Para el juego descrito en el Ejemplo 2.4, observemos que los perfiles (Ba, St)
y (St, Ba) no pueden ser equilibrios de Nash, puesto que para ambos perfiles de estrategias los
jugadores tienen incentivos para desviarse. Por ejemplo, si se juega (Ba, St), H tiene incentivos
para cambiar su estrategia a St puesto que uH (St, St) = 1 > 0 = u1 (Ba, St). En cambio, tanto el
perfil (Ba, Ba) como (St, St) son equilibrios de Nash puesto que en cada caso, dado lo que hace el
rival, ningn jugador tiene incentivos a desviarse. En efecto para el perfil (Ba, Ba) tenemos que :
uH (Ba, Ba) = 2 > 0 = uH (St, Ba)
uM (Ba, Ba) = 1 > 0 = uM (St, Ba)
12
La funcin de mejor respuesta nos permite proveer una caracterizacin de equilibrio de Nash.
Proposicin 2.18 (Caracterizacin de EN). Un perfil de estrategias s S es un equilibrio de
Nash si y solo si:
La Proposicin 2.18 nos provee un mtodo para buscar equilbirios de Nash en un juego: calcular
las funciones de mejor respuesta de los jugadores y buscar perfiles que satisfagan las condicin de
la proposicin. En el caso que las funciones de mejor respuesta de los jugadores de un juego sean en
efecto funciones (i.e. que para todo i N y para todo perfil de estrategias de los rivales de i haya
una nica mejor respuesta), entones la condicin (6) se transforma en un sistema de ecuaciones. En
este sistema hay una ecuacin por cada jugador y una variable por cada jugador.
Definicin 2.19 (Aplicacin de mejor respuesta
de un juego).
La aplicacin de mejor respuesta de un juego N,(Si )iN ,(ui )iN , B : S S est definida como:
Y
B(s) := Bri (si )
iN
Estrictamente Dominadas.
Demostracin. Demostramos esto por contradiccin. Es decir, tomemos un perfil s S y supon-
gamos que no sobrevive la EIEED.
Si no la sobrevive, quiere decir que en alguna etapa de la EIEED, la estrategia de algn jugador
en ese perfil es la primera del perfil en ser eliminada. Llamemos i N al jugador cuya estrategia
si es la primera del perfil s en ser eliminada mediante la EIEED. Esto quiere decir, que existe una
estrategia s0i Si tal que
13
para todo perfil de estrategias si Si que no ha sido an eliminado. Como si es la primera
estrategia del perfil s en ser eliminada, el perfil de los rivales de i, si es uno de los perfiles que
aparecen en (7). Luego, en particular se tiene
ui s0i , si > ui si , si
La siguiente proposicin nos dice que si en un juego finito se obtiene un nico perfil como
resultado de la EIEED, entonces ese perfil es el nico EN del juego.
Proposicin 2.22. Si en un juego estratgico finito N,(Si )iN ,(ui )iN , un perfil de estrategias
s S es el nico resultado de la Eliminacin Iterada de Estrategias Estrictamente Dominadas,
entonces s es el nico equilibro de Nash del juego.
Demostracin. Como ya tenemos el resultado de la Proposicin 2.21 slo tenemos que probar que si
un perfil es el nico en sobrevivir la EIEED, entonces es un equilibrio (podra no serlo). La Propo-
sicin 2.21 nos dice que de haber otros equilibrios, tambin hubiesen sobrevivido la EIEED, y por
lo tanto este es el nico equilbirio.
Entonces, supongamos que la EIEED elimin a todos los perfiles salvo a s . Si s no fuese
equilibrio de Nash, entonces existe un jugador i N y una estrategia si Si tal que
ui si , si > ui si , si .
(8)
Como si fue eliminada, tiene que existir otra estrategia s0i Si que en alguna etapa de la EIEED
la domin. En particular,
ui s0i , si > ui si , si .
(9)
Pero s0i tambin fue eliminada y por lo tanto tiene que existir otra estrategia s00i Si que en alguna
etapa de la EIEED domin a s0i . En particular,
Notemos que ninguna de las dos proposiciones hace afirmaciones sobre la existencia de equilibrio.
La primera dice que si hay un equilibrio, entonces nunca es eliminado; y la segunda dice que si el
resultado es nico, entonces es el nico equilibrio.
14