0601TeodeJuegos20170419 275878

Teora de Juegos
1. Introduccin
La teora de juegos es la rama de las matemticas que estudia los juegos. Un juego es una re-
presentacin formal de una situacin en la que hay interaccin estratgica. Esto es, una situacin
en que un grupo de agentes que toman decisiones estn conscientes de que su bienestar depende de
la decisin tomada por cada uno de los integrantes del grupo y actan en consecuencia. Llamamos
jugadores a los agentes que participan en la situacin de interaccin estratgica de inters. Cada
jugador tiene un conjunto de acciones o estrategias disponibles y su problema de decisin consiste
en elegir una de stas alternativas. Los jugadores tienen una relacin de preferencias definida sobre
el conjunto de resultados, la consecuencia de las decisiones tomadas por todos los agentes. As, cada
jugador trata de anticipar lo que harn los dems al momento de elegir su propia accin y su propio
comportamiento entonces, depende de lo que l piensa que harn los dems.
En la mayora de los modelos que hemos estudiamos hasta el momento, no haba interaccin
estratgica por dos razones: asumamos que haba un nico agente, o asumamos que haba muchos
agentes, pero que stos no eran conscientes de que sus pagos dependan tambin de las acciones
tomadas por los dems agentes. Por ejemplo, en todos los modelos de monopolio, el nico agente
tomador de decisiones era una nica firma y, como no haban otras firmas, simplemente no haba
interaccin estratgica. Cuando estudiamos competencia perfecta, asumimos que cada firma era to-
madora de precios; es decir, asumimos que la firma no era consciente de que sus propias decisiones
de produccin afectan el precio y a travs del precio, las decisiones de produccin de las dems firmas.
La importancia de la teora de juegos en organizacin industrial es que en la mayora de las

industrias podemos encontrar interaccin estratgica y muchas de las prcticas que se observan en
las industrias, como por ejemplo, las estrategias de precios, la diferenciacin de bienes, las decisiones
de inversin en publicidad, etc.; estn inmersas en situaciones de interaccin estratgica. La teora
de juegos nos permitir representar problemas econmicos ms complejos y nos permitir analizar
la conducta de los agentes y extraer conclusiones en contextos ms ricos y complejos.
La teora de juegos se construye principalmente sobre dos supuestos:
1. Los agentes son racionales.
2. Existe conocimiento comn de las reglas del juego y la racionalidad de los agentes.
Aunque estos supuestos constituyen la base de la teora de juegos, en muchos juegos se relajan
algunos de estos supuestos. Por ejemplo, hay juegos donde se asume que algunos jugadores no son
racionales.
Existen muchos tipos de juegos y, en general, los podemos clasificar en base al orden en que los
jugadores toman decisiones y a la estructura de la informacin que manejan los jugadores. Cuando
en un juego todos los jugadores eligen en forma simultnea, decimos que el juego es esttico y si por
el contrario, los jugadores eligen en algn orden, decimos que el juego es extensivo o dinmico. Por
otra parte, si todos los jugadores conocen todo en un juego, decimos que el juego tiene informacin
1
completa, mientras que si algn jugador no conoce los pagos de algn otro jugador, decimos que
el juego tiene informacin incompleta. De esta manera podemos agrupar los juegos bsicamente en
cuatro categoras:
1. Juegos estticos con informacin completa.
2. Juegos dinmicos con informacin completa.
3. Juegos estticos con informacin incompleta.
4. Juegos dinmicos con informacin incompleta.
En este curso nos centraremos especialmente en los juegos estticos y extensivos con informacin
completa.
2. Juegos estticos con informacin completa

2.1. Juegos en forma normal y notacin
En un juego esttico con informacin completa todos los jugadores toman una nica decisin
y una sola vez en el juego. Los jugadores, adems, toman esta decisin en forma simultnea; o
equivalentemente, al momento de tomar la decisin, no estn informados de las elecciones hechas
por los dems jugadores. En esta clase de juegos, la interaccin se captura mediante las preferencias
de los jugadores sobre el perfil de estrategias jugado (es decir, la lista de elecciones realizadas por
todos los jugadores).
Habitualmente representamos esta clase de juegos mediante su forma normal.

Definicin 2.1 (Juego en forma normal). Un juego en forma normal consiste de:
Un conjunto finito de jugadores, denotado por N .
Para cada jugador i N
Un conjunto de estrategias disponibles, Si .

Una relacin de preferencias definida sobre el conjunto de perfiles de estrategias factibles,
es decir sobre el conjunto:
S = S1 Sn
Habitualmente, supondremos que las preferencias de cada jugador pueden ser representadas me-
diante una funcin de pagos ui : S R. De manera que ui (s) > ui (s0 ) si y slo si el jugador i N
prefiere el perfil de estrategias s al perfil s0 .
En este contexto, nos referiremos a un perfil de estrategias jugado s S como el resultado del
juego.
Un juego en forma normal, queda entonces, completamente caracterizado por:
hN, (Si )iN , (ui )iN i
2
Definicin 2.2 (Juego finito). Si el conjunto de acciones de cada jugador es finito, entonces diremos
que el juego es finito.
Escribiremos a partir de ahora, si para referirnos a las acciones jugadas por todos los jugadores,
excepto a la accin del jugador i. Explcitamente, si s S, entonces s = (si , si ). Adems, el
conjunto de estrategias factibles para los jugadores diferentes de i es:
Y
Si = Sj . (1)
jN
j6=i
De esta manera,
s = (si , si ) Si Si = S. (2)
Ahora, vamos a ilustrar la representacin de un juego en forma normal con algunos ejemplos
clsicos.
Ejemplo 2.3 (Dilema del prisionero). Dos sospechosos, a los que llamaremos 1 y 2 son detenidos
y acusados de un delito. La polica no tiene evidencia suficiente para condenar a los sospechosos,
al menos que alguno confiese. La polica encierra a los dos sospechosos en celdas separadas y les
explica a ambos que pueden confesar (c) el delito o no confesar (nc) y les explica las consecuencias
de las decisiones que tomen:
si ninguno confiesa, ambos sern condenados por un delito menor y sentenciados a un ao de
crcel;
si ambos confiesan, sern ambos sentenciados a 5 aos de crcel;
finalmente, si uno confiesa y el otro no, el que confiesa ser puesto en libertad por cooperar
con la investigacin y el otro ser sentenciado a 8 aos de prisin, 5 aos por el delito y tres
ms por obstruccin a la justicia.
Podemos describir esta situacin mediante un juego en forma normal donde:
N = {1, 2}
S1 = S2 = {c, nc}, con lo que S = {(c, c), (c, nc), (nc, c), (nc, nc)}
Preferencias de 1: (nc, nc) 1 (c, nc) 1 (nc, nc) 1 (nc, c)
Preferencias de 2: (nc, nc) 2 (nc, c) 2 (nc, nc) 2 (c, nc)

Podemos representar las preferencias de los jugadores 1 y 2 mediante una funcin ui : S R con
i {1, 2} que a cada perfil de estrategias s S le asigne menos el nmero de aos que recibe el
jugador i (suponiendo que ambos individuos prefieren recibir menos aos de prisin).
El juego puede ser representado mediante una matriz de pagos, en la cual cada fila corresponde
a las estrategias disponibles para el jugador 1 y cada columna corresponde a las estrategias disponibles
para el jugador 2. Adems, en esta matriz se incluyen los pagos asociados a cada combinacin s S
de estrategias de los jugadores 1 y 2, en la forma (u1 (s), u2 (s)). La matriz de pagos del Dilema del
prisionero se puede ver en la Figura 1.
3
Jugador 2
c nc
c 1, 1 0, 8
Jugador 1
nc 8, 0 5, 5
Figura 1: Dilema del prisionero.
Ejemplo 2.4 (Bach o Stravinsky). Dos individuos deben elegir entre dos conciertos de msica cl-
sica. Cada individuo prefiere ir acompaado al concierto que ir solo, pero el individuo H prefiere ir
al concierto de msica de Bach (Ba), mientras que el individuo M prefiere ir al concierto de msica
de Stravinsky (St).
Podemos describir esta situacin mediante un juego en forma normal donde:
N = {H, M }
SH = SM = {Ba, St} con lo que S = {(Ba, Ba), (St, St), (Ba, St), (St, Ba)}
Preferencias de H: (Ba, Ba) H (St, St) H (Ba, St) H (St, Ba)
Preferencias de M : (St, St) M (Ba, Ba) M (Ba, St) M (St, Ba)
Podemos representar las preferencias de cada jugador mediante las siguientes funciones de pago:

2 si s = (Ba, Ba)
2 si s = (St, St)

uH (s) = 1 si s = (St, St) uM (s) = 1 si s = (Ba, Ba)

0 si s {(Ba, St), (St, Ba)} 0 si s {(St, Ba), (Ba, St)}

La matriz de pagos de este juego queda:
M
Ba St
Ba 2, 1 0, 0
H
St 0, 0 1, 2
Figura 2: Bach o Stravinsky.
Ejemplo 2.5 (Polica y Ladrn). Un ladrn, L, y un polica, P deben elegir una ubicacin I o
D en la ciudad para ejercer sus respectivos oficios. Si ambos eligen la misma ubicacin, entonces
el polica atrapa al ladrn; y si eligen localizaciones diferentes, el ladrn puede robar y escapar sin
consecuencias. Podemos describir esta situacin como juego en forma normal con:
N = {P, L}
SP = SL = {I, D} con lo que S = {(I, I), (D, D), (I, D), (D, I)}
Preferencias de P : (I, I) P (D, D) P (D, I) P (I, D)
4
Preferencias de L: (D, I) L (I, D) L (I, I) P (D, D)
Podemos representar las preferencias cada jugador mediante las funciones de utilidad uP y uL
definidas como:
( (
1 si sP = sL 1 si sL 6= sP
uP (s) = uL (s) =
1 si sP 6= sL 1 si sL = sP
La matrz de pagos queda:
Jugador L
I D
I 1, 1 1, 1
Jugador P
D 1, 1 1, 1
Figura 3: Polica y Ladrn
Ejemplo 2.6 (Juego de Cournot). En un mercado de un bien homogneo, hay dos firmas que deben
elegir cunto producir. La firma i {1, 2} produce con costos totales de produccin Ci : R+ R+ .
La produccin total va al mercado y se vende. El precio de venta se determina segn la cantidad
total producida. La funcin inversa de demanda es la funcin P : R+ R+ . Cada firma quiere
tener los beneficios ms altos posibles. Podemos describir este juego como:
N = {1, 2}
S1 = S2 = R+
Las preferencias de las firmas quedan directamente representadas por sus funciones de benefi-
cio. Esto es, para i {1, 2} la funcin de pago ui : S1 S2 R est definida por:
ui (s1 , s2 ) = si P (s1 + s2 ) Ci (si )
2.2. Eliminacin iterada de estrategias estrictamente dominadas (EIEED)

Hemos examinado los elementos de los que consiste un juego esttico con informacin completa.
Ahora debemos empezar a aproximarnos a alguna nocin de solucin; es decir, intentar responder
a la pregunta: qu acciones tomar cada jugador?
La primera idea para aproximarnos a un concepto de solucin de un juego es la idea de que

si un jugador es racional, no jugar una estrategia que produzca peores resultados que otra, bajo
cualquier conjetura respecto de lo que harn los rivales.

Definicin 2.7 (Estrategia estrictamente dominada). En un juego etratgico N, (Si )iN , (ui )iN ,
una estrategia s0i Si de un jugador i N , es estrictamente dominada por otra estrategia s00i Si
si:
ui (s00i , si ) > ui (s0i , si ) si Si
5
Notemos que una estrategia s0i de un jugador i N es estrictamente dominada, si existe alguna
estrategia s00i tal que, independiente de lo que hagan los rivales, el jugador obtiene mejores resulta-
dos jugando s00i . Bajo el supuesto de racionalidad, una estrategia estrictamente dominada no debera
jugarse. Adems, bajo el supuesto de conocimiento comn, todos los jugadores saben que de existir
estrategias estrictamente dominadas, stas no deberan jugarse. En definitiva, cada jugador puede
predecir qu estrategias de cualquier jugador no sern jugadas.
Utilizando la idea de estrategias estrictamente dominadas, podemos realizar un proceso conocido

como Eliminacin Iterada de Estrategias Estrictamente Dominadas (EIEED) que en algunos casos
nos permitir determinar qu estrategias sern jugadas en el juego. Para ilustrar en qu consiste
este proceso, revisaremos primero un ejemplo.
Ejemplo 2.8 (EIEED). Consideremos un juego con dos jugadores, donde el primer jugador debe
escoger entre jugar arriba (U ) o abajo (D) y donde el jugador 2 debe elegir entre jugar izquierda
(L), centro (C) o derecha (R). En este juego la siguiente matriz resume los pagos que obtiene cada
jugador:
Jugador 2
L C R
U 1, 0 1, 2 0, 1
Jugador 1
D 0, 3 0, 1 2, 0
Figura 4: Juego del ejemplo 2.8.
Notemos que el jugador 1 tiene dos estrategias posibles, S1 = {U, D}, y el jugador 2 tiene tres
estrategias factibles, S2 = {L, C, R}. Podemos observar que para el jugador 1 no hay estrategias
estrictamente dominadas, ya que
u1 (U, L) = 1 > U1 (D, L) = 0 y u1 (U, R) = 0 < 2 = u1 (D, R).
Pero para el jugador 2, en cambio, la estrategia C domina estrictamente a R, dado que
u2 (C, U ) = 2 > 1 = u2 (R, U ) y u2 (C, D) = 1 > 0 = u2 (R, D).
El jugador 1 entonces, sabe que el 2 nunca jugar R y el juego se reduce ahora a:
Jugador 2
L C
U 1, 0 1, 2
Jugador 1
D 0, 3 0, 1
Ahora, la estrategia D est estrictamente dominada para el jugador 1 por la estrategia U dado que
u1 (U, L) = 1 > 0 = u1 (D, L) y u1 (U, C) = 1 > 0 = u1 (D, C).
Como el jugador 2 tambin es racional, sabe que 1 sabe que l nunca jugar R y por lo tanto 2 sabe
que 1 nunca jugar D. Luego, el juego queda:
6
Jugador 2
L C
Jugador 1 U 1, 0 1, 2
Finalmente, para el jugador 2 la estrategia I est estrictamente dominada por C, dado que
u2 (C, U ) = 2 > 0 = u2 (I, U ).
Con lo que podemos concluir que en este juego, se jugar el perfil (U, C).
Eliminacin Iterada de Estrategias Estrictamente Dominadas: La EIEED consiste en:
1. Buscar alguna estrategia estrictamente dominada en el juego. De existir, eliminarla generando

un nuevo juego que tiene menos perfiles de estrategias.
2. En este nuevo juego, buscar una nueva estrategia estrictamente dominada y, de encontrar,
eliminarla.
t. Continuar as hasta que ya no se encuentren estrategias estrictamente dominadas.
Como ilustra el ejemplo, la EIEED nos permite, en algunas ocasiones, reducir el espacio factible de
estrategias. Incluso, podra darse el caso de que en algn juego, nicamente una estrategia de cada
jugador sobreviva al proceso de EIEED, de manera que en ese juego podamos obtener el perfil de
estrategias que ser jugado. Sin embargo, este proceso tiene la desventaja de que en muchos juegos
no hay estrategias estrictamente dominadas y, en consecuencia, no podemos descartar ninguna es-
trategia y la EIEED no ayudar a obtener una idea de lo que eligen hacer los jugadores.
2.3. Estrategias Racionalizables

Jugadores racionales slo deberan jugar mejores respuestas.

Definicin 2.9 (Mejor respuesta). En un juego estratgico N, (Si )iN , (ui )iN una estrategia
si Si es una mejor respuesta a un perfil de estrategias si Si de los rivales si:
ui (si , si ) > ui (s0i , si ) s0i Si
En palabras simples, una mejor respuesta de un jugador i N a un perfil de estrategias si de

los rivales, es lo mejor que puede hacer el jugador i dado ese perfil de estrategias de los rivales.
Observacin 1. Una estrategia estrictamente dominada no puede ser una mejor respuesta (por
qu?), pero una estrategia que nunca es mejor respuesta no necesariamente est estrictamente do-
minada.
Dado un jugador i N la Funcin de mejor respuesta del jugador i, denotada por Bri , es aquella
que asocia a cada perfil de estrategias del resto de los jugadores si , el conjunto de acciones ptimas
del jugador i respecto de ese perfil.
7
Definicin 2.10 (Funcin de mejor respuesta). La funcin de mejor respuesta del jugador i, Bri :
Si Si est dada por:
Bri (si ) := argmaxs0i Si ui (s0i , si )
Si si Bri (si ) diremos que si es una mejor respuesta a si . Podemos hacer dos razonamientos
sobre las mejores respuestas:
Si i N cree que sus rivales juegan si Si entonces i N debera escoger una estrategia
en el conjunto Bri (si ).
Es razonable pensar que un jugador no elegir una estrategia que nunca es mejor respuesta
(pues siempre puede mejorar su pago eligiendo una mejor respuesta).
Estos dos razonamientos nos llevan a considerar un nuevo proceso de eliminacin de estrategias: la
Eliminacin Iterada de Nunca Mejores Respuestas (EINMR).
Eliminacin Iterada de Nunca Mejores Respuestas: En este proceso se parte considerando

todo el conjunto de perfiles de estrategias S.
Ahora, si los jugadores son racionales, deberan jugar estrategias que son mejores respuesta
a algn perfil de sus rivales (no sabemos cual), por lo que las estrategias que no son mejores
respuesta a ningn perfil de los rivales, pueden ser eliminadas.
Esto nos lleva a quedarnos, para cada jugador i N , con el conjunto Bri (Si ) Si . Llamamos
a este conjunto Ri1 . Es decir,
Ri1 := Bri (Si ) .
Considerando lo anterior, podemos concluir que los perfiles de estrategias posibles no son todos
los que estn en S, si no ms bien los formados por estrategias que no hayan sido eliminadas;
es decir, por cada jugador i N una estrategia en su conjunto Ri1 . Consideramos entonces el
conjunto R1 S, definido como Y
R1 := Ri1 .
iN
Como este razonamiento lo pueden hacer todos los jugadores, todos pueden deducir que los
perfiles de estrategias estarn en R1 y, por lo tanto, todos saben que las estrategias posibles
de cada jugador i N son en realidad mejores respuestas a algn perfil en Ri 1 S .
i
1 Ri1 Si .

Esto nos lleva a quedarnos, para cada jugador i N , con el conjunto Bri Ri
2
Llamamos a este conjunto Ri . Es decir,
Ri2 := Bri Ri
1

.
Considerando lo anterior, podemos concluir que los perfiles de estrategias posibles no son todos
los que estn en R1 , si no ms bien los formados por estrategias que no hayan sido eliminadas;
es decir, por cada jugador i N una estrategia en su conjunto Ri2 . Consideramos entonces el
conjunto R2 S, definido como Y
R2 := Ri2 .
iN
8
Podemos seguir haciendo el mismo razonamiento en cada etapa t 1. Es decir, dado un
conjunto de perfiles de estrategias Rt , para cada jugador i N , nos quedamos con el conjunto
Rit+1 := Bri Ri
t
Rit Si

y consideramos el conjunto de perfiles de estrategias Rt+1 Rt S definido como,

Y
Rt+1 := Rit+1 .
iN
El proceso continua al infinito o hasta que Rt+1 = Rt .
El proceso de EINMR entrega un conjunto de perfiles de estrategias que denominamos conjunto de

perfiles de estrategias racionalizables.

Definicin 2.11 (Estrategias Racionalizables). En un juego estratgico N,(Si )iN ,(ui )iN , el
conjunto de perfiles de estrategias R S que sobrevive la EINMR se conoce como el conjunto de
perfiles de Estrategias Racionalizables.
Ejemplo 2.12 (Funcin de mejor respuesta y EINMR). Consideremos el juego descrito en la Figura
5.
J2
b1 b2 b3 b4
a1 0, 7 5, 2 7, 0 6, 6
a2 2, 5 3, 3 2, 5 2, 2
J1
a3 7, 0 5, 2 0, 7 4, 4
a4 6, 6 2, 2 4, 4 10, 3
Figura 5: El juego del Ejemplo 2.12.
Notemos que si J2 juega b1 , la mejor respuesta de J1 es jugar a3 ; si J2 juega b2 , J1 tiene dos mejores
respuestas: a1 y a3 ; si J2 juega b3 , lo mejor para J1 es jugar a1 y, finalmente, si J2 juega b4 , la
mejor respuesta para J1 es a4 . Podemos escribir la funcin de mejor respuesta del jugador J1 como:

a3 si s2 = b1
a1 , a3 si s = b2

2
Br1 (s2 ) = 1
(3)

a si s2 = b3
a4

si s2 = b4
9
Realizando un anlisis anlogo para J2, obtenemos que la funcin de mejor respuesta para el jugador
J2 es:

1 si s1 a1 , a4

b

b1 , b3 si s1 = a2

Br2 (s1 ) = (4)

3
b si s1 = a3
Ahora observemos en la funcin de mejor respuesta del jugador J1 que la estrategia a2 nunca es
mejor respuesta. Similarmente, en la funcin de mejor respuesta para J2 podemos observar que las
estrategias b2 y b4 nunca son mejores respuestas. Por lo tanto, cada jugador sabe que dichas estra-
tegias no sern jugadas y pueden descartarlas como posibles resultados del juego. El conjunto R1 y
sus respectivos pagos quedan representados en la Figura 6.
J2
b1 b3
a1 0, 7 7, 0
J1 a3 7, 0 0, 7
a4 6, 6 4, 4
Figura 6: Conjunto R1 del Ejemplo 2.12 y sus pagos asociados.
De (3) y (4) podemos observar que, dado que nadie juega a2 , b2 b4 , entonces a4 pasa a ser nunca
mejor respuesta, con lo que obtenemos R2 representado junto a sus pagos en la Figura 7.
J2
b1 b3
a1 0, 7 7, 0
J1
a3 7, 0 0, 7
Figura 7: Conjunto R2 del Ejemplo 2.12 y sus pagos asociados.
Llegado a este punto somos incapaces de seguir eliminando estrategias, puesto que no quedan estra-
tegias que no sean nunca mejor respuesta; con lo que R3 = R2 y el proceso se acaba.
El conjunto de perfiles de estrategias racionalizables es el conjunto
R = (a1 , b1 ), (a1 , b3 ), (a3 , b1 ), (a3 , b3 ) .

10
Observacin 2. De la Observacin 1 obtenemos que el conjunto de perfiles de estrategias racionali-
zables es un subconjunto del conjunto de perfiles que resulta de la EIEED.
Ejemplo 2.13. Consideremos el juego de la Figura 8 en que el jugador 1 elige filas y el jugador 2
elige columnas.
L M R
U 2,0 3,5 4,4
D 0,3 2,1 5,2
Figura 8: Juego del Ejemplo 2.13
Vemos que en este juego no hay estrategias estrictamente dominadas y por lo tanto la EIEED
entrega todo el conjunto de perfiles de estrategias.
Sin embargo, la estrategia R del jugador 2 nunca es mejor respuesta, por lo que no es raciona-
lizable. Si la eliminamos, obtenemos que ahora la estrategia D del jugador 1 no es mejor respuesta
(pues slo era mejor respuesta a la estrategia R del jugador 2) y en consecuencia tampoco es racio-
nalizable. Una vez que la eliminamos, tenemos que ahora la estrategia L del jugador 2 no es mejor
respuesta, con lo que obtenemos que el nico perfil de estrategias racionalizables es el perfil (D, M ).
2.4. Equilibrio de Nash

El concepto de solucin ms usado en teora de juegos es el equilibrio de Nash (EN a partir
de ahora). La nocin de EN pretende capturar una situacin de Estado estacionario de un juego,
en el sentido de que dado el perfil de estrategias que se est jugando, a ningn jugador le gustara
cambiar su decisin. El concepto de EN consiste de dos ideas principales:
1. Cada jugador sostiene un expectativa correcta de lo que juega el resto de los jugadores.
2. Cada jugador acta de manera racional con respecto a esta expectativa. En este sentido su
decisin maximiza su funcin de pagos dada su expectativa.
Podemos definir formalmente un equilibrio de Nash como,

Definicin 2.14 (Equilibrio de Nash). Un equilibrio de Nash de un juego estratgico N, (Si )iN , (ui )iN ,
es un perfil de estrategias s S, tal que el pago de cada jugador i N alcanza su mximo en si
dado el perfil, si , de estrategias de los rivales. Esto es, para cada jugador i N se tiene:
ui (si , si ) ui (si , si ) si Si (5)
Observacin 3. Sobre el equilibro de Nash podemos decir que:
El concepto de equilibrio de Nash no explica el proceso mediante el cual se llega a la situacin

de equilibrio, solo la describe.
Un juego puede tener mltiples equilibrios de Nash (ver ejemplo 2.16).
11
Un juego puede no tener equilibrio de Nash (Ver ejemplo 2.17).
Un equilibrio de Nash es un Perfil de estrategias, lo cual No es lo mismo que los pagos que
reciben los jugadores en equilibrio.
Tal como dijimos arriba, en un equilibrio de Nash no hay incentivo a cambiar de estrategia. Esto
nos entrega un mtodo de verificacin de si un perfil es o no un equilibrio de Nash:
Dado un perfil de estrategias s S, si existe un jugador i N para el cual hay una estrategia
si Si tal que
ui (si , si ) > ui (s)
entonces el perfil s no es un equilibrio de Nash.
Esta observacin nos permite ver que en el Ejemplo 2.12 no hay equilibrio de Nash, mientras
que en el Ejemplo 2.13 el nico equilibrio de Nash es el perfil (U, M ).
Ejemplo 2.15 (Dilema del prisionero). En el juego descrito en el Ejemplo 2.3, tenemos que el perfil
(c, c) es un EN del juego, puesto que:
u1 (c, c) = 1 > 8 =u1 (nc, c)
u2 (c, c) = 1 > 8 =u2 (nc, c)
Ninguno de los otros perfiles es un EN. Notemos que para (nc, nc) cualquiera de los dos prisioneros
querr desviarse y delatar al compaero, pues de esa manera tienen penas menores. Por otra parte,
notemos que para (nc, c) y (c, nc), el prisionero que no confiesa tiene incentivos para desviarse y
confesar tambin, puesto que si persistiera en no confesar tendra una pena an mayor. De esta
forma, podemos concluir que para el Dilema del prisionero, (c, c) es el nico EN.
Ejemplo 2.16 (BoS). Para el juego descrito en el Ejemplo 2.4, observemos que los perfiles (Ba, St)
y (St, Ba) no pueden ser equilibrios de Nash, puesto que para ambos perfiles de estrategias los
jugadores tienen incentivos para desviarse. Por ejemplo, si se juega (Ba, St), H tiene incentivos
para cambiar su estrategia a St puesto que uH (St, St) = 1 > 0 = u1 (Ba, St). En cambio, tanto el
perfil (Ba, Ba) como (St, St) son equilibrios de Nash puesto que en cada caso, dado lo que hace el
rival, ningn jugador tiene incentivos a desviarse. En efecto para el perfil (Ba, Ba) tenemos que :
uH (Ba, Ba) = 2 > 0 = uH (St, Ba)
uM (Ba, Ba) = 1 > 0 = uM (St, Ba)
Para el perfil (St, St) tenemos:
uH (St, St) = 1 > 0 = uH (Ba, St)

uM (St, St) = 2 > 0 = uM (Ba, St)
Ejemplo 2.17 (PyL). En el juego descrito en el Ejemplo 2.5 no hay equilibrios de Nash. Ob-
servemos que en cualquier perfil los jugadores tienen incentivos a desviarse. En efecto, tomemos
primero los perfiles (I, D) y (D, I). Para ambos perfiles de estrategias el jugador P tiene incenti-
vos a desviarse, puesto que uP (D, D) = 1 > 1 = uP (I, D) y uP (I, I) = 1 > 1 = uP (D, I).
Tomemos ahora los perfiles (I, I) y (D, D). Para ambos perfiles de estrategias el jugador L tiene in-
centivos para desviarse puesto que uL (D, I) = 1 > 1 = UL (I, I) y uL (I, D) = 1 > 1 = uL (D, D).
12
La funcin de mejor respuesta nos permite proveer una caracterizacin de equilibrio de Nash.
Proposicin 2.18 (Caracterizacin de EN). Un perfil de estrategias s S es un equilibrio de
Nash si y solo si:
si Bri (si ) iN (6)
Demostracin. Directo de la definicin.
La Proposicin 2.18 nos provee un mtodo para buscar equilbirios de Nash en un juego: calcular
las funciones de mejor respuesta de los jugadores y buscar perfiles que satisfagan las condicin de
la proposicin. En el caso que las funciones de mejor respuesta de los jugadores de un juego sean en
efecto funciones (i.e. que para todo i N y para todo perfil de estrategias de los rivales de i haya
una nica mejor respuesta), entones la condicin (6) se transforma en un sistema de ecuaciones. En
este sistema hay una ecuacin por cada jugador y una variable por cada jugador.
Definicin 2.19 (Aplicacin de mejor respuesta

de un juego).
La aplicacin de mejor respuesta de un juego N,(Si )iN ,(ui )iN , B : S S est definida como:
Y
B(s) := Bri (si )
iN
Proposicin 2.20 (Caracterizacin de EN).

Un perfil de estrategias s S en un EN de un juego N,(Si )iN ,(ui )iN si y solo si s B(s ).

Es decir, s es un EN si y slo si s es un Punto Fijo de B.

Demostracin. Es una re-escritura de la condicin (6).
2.5. Relacin entre equilibrio de Nash y la EIEED

Claramente, las estrategias que conforman un perfil de equilibrio de Nash son racionalizables, ya
que al ser mejores respuesta a algn perfil de los rivales, nunca son eliminadas en la EINMR. Esta
afirmacin, junto a la Observacin 2, demuestran la siguiente Proposicin, para la cual proveemos
una demostracin formal y alternativa, usando slo la definicin de EIEED.
Proposicin 2.21. Si un perfil de estrategias s S es un equilibro de Nash de un juego estra-
tgico N,(Si )iN ,(ui )iN , entonces el perfil s sobrevive a la Eliminacin Iterada de Estrategias

Estrictamente Dominadas.
Demostracin. Demostramos esto por contradiccin. Es decir, tomemos un perfil s S y supon-
gamos que no sobrevive la EIEED.
Si no la sobrevive, quiere decir que en alguna etapa de la EIEED, la estrategia de algn jugador
en ese perfil es la primera del perfil en ser eliminada. Llamemos i N al jugador cuya estrategia
si es la primera del perfil s en ser eliminada mediante la EIEED. Esto quiere decir, que existe una
estrategia s0i Si tal que
ui s0i , si > ui (si , si )

(7)
13
para todo perfil de estrategias si Si que no ha sido an eliminado. Como si es la primera
estrategia del perfil s en ser eliminada, el perfil de los rivales de i, si es uno de los perfiles que
aparecen en (7). Luego, en particular se tiene
ui s0i , si > ui si , si

lo que contradice que s sea un equilibrio de Nash.
La siguiente proposicin nos dice que si en un juego finito se obtiene un nico perfil como
resultado de la EIEED, entonces ese perfil es el nico EN del juego.

Proposicin 2.22. Si en un juego estratgico finito N,(Si )iN ,(ui )iN , un perfil de estrategias
s S es el nico resultado de la Eliminacin Iterada de Estrategias Estrictamente Dominadas,
entonces s es el nico equilibro de Nash del juego.
Demostracin. Como ya tenemos el resultado de la Proposicin 2.21 slo tenemos que probar que si
un perfil es el nico en sobrevivir la EIEED, entonces es un equilibrio (podra no serlo). La Propo-
sicin 2.21 nos dice que de haber otros equilibrios, tambin hubiesen sobrevivido la EIEED, y por
lo tanto este es el nico equilbirio.
Entonces, supongamos que la EIEED elimin a todos los perfiles salvo a s . Si s no fuese
equilibrio de Nash, entonces existe un jugador i N y una estrategia si Si tal que
ui si , si > ui si , si .

(8)
Como si fue eliminada, tiene que existir otra estrategia s0i Si que en alguna etapa de la EIEED
la domin. En particular,
ui s0i , si > ui si , si .

(9)
Pero s0i tambin fue eliminada y por lo tanto tiene que existir otra estrategia s00i Si que en alguna
etapa de la EIEED domin a s0i . En particular,
ui s00i , si > ui s0i , si .

(10)
Repitiendo este argumento a lo ms |Si | veces, llegaremos a que
ui (s ) < ui si , si < ui s0i , si < . . . < ui si , si .

lo que no puede ser.
Por lo tanto, s es un equilibrio de Nash.
Notemos que ninguna de las dos proposiciones hace afirmaciones sobre la existencia de equilibrio.
La primera dice que si hay un equilibrio, entonces nunca es eliminado; y la segunda dice que si el
resultado es nico, entonces es el nico equilibrio.
14

0601TeodeJuegos20170419 275878

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

0601TeodeJuegos20170419 275878

Загружено:

Авторское право:

Доступные форматы

Teora de Juegos

La importancia de la teora de juegos en organizacin industrial es que en la mayora de las

La teora de juegos se construye principalmente sobre dos supuestos:

1. Los agentes son racionales.

1. Juegos estticos con informacin completa.

2. Juegos dinmicos con informacin completa.

3. Juegos estticos con informacin incompleta.

4. Juegos dinmicos con informacin incompleta.

2. Juegos estticos con informacin completa

Habitualmente representamos esta clase de juegos mediante su forma normal.

Para cada jugador i N

Un conjunto de estrategias disponibles, Si .

Un juego en forma normal, queda entonces, completamente caracterizado por:

hN, (Si )iN , (ui )iN i

si ambos confiesan, sern ambos sentenciados a 5 aos de crcel;

Preferencias de 1: (nc, nc) 1 (c, nc) 1 (nc, nc) 1 (nc, c)

Preferencias de 2: (nc, nc) 2 (nc, c) 2 (nc, nc) 2 (c, nc)

Figura 1: Dilema del prisionero.

Podemos describir esta situacin mediante un juego en forma normal donde:

Preferencias de H: (Ba, Ba) H (St, St) H (Ba, St) H (St, Ba)

Preferencias de M : (St, St) M (Ba, Ba) M (Ba, St) M (St, Ba)

La matriz de pagos de este juego queda:

Figura 2: Bach o Stravinsky.

Preferencias de P : (I, I) P (D, D) P (D, I) P (I, D)

La matrz de pagos queda:

Figura 3: Polica y Ladrn

ui (s1 , s2 ) = si P (s1 + s2 ) Ci (si )

2.2. Eliminacin iterada de estrategias estrictamente dominadas (EIEED)

La primera idea para aproximarnos a un concepto de solucin de un juego es la idea de que

ui (s00i , si ) > ui (s0i , si ) si Si

Utilizando la idea de estrategias estrictamente dominadas, podemos realizar un proceso conocido

Figura 4: Juego del ejemplo 2.8.

u1 (U, L) = 1 > U1 (D, L) = 0 y u1 (U, R) = 0 < 2 = u1 (D, R).

Pero para el jugador 2, en cambio, la estrategia C domina estrictamente a R, dado que

u2 (C, U ) = 2 > 1 = u2 (R, U ) y u2 (C, D) = 1 > 0 = u2 (R, D).

El jugador 1 entonces, sabe que el 2 nunca jugar R y el juego se reduce ahora a:

u1 (U, L) = 1 > 0 = u1 (D, L) y u1 (U, C) = 1 > 0 = u1 (D, C).

u2 (C, U ) = 2 > 0 = u2 (I, U ).

Eliminacin Iterada de Estrategias Estrictamente Dominadas: La EIEED consiste en:

1. Buscar alguna estrategia estrictamente dominada en el juego. De existir, eliminarla generando

t. Continuar as hasta que ya no se encuentren estrategias estrictamente dominadas.

2.3. Estrategias Racionalizables

ui (si , si ) > ui (s0i , si ) s0i Si

En palabras simples, una mejor respuesta de un jugador i N a un perfil de estrategias si de

Eliminacin Iterada de Nunca Mejores Respuestas: En este proceso se parte considerando

y consideramos el conjunto de perfiles de estrategias Rt+1 Rt S definido como,

El proceso continua al infinito o hasta que Rt+1 = Rt .

El proceso de EINMR entrega un conjunto de perfiles de estrategias que denominamos conjunto de

Figura 5: El juego del Ejemplo 2.12.

Figura 6: Conjunto R1 del Ejemplo 2.12 y sus pagos asociados.

Figura 7: Conjunto R2 del Ejemplo 2.12 y sus pagos asociados.

El conjunto de perfiles de estrategias racionalizables es el conjunto

R = (a1 , b1 ), (a1 , b3 ), (a3 , b1 ), (a3 , b3 ) .

Figura 8: Juego del Ejemplo 2.13

2.4. Equilibrio de Nash

Podemos definir formalmente un equilibrio de Nash como,

ui (si , si ) ui (si , si ) si Si (5)

Observacin 3. Sobre el equilibro de Nash podemos decir que:

El concepto de equilibrio de Nash no explica el proceso mediante el cual se llega a la situacin

Un juego puede tener mltiples equilibrios de Nash (ver ejemplo 2.16).

Para el perfil (St, St) tenemos:

uH (St, St) = 1 > 0 = uH (Ba, St)

si Bri (si ) iN (6)

Preferencias de 1: (nc, nc) 1 (c, nc) 1 (nc, nc) 1 (nc, c)

Preferencias de 2: (nc, nc) 2 (nc, c) 2 (nc, nc) 2 (c, nc)

Preferencias de H: (Ba, Ba) H (St, St) H (Ba, St) H (St, Ba)

Preferencias de M : (St, St) M (Ba, Ba) M (Ba, St) M (St, Ba)

Preferencias de P : (I, I) P (D, D) P (D, I) P (I, D)