Un Primer Curso de Teoria de Juegos - Robert Gibbons

52/
JUEGOS ESTTICOS CON INFORMACiN
,',
COMPLETA (e. 1)
'.'.'
COURNOT,A. 1838. l\echerches Sllr les Principes Mathmatiques de la Thorie

des Richesses. Edicin inglesa: Researches into the Mathematical Principies of
theon) of Wealth. Publicado por N. Bacon. New York: Macmillan, 1897.
2. JUEGOS DINMICOS
CON INFORMACIN COMPLETA
DASGUPTA,
P, y E. MASKIN,1986. "The Existence of Equilibrium in Discontinuous Economic Games, 1:Theory." ReviC'U!of Economic Studies 53:1-26.
FARBER,H., 1980, "An Analysis of Final-Offer Arbitration."Journal
flict Resolution 35:683-705.
FRIEDMAN,J. 1971. "A Noncooperative
Review of Economic Studies 28:1-12.
Equilibrium
for Supergames."
GIBBONS,R. 1988. "Learning in Equilibrium Models of Arbitration." AmerieclrlEconomic Review 78:896-912.

HARDIN,G. 19613."The Tragedyof
the Commons." Science 162:1243-48.
HARSANYI,J. 1973. "Games with Randornly Disturbed Payoffs: A New

Rationale for Mixed Strategy Equilibrium Points." International Journal of
Came Theory 2:1-23.
HOTELLING,H. 1929. ';Stability in Competition." Economic JournaI39:41-57.
HUME, D. 1739. A Treatise of Human Nature.
Dent. 1952.
KAKUTANl,S. 1941. "A Generalization
Dllke Mathematieal Joumal 8:457-59.
Reedicin.
Londres:
J. M.
of Brouwer' s Fixed Point Theorem."
KREPS,D., y J. SCHElNKMAN.1983. "Quantity Precommitrnent and Bertrand Competition Yield Cournot OutcolIles." Bell JOL/rnal of Economics
4:326-37.
MONTGOMERY,
J. 1991. "Equilibrium Wage Dispersion and Interindustry
Wage Differentials." Qllarterly JOl/mal of Economics 106:163-79.
NASH,J. 1950. "Equilibrium Points in n-Person Games." Proceedings of the
National Aeademy of Sciences 36:48-49.
PEARCE,O, 1984. "Rationalizable Strategic Behavior and the Problem of
Perfection." Econometrica 52:1029-50.
STACKELBERG,
H. VON, 1934, Marktfonn
Springer.
c\
'.','.
of Con-
L/nd Cleichgewicht.
Viena: Julius
Ijnestecaptulo
presentamos los juegos dinmicos. De nuevo, limi~amas nue~tra atencin a los juegos con informacin completa. (es ddr;
juegos en los que las fundones de ganancias de los jugadores so~ Wormacinqel dorinio pblico); vase una introduccin a 10s'jugOs con
informacin incompleta en el captulo 3. En la seccin 2.1 analiZarnos
los juegos dinmicos no slo con informacin completa, sino tambii:co~
informacin perfecta, lo que significa que en cada momentodeI'j1ego;~1
jugador a quien le corresponde decidir conoce la historia cmple'f:de
todas las decisiones tornadas hasta ese momento. En las secciries'i;2';
2.4, considercunos los juegos con informacin completa pero imperfet~:
en algn momento ~~l juego el jugador a quien le corresponde decidirno
conoce toda lahistoria del juego.
.
El tema central en todo juego dinmico es el de la credibilidad. Como
ejemplo de una amenaza que no resulta creble, consideremos el siguiente
juego de dos tiradas. Primero, el jugador 1 escoge entre dar 1.000 pesets
al jugador 2 () no darle nada, n segundo lugar, el jugado.r2 observa la
decisiridel jugador 1 y de~ide si hacer estallar o no una granada que
los matara a los dos. Supongamos que el jugador 2 amenaza' c;on hacer
estallar la granada a no ser que el jugador 11e page las 1.000 pesetas. Si
el jugador. 1 cree que puede cumplirse la amenaza, su mejor respuesta es
la de pagar las 1.000 pesetas. Pero el jugador 1 no debera creerse una
amenaza semejante: si al jugador :2 s~ le diera la oportunidad de ejecutar
dicha amenaza, escogera no hacerlo., Por tanto, el jugador 1 no debera'
pagar nada al jugador 2.1
En la seccin 2.1 analizamos los siguientes casos de juegos dinmicos
con informacin completa y perfecta: el jugador 1 decide primero, acto
seguido el jugador 2 observa la decisin dl jugador 1 y finalmente el juga1. El jugador 1 podra preguntarse si un o?>n~nie que amenaza con hacer explotar una'
granada est loco. Este tipo de dudas se modelali como informacin incompleta, porque el
jugador 1 no est seguro de la funcin d ganancias del jugador 2 (vase captulo 3).
(,
1",'
:',
'..
-,
1
54 / JUEGOS DINMICOS CON INFORMACIN
Juegos dillmicos
COMPLETA (e. 2)
dar 2 toma su decisin con lo que concluye el juego. Eljuego de la granada

pertenece a esta clase, como el modelo de duopolio de Stackelberg (1934) y
. el modelo de Leontief, (1946) de determinacin de salarios y nivel de empleo en una empresa con fuerte implantacin de un sindicato. Definimos
.' el resultado por induccin hacia atrs y consideramos brevemente su relacin
'" con el equilibrio de Nash (posponiendo la discusin de esta relacin hasta
la seccin 2.4). Resolvemos los modelos de Stackelberg y Leontief, utilizando este criterio. Derivamos tambin un resultado a~logo para el
modelo de negociacin de Rubinstein (1982), aun cuando ese juego tiene
una sucesin potencialmente infinita de tiradas y, por tanto, no pertenece
ala cl~se de juego,s considera~a, '.
. En la seccin 2.2 ampliamos la clas de juegos analizada en la seccin
anterior: primero ambos jugadores 1 y2 deciden simultneamente, acto
seguido los jugadores 3 y 4 observanlas decisiones de 1 y 2y finalmente,
los jugadores 3 y 4 deci~fensimultnemente'c!Jn lo que concluye el juego.
Como ya se explicar en la seccin 2.4, la simultaneidad de las decisiones
significa en este contexto que estos juegos son de informacin imperfecta,
Definimos el resultado perfecto en subjuegos d tales juegos, que es la extensin natural de la induccin hacia atrs. Resolvemos los modelos de
Diamond. y Dybvig (1983) de pnico bancario" un modelo de aranceles y
de competencia internacional imperfecta y el modelo de los torneos de
LazearyRosen (1981), utilizandoeste.criterio.
En la seccin 2.3 estudiamos los juegos repetidoS"; en los cuales un
grupo determinado de participantes juegan repetidamente un determinado juego, habiendo observado los resultados de las anteriores rondas
del juego antes de iniciar la siguiente. El tema del anlisis es que las amenazas y las promesas (crebles) sobre el comportamiento futuro pueden
afectar el comportamiento presente. Definimos el equilibrio de Nash perfecto
en subjuegos para juegos repetidos y lo relacionamos con los resultados de
la induccin hacia atrsy de la perfeccin en subjuegos definidos en las
secciones 2.1 y 2.2. Enunciamos y demostramos el teorema de tradicin
oral para juegos repetidos infinitamente y analizamos el modelo de Friedman (1971) de colusin entre duopolistas de Coumot, el de Shapiro y
Stiglitz (1984) de salarios de eficiencia y el de poltica monetaria de Barro
y Cardan (1983).
En la seccin 2.4 presentamos las herramientas necesarias para analizar en general un juego dinmico con informacin completa, ya sea con
informaci9n. perfecta o imperfecta. Definimos la representacipn de un
juego enformaextensivaylrelacionamos
con la representacin en forma
COI 'formacin
completa
y perfecta
/ 5.5
l presentada en el captulo 1. Definimos tambin el equilibrio de

.,
.,
1
Nash perfecto en subjuegos para juegos en general. La cuestlOn pnl~clpa
que un Juego
(tan to de esta seccin como del captulo en su cODjunto)es
h
'l'b'
d
dinmico con informacin completa puede tener muc os equt J nos e
Nash, pero algunos de ellos pueden incluir amenazas.o promesas que no
son crebles. Los equilibrios de Nash perfectos en subluegos son aquellos
que pasan la prueba de credibilidad.
norm a
2.1Juegos dinmicos con informacin completa y perfecta

2.1.A Teora: induccn hacia atrs
El juego de la granada es un representante de la siguiente clase de juegos

sencillos con informacin completa y perfecta:
1. El jugador 1 escoge una accin al del conjunto factible Al'
2. El jugador 2 observa 0'1 y escoge una accin o,z del conjunto factible
Az.
3. Las ganancias son
1J,1
(a1,o.z) y'Uz(al,o,z).
z
Muchos problemas econmicos se ajustan a esta descripcin. Dos ejemplos (que ms adelante discutiremos con mayor detalle) so~ el mo~elo d,e
duopolio de Stackelberg y el modelo de Leontief, de sal~~lO~y mv~l de
empleo en una empresa con fuerte implantacin ~~ un smdIcato .. ?lros
problemas econmicos pueden modelarse si permItimOS una suce:J7n de
movimientos ms amplia, ya sea aadiendo ms jugadores o penmllendo
q~e los jugadores tiren ms de una vez. (El modelo de negoci~ci.nde Rubinstein discutido en la seccin 2.1.0 es un ejemplo de este ultImo caso.)
Las caractersti~as clave de un juego dinmico con informacin completa
y perfecta son que (1) las decisones se toman de manera sucesiv~, .~2)
todas las decisiones anteriores son conocidas antes de tomar la deOSlon
2 Se podra permitir que el conjunto fa~tH:'I~'del jugador 2, Az, dep:n~iera de la accin
del jugador 1, al' Tal dependencia podra d~notarse con AZ(aI) O podna Incorporarse en la
funcin de ganancias del jugador 2 estableoendo que 11:z(a1'0,z) =
para valores de a2
do a Algunos movimientos del Jugador 1 podnan mcluso poner
que no son fac ti'bles d al'.'
. An
al juego sin dar la oportunidad de move~ a~jugador 2; para tales valores de al, el conJ'.~nto
de acciones factibles Az(o,J) contiene un umco elemento. de forma que el Jugador 2 no tiene
-ex:
eleccin posible.
",.'.
56 / JUEGOS DINMICOS CON INFORMACiN COMPLETA (c. 2)
siguiente y (3) las ganancias de los jugadores para cada combinacin posible de jugadas son informacin del dominio pblico.
Resolvemos un juego por induccin hacia atrs de la siguiente forma:
cuando al jugador 2 le corresponda decidir en la segunda etapa del juego,
se enfrentar al siguiente problema, dada la accin al previamente adoptada por el jugador 1:
max
'u2(.l,az).
azEAz
Supongamos que para cada ajen Al, el problema de optimizacin del

jugador 2 tiene una nica solucin que podemos denotar con Rz(al)' sta
es la reaccin (o mejor respuesta) a la accin del jugador 1. Dado que
el jugador 1 puede resolver el problema de maximizacin del jugador 2
tanto como el propio jugador 2, el jugador 1 debera prever la reaccin del
jugador 2 a cada accin al que 1 pudiera tomar, de forma que el"problema
de 1 en la primera etapa se concreta en
max
'Ul (al,Rz(al).
alEA]
Supongamos que este problema de optimizacin del jugador 1 tiene

tambin una solucin lca que podemos denominar aj. Llamaremos
a (aj,Rz(aj
el resultado por induccin hacia atrs de este juego. El resultado
por induccin hacia atrs ignora las amenazas no crebles: el jugador 1
prev que el jugador 2 responder ptimamente a cualquier accin que 1
pueda escoger jugando Rz(al); el jugador 1 ignora las amenazas por parte
del jugador 2 que no favorezcan a 2 cuando el juego llegue a su segunda
etapa.
Recordemos que en el captulo 1 usamos la representacin en forma
. normal para estudiar juegos estticos con informacin completa y hos
concentramos en la nocin del equilibrio de Nash como concepto para solucionar tales juegos. Sin embargo, en la discusin sobre juegos dinmicos
de esta seccin no hemos hecho mencin alguna ni de la representacin
en forma normal ni del equilibrio de Nash. Al contrario, hemos dado una
descripcin verbal de un juego en (1)-(3) y hemos definido el resultado
por induccin hacia atrs como solucin del juego. En la seccin 2.4.A
veremos que la descripcin verbal en (1)-(3) es la representacin en forma
extensiva del juego. En esta seccin estableceremos la relacin entre las
representaciones en forma extensiva y normal, y veremos que para juegos
dinmicos la representacin en forma extensiva es a menudo ms conveniente. En la seccin 2.4.B definiremos el equilibrio perfecto de Nash
Juegos dinmicos con informacin completa y perfecta / 57
en subjuegos: un equilibrio de Nash es perfecto en subjuegos si ignora

las amenazas que no son crebles en un sentido que definiremos con ms
precisin. Veremos que pueden existir mltiples equilibrios de Nash en
un juego de la clase definida por (1)-(3)" pero que el nico equilibrio de
Nash perfecto en subjuegos es el equilibrio asociado con el resultado obtenido por induccin hacia atrs. ste es un ejemplo de la observacin,
hecha en la seccin 1.1.C, de que algunos juegos tienen mltiplesequili"
brios de Nash pero tienen un equilibrio que destaca como la solucinms
llamativa del juego.
Concluirnos esta seccin explorando los supuestos de racionalidad
inherentes en los argumentos de induccin hacia atrs. Considere~os
para ello elsiguiente juego de tres etapas en el que el jugador 1 decide dos
veces:
1. El jugador 1 escoge J o D donde J finaliza el juego con ganancias de 2
para el jugador 1 y Opara el jugador 2.
2. El jugador 2 observa la eleccin de 1. Si 1 escoge D entonces 2 escoge
J' o D', donde l' finaliza el juego con ganancias de 1 para ambos
jugadores.
3. El jugador 1 observa la eleccin de 2(y recuerda su propia decis~~t:J:
~
la primera etapa). Si las deCisiones anteriores fueroniJ,y, pi enton2es
1 escoge J" o D" finalizando ambas el juego, J" c0rtganane5.asde 3
para el jugador 1 y Opara el jugador 2 y D" con ganancias ,de O Y: 2
respectiv~mente.,;
,
,_.; _~
c.
: . ..;,.:_a..;.:.:_:.:.:.l._.~:.,~. ;--:~.:.'~..<S- .., .: l:..:'::.~~'
Esta descripcin verbal puede trlducirse al siguiente,juego en femp.dg

rbol. (sta es la representacin en forma extensiva que definiremos. de
forma ms general en la seccin 2.4.) La ganancia superior en el par .
de ganancias que aparecen en el extremo de cada rama del rbol es la
ganancia del jugador 1; la inferior es la del jugador 2, ~;,'
Para calcular el resultado por inducc:in hacia atrs de este' juego
empezamos por la tercera etapa (es dear,la segunda decisin deLjugador
1). Aqu el jugador 1 se enfrenta a una eleccin entre una ,ganancia de.3
por medio de 1" o una ganancia de Oa trays de 'J)"; de forma que!" ~
ptimo. Por tanto, en la segunda etapa, el jugador2 prev que si l jego
llega a su te;cera etapa el jugador 1 escoger J", lo que le proporcionara
una ganancia de O.Por tanto,~n la egunda etapala decisin del jugador 2
es entre una ganancia de 1 por medio d l' o una ganancia de Oa travs de
D', de forma que l' es ptimo. Consecuentemente, eh la primera etapa el
(,
...
jugador 1 prev que si el juego llega a la segunda etapa el jugador 2 elegir

1', lo que le proporcionar una ganancia de 1. La eleccin del jugador 1
en la primera etapa es, por tanto, entre una ganancia de 2 por medio de I
o una ganancia de 1 a travs de D, de forma que I es ptimo.
Juegos
COMPLETA (e. 2)
::~::
dil1tmicos
COI1 il1formacill
completa
y perfecta
/ 59
.
dor 2 lo sea: si 1piensa que 2 podra no ser racionill,
ro no que el Juga
1"
O'
pe
.
ger D en la primera etapa confiando en que 2 e 19wril, en
1 podna esCO
'.
'
I"
1 tercera
se nda, dando con ello la oportunida~.a 1 de Jug~r.
~n.8
la ; Otra osibilidad es quesea informaClon del dommlO ~ubhco q.ue el
~taPd' 2 Pracional pero no que el jugador 1 sea racional: sIl es raClonal
Juga or. es.que 2 cree que 1 podra no ser racional, 1 podna. escoger /) en
pero pIensa
.
l
.
' tapa confiando en que 2 pensara que 1 no es raClona, y, por
la pnmera e
"1
t
El
.
DI con la esperanza de que 1jugara D en a tercera e ilpa._"
tanto, Jugara
1 '. d D
r 'parte
USO de la induccin.hacia
atrs presupone que la e eCClOn e po.
eda
explicarse siguiendo este razonamiento. Para algunos Juegos,
,d e l pu
.
l'
. D arque 1
sin embargo, podra ser ms razonable suponer que J~go
~.'
.
.
.'
1
En
tales
J'uegosel
uso
de
la
mducClon
hacla
es, efectivamente, lrraClOna .
, . .
..
atrs pierd~ mucho de su atractivo como predlCclOn del J~ego,. tal como
le a'sa al equilibrio de Nash en juegos en los que la teona de Juegos no
p
.'
una solucin nica y no cabe esperar acuerdo alguno enbe
proporclOna
los jugadores.
2.1.B El mod~lo de duopolio de Stackelberg
,.'0
Este argumento establece que el resultado por induccin hacia atrs

es que el jugador 1escoge I en la primera etapa y sacaba el'juegb: Aun
cuando el uso de la induccin hacia atrs establece que el juego s acaba
en la primera etapa, UIlaparte importante del'afgUiriento fthl d 10 que
ocurrira si el juego no se acabase en esta primera etapa. En la segunda
etapa, por ejemplo, cuando el jugador 2 prev que si el juego llega a la
terc;era etapa el jugador 1 elegir I" 2 est suponiendo que 1es racional.
Este supuesto puede parecer inconsistente coil el hecho de qu 2 tiene
la oportunidad de decidir en la segunda etapa slo si 1 se desVa del
resultado obtenido por induccin hacia atrs. Es decir, puede parecer que
si 1juega D en la primera etapa, 2 no puede suponer en la segunda etapa
que 1 sea racional, pero 'esto no es, as: si 1 juega D, en la primera etapa
est claro que no puede ser informacin del dominio pblico que los dos
jugadores sean racionales; pero existen razones para que 1escogietaD
que no contradicen el supuesto de2 de que 1esracionaL3 Una posibilidad
es que sea informacin del dominio pblico que el jugador 1 es racional
3 Recordemos deI a discusin sobre l~elimiracin
dominadas (eIlla seccin 1.1.,B),que es lormacin
son racionales si todos los jugadores son rciomiis,
los jugadore,s son racionales y si todoS los jugadores
lodos los jugadores son racionales, etc; adinjiiltum.
itera tiva de las,."~tr~tegiasest:ric~~~ente

del domirti9pblic que Io~ jug-adores
y si todos los jugadfes S5~ft'qUe'tdos
saben que,todoslos jugadores slJe que
,
. ':!
",'
Stackelberg (1934) pr!Jpuso un modelo dinmico de duopolio en el cu~l

unae'mpresa dominante (o lder) decide primero y una empresa subordInada (o seguidora) decide en segundo lugar. En al~nosmome~os
de
la historia de la industria automovilstica estadourudense: por ~Jel1lplo,
General Motors parece haber jugado este papel de lder. Es mmedlat.o ampliar esta des~ripcin al caso en que haya ms de una empresa segUidora,
como Ford~ Chrysler y otras. Siguiendo a Stackelberg, de~arrollarelJlos el
modelo bajo el supuesto de que las empresas escogen cantidades, como en
el modelo de Coumot (donde las empresas deciden simultneamente en
.
ente como aqUlO. DeJ'amos
como ejercicio el desarrollo
veZ d e suceSlvam
,
de un modelo de tomas de decisiones sucesivas en el que las empresas
. s tal como
en el modelo ele
escogen 1os preclO
" lo hacen (simultneamente)
' ' .
Bertrartd.
El desarrollo
,
temporal del juego es el sig'uiente: (1) La empresa 1
escoge una can t'd
1 a d ql >
_ O., (2) la empresa 2 observa ,11 .y escoge entonces
.
una cantidad q2 ? O; (3) las ganancias de la empresa ~Vlenen dadas pOI la
funcin de beneficio
'7ri(q;,qj)
donde P(Q)
= qi[P(Q)
el,
a - Q es el precio de equilibrio
de mercado cuando la
60 / JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)
Juegos dinmicos con informacin completa y perfecta I 61
cantidad agregada es Q ==qI + q2, j e es el coste marginal constante de

produccin (siendo cero los costes fijos).
Para hallar el resultado por induccin hacia atrs de este juego, calculamos en primer lugar la reaccin de la empresa 2 a una cantidad arbitrariamente fijada por la empresa 1. R2(ql) es una solucin de
maX7r2(ql,q2)==maxq2[a
Q22:0
ql -
q2 -
qz 2:0
el,
lo que resulta en
R2(ql) =="
a-ql-e
'
siempre, queql < a-e .. La misma' ecuacin pr_aR2(ql) apareCi en

nuestro aniilisisdl' juego de Coumot con' qecisiones sinlultneas en la
seccin D.A. La diferencia' es que aqu R2(iJ.~)e~~eal~e~:lte la reaccin
por parte de la~mpresa 2: la cailtidadobservad~ que fijala empresa i,
mientras que en el anlisis de Coumot R2(qI) es la mejor respuestacle h:i
empresa 2 a una cantidad hipottica que'ser sil!lultneamenteescogida
por la empresa 1.
'."
Dado q:r,e}a empresa l. p~ede resolver el p~?b~~made la. empresa
2 tantoc0fi.lo,.l.a,propia e~p'~~a 2, I~, e0pres 1
debera prever q~e ia
eleccin:'del~antidad ql coinCidir co"nla reacinR2(ql)' Por tanto, el
problema d~ laen:,.pr~sa 1 en la primera etapa del juego se concreta en
"maX7fl (ql,R2(ql)
'_Q2:0,
,.'
,.'
==maxqIfa - ql - R2(qi)
Ql2:0 .
. '.
-:- el
.
.. a- ql.""'"C
==maxql
'2
. ,.
Q2:0
lo que resulta' en
a-c
qi == -. -2-
a-c
R2(qi) ==-4-
que es el resultado por induccin hacia atrs del juego del duopolio de
Stackelberg.4
'..
'.
4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" se
refieren tpicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mencin
del "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas en
vez de ~u:nultneas. Sin embargo, como se ha constatado en la secci'nanterior, los juegos
con deaslones sucesivas poseen a menudo mltiples equilibrios de Nash, de los cuales slo
uno est asociado can el resultado obtenido por induccin hacia atrs del juego, Por tanto, el
"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como al
uso de unrnterio de solucin ms poderoso que el mero equilibrio de Nash.
Recordemos que en el equilibrio de Nash del juego de Cournot del

captulo 1, cada empresa produce (a-"'e)/3. Por tanto, la cantidad agregada
obtenida por induccin hacia atrs en el juego de Stackelberg, 3(a - e)/4,
es mayor que la cantidad agregada en el equilibrio de Nash del juego de
Cournot, 2(a - c)/3, de forma que, el precio de equilibrio de me;cado es
inferior en el juego de Stackelberg. Sin embargo, en el juego de Stackelberg
la empresa 1 poda haber escogido la cantidad correspondiente al juego
de Coumot, (a - e)/3, en cuyo caso la empresa 2 habra respondido con su
cantidad de Coumot. Por tanto, en el juego de Stackelberg, la empresa 1
podra haber alcanzado el nivel de beneficios de Coumot, pero escogi no
hacerlo, por lo que los beneficios de la empre~a 1 en el juego de Stackelberg
deben'ser mayores que sus beneficios en el juego de Cournot. Pero el
precio de equilibrio es inferior e:';lel juego de Stackelberg, de forma que ros
beneficios agregados son menores. Por tanto, el hecho de que la empresa
1 est mejor implica que la empresa 2 est peor en el juego de Stackelberg
queen el jueg() de Coumot.
La observacin de que la empresa 2 se encuentra en peor situacin en
el juego de Stackelberg que en el juego de Coumot ilustra una diferencia
importante que existe entre los. problemas de decisin uni cimultiperL
sonale~:. En la teora de la decisin con un nico agente, eltenerms .
informacin nunca puede hacer que el agente decisor est peor. En teora
de juegos, sin embargo, tener ms informacin (o ms precisamente, que
otros jugadores sepan que uno tiene ms informacin) puede hacer que un
jugador est peor. '
Eil el juego de Stackelberg, la informacin en cuestin es la cantidad
de la empresa 1: la empresa 2 conoce ql y (tan importante como' estb)
la empresa 1 sabe que la empresa 2 conoce l' Para ver el efecto que'
esta informacin tiene, consideremos un,juego de decisin suc~siva algo
distinto, en el que la empresa 1 escoge qr, despus de lo cual la empresa
2 escoge q2, pero lo hace sin haber observado. 111. Si la empresa 2 cree
que la empresa 1 ha escogido su cantidad de Stackelberg qi ==(a - e)/2, la
mejor respuesta para la empresa 2 es de nuevo R2(qi) ==,(a-e)/4. Pero si la
empresa 1 prev que la empresa 2 creer que ello vaya a ser as y, por tanto,
escoja esta cantidad, la empresa 1 prefiere escoger su mejor respuesta a
(a - e)/4 (es decir, 3(a - c)/8) en lugar de su cantidad de Stackelberg
(a - c)/2. Por todo ello, la empresa 2 no debe confiar en que la empresa 1
escoja su cantidad de Stackelberg. Ms bien, el nico equilibrio de Nash de
este juego secuencial es que ambas empresas escojan la cantidad (a - e)/3,
precisamente el equilibrio de Nash del juego de Cournot, en el que las dos
..
'
".
,"
Juegos dinmicos con infonlwcin completa y perfecta /
62 I JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)
empresas deciden simu1tneamente.5 Por lo tanto, que la empresa 1 sepa

que la empresa 2 conoce q va en contra' de la empresa 2.
1\3
cuya condicin de primer orden es

R'(L) - w
= O.
2.1.C Salarios y nivel de empleo en una empresa con fuerte

implantacin sindical
Supongamos que el desarrollo telT\pora1del juego es: (1) el sindicato

efecta una demanda salarial, w; (2) la empresa observ.a (y acepta) lJ) yescoge entonces el nivel de empleo, L;.(3) las ganancias son U(w,L) Y7r(w,L).
Podemos decir bastantes cosas sobre el resultado por induccin hacia atrs
de este juego, aun sin haber supuesto ninguna forma funcional concreta
de U(w,L) y R(L), pero no podemos calcular el resultado explcitamente.
. En primer lugar caracterizamos la mejor respuesta de la empresa en la
etapa (2), L*(w), a una demanda salarial arbitraria por parte del sindicato
en la etapa (1), w. Dado w, la empresa escoge el nivel L*(w) que soluciona
=maxR(L)
L2:0
- wL,
En el modelo de Leontief, (1946) de relacin entre una empresa y un

nico sindicato (es decir, un sindicato que tiene el poder de monopolio de
ofrecer la fuerza de trabajo a la empresa), el sindicato tiene poder exclusi vo
sobre los salarios, pero la empresa tiene el nrrolexclusivo del nivel de
empleo. (Conclusiones cualitativamente similares emergen en un modelo
ms realista en el cual la empresa y el sindicato negocian los salarios,
pero la empresa retiene el poder exclusivo sobre el nivel de empleo.) La
funcin de utilidad del sindicato es U(7JJ,L), donde w es el salario que el
sindicato pide a la empresa y L es el nivel de empleo. Supongamos que
U(w,L) es creciente en los dos argumentos w y L. La funcin de beneficios
de la empresa eS7r(w,L) = R(L) :- wL, donde R(L) son los ingresos que
la empresa obtiene si emplea L trabajadores (y toma de forma ptima las
correspondientes decisiones de produccin y de estrategia de mercado).
Supongamos que R(L) es creciente y cncava;
max7r(w,L)
L2:0
Pendiente =
R(L)
L * (w)
Figura 2.1.1
Para garantizar que la condicin de primer orden R'(L) -w =. O ~enga
solucin, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la
figura 2.1.1.
La figura 2.1.2 representa L * (w) en funcin de tu (pero ~tiliza l~s e!es
de forma que faciliten la comparacin con grficos postenores) e lnchca
que L*(w) corta cada una de las curvas de isobeneficio de la e~1presa
en su punto mximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.anto
mejor cuanto menor sea w, de forma que las curvas :sobenefIClo Dfenores
representan niveles de beneficio ms altos. La fi.gura 2.1.3 representa
las curvas de indiferencia del sindicato. Mantemendo L constante, el
sindicato est tanto mejor cuanto ms alto sea w, de forma que las curvas
de indiferencia ms altas corresponden a niveles de utilidad mayores del
sindicato.
Esto es un ejemplo de la afirmacin hecha en la seccin 1.1.A:en';,n Juego en forma normal

los jugadores escogen sus estrategias simultneamente, pero ello no implica necesariamente'
que acten simultneamente; es suficiente con que cada uno tome su decisin sin conocer las
decisiones de los dems. Vase la seccin 2.4.A para ms discusin sobre esta cuestin.
5
6 Esta
dado 'UJ.
concreta
beneficio
ltima propiedad es simplemente otra manera~e decir que L *('UJ) maximiza 7f( ["w)
Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa se
en la eleccin de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel de
posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por
(L,u/) sea tangente a la restriccin
'UJ
1J)'.
64 / JUEGOS DfNAMICOS CON INFOR1ACIN COMPLETA (c. 2)
Juegos dinmicos con informacin completa y perfecta / 65
L *(w)
'
...'
Curva de indiferencia
del sindicato
w*
L*(w)
L
Curvas de isobeneficio de la empresa
L*
(w*)
Figura 2.1.2
'Figura
2.1.4.
,
w
L
Curvas de indiferencia del sindicato
Figura 2.1.3
Consideremos ahora el problema del sindicato en la etapa (1). Dado

que el sindicato puede resolver el problema de la.empresa en la segunda
etapa, tanto como la propia empresa, el sindicato deberla prever que la
reaccin por parte de la empresa a su demanda salarial w ser escoger el
nivel de empleo L*(w). Por tanto, el problema del sindicato en la primera
etapa se concreta en
maxU
lU~O
(w,L*(w).
En trminos de las curvas de indiferencia representadas en la figura

2.1.3, al sindicato le gustarla escoger la demanda salarial w que proporcione un resultado (w,L * (w que est en la curva de indiferencia ms alta
posible; La solucin al problema del sindicato es w*, la demanda salarial
que hace que la curva de indiferencia del sindicato que pasa por el punto
(w*,L*(w* sea tangente a L*(w) en ese punto (vase la figura 2.1.4)'- Por
lo tanto, (w* ,L*(w* es el resultado por induccin hacia atrs de este juego
de salarios y nivel de empleo.
Es fcil ver que (w* ,L * (w* es ineficiente: tanto la utilidad del sindicato como los beneficios de la empresa aumentaran si w y L estuvieran en
la regin sombreada de la figura 2.1.5. Esta ineficiencia hace que resulte
difcil de entender que en la prctica las empresas parezca que retienen
el control exclusivo sobre el nivel de ocupacin. (Si permitimos que la
empresa y el sindicato negocien los salarios pero mantenemos el control
exclusivo de la empresa sobre el nivel de empleo obtenemos un resultado
igualmente ineficiente.) Espinosa y Rhee (1989)proponen una explicacin
a este enigma basada en el hecho de que el sindicato yla empresa negocian
repetidamente a lo largo del tiempo (normalmente cada tres aos en Estados Unidos). En ese juego repetido, siempre que la eleccin de.w por parte
del sindicato y la eleccin de L por parte de la empresa caigan en la regin
sombreada de la figura 2.1.5 puede existir un equilibrio, aun cuando esos
valores de w y L no pueden ser el resultado por induccin hacia atrs de
un~ nica negociacin. Consltese la seccin 2.3 sobre juegos repetidos y
el ejercicio 2.16 sobre el modelo de Espinosa-Rhee.
'.
',.,.,'
"~o
'.:
.'
66
1 JUEGOS
OlNMIC05
CON INFORMACIN
luegos dilllm.icos con informacin
COMPLETA (e. 2)
completa y I",rleeta
67
Una descripcin ms detallada de la secuencia temporal del juego de
w
Curva de beneficio
w*
de la empresa
L * (w*)
Figura 2.1.5
2.1.D Negociacin secuencial
Empezamos con un modelo de negociacin de tres periodos perteneciente
a la clase de juegos estudiada en la seccin 2.1.A. Pasamos luego a discutir el modelo de Rubinstein (1982), en el que. l nmero de periodos
. es (potencialmente) infinito. En ambos modelos se llega a un acuerdo
inmediatamente, no hay negociaciones prolongadas (como huelgas). En
el modelo de Sobel y Takahashi (1983) de negociacin secuencial con
informacin asimtrica, en cambio, pueden ocurrir huelgas en el nico
equilibrio (bayesiano perfecto) con probabilidad positiva (vase la seccin
4.3.B).
Los jugadores 1 y 2 negocian el reparto de una peseta. Hacen ofertas

alternativamente: primero el jugador 1 hace una propuesta que el jugador
2 puede aceptar o rechazar; si 2la rechaza, hace una propuesta que 1 puede
aceptar o rechazar, y as sucesivamente. Una vezqe una oferta ha sido
rechazada, deja de ser vinculante y es irrelevante en las siguientes rondas
del juego. Cada oferta corresponde a UI. periodo y los jugadores son
impacientes: desCuentan las ganancias obtenidas en periodos posteriores
de acuerdo con el factor , donde O < < 1.7
7 El factor de descuento reflej el' valr temporal del dinero. Una peseta: recibida al
principio deun periodopede ingresarse en un bancoy proporcionar intereses, digamos-que
a-un tipo r por period y, por tanto, tendr n vlor de 1 + r pesetas al principio de periodo
siguiente, De forma equivalente, una peseta que se reciba al principio del periodo siguiente
tiene ahora un valor de slo 1/0 + r) pesetas. Sea =' 1/0 + r); entonces na ganancia
.". obterlida en el prximo periodo tiene ahora ahora un valor de slo 6.".; una ganancia 7f
obtenida dentro de dos periodos tiene ahora un valor de s6lo 62."., yassucesivaI'nente. El
valor actual de una ganancia futura recibe el nombre de valor futuro de esa ganancia._
tres periodos es la siguiente:

(la) Al principio del primer periodo el jugador 1 propone quedarse con
una fraccin SI de una peseta, dejando 1 - SI para el jugador 2.
(lb) El jugador 2 puede aceptar la oferta (en cuyo caso el juego finaliza
y los jugadores reciben las ganancias SI y 1 - 81 inmediatamente) o
rechazarla (en cuyo caso el juego pasa al segundo periodo).
(2a) Al principio del segundo periodo el jugador 2 propone que el jugador) se quede con una fraccin 82 de una peseta, dejando 1 ~ 82 para
el jtgador 2. (Ntese la convencin de que 8t corresponde s_iempre
al jugdor 1, sea quien sea quien hace la oferta.)
(2b) El jugador 1 puede aceptar la oferta (en cuyo caso el juego finaliza
y los jugadores reciben las ganancias 82 y 1 - 82 inmediatamente) o
rechazarla (en cuyo caso el juego pasa al tercerperiodo).
(3) Al principio del tercer periodo el jugador 1 recibe una fraccin 8 de
una peseta, dejando 1 - S para el jugador 2, donde O < s < 1.
En este modelo de tres periOdos, el acuerdo a:Lque se llega en el tercer
periodo (s,1 - s) est fijado exgenamente. En el modelo con horizonte
infinito que consideraremos ms tarde, la ganancia 8 del tercer periodo
representa la ganancia del jugador 1 en lo que queda del juego si se llega
al tercer periodo (esto es, si las dos primeras ofertas son rechazadas).
Para calcular el resultado por induccin hacia atrs de este juego de
tres periodos, calculamos en primer lugar la oferta ptima por parte del
jugador 2 si llega al segundo periodo. El jugador 1 puede recibir .5en el
tercer periodo rechazando la oferta S2 del jugador 2 en este periodo, pero
el valor en este periodo de recibir s en el periodo siguiente es slo 8s. Por
tanto, el jugador 1 aceptar S2 si y slo si 82 :::::s: (Suponemos gue cada
jugador aceptar una oferta si es indiferente entre aceptarla o rechazarla.)
El problema de decisin del jugadOr 2 en el segundo periodo, por tanto,
se concreta en escoger entre 1 - s en este periodo (ofreciendo 82 = s al
jugador 1) o recibir 1 - s en el siguiente periodo (ofreciendo al jugador 1
cualquier S2 < s). El valor descontado de la ltima opcin es (l - s),
que- es menor que 1 -Os obtenible por medio de la primera opcin, de
forma quela oferta ptima del jugador 2 en el segundo periodo es 8i = ,)8.
Por tanto, si el juego llega al segundo periodo, el jugador 2 ofrecer si y
el jugador 1 aceptar .
Dado que el jugador 1 puede resolver el problema del jugador 2 en
el segundo periodo tan bien como el propio jugador 2, el jugador 1 sabe
se
68/ JUEGOS DINMICOS CON INFORMACIN COMPLETA (c. 2)
que el jugador 2 puede recibir 1 - 8i en el segundo periodo rechazando

la oferta S] del jugador 1 en este periodo, pero el valor en este periodo de
recibir 1 - si el periodo siguiente es slo de 50 - si). Por tanto, el jugador
2 aceptar 1 - s] si y slo si 1 - s] 2: 50 - si) o s] ::; 1 - 50 - si). El
problema de la decisin del jugador 1 en el primer periodo, por tanto, se
concreta en escoger entre recibir 1 - 50 - si) en este periodo (ofreciendo
1- SI = 50-si) al jugador 2) o recibir si en el prximo periodo (ofreciendo
cualquier 1 - S1 ::; 50- si) al jugador 2). El valor descontado de la ltima
opcin es 5si = 52s, que es menor que 1 - $0- si) = 1- 5(1"':5s) obtenible
por medio de la primera opcin, de forma que la oferta ptima del jugador
1 en el primer periodo es si = 1 - 50 - si) == 1 ::,.'5(1- 58).'Por tanto, en
el resultado por induccin hacia atrs de este juego de tres periodos, el
jugador 1 ofrece el reparto (si ,1 - si) al jugador 2, quien acepta.
Consideremos ahora el caso en que el horizonte es infinito. El desarrollo temporal es el mismo que hemos descrito anterio~ente, excepto que el
acuerdo exgeno del paso (3) esreemplazado por una sucesin infinita de
pasos (3a), (3b), (4), (4b) yassuesivamerite. El jugador 1 hacela"oferta
en los peripdiJsII1par~s, el jugador 2 en 10s.pares;1~!1egQ<;iii<,:in
con~
tina hasta que un9 elelos dos jugadore~ acepta,unt9f~rta. Nos gustara
hallar el resultado PO! induccin pacia atrs de esteJuego pe horizonte
infinito movil}-dcmoshacia atrs, tal como lo hemos hecho en los casos
analizados hasta ahora. Sin embargo, co~oel jueg~podra continuar
hasta el infinito, no existe un ltimo momento a partir del cual iniciar tal
anlisis. Afo~nadamente,
la,siguiente idea (aplicada.()riginalmente por
Shaked y Sutton [1~84])nos permit truncar el juego de horizonte infinito
y aplicar la lgica del Giso'en el que ell10rizonte ~. fui:to:el juego q~e
empieza en el,tercer periopo (si se alcanza) es idntico al jueg~ completo
(empezando desde el primer periodo); en ambos cas~s el jugador 1 hace
la primera oferta, los jugadores se alternan haciendo las siguientes ofertas
y la .negociacin contina hasta que un jugador acepta una oferta.
Dado que no hemos definido formalmente el resultado por induccin
hacia atrs de este juego 'de negociacin con horizonte infinito, nuestros
argumentos sern informales (pero pueden formalizarse). Supongamos
que existe un resultado por induccin hacia atrs del juego completo en
el que los jugadores- 1 y 2 reciben las ganancias s y 1 - s respectivamente.
Podemos utilizar estas ganancias en el juego que empieza en el tercer
periodo, si se alcanza, y proceder entonces hacia atrs hasta el priner penodo (como en el juego de tres periodos) para calcular un nuevo resultado
por induccin hacia atrs del juego completo. En este nuevo resultado
Juegos en dos etapas de informacin / 69
por induccin hacia atrs, el jugador 1 ofrecer el acuerdo (j(s),lf(s

en el primer periodo y el jugador 2 aceptar, donde fes) = 1 - 50 - os)
es la fraccin del jugador 1 en el primer periodo del juego anterior de tres
periodos cuando el acuerdo (s,1 - s) se impona exgenamente en el tercer
periodo.
Sea s A la ganancia ms alta que el jugador 1 puede recibir en cualquier
resultado por induccin hacia atrs del juego completo. Consideremos el
uso de SA como la ganancia del jugador1 en el tercer periodo, tal como
lo hemos descrito anteriormente; esto producir un nuevo resultado por
induccin hacia atrs en el que" la ganancia en el primer penado del
jugador 1 es fCsA).Dado
que fes) = 1- 5 + 02Ses creciente'en s; f(sA)
es la ganancia en el primer periodo ms alta posible; ya quesA es la
ganancia ms alta posible en el tercer periodo. Pero SA es tambin la
ganancia ms alta posible en el primer periodo; de forma que!(sA) =
SAo Argumentos similares demuestran que f(sB)
= SB, donde SB es la
ganancia ms baja posible que el jugador 1 puede obtener en cualquier
resultado por induccin hacia atrs del juego completo. El nico valor de
s que satisface fes) = s, es"1/(1 + o), que denotaremos con s*.Por tanto;
sA = SE 0= s. de forma que, existe un nico resultado por induccin hacia
atrs d~l juego completo: en el primer periodo el jugador 1 ofrece un
acuerdo (s' = 1/(1+0),1- s'" = 5/0 + o al jugador 2, quien acepta.
'"
1',
\.'
,
'"
2.2 Juegos en dos etapas con informacin completa

.pero imperfecta :,
2.2.A.Teoa: Perfeccin en subjuegos .
Enriquecemos ahora la clase de juegos analizacia eIlla seccin anterior:
Como en los juegos dinmIcos con informacin completa y perfecta, continuamos suponiendo que el jUego sigue una sucesin de etapas, habiendo
los jugadores observado las decisiones formads~ las etapas previas antes del comienzo de una nueva etapa. Sin embargo, a diferencia de los
juegos analizados en la seccin anterior, peImit:iritos qe haya decisiones
simultneas en cada etapa .. t:omo explicaremos ,en la seccin 2.4; esta
simultaneidad de decisiones significa que los juegos analizados en esta
seccin tienen informacin imperfecta. Noobstante, estos juegos compar"ten caractersticas importantes con los"juegos con irLformacin perfecta
considerados en la secclnanterior.
,~
"
Juegos elldos etapas de illfomwcilI
'70 I JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)
Analizaremos el siguiente juego sencillo, al cual (sin mucha inspiracin) llamaremos juego en dos etapas con informacin perfecta pero
incompleta:
1. Los jugadores 1 y 2 escogen simultneamente las acciones al y az de
los conjuntos factibles Aly Az respectivamente.
2. Losjugadores 3 y 4 observan el resultado de la primera etapa, (al,az), y
escogen entonces simultneamente las acciones 0.3 y 0.4 de los conjuntos
factibles A3 y A4 respectivamente.
.
~
3. Las ganancias sonui(al,az,a3,a4)
para i = 1,2,3,4.
Muchos problemas econmicos se ajustan a esta descripcin.8 Tres ejemplos (que discutiremos ms adelante con mayor detalle) son los pnicos
bancarios, los aranceles y la competencia internacional imperfecta y los
torneos (por ejemplo, la lucha entre varios vicepresidentes de una empresa
por ser el prxno presidente). Otros problemas e~xJl1micospueden modelarse si permitimos una mayor complejidad, ya sea aadiendo ms
jugadores o permitiendo que los jugadores jueguen en ms de una etapa.
Podra incluso hab~r~enos jugadores: en algunas aplicaciones.los jugadores 3 y 4 son los jugadores 1 y 2; en otras, bien el jugador 2 o el 4 no
aparece.
Resolvemos un juego de esta clase utiizando un enfoque parecido
~!_qe la induccin haci~ atrs, pero est~ vez, el primer paso quedamos
cuando nos movemos hacia atrs desde el final del juego exige la resolucin de un juego real(el juego siinultneoentre los jugadores 3 y 4 en
la segUnda etapa, dado el resultado de la primera etapa) en vez de resolver un problema de optnizacin para un nico individuo como en la
seccin anterior. P.arano complicar las cosas; supondremos en esta seccin
que para cada resultado factible de la primera etapa, (0.1,0.2), el juego que
queda pendiente enla segunda etapa entrylos jugadores 3 y 4 tiene un
nico equilibrio de Nash que denominam()s (a;(al,az),a(al,az.
~ la
seccin 2.3.A (sobre juegos repetidos) consideramos las consecuencias de
prescindir de este supuesto.
Si los jugadores 1 y 2 prevn que el comportamiento en la, segunda
etapa de los jugadores 3 y 4 vendr dado por (a;(al,a2~,-a(al,az,
la interaccin entre los jugadores 1 y 2 en la primera etapa se concreta en el
siguiente juego de decisiones simultneas:
8 Como en la seccin anterior, los conjuntos de ~ccioIies factibles de los jugadores 3 y 4 en
la segunda etap~, A:>! A4, podran depender del resultado de la primera etapa (al,a2)' En
particular, podnan eX1stirvalores (al,a2) que finalizaran el juego.
.. ,:'
1. Los jugadores 1 y 2escogen simultneamente las acciones

los conjuntos factibles Al Y Az respectivamente.
2. Las ganancias son Hi(al,az,0,;(o.L(1,Z),o'4(al,l/,z
parai = 1,2.
1/,1
TI
"-z de
Supongamos que (0.1,0.2) es el nico equilibrio de Nash de este juego de

decisiones simultneas. Llamaremos a (o,i,0,2'0.; (al' 0.2),0,4 (al ,(1,2 resultado
perfecto en subjuegos de este juego en dos etapas. Este resultado es el
nalogo natural del resultado por induccin hacia atrs en los juegos con
informacin completa y perfecta, y esta analoga se refiere tanto a sus
canietersticas atractivas como a las que no lo son tanto. Los jugadores 1 y
2 no deberan creer ninguna amenaza por parte de los jugadores 3 y 4 que
correspondiera a acciones que no fueran el equilibro de Nash del juego
que queda en la segunda etapa, ya que cuando el juego llegue realmente a
la segunda etapa, al menos uno de los jugadores 3 o 4 no querr cumplir su
amenaza (precisamente porque no es un equilibrio de Nash del juego que
queda en la segunda etpa).Por otra parte, supongamos que el jugador
1 es tambin el jugador 3, y que el jugador 1 no juega 0'1 en la primera
etapa: el jugador 4 puede querer entonces reconsiderar el supuesto de que
el jugador 3 (es decir, el jugador 1) jugar a;(0,1,o.Z) en la segunda etapa.
2.2.B Pnico bancario
Dos inversores han depositado cada uno de ellos una cantidad D en un
banco. El banco ha invertido estos depsitos en un proyecto a largo plazo.
Si el banco se ve obligado a liquidar su inversin antes de que el proyecto
venza, puede recuperar un total de 2r, donde D > r > D /2. Sin embargo,
si el banco deja que la inversin llege a su vencimiento, el proyecto rendir
un total de 2R, donde R > D.
Existen dos fechas en las cuales los iiwersores pueden sacar dinero del
banco: la fecha 1 es anterior al vencimiento de la inversin del banco, la
fecha 2 es posterior. Para simplificar, supondremos que no hay descuento.
Si ambos inversores sacan dinero en la fecha 1, cada uno recibe r y el juego
se acaba. Si slo un inversor saca dinero en la fecha 1, ese inversor recibe
D, el otro recibe 2r - D Y el juego se acaba. Finalmente, si ninguno de
los inversores saca dinero en la fecha 1, el proyecto JJega a su vencimiento
y los inversores deciden si sacar el dinero o no en la fecha 2. Si los dos
inversores sacan el dinero en la fecha 2, cada rula de ellos recibe R y el
juego se acaba.' Si slo un inversor saca el dinero en la fecha 2, ese inversor
recibe 2R - D, el otro recibe D y el juego se acaba. Finalmente, si ninguno
72 / JUEGOS DINMICOS CON INFOJ<MAClN COMPLETA (c. 2)
de los inversores saca el dinero en la fecha 2, el banco devuelve R a cada

inversor y el juego se acaba.
En la seccin 2.4 discutiremos cmo representar formalmente este
juego. Sin embargo, por ahora procederemos de modo informal. Representemos las ganancias de los dos inversores en las fechas 1 y 2 (en funcin
de sus decisiones sobre sacar dinero en esas fechas) con el siguiente par
de juegos en forma normal. Ntese que el juego en forma normal correspondiente a la fecha 1 no es tpico: si ambos inversores escogen no
sacar dinero en la fecha 1, no se especifica ninguna ganancia, sino que los
inversores pasan al juego en forma normal correspondiente a la fecha 2.
JlIegos en dos etapas de infonnacin / 73
ganancias de (r,r); (2) ninguno de los inversores saca el dinero en la fecha

1 pero lo hacen en la fecha 2, lo que conduce a unas ganancias de (R,R) en
la fecha 2.
Sacar
Sacar
No sacar
r,r
D,2r - D
No Sacar 2r - D,D
R,R
Figura 2.2.1
Sacar
No sacar
Sacar
T,T
D,2r-'--D
No Sacar
2r - D,D
siguiente etapa
Fecha 1
Sacar
Sacar
R,R
NoSacar
D,2R - D,
No sacar
2R-
D,D
R,R
Fecha 2
Para analizar este juego procedemos hacia atrs. Considrese el juego
en forma normal correspondiente a la fecha 2. Como R > D (y por
tanto 2R - D > R), "sacar" domina estrictamente a "no sacar", de forma
que existe un nico equilibrio de Nash de este juego: ambos inversores
sacan el dinero, lo que conduce a unas ganancias de (R,R). Como no hay
descuento, podemos simplemeI1te sustituir estas ganancias en el juego en
forma normal correspondiente a la fecha 1, tal como indica la figura 2.2.1.
Dado que r < D (y por tanto 2r - D < 1'), esta versin de un periodo del
juego de dos periodos tiene dos equilibrios de Nash en estrategias puras:
(l) ambos inversores sacan el dinero, lo que conduce a unas ganancias
de (,.,.,.);(2) ninguno de los dos inversores saca el dinero, lo que lleva a
unas ganancias de (R,R). Por tanto, el juego original del pnico bancario
de dos periodos tiene dos resltados perfectos en subjuegos (y, por tanto,
no se ajusta totalmente a la clase de juegos definida en la seccin2.2.A):
(1) ambos inversores sacan el dinero en la fecha 1, lo que conduce a unas
El primero de estos resultados puede interpretarse. como el de un

pnico bancario. Si el inversor 1 cree que el inversor 2 sacar su dinero
en la fecha 1, su mejor respuesta es sacar tambin el dinero, aun cuando
a ambos les ira mejor si esperasen a la fecha 2 para sacar el dinero. Este
juego del pnico bancario difiere del dilema de los presos discutido en el
. captulo 1 en un aspecto importante: ambos juegos poseen un equilibrio de:
Nash que conduce a unas ganancias socialmente ineficientes; en el dilem.a
de los presos ste es el nico equilibrio (y loes en estrategias dominantes),
mientras que en este juego existe tambin un segundo eqUilibrio qe
es eficiente. Por tanto, este modelo no predce cundo va a ocurrir un
pnico bancario, pero muestra que es un fenmeno que'p~~de ocurrir en
equilibrio. Vase un modelo ms rico en Diamond y DybVig (1983):.
/,
2.2.C Aranceles y competencia internacional imperfecta

Nos ocupamos ahora de una aplicacin de economa internacional. Consideremos dos pases idnticos, que denominamos con i = 1,2. Cada pas
tiene un gobierno que escoge un arancel, una empresa que produce tanto
para el consumo interno como para la exportacin y unos consumidores
que compran en el mercado interno, ya sea de la empresa nacional o efe
la extranjera. Si la cantidad total en el mercado del pas i es Qir el precio
de equilibrio del mercado es Pi(Qi) = a - Q.. La empresa del pas i (que
en adelante llamaremos empresa ~)produce hi para el consumo interior
y ei para la exportacin. Por tanto, Q = h + ej. Las empresas tienen
un coste marginal constante e y no tienen costes fijos. Por tanto, el coste
total de produccin de la empresa i es C(h,ei) = c(h + e). Las empresas
tambin incurren en un coste arancelario sobre las exportaciones: si la
-,
.,
fllegos
74 I JUEGOS DINMICOS CON INFORMACiN COMPLETA Ce. 2)
empresa iexporta ei al pas ,7 cuando el gobierno j ha establecido una tasa

arancelaria de tj, la empresa i debe pagar tjei al gobierno j,
, El desarrollo temporal del juego es el siguiente: Primero, ambos gobIernos escogen simultneamente las tasas arancelarias tI y t2. En segundo lugar, las empresas observan las tasas arancelarias y escogen sim~:neamente las cantidades para el consumo interno y para la exportacIOn, (hI,eI) y (h2,e2). En tercer lugar, las ganancias son los beneficios
de la empresa i y el bienestar total del gobie.r:noi, donde el bienestar total
del pas i es la suma de los excedentes de los consumidor~s9 del pas i,
los ~eneficios recibidos por la empresa i y el ingreso arancelario que el
gobIerno ~recauda de la empresa j:
.....
...,.'
1r'i(ttj,hi,ehj,ej)
=[0. - (hi+ ej)Jhi + [a - (ei + hj)Jei

- c(hi
",
Wi(ttj,h"e"hJ,ej)
+ e;) -
tje
='2Qf
+ 1r'i(titjhi,ei,hj,ej)
+ tiej,
Supongamos que losgobie~os hanestogido los aranceles tI y t2. Si

es un equilibrio de Nash del juego (de dos mercados) restante
entrelas empresas 1 y2 entonces, para cada i, (hi,ei> debe solucionar
(hj,ej,hi,ei)
'!'~
Como 1r'i(t"tj,h"e"h;,e;)
puede escribi~e como la sum~ de los benefi~io,sde la empresa i en ~l.mercado i (los cuales son funcin de hi y e;
Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cuales son funcin, de ei, h;.y tj. nicamente), el problema de optimizacin
en los dos mercados para la empresa i se simplifica al separarse en dos
problemas, uno para cada mercado: hi debe solucionar
, max
h,::::O
.-~
+ eJ~)-
hi[a - (hi
'
cL
y ei debe solucionar
maxei[a
<,::::0
- (ei
+ 11,*) - el J
te'.
J
'
9 S'
.
1 un consUffildor compra un bien a un, precio,p cua~dohab'r
estado dispuesto a
pagar un valor v, se beneficiade un excedente de v '-' p. Dada la i:ufV~de deinilcla inversa
Pi(Qi) ~ a - Q" si la cantidad vendida en ei mercado i es Qi, puede demostrarSe que el
excedente agregado del consumidor es (l/2)Qr
Suponiendo que
e; :::;a -
eH
dos etapas de
ill{omlOc/I
I 75
c, tenemos que
1(
,,)
11,; =
a - ej - e ,
'2
(22,1)
y suponiendo que 11,; :::; a - e - tj, tenemos que

1('o, - 1*
ei = '2
tj
e - tj ) .
(2.22)
(Los resultados que derivamos son coherentes con ambos supuestos,) Las
dos funciones de mejor respuesta (2.2.1) y (2.2.2) deben cumplirse para
cada i = 1,2. Por tanto, tenemos cuatro ecuaciones con cuatro incgnitas
(hi,ei,hi,ei).
Afortunadamente, este sistema de ecuaciones puede simplificarse dividindose en dos grupos de dos ecuaciones con dos incgnitas,
Las soluciones son
h~ =
,
0.-
'3
+ ti
ei
0.-
C -
2tj
(2,23)
Recordemos (en la seccin 1.2.A) que la cantidad de equilibrio escogida

por las dos'empresas en el juego de Cournot es (a - c)/3, pero que este
resultado se obtuvo bajo el supuesto de costes marginales simtricos. En
el equilibrio descrito en (2.2.3),por el contrario, las decisiones arancelarias
de los gobiernos hacen que los costes marginales sean asimtricos (como
en el ejercicio 1.6). En el mercado i, por ejemplo, el coste marginal ele
la empresa i .es c, pero el delaempresa j es c + ti. Como el coste de la
empresa j es ms alto, sta quiere producir menos .. Pero si la empresa j
va a producir menos, el precio de ,equilibrio ser'.Il~J~al~~,deforma que la
empresai querr producir ms, en cuyo caso la empresa j querr producir
menos todava. Por tanto, en equilibrio, hi crece con ti y e; decrece (a un
ritIno ms rpido) con ti, como indica (2.2.3).
Una vez resuelto el juego entre las dos empresas que queda en la
segunda etapa, cuandolos gobiernos han escogido las tasas arancelarias,
podemos ahora representar la interaccin entre los dos gobiernos en la
primera etapa con el siguiente juego de decisiones simultneas. Primero,
los gobiernos escogen las tasas aran,celarias tI y t2 simultneamente. En
segundo lugar, las ganan9j=ls;spr,~i(t;,t'j,hj,ei,hi,ei)
para el gobierno
i = 1,2, donde hi y ei.son funciones de ti y tj, tal como se indica en (2.2.3),
Hallamos 'ahora el equilibrio d~ Nash de este juego entre los gobiemos.
Para simplificar la notacin, suprimiremos la dependencia de 11.; de f'i
y de ei de tj: con W;(ti,tj)genotamos
a Wi(ti,tj,hi,ei,hi,ei),
la ganancia
del gobierno i cuando eS.<;9ge1a
tasa arancelaria ti, el gobierno .i escoge t j
/,-.
76/
JUEGOS DINJVlICOS CON INFORMACIN COMPLETA
Ce.
2)
Juegos en dos etapas de informacin / 77
y las empresas i y jse comportan segn el equilibrio de Nash dado por
(2.2.3). Si (ti Ji) es un equilibrio de Nash de este juego entre los gobiernos,
entonces, para cada i, ti debe solucionar
max
W;*(ti,t*).
ti~O
Pero
W;*(t,tiJ
es igual a
(2(a - e) - ti?
(a - e + ti)2 + (a - e - 2t~?
1
18
+ t(a
t
- e - 2t)1
del libre comercio). (Si es factible tener aranceles negativos, es decir,

subsidios, el ptimo social consiste en que los gobiernos escojan tI =
t2 = -(a - e), lo que hace que la empresa nacional no, produzca nada
para el consumo interior y exporte la cantidad de competencia perfecta
al otro pas.) Por lo tanto, dado que las empresas i y j se comportan
segn el equilibrio de Nash caracterizado en (2.2.3) en la segunda etapa,
la interaccin entre los gobiernos en la primera etapa es un dilema de los
presos: el nico equilibrio de Nash lo es en estrategias dominantes, y es
socialmente ineficiente.
3'
por tanto
2.2.0 Torneos
a-e
t~ =--
para cada i, independientemente de tj. En consecuencia, en este modelo

escoger una .tasa arancelaria de (a - e)j3 es una estrategia dominante
de cada gobIerno. (En otros modelos, por ejemplo cuando los costes
margInal.es son crecientes, las estrategias,.de equilibrio de los gobiernos no
son domInantes.) Sustituye~do ti = t; = (a - e)j3 en (2.2.3) obtenemos
hi = 4(a -:-e)
e~ = a - e
como las cantidades escogidas por las empresas en la segunda etapa. Por
tanto, el resultado perfecto en subjuegos de este juego -de aranceles es
(ti
(a - e)j3,hj=hi=
4(u-:- e)j9,ej = ei = (a --' e)j9)~
'
En el resultado perfecto en subjuegos, la cantidad agregada en cada
mercado es S(a - e)j9. Sin embargo, si los gobiernos hubieran escogido
unas tasas, ar~ncelarias iguales a cero, la cantidad agregada en cada mercado habna SIdo 2(a - e)/3, exactamente igual que en el modelo de Cournot. Por tanto, el excedente de los consumidores en el mercado i (el cual,
como hemos visto anteriormente, es simplemente la mitad del cuadrado
de la cantidad agregada en el mercado i) es menor, cuando los gobiernos
esc?ge.n l~s tasas arancelarias que son estrategias dominantes, de lo que
~ena SIelIgieran unos aranceles iguales a cero. De hecho, unos aranceles
Iguales a cero son socialmente ptimos en el sentido de
=5 =
max
W(t],t2)
Consideremos a dos trabajadores y su capataz. El producto del trabajador i (i = 1 o 2) es Yi = ei + E donde ei es esfuerzo y Ei es ruido. El
proceso de produccin es el siguiente: Primero, los trabajadores escogen
simultneamente sus niveles no negativos de esfuerzo: ei ?: O. En se--'
gundo lugar, los valores de ruido E] y 1'2 se obtienen independientemente,
de acuerdo con una funcin dedensidad f(E) con media cero. Entercer
lugar, el producto de los trabajadores es obsen:ado pe~ono su
Los salarios de los trabajadores,' por tanto, pueden depender de lo que
han producido, pero no (directamente) de su esfuerzo.
Supongamos que el capataz decide inducir a los trabajadores a esforzarse ms y para ello les hace competir en un torneo;.tal y como originalmente analizaron Lazear y Rosen (1981).10 El salario recibido 'por el
vencedor del torneo (es decir, el trabajador quems:produica)eswA;"el
salario recibido por el perdedor es WB. La ganancia:deun trabajador que
reciba un salario W y realice un esfuerzO e es u(w,e) = w - g(e), donde la
desutilidad del esfuerzo, g(e), es creciente y convexa (es decir; g'(e) > O Y
g"(e) > O). La ganancia del capataz es Yl + YF-WA - WB.
Transcribimos ahora esta aplicacin'a lostrininos de la clase de juegos
discutida en la seccin 2.2.A. El capat~~'~"eIRg~dor 1~cuya accin al es
escoger lbs salarios W A y W B que se pagarn en el torneo. No hay jugador
2. Los trabajadores son los jugadores 3 y4;quienes observan los salarios .
escogidos en la primera etapa y deci~e,!-1~n.t,?~cessnultneamente sus
acciones a3 Y a4, es decir los esfur~o~'~l'y'~:(Consideraremos ms de-
e~fu~i~o~
+ Wi(t2,tl),
tl,t2~O
de fOlIDaque existe unincentivo para que los gobiernos firmen un acuerdo

en el que se comprometan a eliminar los aranceles (es decir, en favor
lO Para no complicar la exposicin de esta aplicacin; ignoramos varios detalles tcnicos,

tales como las condiciones bajo las cuales la 'condicin de primer orden del trabajador es
suficiente. No obstante, el anlisis eXige illI mayor clculo de probabilidades que en los casos
anteriores. Esta aplicacin puede saltarse sin prdida de continuidad.
'
... ".
78 / ]VEGaS
DINMICOS CON INFORMACIN
Juegos el1 das etapas de ,[anuaciru ! 79
COMPLETA (e. 2)
lante la posibilidad de que, dados los salarios elegidos por el capataz, los
trabajadores prefieran no participar en el torneo y acepten en cambio una
oferta de empleo alternativo.) Finalmente, las ganancias de los jugadores
son las establecidas anteriormente. Dado que lo que se produce (y por
tanto tambin los salarios) es funcin no slo de las decisiones de los jugadores sino tambin de los trminos de ruido El y (.2,operaremos con las
ganancias esperadas de los jugadores.
Supongamos que el capataz ha elegido los salarios WA y WB. Si el
par de esfuerzos (ei,ei) es un equilibrio de Nash del juego festante entre
los trabajadores, para cada i, ei ha de maximizar el salario esperado del
trabajador i menos la desutilidad del esfuerzo: ei debe ser una solucin
dell
,','
-_:;,'
Prob{Yi(e;) >
Yj(ej)}
=Prob{Ei >
' =1
ej +
e;}
Prob{Ei>e;+Ej-e,IEj}f(Ej)dEj
. j
/[1 -
F(ej
- ei
+ Ej)JJ(Ej)dEj,
de forma que la condicin de primer orden de (2.2.5) se convierte en

(WA -
WB)
J(e;
- ei + Ej)f(Ej)dEj
= g'(ei)'
En un equilibrio de Nash simtrico (es decir, ei = ei = e') tenemos que

max WA Prob{Yi(ei) >
e,,,=O
, = (WA
::.
donde
"',1::'"
Yi(ei)
- WB)
Yj(e;)}
+ 1)1B Prob{Yi(ei) ::; YjCe;)}
Prob{Yi(ei) >
,,',
Yj(e;)}
+ WB
-' g(ei)
(WA - WB)
(2.2.4)
~ g(ei),
Como
= ei + Ei',La condicin de primer orden de (2.2.4) es'
-,,) :
(WA _
,-,~~tl
~~~,
.,::- ..'
~:',
.",.!:.'
--");
"
__
,~i
:;
~~','
"o,}'
,)~
.~}
,",.l~
'. '-,'
'
..../
~_l.>t'
)8Prob{Yi(ei) >
WB
8
ei
Yj(e;)}
- 9
'(
,)
e,.
(2.2.5)
.'
Es decir, el trabajador i escoge ei de forma que la desutilidad marginal de
un esfuerzo extra, g'(e;), sea igual al beneficio marginal de ese esfuerzo
adicional, que es el producto de lo que se gana en salario por venCer en el
torneo, WA '-w B, y el aumento marginal de la probabilidad de ganar.
Por la regla de Bayes,12
11 Al escribir (2.2.4),supusimos
que la funcin de densidad del ruido (e) es tal que el
suceso en el qU lostrabaj~dores producen exactamente lo mismo OCurrcon probabilidad
cero y, por tanto;no es necesario considerarlo en la funcin de utilidad esperada del trabajador
i. (Ms formalmente, suponemos que la funcin de densidad (E) es no atmica) En una
descripcin completa del torneo, sera natural (pero innecesario) especificar que el ganador se
determina a cara o cruz, o (lo que en este modeio resulta eqttivalente) que ambos trabajadores
reciben(wA
+wB)/2
J(Ej) 2 dEj -- 9 '(')e
(2.26)
es ~onvexa, un premio mayor por ganar (es d~cir, .U.Jl valor

esfuerzo, cosa harto
mtU.lliva. Por
) I'nduce a un mayor
mayor d eWA-WB
'
,
tra parte con un mismo premio, no vale tanto la pena esforzarse cuando
ruido e~ muy fuerte, porque es probable que elresultado del to:neo se
determine aleatoriamente, y no de acuerdo con elesfuerzo. Por ejemplo,
si Ese distribuye normalmente con varianza a2, entonces
g(e)
:1
"
;:\
. j
l2La regla de Bayes proporciona una frmula para P(AIB), la probabilidad (condicional)
de que un suceso A ocurra dado que el suceso B ha ocurrido. Sean P(A), P(B) Y P(A,B)
las probabilidades (a priori) (es decir, las probabilidades antes de que tanto A como B hayan
tenido la oportunidad de ocurrir) de que A ocurra, B ocurra y de que ambos A y B ocurran
respectivamente.
La regla de Bayes establece que P(AIB) = P(A,B)/ P(B). Esto es, la
probabilidad condicional de A dado B es igual a la probabilidad de que ambos 'A y B ocurran
dividida por la probabilidad a priori de que B ocurra.
que decrece en a, de forma que E' efectivamer:te decrece en a..

Procedemos ahora hacia atrs, hasta la pnmera etapa del Juego. Suacuerdan
participar
en el torneo
pongamos que SI,. 1os trabaJ'adores
'
' '
,
. (en
lternativo)
responderan
a
los
salanos
',I! A
mpleo
a
t
vez d e acep ar un e,
,
.
.
d
1
'libn'o
de
Nash
simtrico
caractenzado
por
(2.2.6).
y W B lugan ,o e eqw,
.. ' .
.,.
(1gnoramos, por t anto , la posibilidad de equihbn, os asrmetncos y,de un
,
equilibrio en el que la eleccin de los es~erzos por parte de los trabaJadores venga dada por la solucin de esquma el = e2 = en vez de por la
condicin de primer orden (2.2.5).) Supon~amos t~~bIen que la oporlunI'd a d d e emp 1ea alternativo proporcionan' a una utilIdad Un' Como
, en' el
.
equilibrio de Nash simtrico cada jugador gana el tor~eo con probal:lhdad un medio (es decir, Prob{Yi(e') > Yj(e')} = 1/2), SI capataz qUJ~re
inducir a los trabajadores a participar en el torneo debera escoger salanos
?:
:1
que satisfagan
80 / JUEGOS DlNAMICOS CON INFORMACIN COMPLETA (c. 2)
-w,
2 ,~ + 2-wB
- g(e*)
>- Ua.
Juegos repetidos / 81
(2.2.7)
ganancias del juego completo son simplemente la suma de las ganancias

de cada etapa (es decir, no hay descuento).
(
Suponiendo que Ua sea lo suficientemente pequea corno para que el

capataz quiera inducir a los trabajadores a participar en el torneo, ste
escoger los salarios que maximicen el beneficio esperado, 2e* -"illA - WB,
sujeto a (2.2.7). En el ptimo, (2.2.7) se satisface con igualdad:
Jugador 2
(
Iz
D2
1,1 5,0
Jugador 1
WB
= 2Ua
+ 2g(e*) -
WA.
El beneficio esperado es entonces 2e* - 2Ua - 2g(e*), de forma que el

capataz quiere escoger unos salarios tales que el esfuerzo inducido, e*,
maximice e* - g(e*). El esfuerzo inducido ptimo, por tanto, satisface
la condicin de primer orden l(e') = 1. Sustituyendo esto en (2.2.6) se
obtiene que el premio ptimo, WA - WB, es una solucin de
(WA -
WB)
f(j)2dj
1,
Y (2.2.8)determina entonces
0,5 4,4
(2.2.8)
WA Y"illB.
2.3Juegos repetidos
En esta seccin analizarnos si las amenazas y promesas sobre el comportamiento futuro pueden influir en el comportamiento presente en situaciones que se repiten en el tiempo. Buena parte de lo que hay que entender
en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas
nuevas se requieren para entender los juegos con un horizonte infinito.
Hemos definido tambin el equilibrio de Nash perfecto en subjuegos. Esta
defircin tiene una expresin ms sencilla para el caso especial de los juegos repetidos que en el general de los juegos dinmicos con informcin
completa que considerarnos en la seccin 2.4.B. La introducirnos aqu para
tacilitar la exposicin posterior.
. '.
2.3.A Teora: Juegos repetidos en dos etapas
Consideremos el dilema de los presos dado en forma normal de la figura
2.3.1. Supongamos que hay dos participantes en este juego que deciden
simultneamente en dos ocasiones, habiendo observado el resultad"ode li,'l
primera decisin antes de decidir por segunda vez, y supongamos que las
('.
Figura 2.3.1
Jugador 2
Iz
D2
2,2 6,1
Jugador 1
1,6 5,5
Figura 2.3.2
Llamaremos a este juego repetido el dilema de los presos en:dos etapas.
Este juego pertenece a la clase de los juegos analizada en la seccin 2.2.A.
Aqu los jugadores 3 y 4 son idnticos a los jugadores 1 y 2, los espaCios
de acciones A3 y A4 son idnticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l
son simplemente la suma de las ganancias en la'pnmera etapa (i.;a2)
y en la segunda etapa (a3,a4)' Adems, el dilema de los presos en d.s
etapas satisface el supuesto que hicimos en la seccin 2.2.A: para cada
resultado factible de la primera etapa del juego, (al,a21, el juego restant.e
en la segunda etapa entre los jugadores 3 y 4 tiene un nico equilibrio
de Nash, que denotamos por (a3(al,a21,a,i(al,a2'
De hecho, el dilema
de los presos en dos etapas satisface este supuesto de forma clara, como
seguidamente indicamos. En la seccin 2.2.A peTInitini.osla posibilidad de
que el equilibrio de Nash del juego restante en la segunda etapa dependa
del resultado de la primera etapa -de aqu la notacin (a; (al ,a2) ,a (al ,a2
en vez de simplemente (aj,a). (En el juego de los aranceles, por ejemplo;
las cantidades de equilibrio escogidas por las empresas en la segunda
etapa dependan de los aranceles escogidos por los gobiernos en la primera
etapa.) Sin embargo, en el dilema de los presos en dos tapas, el nico
~'.
[IleSOS
82 / JuEGOS DINMICOS CON INFORMACIN COMPLETA (c. 2)
equilibrio del juego de la segunda etapa es (I,h), independientemente

del resultado de la primera etapa.
Siguiendo el procedimiento descrito en la seccin 2.2.A para calcular el
resultado perfecto en subjuegos de tal juego, analizamos la primera etapa
del dilema de los presos en dos etapas teniendo en cuenta que el resultado
del juego restante en la segunda etapa ser el equilibrio de Nash de ese
juego, es decir, (IIJ con ganancias de (1,1). Por tanto, la interaccin en
la primera etapa entre los jugadores en el dilema de los p~esos en dos
etapas se concreta en el juego de una jugada de la figura 2.3.2, en el que
las ganancias 0,1) de la segunda etapa se han sumado ' cada par de
ganancias de la primera etapa. El juego de la figura 23.2 tiene tambin un
nico equilibrio de Nash: (IIJZ). Por tanto, el nico resultado perfecto en
subjuegos del dilema de los presos en dos etapas es (Jz) en la primera
etapa, seguidC? de (IJz) en la segunda etapa. No se puede conseguir
cooperacin, es decir, (DI,Dz) en ninguna etapa del resultado perfecto en
subjuegos.
Este argumento contina siendo vlido en situaciones ms generales.
(Aqu nos apartamos momentneamente del caso de dos periodos para
permitir cualquier nmero finito de repeticiones, T.) Denotemos con
G = {A, ... , An; Ul; ... ,un} un juego esttico con informacin completa
en el que los jugadores 1 a n escogen simultneamente las acciones a a an
de los espacios de acciones A a An respeftivamente, siendo las ganancias
U(al;', . ,an) a un(a, ... ,an). Llamaremos al juego G, juego deetapadel
juego repetido.
...
}:
Definicin. Dado un juego de etapa G, G(T) denota el juego r.epetido finitamente en el que G se juega T veces, habiendo los jugadores observado los
resultados de todas las jugadas anteriores antes de que empiece la siguiente. Las
ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de .
etapa.
Proposicin. Si el juego de etapa G .tiene un nicQequilibrio de Nash, entonces,
para cualquier T finito, el juego repetido G(T) tiene un ~ico resultado perfecto
en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3
13 Se ~btienen resUltados anlogos si el juego de etapa G es un jego dinmic con informadn completa. Supongamos que G es un juego dinmico con inJonndn completa y
perfecta de la clase definida en la secdn 21.A. Si G tiene un rjco resultado por inducdn
hada atrs, G(T) tiene un nico resultado perfecto en subjuegos: en cada etapa se juega el
resultado por inducdn hacia atrs de G. Sinillarmente, supongamos que G es un juego en
repef idos / 83
lora al caso de dos periodos, pero consideramos la posi.. vodlvdemqo:::1 J'uego de etapa G tenga mltiples equilibrios :le ..NilSh,
blhda
e
. d
. d
[y C ll1utan 1
3 3 1~as estrateglils enOillma as ./. d /
en l a fi gura 2 ..,
. 1
como
enOJ1Unal
.
de los presos d e l a fi gura 23.. I , pero las estrategias
. 'b .ilS
dIlem; sido aadidas al juego de forma que ahora existen dos eqUlh nos
Di ha
'.
(1 J) como en el dilema de los presos, y
,2
.
"1'
I
N h en estrategIas puras.
de as d
1
' (D D) Natura men te, es artl' f)' cial aadir un eqUllt mo a
a~ora a de~as pr~~os2de esta manera, pero nuestro inters en este juego
dIlema, e os 't'vo que sustan h' va. En la prxima seccin veremos que
es mas exposll
, 'h d
uilibrios
.
tidos infinitamente comparten este espm I e eq ..
los Juegos ~epe
'1'
d etapa que se repiten infinitamente tienen
. "
u'Iti les mc1uso SI os Juegos e
m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en
un UNCOeq.
.
de etapa artificial en el contexto Sl1nple
. , n analIZamos un Juego
est~::cC1:riodos, y nos preparamos con ello para el anlisis poster~or de
de
p
..'
'co en un contexto con honzonte
un juego de etapa con mteres economl ,
infinito.
1,1 5,0 0,0

0,5 4,4 0,0
0,0 0,0 3,3
Figura 2.3.3
Supongamos que el juego de etapa de la figura 2.3.3 s.ejuega dos veces,

h b' do los J'ugadores observa d o e1 resu lt a d o de la .pnmera etapa antes
a len
.
l
d Demostraremos que existe. un nico resultado
de que empIece a segun a.
. (c c)
erfecto en subjuegos de este juego, en el que el par de estrategIas
1, 2
P
.
l'
etapa
14 Corno en la seccin 2.2.A, supongamos que
se Juega en a pnmera
.
. .
.. 22 A Si G tiene un nico resultado perfecto en
dos etapas de la clase defin~da en Ia.s~cClon ~lt~d'o perfecto en subjuegos: en cada etapa se
subjuegos, entonces G(T) hene un unlCOres
juega .el resultado perfecto en subjuegOdsfide.~. la nodn de resultado perfecto en subjuegos
14E '-' tamente hablando hemos e ni o
S'HC
' '. 'd
l
.. 22 A El dilema de los presos en dos etapas
l
1 1 se de juegos defim a en a seccJOn . . .
.
s o para a e a
da resultado factible del juego de la primera eta pa eXlste
pertenece a esta clase, porque para ca
d
l
gunda etapa Sin embarg0. el
Tb'
d N sh en el juego que que a en a se
.
un nico eqU11 no e ~
. n el . e o de e~apa de la figura 2.3.3 no pertenece a
juego en dos etapas Tepehdo, basadh.oe u'~pfes equilibrios de Nash. No vamos a extender
tIque
el U.ego de etapa ene m.
. 11
es a c ase, por
b'
os de forma que sea apiJea ) e a
formalmente la definicin del resultado perfecto en su Jueg
84 / JUEGOS DlN,vllCOS CON INFORfvIACN COMPLETA (e. 2)
en la primera etapa los jugadores prevn que el resultado de la segunda

etapa ser un equilibrio de Nash del juego de etapa. Puesto que este
Juego de etapa tiene ms de un equi.librio de Nash, ahora es posible que
los Jugadores prevean que a resultados diferentes en la primera etapa
les sIguen equilibrios diferentes del juego de etapa en la segunda etapa.
Supongamos, por ejemplo, que los jugadores prevn que (Dl,Dz) ser el
resultado de la segunda etapa si el de la primera etapa es (Cl,CZ), pero
que (II,1z) ser el resultado de la segunda etapa si el resultado de la
primera etapa es cualquiera de los ocho restantes. La interaccin entre
los jugadores en la primera etapa se concreta entonces en el juego de una
etapa de la figura 2.3.4, donde (3,3) se ha sumado a la casilla (C],Cz) y 0,1)
se ha sumado a las otras ocho casillas.
2,2 g,1 1,1
1-:'"
--
1,6
]1 1,1
1,1 1,1
~''!.
Figura 2.3.4
Existen tres equilibrios de Nash con estrategias puras en el juego
de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2,
los equilibrios de Nash de este juego de una etapa corresponden a los
resultados perfectos en subjuegos del juego repetido original. Denotemos
con w,x),(y,z)
un resultado del juego repetido: (w,x) en la primera etapa
y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4
corresponde al resultado perfecto en subjuegos (1],[Z),(1],[2 del juego
repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z)
como consecuencia de cualquier resultado en la primera etapa excepto de
(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura
~.3.4 corresponde al resultado perfecto en subjuegos Dl,Dz),(11'!Z
del
Juego repetido. Estos dos resultados perfectos en subjuegos del juego
repehdo simplemente enlazan los resultados de los equilibrios de Nash
de los juegos de etapa, pero el tercer equilibrio de Nash de la figura
2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura
todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es
nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones
mduso mas generales.
Juegos rq;elidos / 85
2.3.4 corresponde al resultado perfecto en subjuegos Cl,Cz),(D],D2)
del
juego repetido, puesto que el resultado previsto en la segunda etapa es
(Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'
anteriormente, se puede alcanzar la cooperacin en la primera etapa de
un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo
de un resultado ms general: si G = {Al,'"
,An; uI- ... ,un} es un juego
esttico con informacin completa que tiene mltiples equilibrios, pueden
existir resultados perfectos en subjuegos del juego repetido G(T) en los
que, para cualquier t < T, el resultado de la etapa t no es un equilibrio
de Nash de G. Volveremos sobre esta idea en el anlisis de un juego con
horizonte infinito en la prxima seccin.
La conclusin principal que debemos sacar de este ejemplo es que

las amenazas o las promesas crebles sobre el comportamiento futuro
pueden influir en el c~mportamiento presente. Sin emba'rgo, desde otra
perspectiva, puede que quizs el concepto de perfeccin en subjuegos
no utilice una definicin de credibilidad lo suficientemente fuerte. Al
derivar el resultado perfecto en subjuegos C],CZ),(D1,Dz, por ejemplo,
hemos supuesto que Jos'jugadores prevn q~e (DI,Dz) s~r el resultacl,
de la segunda ronda si el resitltado en la primera etapa es (C],Cz), y q~~
(I'!z) ser el resultado en la segunda etapa si eIde la primera ronda es
cualquiera de los ()chorestantes. Pero jugar (11,!2)enli.se~da etapa, con
unas ganancias de 0, 1), puede parecer poco atractivo~a:hdo (DI,Dz),
con una ganancia de (3, 3), est tambin dispnible cci~oe'luilibrio de
Nash del juego de etapa que queda. Dicho en trminos poco preciSos.
parecera natural que los jugadores renegocii-an:15.SiJC1,cz) no es'~i
resultado de la primera etap~ del-juego, e~d~'~{~e~u'p'~~equ~~~'j~g~
(I'!z) en la segu~cl,~~ta,pa, cada jugadorp_~t;4-;;"p~TIs~que_lo p~sadQ;
pasado est, y que se debe jugar el eqilibriodel juegbdeetapa (Dl,D~)
unnimemente preferido. Pero si (DI,Dz)va
a serelr~sltado de la
segunda etapa independientemente de cul sea el rescltadoenla primera
ronda, el incentivo para jugar (Cl,Cz) en ia prir~~et~p.a_desaparece: la
interaccin entre los dos jugadores en la p'riill~;a~tapa' s~~~~.duce
al juego
de una etapa en el que la gnancia (3, 3Yse'ha~st1adacada casilla del
juego de etapa de la figura 2.3.3; d'e'fo~a que Ji e~ la mejor respuesta a
Cj del jugador i.
' '. . ."._..
'.
','
15 Decimos que es impreciso p~rq~~"renegociar" sugiere que hay comunicadn (o incluso

negodadn) entre la primera y la"Segunda e,tapa. Si esto fuera posible, debera aadirse a
la descripdn y anlisis del jue;m.'Aqu spimemos que no es as, de forma que lo que
entendemos por "renegodar" no-esotra cosa que un ejerddo de introspeccin.
86 / JUEGOS DINMICOS CON INFORMACIN COMPLETA (e 2)
JI 1,1 5,0 0,0 0,0 0,0
Cl 0,5 4,4 0,0 0,0 0,0

DI 0,0 0,0 3,3 0,0 0,0
/:;~
PI 0,0 0,0 0,0 4,! 0,0

Ql
0,0 0,0 0,0 0,0 !,4

Figura 2.3.5
Para acercamos a la solucin de este problema de renegociacin,-con~

sideremos el juego de la figura 2.3.5, que es an ms artificial qu l j\.tego
de la figura 2.3.3. Una vez ms, huestro inters en este juego' ~s ms
expositivo que econmico. Las lciJ~squstamosdesarrollnd pi~-tTa:
tar l tema de la renegociacin en est juego artificial se pueden aplicar
tambin a la renegociacin en juegos infinitamente repetidos; vase Fairell
y Maskin (1989),por ejemplo.
"
Eneste juego de etapa se aaden las estrategi~s Pi y Qia1juego de
etapa de la figUra 2.:5.3.Existen cuatro equilibrios de Nash con estrategias
purasdeljuego de etapa: (IJ,h)' (Dr,1J2) Y ahora tambin (Pl,P2) y (Ql,Q2)'
Como antes, los)ugadores prefieren unnimemente\D1,D2) a (h,h). Ms
importante an, no hay ningn equilibrio de Nash (x,y) en llfigUra 2.3.5
t~l que los jugadores prefieran unnimemente (x,y) a (Pl,P2); (Q1;Q2) o
(Dl;D2). Decimos entonces que (Dl,D2) domina en el sentidO de Peto' a
(IJ,h), y que (P1,P2),(Ql,Q2) y (Dl,D2) estn en a fronterade Paretode las
ganancias de los equilibrios de Nash del juego de etapa de la figtira2.3.5.
Supongamos que el juego de etapa de la figura 2.3.5 se'juega dos
veces, habiendo los jugadores observado el resultado de la prirnfa\511da
antes de
empiece la segunda. Supongamos adicion~J~erit~gue los
jugadores prevn' que el resultado de la segundatapa ser el sigUi~nte:
(DJ,D2) si el resultado dela primera etapa es (Cl,C2); (PI ,P2) sieiis'U1tad
de la primera etpa es (Cj,w), donde 1JJ puede ser cualquierco~amE:los
C2; (Ql,Q2) si el resultado de la primera etapa eS (x,C2), donde x puede ser
cualquier cosa menos Cl y (DJ,D2) si el resultado de la primera etapa es
(y,z), donde y puede ser cualquier cosa menos
y zpuedes~;, ctialquier
cosa menos C2. Entonces Cl,C2),(Dl,D2 es un result<l:dpeasto'en
subjuegosdeljuego repetido porque cada jugador obtiene 4+3l jugare;
que
el
seguido de Di peros~lo 5 +1/~ a.ljugar Ji en :a primera ~tapa (e i.ncluso

menos con otras deCISIOnes).Mas Importante aun, el problema del eJemplo
, terior no aparece aqu. En el juego repetido en dos etapas basado en la
an
figura 2.3.3, la nica forma de castigar a un jugador por desviarse en la
, primera etapa era jugar ~n equilibrio .~ominado en :1 sentido de Par,eto
en la segunda etapa, cashgandotamblen con ello al Jugador que casllga,
Aqu, en cambio, existen tres equilibrios en la frontera de Pareto -uno
para recompensar el buen comportamiento de ambos jugadores en la
primera etapa y los otros dos para ser utilizados no slo para castigar al
~Ti;;~):Jugador que se desva en la primera etapa, sino tambin para recom pensar
'."'2E::.aiillgdor que castiga. Por tanto, si se requiere una penalizacin en la
Y';~">Segunda ronda, no existe otro equilibrio del juego de etapa preferido por
!-F ' ., .eljugador que castiga, de forma que no se puede persuadir al jugador que
castiga de que renegocie la penalizacin.
2.3.B Teora:Juegos
repetidos
infinitamente
Pasamos ahora a los juegos repetidos' infinitamente. Como en el caso

de un horizonte finito, el tema principal es el de que las amenazas o las
promesas, crebles sobre el comportamiento futuro pueden influir en el
comportamieritopresente\ En el caso de un horizonte finito vimos que si
existen equilibrios de Nash mltiples del juego de etapa G, pueden existir
resultados perfedos en subjuegos del juego repetido G(T) en los que, para
,rualquier t < T, el resultado de la etapa t no es un equilibrio de Nash de G.
~ Untesultado ms poderoso se da en los juegos repetidos infinitamente:
intruso si el juego de etapa tiene un nico equilibrio de Nash, pueden
','e3dstir muchos resultados perfectos en subjuegos en los que ning'uno de
los resultados en cada etapa sea un equilibrio de Nash de G,
_ Empezamos con el estudio del dilem de los presos repetido in rinitamente. Consideramos a continuacin la clase de juegos repetidos infini, tamente anloga a la clase de juegos repetidos finita mente definida en la
o" :,'sccin anterior:' un juego esttico con informacin completa, G, se repi te
t:r;~LIfullutamente, habiendo los jugadores observado 10s'resultados de todas
,
las rondas anteriores antes de que empiece la etapa siguiente. Para esta
. "cIase de juegos repetidos finita e infinitamente, definimos los conceptos
de estrategia de un jugador, de subjuego y de equilibrio d Nash perfecto
el).,"sbjuegos.(En la seccin 2.4.B definimos estos conceptos para juegos
, dinmicos con informacin completa en general, no slo para esta clase
de juegos repetidos.) Utilizamos despus estas definiciones para enuncia r
.;
(
''-.(,
~
..
1'.
~,
~8 / JUEGOS DINMICOS CON INFORMACIN
]egos repetidos /89
COMPLETA (c. 2)
y demostrar el teorema de Friedman (1971) (tambin llamado teorema de
tradicin oral o teorema folk).I6
Jugador 2
D2
el valor presente de las ganancias, es decir, la ganancia total que podra

ingresarse en un banco ahora de forma que produjera el mismo saldo al
final de la sucesin.
Definicin. Dado un factor de descuento 5, el valor presente
infinita de pagos 7f,7f2,7f3,'
.. es
1,1 5,0
0,5 4,4
Figura 2.3.6
Supongamos que el dilema de los presos de la figura 2.3.6 se repite

infinitamente y que, para cada t, los resultados de las t - 1 jugadas anteriores del juego de etapa se han observado antes de que la t-sima etapa
empiece. Sumar simplemente las ganancias de esta sucesin infinita de
juegos de etapa no proporciona una medida til de la ganancia de un
jugador en el juego repetido infinitamente. Recibir una ganancia de 4 en
cada periodo es mejor que recibir una ganancia de 1 en cada periodo, por
ejemplo, pero la suma de ganancias es infinita en ambos casos. , Recordemos (en el modelo de negociacin de Rubinstein <;lela seccin 2.1.D)
que el factor de descuento 5 = l/O + 1') es el valor actual de lila peseta
que se vaya a recibir en el periodo siguiente, donde l' es el tipo de inters
por periodo. Dados un factor de descuento y las ganancias de un jugador
obtenidos de una sucesin infinita de juegos de etapa, podemos calcular
16 El teorema de tradicin oral original se referia a las ganancias en todos los equilibrios
de Nash de un,juego repetido infinitamente. A este resultado se le llam teorema de tradicin
oral por ser ampliamente conocido entre los tericos de juegos de os "aos cincuenia, aun
sin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgnancias
en ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y,
por tanto, refuerza el teorema de tradicin oral original al utilizar un criterio de solucin ms
fuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo,
el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)
se les llama a veces teoremas ele tradicin oral, aun cuando' no hayan sido ampliamente
conocidos entre los tericos de juegos antes de ser publicados.
de la sucesin
00
7fi+ 57f2+ 527f3+ ...
Jugador 1
.'
L 5 l7f
t
t.
t=I
Tambin podemos utilizar 5 para reinterpretar lo que l~amamos un

juego repetido infinitamente como un juego repetido que se acaba despus
de un nmero aleatorio de repeticiones. Supongamos que al finalizar cada
etapa se lanza una moneda (trucada) para determinar si el juego se acaba
~ no. Si la probabilidad de que el juego se acabe inmediatamente es p y,
por tanto, 1 - p es la probabilidad de que el juego continue al menos una
etapa ms, una ganancia de,7f a recibir en la siguiente etapa (si se juega)
tiene un valor de slo O-p)7f /0 +1')antes de efectuar el lanzamiento del~
moneda correspondiente a esta etapa. Del mismo modo, una gan~cia de
7fa recibir dentro en dos etapas (si ambas etapas se juegan) tiene un:valor
de slo 0- p)27f/0 + 1')2antes de efectuar el lanzamiento de la moneda
correspondiente a esta etapa. Sea 5 = O - p)/O + 1'). Entonces el valor
presente 7f1+ 57f2+ 527f3+ ... refleja tanto el valor temporal del dinero como
la posibilidad de que el juego se acabe.
Consideremos el dilema de los presos repetido infinitalIlente en elque
el factor de descuento de cada jugador es 5"y la ganancia de cq9,aj:ugador
en el juego repetido es el valor presente de las ganan.ciasdel jugad()f,ep
los juegos de etapa. Demostraremos que la cooperacin, es decir,(D1,D2),
puede ocurrir en cada etapa de un resultado perfecto en subjuegos del
juego repetido infinitamente, aun cuando el nico equilibrio de Nash
del juego de etapa es la no cooperacin, es decir, (1},h) El argumerlto
es del mismo estilo que nuestro anlisis del juego repetido en dos etapas
basado en la figura 2.3.3 (el juego de etapa en el que aadimos un segundo
equilibrio de Nash al dilem,! de los presos): si los jugadores cooperan
hoy entonces juegan un equilibrio con ganancias altas maana; en caso
contrario juegan un equilibrio Con ganancias bajas maana. La diferencia
entre el juego repetido en dos etapas y el juego repetido infinitamente es
que aqu el equilibrio con ganancils ltasquepodra jugarse maana no
se ha aadido artificialmente, sirlOque representa continuar cooperando
a partir de maana y en lo Sucesivo.
c..
';-',
"'~'-
,,",
'.'
Juegos repetidos ! 91
90 I JUEGOS D'\JMICOS CON INFORMACIN COMPLETA (c. 2)
Supongamos que el jugadori empieza el juego repetido infinitamente

cooperando y sigue cooperando en cada juego de etapa siguiente si y slo
si ambos jugadores han cooperado en cada ronda previa. Formalmente,
.Ia estrategia, del jugador i es:
ue el jugador j recibe por realizar esta eleccin de forma ptima (ahora

q cada vez que aparezca). Si jugar Dj es ptimo entonces
y
,
V=4+l/,
o V = 4/(1- ), ya que jugar Dj conduce a la misma decisin en la sig"uiente

Jugar Di en la primera etapa. En la t-sima etapa, si
el resultado de todas las t - 1 etapas anteriores ha sido
(Dl,D2) entonces jugar Di; en caso contrario, jugar h
etapa. Si jugar Ij es ptimo entonces

.
Estaes~~~t~i?aesun, ei,:fi,lplod:l~/~t.rategiadel
disparador(trigger strategy);.
'llamadaas p'orque el jugad~i coopera hastaquealguieridefa de Cooperar,
lo qu~Aesencadena' la;dcisln'de. rtovivi '~'.'cooperair.Utlcaffis: Si
ambos jugadores adoptnla, estrat~gia derdlsparador, el resUltado d~l"
juegorepeti~o inffuitamertte ser (Dl,D~)enCdaetapa.' Yerembs pnmeio
que si o est' lo suficientemente Cerca de uno, el hecho de que los dos
jugadores adopten esta estr~tegia cortstituyeun equilibrio de Nash del
juegorepetid infinitamente. Veremos a contiriu~cin que este equilibrio
de Nash es'perfecto en subjuegos, en un sentido que se precisar ms
adelante.
Para demostrar que la adopcin de la estrategia del disparador por
parte de los dos jUi?adores es un equilibrio de Nash del juego repetido
infinitamente, supondremos que el jugador i ha adoptado la estrategia
del disparador ydemostraremos a'continuacin, siempre que o est lo
suficientemente cerca de uno, que adoptar esta estrategia es tambin la
mejor respuesta del jugador j. Dado que el jugador i jugar I para
siempreeuand el resultado de alguna ronda difiera de (Dl~D2), lafuejor
respuesta del jugador j es efectivamente jugar Ij para siempre ruando el
resultado de alguna etapa difiera de (Dl,D2)' Queda: por determinar la
mejor respuesta del jugador ien la primera etapa yen cualquier etapa tal
que los resultados anteriores hayan sido (Dl,D2). Jugar Ij proporcionara
una ganancia de 5 en esta etapa, pero desencadenara la riocooperacin
del jugador"i (y, por tanto, tambin del jugador j) enio sucesivo, de forma
que la ganancia en cada etapa futUra sera 1: Comd'1++2+:. /=1/(1-0),
el valor presente de esta:sucesin de ganancias es
5 + 0.1 +
.::
..,'
_.
o'
coma obtuvimos antes. Por tanto, jugar Dj es ptimo si y slo si

4
1_ o
5 + 1 _ '
(2.3.1)
o ~ 1/4. Por tanto, en la primera etapa, y en cualquier ronda tal que

todos los resultados anteriores hayan sidoCDl,D2), la decisin ptima del
jugador j (dado que el jugador i ha adoptado lestrategia del disparador)
es Dj si y slo si ~ 1/4. Combinando esta observacin con el hecho
de que la m~jor respuesta de j es jugar siempre Ij cuando el resultado
de alguna etapa difiera de (Dl,D2), tenemos que el que los dos jugadores
jueguen la estrategia del disparador es un equilibrio de Nash si y slo si
1/4.
Vamos a ver ahora que este equilibrio de Nash es perfecto en sub.juegos. Para hacerlo, definimos el concepto de estrategia en un juego
repetido, de subjuego en un juego repetido y de equilibrio de Nash perfecto en subjuegos en un juego repetido. Para ilustrar estos conceptos
con ejemplos sencillos de las secciones anteriores, los definiremos para
juegos repetidos tanto finita como infinitamente. En la seccin anterior
definimos el juego repetido finitamente G(T) basado en un juego de etapa
G = {Al,'"
,An; 'ul,' .. ,un), un juego esttico con informain completa
en el que los jugadores 1 a n eligen simultneamente las acciones al a (1."
de los espacios de acciones Al a An respectivamente, y las ganancias son
Ul (al, ... ,an) a Un (al, ... ,O'n)' Definimos ahora el juego anlogo repetido
infinitamente.17
~
Definicin. Dado un juego de etapa G, denominamos G(co,o) al juego repetido

.infinitamente en el que G se repite por siempre y los jugadores tienen el mismo
.0
.1 + ... = 5 + -"-.
1-0
17 Naturalmente se puede definir tambin un juego repetido basado en un juego de etapa
dihInico, En esta seccin limitamos nuestra atencin a juegos de etapa estticos para poder
presentar las ideas principales de. forma sencilla. Las aplicaciones en las secciones 2.3.0 y
2.3.E son juegos repetidos basados en juegos de etapa dinmicos.
Alternativamente, jugarD j proporcionara una gananCiade 4 enit'etapa

y conducira a exactamente lafuis~a eleccirtentre Ijy Dj en lasigtiiente
etapa. Llamemos V al val,or ptesert!e de la sucesin infinIta degahnia's
.
V =5+ 1_
. _
'.
"'.~
~,.~-
;.0
<
,"
92 I JUEGOS DfNMICOS CON INFORMACiN COMPLETA (e. 2)
Juegos repetidos I 93
clor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores del
jllego de etapa son conocidos antes de que empiece la t-sima etapa. La ganancia
de cada jugador en G(co,o) es el valor presente de las ganancias que el jugador
outiene en la sucesin infinita de juegos de etapa.
En cualquier juego (repetido o no), la estrategia de un jugador es un
plan completo de accin, es decir, especifica una accin factible del jugador
en cada contingencia en la que le pudiera corresponder actuar. Dicho de
forma algo ms frvola, si un j~ga_dordejara una estrateg!a a su abogado
anles de que el juego empezase, el abogado podra sustituir al jugador
en el juego, sin necesitar en ningn caso de instrucciones adicionales
sobre cmo jugar. En un juego esttico con informacin completa, por
ejemplo, una estrategia es simplemente una accin. (Por esto describimos
lal juego como G = {S,,,,,Sn;'U,
... ,un} en el capitulo t pero aqu
pu:de describirse tambin como G = {A], ... ,An; U, '" ,un}: en un juego
estallco con informacin 120mpletael ~spacio de estrategias del jugador i,
Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juego
dinmico, una estrategia es ms complicada.
Consideremos el dilema de los presos en dos etapas analizado en la
seccin anterior. Cada jugador acruados veces, de forma que podra
pensarse que una estrategia es simplemente un par d irIstrucciones (b,c),
donde b es la decisin en la primera etapa y e es la decisin en la segunda
elapa. Pero existen cuatro resultados posibles de la pr11leraetapa, (1,1z),
U,Dz),(D1,1 y (D,D, que representan cuatro contingencias diferentes
en las que al jugador l~ podra corresponder actuar. Por tanto, la estrategia
de cada jugador consta de cinco instrucciones, que indicamos mediante
(VW,x,y,z), donde v es la decisin en la primera etapa y w,x,y y zson''!as
decisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (DJz) y
(D,Dz) respectivamente. Usando esta notacin, las instrucciones "jugar b
en la primera etapa y jugar e en la segunda pase lo que pase enla primera"
se describen como (b,c,c,c,c), pero esta notacin tambin puede expresar
estrategias en las que la decisin de la segunda etapa es contingente del
resultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b en
la pnmera etapa y jugar e en la segunda ronda a menos que el resultado
de la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, en
el juego. repetido en dos etapas basado en la figura 2.3.3, la estrategia
de cada Jugador consta de diez instrucciones, una decisin en la primera
etapa y nueve decisiones contingentes en la segunda etapa, una para cada
resultado posible de la primera etapa. Recordemos que al analizar el
juego repetido en dos etapas consideramos una estrategia en la que la

decisin del jugador . en la segunda etapa era contingente del resultado
de la primera etapa: jugar Ci en la primera etapa y jugar li en la segunda
a menos que el resultado de la primera sea (C,Cz), en cuyo caso jugar Di
en la segunda etapa.
En el juego repetido finitamente G(T) o en el repetido infinitamente
G(co/i), la historia de! juego hasta la etapa t es el registro de las decisiones
de los jugadores desde la etapa 1 hasta la t. Los jugadores podran haber escogido (un, ... ,un) en la etapa 1, (un, ... ,unz) en la etapa 2,. .. , y
(Uu ... /lnt) en la etapa t por ejemplo, donde para cada jugador i y etapa
s la accin Uis pertenece al espacio de acciones Ai.
Definicin. En e! juego repetido finitamente G(T) o en el juego' repetido infinitamente G(co,8), la estrategia de un jugador determina la accin que el jugador
realizar en cada etapa para cada posible historia de/juego hasta la etapa anterior.
Pasemos ahora a los subjuegos. Un subjuego es una parte de un juego,
la parte que queda por jugar empezando en cualquier momento en el que
la historia completa del juego hasta entonces sea informacin deI'doIro
pblico entre los jugadores. (Ms adelante en esta seccin damos una
definicin precisa en el caso de los juegos repetidos G(T) y G(co,8);en l(i
seccin 2.4.B damos una definicin precisa para juegos dinmicos con informacin completa en general.) En el dilema de los presos en dos etapas,
por ejemplo, hay cuatro subjuegos que corresponden a los juegos de la
segunda etapa que siguen a los cuatro resultados posibles de la primera
etapa. Del mismo modo, en el juego repetido en dos etapas basado en
la figura 2.3.3, hay nueve subjuegos que corresponden a los nueve resultados posibles en el juego de la primera etapa. En el juego repetido
finita mente G(T) yen el juego repetido infinitamente G(co,8)la definicin
de estrategia est ntimamente ligada a la definicin de subjuego: la estrategia de un jugador determina las acciones que el jugador realizar en
la primera etapa del juego repetido y enla primera etapa de cada uno de
sus subjuegos.
Definicin. En e/juego repetido finitamente G(T), un sllbjllego que empieza en
la etapa t + 1 es e! juego repetido en e! que G se juega T - t veces y que designamos
por G(T - t). Exist~ muchos subjuegos que empiezan en la etapa t + 1, uno para
cada una de las posibles historias de! juego hasta la etapa t. En e! juego repetido
infinitamente G(co,8), cada subjuegoque
empieza en la etapa t + 1 es idntico
liegos "e'e/idos
94 / JUEGOS DINMICOS CON INFOI~MAClN COMPLETA (e. 2)
al juego original G(oo,o). Como en el caso con horizonte finito, existen tantos
subjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias del
juego hasta la etapa t.
Obsrvese que la t-sima etapa de un juego repetido no es por s misma
un subjuego del juego repetido (suponiendo que t < T en el caso finito).
Un subjuego es una parte del juego original que no slo empieza en un
momento en que la historia del juego hasta entonces es informacin del
domino pblico entre todos los jugadores, sino que tambin incluye todas
las decisiones posteriores a ese rnome~toen el juego original. Analizar la
t-sima etapa aisladamente sera equivaierit~a considerar la t-sima etapa
corno la etapa final del juego repetido .. Tal anlisis podra llevarse a cabo
pero no sera relevante para el juego repetido original.
Estamos ahora preparados para la definicin de equilibrio de Nash
perfecto en subjuegos, la cual depende a su vez de la definicin de equilibrio de Nash. Esta ltima no 11acambiado desde el captulo 1, pero ahora
apreciamos la complejidad potencial de la estrategia de un jugador en
un juego dinmico: en cualquier juego, un equilibrio de Nash es una coleccin de estrategias, una para cada jugador, tal que la estrategia de cada
jugador es la mejor respuesta a las estrategias de los dems jugadores.
Definicin. ,(Selten 1965): Un equilibrio de Nash es perfecto en subjuegos
si las estrategias de los jugadores constituyen un equilibrio de Nash en cada
subjuego.
'
,
,
qs
Si el jugador adopta la estrategi~ del disparador p~ra el juego

entonces (i) las estrategias del Jugador en un subluego de la
comp leto ,
1
. era clase son de nuevo la estrategia del disparador, que ya 1e11l0S
nm
Pd strado que es un equilibrio de Nash del juego completo, y (H) la,s
emo
.
1
t
estrategias del jugador en un juego de la segunda clase son slmp eme:1.e
repetir en lo sucesivo el equilibrio del juego de etapa (1,1z), que e: ~a,~blen
un equilibrio de Nash del juego completo. Por tanto, un eqmhbllo. de
Nash en las estrategias del disparador del dilema de los presos repetido
(Dl,Dz).
infinitamente es perfecto en subjuegos.

Ganancia al jugador 2
(0,5)
(5,0)
Ganancia al
jugador 1
Figura 2.3.7
'
El equilibrio de Nash perfecto en subjuegos es un refinamiento del

equilibrio deNash. Es decir, para ser perfecto en subjuegos, las estrategias
de los jugadores deben ser primero un equilibrio de Nash y pasar luego
una prueba adicionaL
Para demostrar que el equilibrio de Nash en las estrategias del disparador deLdilema de los presos repetido infinitamente es perfecto en
subjuegos, debernos demostra'r que las estrategias del disparador constituyen un equilibrio de Nash en cada subjuego de este juego repetido
infinitamente. Recordemos que cada subjuego de un juego repetido infinitamente es idntico al juego completo. En el equilibrio de Nash en las
estrategias del disparador del dilema de los presos repetido infinitamente,
estos subjuegos pueden agruparse en dos clases: (i) subjuegos en los que
todos los resultados de las etapas anteriores han sido (D,D2), y (ii) subjuegos en los que el resultado de al menos una etapa anterior difiere de
Aplicamos seguidamente argumentos anlogos al juego repet.do infi'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman
(1971) para juegos repetidos infinitamente. Para enunciar' el teorema, necesitarnos dos ltimas definiciones. Primero, llamamos factIbles a las ga. (Xl,"" x n ) en ell'uego de etapa G si son una combinacin
convexa
nanCIas
.
(es decir, una media ponderada donde las ponderaciones son no-negativas
y suman uno) de las ganancias a las estrategias puras de. G. El conju.llto
de ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es la
regin sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras
(1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los
, ) para 1 < .,x < 4 que resultan de las medias ponderadas de (1,
pares (X,X
1) Y (4, 4), Y los pares (y,z) para y + z = 5 Y O < Y < 5, que resl1.ltan.de
las medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenor
de) la regin sombreada de la figura 2.3.7 son medIas ponderadas de las
96 / JUEGOS DfNMICOS CON INFORMACIN COMPLETA (e. 2)
ganancias de ms de dos estrategias puras. Para conseguir una media

ponderada de las ganancias de estrategias puras, los jugadores podran
ulilizar un mecanismo aleatorio pblico: jugando U],D2) o (D],h) dependiendo del lanzamiento de una moneda (no trucada), por ejemplo,
consiguen ganancias esperadas de (2,5,2,5).
La segunda definicin que necesitamos para poder enunciar el teorema de Friedman es un reajuste de las ganancias a los jugadores: Continuamos definiendo las ganancias de cada jugador en el juego repetido
infinitamente G(oo,ti) como el valor presente de la sucesin infinita de
ganancias del jugador en el juego de etapa, pero es ms conveniente expresar este v.alor en trminos de la ganancia media de la'misma sucesin
infinita de juegos de etapa, la ganancia que se tendra que recibir en cada
etapa de forma que resultara en el mismo valor presente. Sea 8 el factor de
descuento. Supongamos que la sucesin infinita de ganancias 7f'1f2,1f3, ...
tiene un valor presente de V. Si se recibiese una ganancia 7f en cada etapa,
el valor presente sera 1fjO - 8). Para que, 1f sea la ganancia media de
la sucesin infinita 7f1,1f2,7f3, ... con un factor de descuento 8, estos dos
valores presentes han de ser iguales, por tanto 1f = VO - 8). Es decir, la
ganancia media es O - 8) veces elv~lOr presente:
Definicin. Dado el factor de descuento 8, la ganancia
infinita de ganancias 1f],1f2,1f3,' .. es
media de la sucesin
00
O -
8)
8t-]7ft._
t=1
La ventaja de la ganancia media con respecto del valor presente es que

el primero es directamente comparable con las ganancias del juego de
etapa. En el dilema de los presos de la figura 2.3.6, por ejemplo, ambos
jugadores podran recibir una ganancia de 4 en cada periodo. Tal sucesin
infinita 0e ganancias tiene una ganancia media de 4 pero un valor presente
de .4/0 - 8). Sin embargo, como la ganancia media no esms que un
reajuste del valor presente, maximizar la ganancia media es equivalente a
maximizar el valor presente.
Estamos finalmente preparados para enunciar el resultado principal
en nuestra discusin sobre juegos repetidos infinitamente.
leorema. (Friedman 1971): Sea G un juego finito, esttic~y con informacin
completa. Denominemos (e], ... ,en) a las ganancias en un equilibrio de Nash de
G, y (x 1, ... ,xn) a otras ganancias factibles cualesquiera de G. Si Xi > ei para
cada jugador ' y si (j est lo suficientemente cerca de uno, existe UI1 equilibrio de
Nash perfecto en subjuegos del juego repetido infinitamente G(oo,ti) que alcanza
(X], ... ,xn) como ganancia media.
'
Pago al jugador 2
(0,5)
(.
(5,0)
Ganancia-al
jugador 1
Figura 2.3.8
La demostracin de este teorema repite los argumentos ya dados para
el dilema de los presos repetido infinitamente, de forma que la relegamos
al apndice, Es conceptualmente inmediato pero algo complicado de notacin extender el teorema a los juegos de etapa de buen comportamiento
que'~~ ~~~ni,finitosni ~iticos (veremos algunos ejemplos ~n las apli7
caciones d las tres prximas secciones). En el contexto del dilema de
lo~p~sos de la fisuril 2.3.6.- el teorema de Friedman garantiza que puede
alcanzarse cualquier punto en la regin ms oscura de la figura 2.3.8como
ganancia media en Un equilibrio de Nash perfecto en subjuegos del juego
rep~tido, siempre y cuando el factor de descuento est lo suficientemente
cerca de uno.
, Concluimos esta seccin esbozando dos derivaciones adicionales de la
teora de juegos repetidos infinitamente, que se complican al aadrseles
la siguiente caracterstica especial del dilema de los presos. En el dilema
de los presos (de una etapa) de la figura 2.3.6, el jugador i puede estar
seguro de recibir,como mnimo la ganancia de 1 del equilibrio de Nash,
jugando 1;. En un juego de duopolio de Cournot de una etapa (como
el descrito en la seccin 1.2.A), por el contrario, una empresa no puede
estar segura de obtener los beneficios del equilibrio de Nash produciendo
,, .:.
<,'
, .~t~;
'b:
~t::
98 I
JUEGOS DlNMIICOS
CON INFORMACIN
la cantidad del equilibrio de Nash; ms bien, el nico beneficio que una

empresa puede estar segura de recibir es cero, produciendo cero, Dado
un juego de etapa arbitario G, denotamos con Ti la ganancia de reserva del
jugador ' -la ganancia ms alta que el jugador ' puede estar seguro de
recibir, hagan lo que hagan el resto de los jugadores, Debe ser el caso que
Ti :::; ei (donde e es la ganancia del jugador ' en el equilibrio de Nash
utilizado en el teorema de Friedman), ya que si Ti fuera mayor que e no
sera la mejor respuesta del jugador ' jugar su estrategia dl:iJ equilibrio de
Nash, En el dilema de los presos, Ti = ei, pero en el juego del duopolio de
Co1irnot (y tpicamente), Ti < ei. "
'-"")': .
Fudenberg yMaskin (1986) demuestt~Il,qyeenjuegos con dos Jugado~
res, las ganancias de reserva (Tl,T2)'pi.led~~rerripla'zaia las gananCias de
equilibrio (q,'en el enunciado del teterna.deFriedman.
Es decir, si
(Xl,X2)
es una ganancia factible deO, C011Xi' > Ti para cada ', para 5 lo
suficIentemente cerca de uno, existe un equilibrio de Nash perfecto en
subjuegos de 0(00,5) que al~ania (Xl,X2) como ganancia media, incluso si
Xi < ei para alguno de los jugadores, En juegos con ms de dos jugadores,
Fudenberg y Maskin ofrecen una condicin dbil bajo la cual las ganancias
de reserva (TI," "Tn) pueden reemplazar a I",sganancias de equilibrio en
el enunciado del teorema.
,',
... ,-,'
. "
'
Juegos
COMPLETA (e. 2)
Tambin tiene inters la siguiente pregunta complementaria: qu

ganancias medias pueden alcanzarsetoh un equilibrio de Nash perfecto
en subjuegos cuando el factor de descunto no est 10 "suficientemente
cerca de Uno"? Una manera de abordar esta cuestin es considerar un
valor fijode5 y determinar las gnaitcis medias que pueden alcanzarse
si los jugadores usan las estrategias del dsparador qu se desplazan para
siempre al equilibrio'de Nashdel juego de'etapa despuS de cualquier
desviacin. Valores menores de 5 hacen queuna penalizacin que empiece
en el prximo periodo sea menos efectiva para evitar una desviacin en
este periodo ..'No obstante;ls jugadores pueden tlpicamernte hacer algo
mejor que simplemente jugar un equilibrio de Nash del juego de etapa.
Un segundo enfoque, iniciado por Abreu (1988), se basa en la idea de
que la forma ms: efectiva de evitar que jm jugador- se desVe de una
estrategia propuesta es amenazarlo con administrar la penalizacin creble
ms dura en el caso que se desVe (es decir, amenazar con responder a
una desviacin jugando el equilIbrio de Nash perfecto en subjuegos del
juego repetido infinitamente que proporciona la ganancia menor entre
todos esos equilibrios al jugador que se desva). En la mayora de juegos,
desplazarse para siempre al equilibrio de Nsh del juego de etapa no es
I'qJef
idos I 99
, 'o'n creble ms fuerte' por tanto, utilizando el enfoque de

la pena 1IzaCI
' ",
'.,
a!1Zarse ganancias medIas que no podnan alcanzill se
Abreu pue den alc
'
,
'l'
do el enfoque de la estrategia del disparador. En el ddema de
utl Izan
"
,
.
. os SI'n embargo el equilibrio de Nash del Juego de etapa genera
los pies ,
'
cias de reserva (esto es, ei = T;) tales que los dos enfoques son
unas g anan
, ,
equivalentes, En la prxima seccin damos ejemplos de los dos enfoques.
Apndice
ste
apndice demostramos el teorema de Friedman, Sea (ael,'"
,o'e,,)
Ene
d
'l'b'
el equilibrio de Nash de G que proporciona las ganancias e equJ 1 no
(el,-'"' e)TI. Del mismo modo, sea (0.",1,' .. ,0,,,,,,) la coleccin de acciones
que proporciona las ganancias factibles,(xl, ... ,xn), ,(La:U~a ~o.tacin es
slo indicativa porque ignora el mecamsmo aleatono publIco l1plCamente
necesario para alcanzar cualquier ganancia factible.) Consideremos la
siguiente estrategia del disparador en el caso del jugador ':
Jugar axi en la primera etapa. En la t-sima etapa, si
el resultado de todas las t - 1 etapas anteriores ha sido
(O.xl" .. ,0.",,,) jugar an; en caso contrario jugar o.ei'
Si ambos jugadores adoptan esta estrategia, el resultado en cada etar,J1
del
juego repetido infinitamente ser (0,,,,1,' .. ,0,,,,,,). Argu~1entaJllOs pnmero
que si ti est lo suficientemente cerca de uno, el que lo~Jugadores ~d()pten
esta estrategia constituye un equilibrio de Nash del Jueg~ re~eltdo, Argumentamos a continuacin que esta estrategia es un equillbno de Nash
perfecto en subjuegos.
,
'
Supongamos que todos los jugadores excepto el J~g~dor ,han, adoptado la estrategia del disparador. Dado que los demas Jugaran Stempl.e
(o.el,'" ,o.e i-l,ae i+l, ... ,aen) siempre si el resultado de alguna etapa dIfiere de (a~l,' .. ,~xn), la mejor respuesta del jugador ' esjugar siempre (J'e;
si el resultado en alguna ronda difiere de (a"l,' .. ,o.xn)' Queda por determinar la mejor respuesta del jugador ' en la primera ronda yen cualquier
etapa en la que todos los resultados anteriores hayan sido (a",l, . ' . ,().",,,),
Sea adi la mejor desviacin de (0.",1, ... ,0.",") que puede adoptar el jugador
'.
Esto es,
adi
es una solucin de
max lLi(o.xl, - -'
,o,x,i_l,ai,o..T:i+l,'"
,o.xn).
a,EA,
Sea
di
la ganancia a -i con esta desviacin:
di = v,;(axl,'
, . ,o,,,,,i-l ,0.di,0'x,;+1
100/
JUECOS DINMICOS CON INFORMACIN
COMPLETA (e. 2)
(Ignoramos de nuevo el papel del'

.
. . 'i - . "
mecamsmo aleatorlO'la meJOIl eSVlaClOny su
",
~
.
ganancIa puellen depender de que' estr t .
hay
l .
d
a egIa pura
a se eCClOna el mecanismo aleatorio)
.,...
"/L(a.
a.
.
lenemos que di ?: x.; =
.. , el",.,.,).
.eL ... , x '-1

I
a XlI. a X'l+
. 1I
...
a)xn
>
e,
Ui
((le]"
...
,aen).
Jugar adi proporcionar una ganancia de di en esta etapa pe d

cadena (ael,' .. ,a.
a.
.
ro esen.
e,,-I, e,-.+L ... ,ae.,.,)en lo sucesIvo por parte de los d
'
Jugadores, ante lo cual la mejor respuesta del J' d'
emas
l'
uga or z es ae;, de forma
que a,gadnanClaen. cada etapa futura ser e'i. El valor presente de esta
SuceSlOn e gananCIas es
(dado que los dems jugadores han adoptado la estrategia del disparador)
es axi si y slo si { ?: (di - xi)/(di - ei).
Combinando esta observacin con el hecho de que la mejor respuesta
de 'i es jugar aei para siempre si el resultado de alguna etapa difiere de
(axIJ' .. ,axn), conc'uimos que jugar la estrategia del disparador por parte
de todos los jugadores es un equilibrio de Nash si y slo si
,
u
?: max
1
d".,+ u . e.,' + u,2 . e. +
'
= d., + 1 _o oei.
'"
(Dad~ ~ue cualquier desviacin desencadena la mismarespuest. d 1

demas Jugad
1"
d
. '.'
,
a e os
.
ores, a umca esviacin que necesitamos considerar es la '
ventaJosa) Alt
ti
.'
mas
"
.
ema vamente, Jugar axi proporcionar una ganancia de x.
en esta et~pa y conducir a exactamente la misma eleccin entre a.
a'
sIguIente ronda. Lla~emos con Vi al valor presente d~ las ga::~ci:~
(e Juego de etapa que el Jugador i recibe por elegir ptimament (h
Ycada vez
t
.
e a ora
que enga que hacerlo en lo sucesivo). Si J'ugar a . es o' ti'
entonces
" X>
P mo,
,~I:/~
o V,-,- x
,/0
,) S"1Jugar
u.
adi
Vi = Xi + oVi,
es. ptimo, entonces
Vi
= di
+ --e.
1-0'"
como obtuvimos p'

(
.
rio no est co 1 ~eVl~ment~. Supongamos que el mecanismo aleato'
. rre aClOna o senalmente. Es suficiente entonces que d. sea
la ganancIa mayor a la
. d
. ., d
'
.
'.
. meJor. eSVlaClOn el jugador i entre las difere _
:~:a~:~:;n~clOnes de es~at~gias puras seleccionadas por el mecanismno
. n consecuencIa, Jugar axi es ptimo si y slo si
{
Xi
-->d+-1 - { - " 1 _
o e,,,.
o>
d; -
Xi
di -
ei'
Por tanto, en la pri..

'
.
.
.
m.ra etapa, y en cualqwer etapa tal que todos los resultal:los antenores hayan 'd (
'"
, .
.
SI o ax] .... ,ax.,.,), la declslOn ophma del jugador i
d,; - Xi
-d--'
i - ei
Como di ?: Xi > ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i,
de foim que eI~valormximo de esta fraccin para cualquier jugador sea
tambin estrictamente menor que 1.
Queda por demostrar que este equilibrio de Nash es perfecto en subjuegos. Es deCir,'que las estrategias del disparador deben constituir un
equilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cada
subjuegode 0(00,0) idntico al propio G(oo,o). En el equilibrio de Nash
con estrategias del disparador estos subjuegos pueden agruparse en dos
clases: (i) subjuegos en los que los resultados de las etapas anteriores han
sido (axl, .. -: ;a~n), y (ji) subjuegos'en los
el resultado de al menoS.ri{
etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'del
disparador en el juego completo, (i) las estrategias'd los jugadores riun'
subjuego de la primera etapa son de nuevo las estrategias del disparador
que, tal como acabamos de demostrar, constituyen un equilibrio de Nash
del juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle .
la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiieg
de etapa (ael,' .. ,aen), lo que tambin es un equilibrio de Nash d~l jrieg;;~"
completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Parador
del juego repetido infinitamente es perfecto en subjuegOs.
es
qu
':,.,
....... '
':.."
2.3.C Colusin entre duopolistas de Coumot

Friedman (971) fue el primero en demostrar que podria alcanzarse la
cooperacin en un juego repetido infinitamente utilizando estrategias que
consistieran en elegir para siempre el equilibrio de Nash del juego de etapa
despus de cualquier desviacin. Originalinente se aplic a los casos de
colusin en un oligopolio de Cmimot, del siguiente modo:
Recordemos el juego deCoumot esttico de la seccin 1.2.A: Si la
cantidad agregada es Q =; ql + q2, el precio de equilibrio es P(Q) = a - Q,
suponiendo que Q < a. Cada empresa tiene un,coste marginal e y no tiene
--------
COMPLETA (c. 2)
Jllegos repel idos / 103
costes fijos. Las empresas escogen sus cantidades simultneamente, En el

nico equilibrio de Nash, cada empresa produce una cantidad (a - c)/3;
a la que llamaremos la cantidad de Cournot y,denotaremos por qc. Dado
que en equilibrio la cantidad agregada, 2(0. - e)/3 es mayor que la cantidad
de monopolio, qm == (a- c)/2, ambas empresas estaran mejor si cada una
produjera la mitad de la cantidad de monopolio, q = qm/2.
"
",',
Consideremos el juego repetido infinitamente basado en este juego

de etapa de Cournot, cuando las dos empresas tienen el mismo factor de
descuento 6. Calculemos ahora los valores de 6 para los <fue,cuando las
dos empresas juegan la siguiente estrategia;. llegamos aun equilibrio de '
Nash perfecto en subjuegos de este juego repetido infinitamente:
'
Prog,!ciT la mitad de la cantidad de monopolio, q;'/2, ~n
e! primer periodo. En el t-sim,o perido~producir qm/"Z
SI ambas empresas han producido qm/2 en cada uno d~
los t- 1 periodos anteriores; en caso ntnirio producir,
la cantidad de Cournot, qc.
,
Puesto,qu~ e,!argumento e~ paralelo al dado para eldilem~de los pres;s
de la seccin anterior, seremos breves en la discusin.
'"
El beneficio qu~ obtiene ~na e~presa cua~doambas producenqm/2 es
c)2/8,.que denotaremos por 1r m/2. ~l beneficio deuna empresa cuando
ambas producen qc es (a - c)2/9, que denotaremos por 11"c. Finalmente, si
la empresa i vaa producir qm/2 en este periodo, la cantidad que maximiza
los beneficios de la empresa j en este periodo es uria sohicin de
'
(a -
max
qj
(a -
q'
La solucin es qj = 3(0. - c)/8, con un beneficio de 9(0. - c)2/64, que

denotamo~ mediante 11"d ("d" por desviacin). ' Por tanto, que las dos!
empresas Jueguen la estrategia del disparador expuesta anteriormente es
un equilibrio de N ash siempre que
' ,
116
1- 6 ' 2"11"m
',':.'
:::
7rd
+ 1 _ 6 . 11"c,
Producir q*
producir q*
uno de los
producir la
en el primer periodo. En el t-simo periodo,

si ambas empresas han producido q* en cada
t ~,1 periodos anteriores; en caso contrario,
cantidad de Coumot, k
El beneficio de una empresa si ambas juegan q* es (a - 2q* - c)q*, que

denotaremos mediante 11"*. Si la empresa i va a producir q* en este periodo,
la cantidad que maximiza los beneficios de la empresa j en este periodo
es una solucin de
_.
max (a, -
qj - q* - c)qj.
qj
La solucin es qj = (a. - q* - e)/2, con un beneficio de (a - q* - c)2/4, que

de nuevo denotamos por 11" d. Que las dos empresas jueguen las estrategias
del disparador dadas anteriormente es un eql,tilibriode Nash siempr que
_l,q
~ c)q,
2'
m
Tambin podemos preguntarnos qu pueden conseguir las empresas si

6< 9/17. Exploraremos los dos enfoques descritos en la seccin ante.rior.
Determinamos en primer lugar, para un valor dado de , la cantIdad
ms rentable que las empresas pueden producir si ambas siguen una
~ trategia del disparador que transforman para siempre en la cantidad .de
Cournot despus de cualquier desviacin. Sabemos que estas estrategIas
no pueden seguirse con una cantidad tan baja como la mitad ~e la cant~dad
de monopolio, mientras que para cualquier valor de 6, repetIr la cantIdad
de Coumot para siempre es un equilibrio de Nash perfecto en subjuegos.
Por tanto, la cantidad ms rentable que puede darse con las estrategias del
clispradoresfentre q;,{/2 y qc. Para calcular esta cantidad, consideramos
la estrategia del disparador siguiente:
'(2.3.2)
anloga a (2.3.1)en el anlisis del dilema de los pr~~9S; S~stitu~e~do los

valores de11"m, -rrd y 11"cen (2.3.2)obtenemos que 6::: 9/1'1. Poi-as mi;mas
razones que en la seccin anterior, este equilibrio d~ Nash es perfecto en
subjuegos.
"..,'
' "
1
1-8
--
'11"*
>
-
7rd
8
1-6
+ --'
7rc,
Despejando q* en la ecuacin de segundo grado resultante se obtiene que

el valor menor de q* para el que las estrategias del disparador dadas
ant~riormente son un equilibrio de Nash perfecto en subjuegos es
9 - 56
q* = 3(9 _ ) (a - e),
que decrece montonamente con , tiende a qm/2 cuando tiende a 9/17

y tiende a qc cuando 6 tiende a cero.
10'1.1 JUEGOS DINMICOS CON INFORMACIN
J !legos repetidos /
COMPLETA (c. 2)
105
Exploramos ahora el segundo enfoque, que incluye la amenaza de

hacer efectiva la penalizacin ms fuerte creble. Abreu (1986) aplica esta
Idea a unos modelos de Cournot ms generales que el nuestro, utilizando
un factor de descuento arbitrario; nosotros simplemel1te demostramos
que el enfoque de Abreu permite que en nuestro modelo se obtenga el
resultado de monopolio cuando f = 1/2 (que es menor que 9/17). Consideremos la siguiente estrategia del "palo y la zanahoria"):
perfecto en subjuegos, esta estrategia debe ser un equilibrio de Nash en

cada clase de subjuegos. En los subjuegos de colusin, cada empresa
debe preferir recibir la mitad del beneficio de monopolio en lo sucesivo a
recibir 7f d este periodo y el valor presente por penalizacin en el periodo
Producir la mitad de la cantidad de monopolio, qm/2, en

el primer periodo. En el t-simo periodo, producir qm/2
si ambas empresas produjeron qm/2 en el periodo t - 1,
qm/2 si ambas empresas produjeron x en el periodo t - 1,
Y x en cualquier otro caso.
En los subjuegos de penalizacin, cada empresa debe preferir administrar

el castigo a recibir 71" dp este periodo y empezar de nuevo la penalizacin
en el siguiente periodo:
Esta estrategia incluye una fase de penalizacin (de un periodo) en la que

la empresa produce x y una fase de colusin (potencialmerite infinita) en la
que la empresa produce qm/2. Si cualquiera de las dos empresas se desva
de la fase de colusin, empieza la fase de penalizacin. Si cualquiera de las
d~)sempresas se desva de la fase de penalizacin, sta vuelve a empezar.
SInmguna empresa se desva de la fase de penalizacin, empieza de nuevo
la fase de colusin.
El beneficio de una empresa si ambas producen x es (a - 2x - e)x, que
denotaremos mediante 7f(x). Sea V(x) el valor presente de recibir 7f(x) en
este periodo y la mitad del beneficio de monopolio en 16 sucesivo:
V(x)
= 7f(x) + --
. -7f
2
m.
Si la empresa 'i va a producir x en este periodo, la cantidad que maximiza

el beneficio de la empresa j este periodo es la solcin de
max
siguiente:
--
1-5
V(x)
Sustituyendo
V(x)
(2.3.3)
> 7rd + 8V(x).
. -7r
m_
(2.3.4)
?: 7r dp(X) + 5V(x).
en (2.3.3) obtenemos
5 G7rm
-7r(X)
?: 7rd -
~7fm.
Es decir, lo que se gana en este periodo por desviarse no debe ser mayor
que el valor descontado de la prdida en el periodo siguiente debida a
la penalizacin. (Siempre y cuando ninguna de las empresas .se desvi
de la fase de penalizacin, no hay ninguna prdida a parlii dl si~ente
periodo, ya que la fase de penalizacin termina y las empresas velven
al resultado de monopolio, como si no hubiera habido desviacin.) Dl
mismo modo, (2.3.4) puede reescribirse como
.
1-
-":
(a - qj - x - e)qj.
qj
Esta solucin es qj = (a - x - e)/2, con un beneficio de (a - x - c)2/4, que

deno~amos por 7r dp(X), donde dp significa desviarse de la penalizacin.
SI arr:ba.s .empresas juegan esta estrategia, los subjuegos del juego
repet~~o mfulltamente pueden agruparse en dos clases: (i) subjuegos de
coluslon:.en los que el resultado del periodo anterior fue (qm/2,qm/2) o
(x,x),y (n) subjuegos de penalizacin, en los que el resultado del periodo
~ntenor no fue ni (qm/2,qm/2) ni (x,x). Para que el que las dos empresas
jueguen la estrategia del palo y la zanahoria sea un equilibrio de Nash
5 G7fm
7r(x)
?: 7rdP
~ 7f(x?::
con una interpretacin anloga. Para 5 = 1/2, (2.3.3)se cumple simp~e y

cuando x/(a - e) no est entre 1/8 y3/8, Y (2.3.4)se'C{unplesix/(a - e)
est entre 3/10 y 1/2. Por tanto, pa~a 5 = 1/2, la,estrafgia del palo y la
zanahoria consigue que el resultado de mO1.<)polio"
sea un equilibrio de
Nash perfecto en subjuegos, siempre y cuando 3/Ss x/(a - e) S 1/2.
Existen otros muchos modelos de oligopolio dinmico que enriquecen
el modelo simple desarrollado aqu. Concluirns esta seccin discutiendo
brevemente dos clases de estos modelos: los modelos con variables de estado y los modelos con supervisin imperfecta. Las dos clases de modelos
tienen muchas aplicaciones que trascienden el mbito del oligopolio;por
ejemplo, el modelo de salaribs de eficiencia de la prxima seccin es un
caso de supervisin imperfecta. ','
..
',
106 / JuEGOS DINMICOS CON INFORMAcrN
COMPLETA (c. 2)
Rotemberg y Saloner (1986 y ejercicio 2.14) estudian la colusin en el

ciclo econmico, permitiendo que la interseccin con el eje de abci~as de
la funcin de demanda flucte aleatoriamente de un periodo al otro. En
cada periodo, todas las empresas observan la interseccin con el eje de abcisas de la funcin de demanda en ese periodo antes de tornar decisiones;
en otras aplicaciones,los jugadores observan otras variables de estado
al principio de cada periodo. El incentivo a desviarse de una estrategia
pactada depende tanto del valor de la demanda en este periodo corno
de los posibles valores de la demanda en periodos futuros. (Rotemberg
y Salonersuponen que la demanda no est correlacionada serialmente
de forma que esta ltima consideracin ,es independiente del valor pre~
sente de la demanda, pero otros autores posteriormente han relajado este
supuesto.)
Green y Porter (1984) estudian la colusin cuando las desviaciones
no se pueden detectar perfectamente: en vez de observar las cantidades
escogi~~s ~or la otra empresa, cada empresa observa tan slo el precio
de eqwlibno del mercado, que cada periodo recibe sacudidas debidas a
una perturbacin aleatoria inobservable. En este contexto, las empresas
no puede,n distinguir cundo un precio de equilibrio bajo se debe a que
una ~ ,mas empresas se han desviado de la estrategia pactada o a que
oc:un0 una perturbacin adversa. Green y Porter examinan los equilibnos con estrategias del disparador tales que c~alquier precio por debajo
de un nivel crtico dispara un periodo de penalizacin durante el cual
las empresas juegan sus cantidades de Coumot. En equilibrio, ninguna
empresa se desva. No obstante, una perturbacin especialmente mala
puede hacer que el precio caiga por debajo del nivel crtico, desencadena~do un periodo de penalizacin. Como algunas penalizaciones ocurren
acc,l~~ntalrnente, las penalizaciones infinitas del, tipo considerado en el
anahSls de las estrategias del disparador no son ptimas. Estrategias de
dos ~ases del tipo ,analizado por, Abreu podran parecer prometedoras;
efec?v~mente, Abreu, Pearce y Stacchetti (1986) demuestran que pueden
ser optimas.
2.3.D Salarios de eficiencia
En los modelos de salariOs de eficiencia, lo que producen los trabajadores
de una empresa depende del salario que la empresa paga. En el contexto. de lo: pases en vas de desarrollo, esto se explicara porque unos
salan os mas altos podran conducir a una mejor nutricin; en los pases
Jllegos
repel ido< / 107
W10S salarios ms altos podran inducir a que los trilbajadodesarro 11ildos ,

,
. .
.' preparados solicitasen empleo en la empresa que los ofrecIelil,
res mejor
.
,.
o podran inducir a los trabajadores ya empleados a trabajar mas mtensa-
mente.
Shapiro y Stiglitz (1984) desarrollan un mo.delo ~inmico en el q.ue
l empresas inducen a los trabajadores a trabajar mas pagando salanos
:r:os y amenazando con despedir a los que sean descubiertos trabajando
poco. Como consecuencia de estos salarios altos, las empresas reducen su
demanda de trabajo, de forma que a1g1.mostrabajadores tendrn empleo
n salarios altos mientras que otros estarn (involuntariamente) parados.
ca
d
,.
1
Cuanto mayor sea el nmero de trabajadores para os, mas tIempo e
llevar a un trabajador que haya sido despedido encontrar un nuevo
empleo, de forma que la amenaza de despido resulta ms. efectiva. En
el equilibrio competitivo, el salario 'w y la tasa de paro 1J, mduc.en a los
trabajadores a esforzarse, de tal forma que la demanda de trabajO de las
empresas al salario lJ) hace que la tasa de desempleo ~ea exactamente 'U,.
Vamos a estudiar los aspectos de este modelo que tienen que ver co~
los juegos repetidos (pero ignoraremos los relacionados co~ el equilibriq'
competitivo) analizando el caso de una empresa y un trabajador.
, Consideremos el siguiente juego de etapa. En primer lugar, la empresa
ofrece al trabajador unsalario,vJ. En segundo lugar, el trabajador a.ceptao
rechaza la oferta de la empresa. Si el trabajador rechaza w, se conVIerte en
un trabajador independiente con un salario Wo. Si el trabajador acepta UI,
escoge entre realizar un esfuerzo (lo que le produce una desutilidad e~o no
(lo que no le produce desutilidad). La decisin tornada por el traba~ador
sobre su esfuerzo no es observada por la empresa, pero lo que el traba)'Jdor
produce es observado tanto por la empresa como por el.!!abajador. La
produccin puede ser alta o baja; para simplificar, suponemos que el
nivel bajo de produccin es cero y escribimos, eLnivel~1to como y > O.
Supongamos que si el trabajador realiza un esfuerzo, la produccin es ~J,ta
con probabilidad 1, pero que si el trabajador no se esfuerza, la producClon
es alta con probabilidad p y baja con probabilidad 1 - p. Por tanto, en
este modelo, un nivel bajo de produccin es signo inequvoco de falta de
esfuerzo.
.tI
Si la empresa emplea al trabajador con un salario w, las gananciils a
lbs jugado~es si el trabajador realiza un esfuerzo ~ la pro~uccin e: alta
son y - w para la empresa y w -'- e para el trabajador. SI el trabaJildor
no se esfuerza, e es cero; si la produccin es baja, y es cero. Suponemos
que y - e > lIJO> py, de forma que al trabajador le resulta eficiente estilr
Jllegos repetidos / 109
108/ JUEGOSDINMICOS CON INFOI~lyIACINCOMPLETA (c. 2)
empleado en la empresa y realizar un esfuerzo, aunque tambin le resulta

m~jor ponerse de independiente a estar empleado en la empresa y no
estorzarse.
El resultado perfecto en subjuegos de este juego de etapa es ms
bien poco prometedor: dado que la empresa pagaw por adelantado, el
trabajador no tiene ningn incentivo para esforzarse, de forma que la
empresa ofrece w = O(o cualquier w ~ 'Wo) y el trabajador escoge trabajar
como independiente. Sin embargo, en el juego repetido infinitamente, la
empresa puede inducir un esfuerzo pagando un salario wsuprior a Wo y
amenazando con despedir al trabajador en cuanto la produccin sea baja.
Demostramos que para algunos valores de los parmetros, la empresa
encuentra que vale la pena inducir un esfuerzo pagando ese salario.
Uno podra preguntarse por qu la empresa y el trabajador no pueden
firmar un contrato c-6mpensatorio que dependa de la produccin, deforma
que induzca al esfuerzo. Una razn por la que estos contratos podran
no ser viables es que a un tribunal le resulta muy dificil. hacer que se
cumplan, quizs porque una medida adecuada de la produccin incluye
la calidad, las dificultades inesperadas en las condiciones de produccin,
etc. De un-aforr1.ams general, es probable que loscontf?tos contingen~
tes a determinadOs vol.menes de produccin sean imperfectos (ms que
completamente inviables), aunque los incentivos todava pueden jugar un
papel en el juego repetido estudiado aqu.
Consideremos las siguientes estrategias en el juego r~petido infinitamente, que incluyen el salario 'W. >wo que se determinar ms adelante.
Diremos que la historia del juego es de salari lto y prod~c2in alta si todas
las ofertas anteriores han sido 'W., todas las ofertas anteriores han sido
aceptadas y todos los niveles de produccin anteriores han sido altos. La
estrategia de la empresa es ofrecer w = 'W. en el primer periOdo, y ofrecer
w = 'W. en cada periodo siguiente siempre y cuando la historia del juego
sea de salario alto, produccin alta, pero ofrecer w = Oen caso contrario.
La estrategia del trabajador es aceptar la oferta de la empresa si w ~_ Wo
(decidiendo trabajar como independiente en caso contrario) y realizar un
esfuerzo si la historia del juego, incluyendo la oferta presente, es de salario
alto y produccin alta (no esforzndose en caso contrario).
La ~trategia de la empresa es anloga a las estrategias del disparador analIzadas en las dos secciones anteriores: jugar cooperativamente
siempre y cuando todas las jugadas anteriores hayan sido cooperativas,
pero escoger en lo sucesivo el resultado perfecto en subjuegos del juego
de etapa si alguna vez se rompe la cooperacin. La estrategia del jugador
es tambin anloga a estas estrategias del disparador, pero es ligeramente

ms sutil ya que el trabajador decide en segundo lugar en el juego de etapa
de decisin sucesiva. En un juego repetido basado en un juego de etapa de
decisin simultnea, las desviaciones se detectan slo al final de la ronda;
sin embargo, cuando el juego de etapa es de decisin sucesiva, una desviacin del primer jugador se detecta (y debera ser contestada) durante
la misma ronda. La estrategia del trabajador es jugar cooperativamente
siempre y cuando todas las jugadas anteriores hayan sido cooperativas,
pero responder de forma ptima a cualquier desviacin de la empresa,
sabiendo que el resultado perfecto en subjuegos del juego de etapa se
jugar en todas las etapas futuras. En particular, si w 1- w. pero w ~ wo,
el trabajador acepta la oferta de la empresa pero no se esfuerza.
Derivamos ahora las cond,iciones bajo las cuales estas estrategias son
un equilibrio de Nash perfecto en subjuegos. Como en las dos secciones
anteriOres, el argumento consta de dos partes: (i) la derivacin de las
condiciones bajo las cuales estas estrategias son un equilibrio de Nash, y
() la demostracin de que es perfecto en subjuegos.
Supongamos que la empresa ofrece w. en el primer periodo. Dada
la estrategia de la empresa, es ptimo para el trabajador aceptar. Si el
trabajador realiza un esfuerzo, est seguro que producir al nivel alto,
de forma que la empresa volver a ofrecer w' yel trabajador volver a
enfrentarse en el periodo siguiente a la misma decisin sobre el esfuerzo
a realizar. Por tanto, si la decisin ptima dl trabajador es esforzarse, el
valor presente de las ganancias del trabajador es
Y.: = (w' -
e)
+ 8y':,
o V. = (w' - e)/O - 8). Sin embargo, si el trabajador no se esfuerza,

producir al nivel alto con probabilidad p, en cuyo caso la misma decisin
con respecto al esfuerzo se dar en el prximo periodo, pero el trabajador
producir el nivel bajo con probabilidad 1- p,en cuyo caso la empresa
ofrecer w = O en lo sucesivo, de forma que en adelante el trabajador
ser independiente. Por tanto, si no esforzarse es la decisin ptima del
trabajador, el valor presente (esperado) de las ganancias del trabajador es
V. = w' + {j { pV.+ O
o V. = [0- 8)'W' + {jO - p)71Jo]/(l ptimo para el trabajador si Ve ~ V.,
{jp)O
O
-p\. wa_ }
{j'
8). Realizar un esfuerzo es
'\."
w
.
',1'
1-
2: Wo + '(1
(j
p{j
)e
p .
Juegos repelidos /
COMPLETA (c. 2)
(1 -
+ 1 + ---
== Wo
(j
[jO - p)
(2.3.5)
Por tanto, para inducir un esfuerzo, la empresa debe pagar no slo Wo + e

para compensar al trabajador por renunciar a la oportunidad de trabajar
como independiente y por la desutilidaddel esfuerzo, sino tambin por
la prima salarial O - {j)e/ [jO - p):NaturaImente, si p est cerca de uno (es
decir, si no esforzarse es difcilmente detectable), la prima salarial debe
ser extremadamente alta para inducir un esfuerzo. Si p == O, por otra parte,
esforzarse es la decisin ptima del trabajador si
1 (*
)
.,.
fj
1 _ 6 w - e 2: w + 1- 6 wo,
(2.3.6)
anlogamente a (2.3.1) y (2.3.2) en los casos con supervisin perfecta de

las dos secciones anteriores, (2.3.6) es equivalente a
W*
>
_wo+
'(1 1- 6)
.+-/5-. e,
queefectivamenfe es (2.3.5) con p == O.

Incluso si (2.3.5) se cumple, de forma que la estrategia del trabajador
sea la mejor respuesta a la estrategia de la empresa, a la empresa tiene
tambin que merecerle la pena pagar
Dada la estrategia del trabajador,
el problema de la empresa en el primer periodo se c(;mcreta en escoger
entre: (1) pagar w == w*, induciendo con ello al esfuerzo y amenazando
co~ ~espedir al trabajador si en algn momento la produccin es baja, y
~eclbl~ndo por tanto la ganancia y - w* en cada periodo; y (2) pagar w == O,
mdu~l~ndo con ello al trabajador a escoger trabajar como independiente,
y reCIbiendo de esta forma una ganancia igual a cero en cada periodo. Por
tanto, la estrategia de la empresa es una mejor respuesta a la del trabajador si
w::
y - w*
2: O.
(2.3.7)
Recordemos que supusimos que y - e > Wo (es decir, que para el trabajador
es eficiente estar empleado por la empresa y esforzarse). Necesitamos una
condicin ms fuerte si estas estrategias han de formar un equilibrio de
Nash perfecto en subjuegos: (2.3.5) y (2.3.7) implican
Y-e>
- 'tilo +
1-/5
---e
60 - p)
111
que puede interpretarse como la restriccin f~~liar de que fj debe ser lo

suficientemente alta para lograr una cooperaclOn sostenIda.
Hemos demostrado hasta ahora que si (2.3.5) y (2.3.7) se cumplen, las
.estrategias que estamos considerando son un equilibrio de Nash: .Para
demostrar que estas estrategias son perfectas en subjuegos, defJmmos
primero los subjuegos del juego repetido. Recordemos que cuan~'o el
juego de etapa obliga a decisiones simultneas, lo~ subJuegos ~el Juego
repetido empiezan entre las etapas del juego repetido. Para el Jue1?ode
etapa de decisiones sucesivas considerado aqu, los subjuegos empIezan
no slo entre etapas sino tambin dentro de cada etapa, despus de que el
trabajador observa el salario que la empresa ofrece. Dadas las estrategias
de los jugadores, podemos agrupar los subjuegos en dos clases: los que
empiezan despus de una historia de salario alto y produccin alta, y los
que empiezan despus de todas las dems historias. Hemos demosb'ado
ya que las estrategias de los jugadores son un equilibrio de Nash dada
una historia de la primera clase. Queda por hacer lo mismo cor~una
historia del segundo tipo: como el trabajador no se esforzar l1\1nca,es
una decisin ptima de la empresa inducir al trabajador a trabajar como
independiente; dado que la empresa ofrecer V) == O en la siguiente etapa y
en lo sucesivo, el trabajador no debera esforzarse en esta etapa y debera
aceptar l oferta presente slo si 'w 2: O.
En este equilibrio, trabajar como independiente es permanente: si se
descubre al trabajador no esforzndose, la empresa ofrece 1J) == O en lo
sucesivo; si la empresa se desva alguna vez de ofrecer w ==. w*, el t.rabajador nunca volver a esforzarse, de fiJrma quela empresa no puede
permitirse emplear al trabajador. Hay varias razC?naspara preguntarse
si es razonable que el trabajo como independiente sea permanente. En
nuestro modelo de una empresa y un trabajador, ambos jugadores preferiran volver al equilibrio de salario alto y produccin alta del juego
repetido infinitamente, antes que jugar para siempre el resultado perfecto
en subjuegos del juego de etapa. ste es el problema de la renegociacin
presentado en la seccin 2.3.A. Recordemos que si los jugadores saben que
no se podrn hacer cumplir las penalizaciones, la cooperacin inducida
por la amenaza de estas penalizaciones ya no es un equilibrio.
En el contexto del mercado de trabajo, la empresa puede preferir no
renegociar si emplea muchos trabajadores, ya que renegociar con un trabajador puede estropear el equilibrio de salario alto y produccin alta que
se est todava jugando (o an s ha de empezar a jugar) con los otros
trabajadores. Si hay muchas empresas, la cuestin es si ~aempresa .i con-
,'.
'112
JUEGOS DlNMJCOS CON INFORMACJN
COMPLETA (c. 2)
tratar a trabajadores empleados anteriormente en la empresa .. Pudiera

ser que la empresa j no lo hiciera, por miedo a estropear el equilibrio de
salario alto y produccin alta logrado con sus trabajadores, como en el
caso de una nica empresa. Algo as puede explicar la falta de movilidad
de los administrativos jvenes y varones entre las grandes empresas en
Japn.
Alternativamente,si los trabajadores despedidos pueden siempre encontrar nuevos empleos que sean preferibles a trabajar como independientes, el salario en esos nuevos empleos (neto de cualquier desutilidad del
esfuerzo) es el que aqu juega el papel del salario en el trabajo por libre
lUo. En el caso extremo en el que un trabajador despedido no sufra ninguna prdida, no existirn penaliza'ciones por no esforzarse en el juego
repetido infinitamente y, por consiguiente, no existir ningn equilibrio
de Nash perfecto en subjuegos en el que el trabajador se esfuerce. Existe
una aplicacin elegante de estas ideas en el contexto de la deuda pblica
externa en Bulow y Rogoff (1989): si un pas endeudado puede conseguir
el importe de los crditos a largo plazo que recibe de los paSes acreedores
mediante transacciones a corto plazo por adelantado en el mercado internacional de capitales, no hay posibilidad de penaliZ~r eliricumplimiento
de los trminos de la deuda en el juego repetido infinitamente entre paSes
deudores y acreedores.
fllegos repetidos / 113
la autoridad monetaria observa esta expectativa y escoge el nivel real de

inflacin, -r. La ganancia de los empresarios es - (7[- 7[e)2. Es decir,
los empresarios quieren simplemente prever correctamente el nivel de
inflacin; alcanzan su ganancia mxima (que es cero) cuando -r= 7[e. A la
autoridad monetaria, por su parte, le gustara que la inflacin fuera cero
. pero que la produccin estuviera en su ruvel de eficiencia (y*). Escribimos
la ganancia de la autoridad monetaria como
U(-r,y),=
::-C'Tr2
_ (y _y*)2,
donde el pi,meti-o c > O refleja el dilema de laa,-t?I1d~dITl();l1~;~ria

~n~,~
S115 dos ~lJjeti~os'?llPo!;ga.mos
q';le el verdad~!(): !yeI d~ pr,c)~}lc.cin
es i~sigule;tefuIdn
del ~velde produccin deseado'y de la inl.ac.i~~
' iIDpfevista';
"
,
, ,
+ d(-r - -re),
y =by*
donde b < 1refleja ,la presencia de un poder de monopolio en los mer~

cados de productos (de forma. que si no hubiera inflacin imprevista; se
produCira a un nivel por debajO del de eficiencia) y d >' O mide el efecto de
la iriflaciQrlin1prevista sobre.la produccin a travs de los salarios reales;
tal ycomo se describi en el prrafo anterior. Podemos entonces reescribrr
la ganancia de la autoridad monetaria como.
.
2.3.E Poltica monetaria estable en el tiempo

W(-r,7[e)
Consideremos un juego de decisiones sucesivas en el que empresarios y

trabajadores renegocian los salarios nominales, despus de lo rualla autoridad monetaria escoge la oferta monetaria que, a su vez, determina la tas'a
de inflacin. Si los contratos salariales no pueden' ser automticamente
achlalizables, empresarios y trabajadores tratarn de prever la inflaCin
antes de fijar los salarios. Sin embargo, una vez se ha fijado el salario nominal, un nivel real de inflacin superior al previsto erosionar el
salario real, haciendo que los empresarios aumenten el empleo y la produccin. La autoridad monetaria, por tanto, se enfrenta aun dilema al
tener que escoger entre los costes de la inflacin y las ventajas de reducir
el paro y aumentar la produccin ante una evolucin impreVista del nivel
de inflacin.
Como en Barro y Cardan (1983), analiZamos una versin en forma
reducida de este modelo en el siguiente juego de etapa. Primero, los
empresarios forman sus expectativas de inflacin, -re.En segundo lugar,
+d(-r - 7[e)]2.
_c-r2 - [(b - l)y*
d~~~tp.J~
Para h~llar el resultadop;d~to

en subjuego~A~:'~!~'jt;~~9.
calculambs primero la eleccin ptima de-n: por Bme~ela,aut0!fd~9
monetari~-a.adas l~s exp~tativas de los einpresarib~ -re.MaximiZando
W(-r,-re) obtenemos
'
1l'*(-re)
= --:J?[(l c+ u-
b)y*
+ d-re].
(2.3.8)
Dado qJle.los empresarios prevn que la autoridad monetaria escoger

-r*(-re),
i~$'empresarios escogern la -reque maximice _[-r*(7[e)- -re]2,lo
que da1r*(-re)= -re,o,.,
d(1 - b) *' = ,-r.,
-re = ---y
c
donde el subndice s denota, "juego de etapa". De forma similar, podra

deCirse que la expectativa' niCiomilque los empresarios deben mantener
.'
~:;,,
~
,
;:~;~~\:i!~W;.;,~,\
~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;,,:,;1;'r,,,,l..l.'~I'
..,,.:.,,;"" .:.:"'J.._~'
~-...:..!...~...:..-'~~L~,I
.........
_ .~I;.l...;.'--:'<'~.
---.---------
Juegos dil1micos
COll
il1fOI'llWI1 completa pero illlpe,.[eda
/ 115
114 / JUEGOS DINMICOS CON TNFORMAClN COMPLETA (c. 2)
<...
".-,:
. ,~.;.
'.":.'
es la que ser confirmada en lo sucesivo por la autoridad monetaria, de

form~ que "*("e) =: ".e, y por tanto ".e = "'s' Cuando los empresarios
mantIenen esta expectativa ".e =: "'s, el coste marginal en que incurre la
autoridad monetaria al fijar". ligeramente por encima de ".s compensa
exactamente el beneficio marginal de la inflacin imprevista. En este
resultado perfecto en subjuegos, se espera que la autoridad monetaria
cree inflacin y as lo hace, pero estara mejor si pudiera comprometerse a
no ~rear inflacin. Efectivamente, si los empresarios tuvieran expectativas
racIOnales (esdecir, rr =: ".e), una inflacin cero maximiza la ganancia de la
autoridad monetaric:.(es;decir, W(". ,'" e) = _c".2 - (b - 1)2y*2 cuando". = ".e,
defonna que"..==O~s1'5tiroo).,
... .. .
.. . C6risi~~r~n10sah~ra!erjeg() rer'etidO infinitam,ente en el que ambos
. Jugadores tienen el rmsmo factor de descuento . Derivaremos condiciones bajo las cuales". = ".e.=: Oen cada periodo de un equilibrio de Nash
per~ecto en subjuegos que incluya las siguientes estrategias. En el primer
penado, los empresarios mantienen la expectativa ".e =: O. En periodos
sucesivos.mantienen1a expectativane =;'O siempre y cuand todas las
expectativas anteriores hayan sido ne=: .}' todos los niveles de inflacin
a~teriores.hayan sido e0ctivamente ". =: O;en caso contrario, los empresanos.mantienenJa'exp'ectativaie
=:".. (la expectativa racional en el juego
de etapa), De forma similar, la autoridad monetaria fija". = Osiempre
y cuando la expectativa presente sea ne,.", O;todas las expectativas ante~ores hay.an sido ".e = OY todos los niveles de inflacin anteriores hayan
sIdo efectIvamente". = O;en caso contrario, laautorid'ad monetaria fija
".=: ".*(nC}(sumejor respuesta a las expectativas de l()s empresarios, tal
como se indica en (23.8. ..
',.' ";
. .
.
Supongamo~que los empresarios mantienen la eXpectativa ".e = O
en el primer periodo. Dada la estrategia de los empresarios (es decir,
la forma en que los empresarios actualizan sus expectativas despus de
obse~a~ el nivel verdadero de inflacin), la autoridad monet~riapuede
restrmgr su atencin a dos decisiones: (1)". =: O, lo que conducir a
ne = Oe~periodo siguiente y, por tanto, a la misma decisin por. parte de
la autondad monetaria en el siguiente periodo; y (2) n = ".*(0)utilizando
(2.3.8),10 que conducir a".e
en lo su~esi~o,'en cuyo caso la autoridad
monetaria encontrar que es ptimo en lo sucesivo escoger n =: ". . En
con~ecuen~ia, fijar". =: Oen este periodo resulta en la ganancia W(O,O) por
p~n~do, mIentras que fijar" =: ".*(0)eneste periodo resulta en la ganancia
W (". (O),O)eneste periodo, pero W(". .,".) en lo sucesivo. Parlo tanto, la
est:rategia de la autoridad monetaria es la mejor respuesta
="..
_l_W(O
1-b
O)
'-
>
(".+(0),0)
+ _rS_vV("',""'s),
1-15
(2,39)
que es anloga a (2.3.6).

2
Simplificando (2.3.9) obtenemos b 2: c/(2e + d ). Cada u~o de los parmetros c Y d tiene dos efectos. Un aumento en d, por ejemplo, hace
que la inflacin imprevista sea ms efectiva de cara al aumento de ~a
produccin, y resulta por tanto ms tentador para la autondad mon:tana
ser indulgente con la inflacin imprevista, aunque por la mIsma razon, un
aumento en d tambin aumenta el resultado del juego de etapa"" lo que
hace que la penalizacin sea ms dolorosa para la autoridad monetria,
Dl mismo modo, un aumento de c hace que la inflacin sea ms dolorosa,
por lo que la inflacin imprevista resulta m~n~s tentadora, pero ~ambin
hace que".. disminuya. En ambos casoS, el ultImo efecto pesa mas que :1
primero, de forma que el valor crtico del factor de descuento necesarIO
para mantener este e.quilibrio, c/(2c + d2), decrece c~n d y crece c.onc.
Hasta ahora hemos demostrado que la estrategIa de la autondad monetaria es una mejor respuesta a la estrategia de los empresarios si (2.3.9)s~
cumple. Para demostrar que stas estrategias son un equilibrio ~e Nash,
queda por demostrar que la ltima es una mejor resp.uesta ~ la pnmera,.lo
cual se deriva de la observacin de que los empresanos obtIenen su mejor
ganancia posible (que es cero) e.\lcada periodo. Demostrar q~e :stas estrategias son perfectas en subjuegos requiere argumentos analogos a los
de la seccin anterior.
2.4 Juegos dinmicos
con infoIDlacin
completa
pero imperfecta
2.4.A Representacin de los juegos en fonna extensiva

En el captulo 1 estudiamos juegos estticos representndolos en forma
normaL Analizamos ahora juegos dinmicos representndolos en forma
extensiva.19 Este enfoque expositivo puede hacer que parezca que los
juegos ~stticos tienen que representarse en fo~a nom:al y los juegos
dinmicos en forma extensiva, pero esto no es asI. CualqUJer Juego puede
representarse tanto en forma normal como extensiva, aunque para algu-
19
Damos una descripcin ;'formaJ de la forma extensiva; p'ara un tratamienTo preciso
consltese Kreps y Wilson (1982).
116/
JUEGOS DINMICOS CON INFORMACIN
COMPLETA (c. 2)
Juegos dinmicos con informacin completa pero imperfecta / 117
nos juegos una de las dos formas es ms apropiada que la otra. Vamos a
ver cmo los juegos estticos pueden representarse utilizando la forma extensiva y cmo los juegos dinmicos pueden ser representados utilizando
la forma normal.
Recordemos de la seccin l.1.A que la representacin en forma normal
de un juego requiere precisar: (1) los jugadores, (2) las estrategias posibles
de cada jugador y (3) las ganancias recibidas por cada jugador para cada
combinacin de estrategias posibles.
Definicin. La representacin en fanna extensiva de un juego exige preci~ar:
(1) los jugadores, (2a) cundo tiene que jugar cada jtigador,(2b) lo qt{e cada
jugador puede hacer cada vez que tiene la oportunidad de jugar, (2c) lo que cada
jugador sabe cada vez que tiene la oportunidad de jugar y (3) la ganancia recibida
por cada jugador para cada combinacin posible de jugadas.
ALmqueno lo dijimos en su momento, eillas secciones 2.1 a 2.3 hemos
analizado varios j~egos representados en forma extensiva. La contribucin de esta seccin consi~te elldescribir estos juegos en forma derbol
en vez de utiliZr' palabr~s, porqtie el uso derbo~es,.~ menudo'facilita
tanto la explicaci6n co~o el anlisis.
' .. , .> .,.
' ..
Como ejemplo de un juego en formaextensiva, consideremseI siglliente representante d la clase de juegos en dos etapas 'con informacin
completa y perfecta presentada en la seccin 2.1.A:
1. El jugador 1 escoge una accin al del conjunto factible Al = {J,D}.
2. El jugador 2 observa al y escoge entonces una accin a2 del conjunto
,42 = {J',D'}.
3. Las ganancias son Ul (al,az) y -uz(al,a2), como se indica en el rbol de
la figura 2.4.1.
<..
2,')
Este rbol empieza con un nodo de decisin correspondiente al jugador

1, donde 1 escoge entre 1 y D. Si el jugador 1 escoge 1,se llega a un nodo
de decisin del jugador 2, donde 2 escoge entre l' y D'. Del mismo modo,
si el jugador 1 escoge D, se llega a otro nodo de decisin del jugador 2,
donde 2 escoge entre l' y D'. Despus de cada una de las decisiones de
2 se llega a un nodo terminal (es decir, el juego termina) y se reciben las
ganmc;iasindicadas ..
Es inmediato extender el rbol de la figura 2.4.1 para representar
cualquier juego dinmiCo con informacin completa y perfecta, es decir,
cualquier juego en el queros jugadores toman sus decisiones uno despus
del otro, todas las decisiones previas son informacin del dominio pblico
antes de realizar el siguiente movirnientoy las ganancias a los jugadores
con cada combinacin factible ,de decisiones son informacin del dominio pblico. (Los espacios. de-acciones continuos, como en el modelo de
5tackelberg, Olos horizontes infinitos, como en el modelo de Rubinstein,
presentan dificultades grficas pero no conceptuales) Deriva~os seguidmWl1teJareprese~tficin.en forma ,normal del juego:de la figura 2.4.1.
C:0l1clpimospOI\ltiII.9esta ~ec;c!9ndt=mostrang,()que los jueglJ,s~~!~cosc
Plledel1represerarse enfofI!la extensiva y descnbiend() cmo represen~ .
tar en formaext~nsiva l()s juegos dinmicos con informacin ~9rnpleta
pero imperfecta.
Tal como parecen indicar las convenciones sobre nmneracin ~l~)as
definiciones de las-formas no,rmaly extensiva, existe una ntiIna relaC;in
entre las estrategias f;ldiblesde un jugador (apartad02)dad.a.s en}a forP:t~
nornal y la descripcipl1 de cu'ndo dec.ide un jugadorrcqu~'p:ll.~doe'):a<;
qp.sabe(apartados 2,?b, 2c) eril? fOI1llaextensiva.;~ani.rep:~~~tar.ti
juego dinmico en forma normal, necesitamos.h"aducirJ~Wof!!lacinen:
forma e?'tensiva en trminos de la descripcin del espacio de estrategas'
de cada jugador en la frma~normal. Para hacer esto, recordemos la
definicin de estrategia dada (formalmente) en la seccin 2.3.B:
Definicin. Una estrategia de un jugador es un plan de accin completo, es
decir, e~pecifica una accin factible de/jugador en cada contingenCia en la que al
jugador le pudiera corresponder actuar.
l'
-.'
Ganancia al jugador 1:
Ganancia al jugador 2:
2
1
Figura 2.4.1
o
O
. Puede parecer innecesario exigir que la estrategia de un jugador es-p~tmque una accin factible, para cada contingencia en la que al jugadb~'I)l~diera<;orrespQnderle decidir~;Resulta claro, sin embargo, que no
. ,poarqlOs aplicar lanociri de equilibrio de Nash a los juegos dinmicos
118/
JUEGOS DINMICOS CON INFORMACfN
COMPLETA (c. 2)
Juegos dinmicos
con informacin completa si permitiramos que las estrategias de un jugador ~epran sin especificar sus acciones en algunas contingencias. Para
que el Jugador j calcule una mejor respuesta a la estrategia del jugador i,
puede que j necesite considerar cmo,actuara i en todas y cada una de las, '
contingencias, no slo en las contingencias que i o j creen que es posible'
~~~.
En el juego de la figura 2.4.1, el jugador 2 puede tomar dos acciones, ,'c:

pero ppsee cuatro estrategias, puesto que hay dos contingencias diferentes'
(concretamente, despus de observar que el jugador 1 ~scoge Iy despus
de observar que el jugador 1 escoge D) en las que podra corresponder
actuar al jugador 2.
,_.
-.e., . '"
",
,
'. ~'
..
, o.'.
,!strategial: Si el jugador 1 juega [,entonces jugar!'; si el jugado~l

Juega D, entonces jugar !', 10que denotamos por (JI,!').
,
,!strategia 2: Si el jugador 1 juega 1, entonces jugar 11; si el jugador 1
, Juega D, entonces jugar DI, 1() que denotamos por (JI,DI).
,!strategil3: Si el jugador 1juega!, entonces jugar DI; si el jugador T
Juega D, entoncesjugar !', lo que denotamos por (DI,!I). ,
COI!
informaci, comFleta Fero imFerfecta / 119
, .,
forma extensiva. Denominemos las filas de la forma normal
entaClonen
.
I
d
sd aCuerd oc on las estrategias factibles del Jugador 1 y las ca umnas e
e d o con las estrategias factibles del jugador.. 2, y calculemos las gana 11euer
a.
en cada combinacin posIble de estrategIas,
~aoo 1 J'ugadores
'
" como se
. dica en la figura 2.4.2.
111 Una vez mostrado que un juego dinmico puede rep~esentars: .en
seguidamente a demostrar cmo un Juego
formano,rmal pasemos
,
, estatIco
'
.
de
decisiones
simultneas)
puede
representarse
en
forma
(es d eClr, ,
'
.,
'.
, extensiva. Para ello, nos basamos len la observaoon hecha en la sec~IOn ] .l.A
(en conex'o'ncon el dilema de los presos) de que
, no es necesano que los
.
, 'dores acten simultneamente: es suficiente con que cada uno escoJa
ugaestrateoia sin conocer la decisin del otro, como sera el caso en el
una
o~
d ..
Id
dilema de los presos silos presos tomaran sus eCSlO~eSen cea: :eparadas. Por tanto, podemos representar un juego de (dgamos) deosJOnes
simultneas entre los jugadores 1 y 2 como sigue:
''!stratega 4: Si elJugador 1 juegaI, Emtonce~jugar DI; si el jugador 1

Juega D,entonces jugar DI; lo que denotamos por (DI,DI).
~l jugad~r 1, sin embargo, tiene dos acciones pero slo dos estrategias:
Jugar 1 yJugar D. La raz~ por la cual el jugador 1slo tiene dos estrategias
:s que solo hay una contingencia en la que pudiera torresponder jugar al
Jugador 1 (concretamente, la primera jugada, que corresponde al jugador
1), de.forma que el espacio de estrategias del jugador1 es equivalente al
espacIO de acciones Al == {1,D}. ,.
.
Jugador 2
(JI,!') (J';DI) (DI,!')
3,1
Jugador 1
3,1
(DI,DI)
1,2
"
1,2
',---.../
2,1
0,0
2,1
')
0,0
1. El jugador 1 escoge una accin al del conjunto factible Al'

2. El jugador 2 no observa la decisin del jugador 1, pero escoge una
accin az del conjunto factible Az3. Las ganancias son tI'l (aj,az) y uz(al,az).
Alternativamente, el jugador 2 podra jugar primero y el jugador 1 podra
decidir sin obervar la accin de 2. Recordemos que en la seccin 2.1.B
demostramos que un juego consiste en escoger cantidades con esta f.or111a
temporal y estructUra informativa difiere significativa,mente del J~Jego
de Stackelberg, que tiene la misma forma temporal pero, una estructura
informativa taL quedacempresa 2 observa la decisin de la empresa ?_
Hemos visto que el juego de decisiones sucesivas y ac~n del contrano
no observada tiene el mismo equilibrio de Nash que el Juego de COUlnot
de decisin simultnea.
Para represen:tar este tipo de ignorancia sobre los mo~i~ientos anteriores en un juego en forma extensiva, introducimos la nOC1On
de conjunto
de informacin de un jugador.
"",.;
Figura 2.4.2
",.,'
.Dados estos espacios dl7estrategias de los dos jugadores, eSnil1ediat

denvar la representacin ,en forma normal del juego a partir de surepre-
de
Defulicin Un conju~to
itlfonnacin
nodos de decisi~ que satisface:
de un jugador es una coleccin de
W al jugador le corresponde jugar ett-cada nodo del conjunto de informaciny.

(ii) cuarido en el transcu'rso del juego se llega a
11/1
nodo del conjunto de 111fOl-
Juegos dinmicos con informacin completa pero imperfecta / 121
120/ JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)
macin, el jugador al que le corresponde decidir no sabe a qu nodo dentro del

conjunto de infonnacin se ha (o no se ha) llegado.
La parte (ii) de esta definicin significa que, en un conjunto de informacin,
el jugador debe tener el mismo conjunto de acciones factibles en cada nodo
de decisin; en caso contrario el jugador seria capaz de inferir a partir del
conjunto de acciones disponibles si ha llegado o no ha llegado a cierto(s)
nodo(s).
Como segundo ejemplo del uso de un conjunto de informacin para

representar la ignorancia de las jugadas anteriores, consideremos el siguiente juego dinmico con informacin completa pero imperfecta:
1. El jugador 1 escoge una accin al del conjunto factible Al = {l,D}.,
2. El jugador 2 observa al y escoge a continuacin una accin
conjunto factible A2 = {J',D'}.
a2
del
3. El jugador 3 observa si (alA!) = {D,DI} O no y escoge a continuacin

una accin a3 del conjunto factible A3 = {I",D"}.
Preso 1
-1
.
La representacin en forma extensiva de este juego (ignoramos las ganancias para simplificar) aparece en la figura 2:4.4. En esta forma extensiva;
el jugador 3 tiene dos conjuntos de informacin: uno con un nico elemento que sigue a D por parte del jugador 1 y DI por parte del jugador
2 y otro con ms de un elemento que incluye los dems nodos en los que
le corresponde decidir al jugador 3.. Por tanto/todo lo que el jugador 3
observa es si (al,a2) = {D,D'} o no ..
1
4
4
5
O
':."'
Figura 2.4.3
En un juego el! forma extensiva, indicaremos que una coleccin de
nodos de decisineonstituye un-conjunto de informacin con una lnea
discontinua, como en la representacin en forma extensiva del dilema de
los presos de la figura 2.4.3. Indicaremos a veces a qu jugador- le corresponde mover en los nodos del conjunto de informacin por medio de una
leyenda, como en la figura 2.4.3; alternativamente, podemos simplemente
dar nombre a la lnea discontinua que une esos'nodos, como en la figura
2.4.4. La interpretacin del conjunto de informacin del preso 2 en la figura 2.4.3 es que cuando al preso 21e corresponde decidir, todo lo que sabe
es que se ha llegado al conjunto de informacin (es decir, que el preso 1
ha decidido), pero no a qu nodo se ha llegado (es decir, lo que ha hecho).
Veremos en el captulo 4 que el preso 2 puede tener una opinin de lo que
el preso 1 ha hecho, incluso sin haberlo observado, pero ignoraremos esta
cuestin hasta entonces.
Figura 2.4.4
Ahora que hemos definido la nocin de conjunto de informacin, podemos ofrecer una definicin alternativa de la distincin entre informacin
perfecta e imperfecta. Definimos previamente la informacin perfecta diciendo que en cada jugada, el jugador al que le corresponde jugar conoce
toda la historia del juego hasta ese momento. Una definicin equivalente
es que cada conjunto de informacin contiene un nico elemento: Por
el contrario, la informacin imperfecta significa que existe al menos un'
--~
122 / JUEGOS DINMICOS CON INFORMAcrN
Juegos dinlmicos
COMPLETA (c. 2)
cO~j~ntode informaci~n con m~ de un elemento,19Por tanto, la represent~ClQnen forma extensiva de un Juego de decisiones simultneas (como el
~lle~a de l~s presos) es un juego con informacin imperfecta. De forma
~lml1ar, l~: J~egos en dos etapas estudiados en la seccin 2.2.A poseen.
l~orm~clOn Imperfecta porque las decisiones. de los jugadores Iy 2 son
slmultaneas~ como tambin lo son las decisiones de los jug~dofes 3 y 4..
?e forma mas general, un juego dinmico con informacin co'mpleta pero
lm~erfecta~~ede repr,esentarse en forma extensiva utilizandbconjuntos
de mformaclOn con mas de un elemento para indicar lo que cada jugador
sabe (y no sabe) cuando le corresponde jugar, tal como hemos hecho en la
figura 2.4.4.
."
....
,_.
..",
.... ", "
"
2.4.B Equilibrio de Nash perfecto e~ ~ubjueg~~"
.: '.
--
". -
~
.
'-..:.
En la secci~ 2.3.B di~s la dfinicin generalder'eqtiilibriOd~~shper:

~.".
fecto .en subJuegos. ~l~ embargo, aplicamos ladefinici6:lsloa
jueg(Js' .
repetido~ porque defimmos' los conceptos de estrategia' ysubjuego slo' .
para los Juego~repetidos. En la secCin2AA dimos la.definicin gene"
ral de ,estrategIa. Presentamos ahora la definieingeneral de subjuego,
despues de lo cual podremos aplicar la definicin de equilibrio de Nash
perfecto en subjuegos a los juegos dinahcos con inforinacin completa
en general.
, Recordemos que en la seccin 2.3.Bdefinimos inforinalmertte un subjue.go como la parte del ju~g,?que'q\teda'prjugatecipeZIldbeit
cual- .
qUl~r momento en el que l.~~storia Orripletadeljuego has~a eritonces
sea mfo~~.c!6n deldoiriinip~b~C~ entretbdosiosjugdor~tydiins
un~ defimclOn formal en el caso de los juegos rpetidos,que"eht6nces
~stabam~s, co~sideran.do',Ofrecemos ahora una. definicih fdrml' para
Juegos dmarrucos con mformacin completa en genera], en tI111iri6sd la
representacin e.nforma extensiva del juego.
Definicin. Un subjuego
en un juego nforina extensiva

-~.--:':
19
.
'. ":.~:;C
,
Est~ ~aracterizacin de la informaan perfecta e imperfecta en trminos de 20njuntos de
informaaon con ~o o ms elementos est restringida a los juegos cn info~aci" complet;
>0
com~.veremos en el c~ptulo,4, la ,repre~:,n;a,~n.."n fonTlae.x.\~~~~<'l'd{~ ju~i.

formaclOn perfecta pero Incompleta tiene un conjunto de informacin cf(ini; d' uti .
elemento. En este captulo, sin embargo, restringimos nuestra atencin a la infbrmacih
completa.
.,
~~~te,
COI1infonl1nn
completa
pero imperfecto
/ 123
(a) empieza en un nodo de decisin n que sea un conjunto de informacin con 1111
nico elemento (pero que no sea el primer nodo de decisin del juego),
(b) incluye todos los nodos de decisin y terminales que siguen a n en el rbol
(pero no los nodos que no siguen a n) y
(e) no intersecta a ningn conjunto de informacin (es decir, si 1m nodo de
decisin n' sigue a n en el rbol, todos los otros nodos en el conjunto de
informacin que contiene a n' deben tambin seguir a -n y, por tanto, deben
incluirse en el subjuego).
Debido al comentario entre parntesis de la parte (a), no contamos el
juego completo como un subjuego, pero esto es slo una cuestin de
estil: eliirtinar ese comentario entre parntesis de la definicin no tendra
ningri efecto.
Podemos utilizar el juego de la figura 2.4.1 y el dilema de los presos
de la figura 2.4.3 para ilustrar las partes (a) y (b) de esta definicin. En la
figura 2:4.1 hay dos subjuegos, que empiezan en cada uno de los nodos de
decisin del jugador 2. En el dilema de los presos (o cualquier otro juego
de decisin simultnea) no hay subjuegos. Para ilustrar la parte (c) de la
definicin', consideremos el juego de la figura 2.4.4. Slo hay un subjuego,
el que empieza en el nodo de decisin del jugador 3 que sigue a D por
parte del jugador 1 y D' por parte del jugador 2. Debido a la parte (c), en
este juego ningn subjuego empieza en ninguno de los nodos de decisin
del jugador 2, aun cuando estos dos nodos son conjuntos de informacin
de un nico elemento..
.
"Vn trtanera de motivar la parte (c) consiste en fumar que queremos
poder ari~liiar ili1subju~gcipor s mismo y que qti~rem6s que el a'niisi's
searei~vait~pai~el juego completo. En la figura 2.4.4, si intentramos
definir un:'subjuego que empezara en el nodo de decisin del jugador 2
qu sigue a la decisin I del jugador 1, estaramos creando un subjuego en
el que el jugador 3 ignora la decisin del jugador 2 pero conoce la deeisln
del jugador.1. Tal subjuego no sera relevante para el juego completo
porque en ~ste lltim el jugador 3 no conoce la jugadade 1, sino que tan
slo observa si (0.1,0.2) = {D,D/} o no. Recordemos el argumento parecido
porelqlleE-fsimojuego de etapa de 1.111 juego repetido no es en s mismo
un stihjUegodeljuego repetido, suponiendo en el caso finito que t < T.
Otra m'anerade motivar la parte (c) es dndonos cuenta de que la
parte (a) slo garantiza que el jugador al que le corresponde jugar en el
nodo n conoce la historia completa del juego hasta ese momento, no que
los dems jugadores tambin conozcan la historia. La parte (c) garantiza
12~ / JUEGOS DINMICOS CON INFORMACIN
COMPLETA (c. 2)
que la historia completa del juego hasta ese momento sea informacin del
dominio pblico en el siguiente sentido: en cualquier nodo que sigue a
/1, digamos ni, el jugador al que le corresponde decidir,en ni sabe que el
juego lleg al nadan. Por tanto, incluso si ni pertenece a un conjunto de
informacin con ms de un elemento, todos los nodos en ese conjunto de
informacin siguen a n, de forma que el jugador al que le corresponde
decidir en ese conjunto de informacin sabe que el juego ha llegado a un
nodo que sigue a n. (Si las dos ltimas afirmaciones parecen difciles es en
parte porque la representacin en forma extensiva de un juego especifica
lo que el jugadori sabe en cada uno de sus nodos de, decisin, pero no
hace explcito lo que el jugador i sabe en los nodosfe decisin de j,)
Como se ha descrito anteriormente, la figura 2.4.4 ofrece un ejemplo de
cmo podra no cumplirse la parte (c). Podemos ahora reinterpretar este
ejemplo: si caracterizsemos (informalmente)1o que el jugador 3 sabe
en el nodo de decisin del jugador 2 que sigue a la decisin 1 por parte
del jugador 1, diramos que 3 no conoce la: historia del juego .hast~ ese
momento, ya que 3 tiene otros nodos de decisin en lasque 3no sabe sil
jug 1 o D.
~;.
Dada la definicin general de subjuego, podemos;ahora aplicar la
definicin de equilibrio de Nash perfecto en subjuegosde la seccin 2,3.B.
Definicin. (Selten 1965):Un equilibrio de Nash es perfecto en subjuegos si las
estrategias de los jugadores constituyen un equilibrio de Nash en cada subjuego.
Es inmediato demostrar que cualquier juego dinrrlic:finito con.informacin completa (es decir, cualquier juego dinmico en l q~~ iffi ~&nero
finito de jugadores tiene un conjunto de estrategias fac~:I:>.!eSftriit~ri:jn
un equilibrio de Nash perfecto en subjuegos"posiblemenh~ co~ e'stnltegias
mixtas. El argumento procede por: construccin, utilizando un procedimiento parecido a la induccin hacia atrs, y est basad~. en dos o~stTrvaciones. Primero, aunque presentamos el teorema de Nash en el contexto
de juegos estticos con informacin completa, ste se extiend~ a'todo
juego finito en forma normal con informacin complef~, y hemos visto
que estos juegos pueden ser estticos o dinmicos. En segundo lugar, un
juego dinmico finito con informacin completa tiene lll nnerq)lnito
de subjuegos, cada uno de los cuales cumple las hiptesisdelte~r~ria d
Nash.20
. -.
- '.
20 Para construir un equilibrio de Nash perfecto en ~ubjuego's,identifiquemos
primero
t"dos los subjuegos menores que contienen nodos terminales en el rbol del. juego original
JlIegos dinmicos con informacin completa pero imperfecta / 125
Hemos encontrado ya dos ideas ntimamente ligadas al equilibrio de

Nash perfecto en subjuegos: el resultado por induccin hacia atrs definido en la seccin 2.1.A y el resultado perfecto en subjuegos definido en
la seccin 2.2.A. En trminos informales, la diferencia es que un equilibrio es una coleccin de estrategias (y una estrategia es un plan completo
de accin), mientras que un resultado describe lo que pasar slo en las
contingencias que se espera que se den, no en cada posible contingencia.
Para ser ms precisos sobre esta diferencia entre equilibrio y resultado,
y para ilustrar.la nocin de equilibrio de Nash perfecto en subjuegos,
!econs~deramos ahora los.juegos definidos en las secciones2.1.A y 2.2~A.
"
.....
Definicin. En el juego en dos etapas con informacin completa y perfecta

definido en la seccin 2.1.A, el resultado por induccin hacia atrs es (aj',R2(aj'
pero el equilibrio de Naslz perfecto en subjuegos es (aj',R2(al.
En este juego, la accin aj' es una estrategia del jugador 1 porque slo
-hay una contingencia en la que le puede corresponder actuar, el principio
del juego. Sin embargo, del jugador 2, R2 (aj') es una accin (concretamente
la mejor respuesta de 2 a aj') pero no una estrategia; porque unaestrate~
gia para el jugador 2 debe especificar la accin que 2 tomar despus' de
cualquier posible decisin de 1 en la primera ronda. La funcin de mejor
respuesta R2(al), por otro lado, es una estrategia del jugador 2. En este
juego, los subjuegos empiezan (y terminan) con el moVimiento del jugador 2 en la segunda etapa. Hay un subjuego para cada accinfactible,'al
en Al, del jugador L Para demostrar que (aj',R2(al esUILequilibrio de
Nash perfecto en subjuegos, debemos por tantodemostraI,que (aj' ;R2(at"
es un equilibrio de Nash y que las estrategias de losjugadoresconstitu~
yen un equilibrio de Nash en cada uno de estos subjuegos ... Como los
subjuegos no son ms que problemas de decisin unipersonales, se trata
de exigir que la decisin del jugador 2 sea ptima en cada subjuego, que
es exactamente el problema que la funcin de mejor respuesta, R2(al),
.C;.,
"
1',.,
(donde un subjuego es un subjuego menor si na contiene ms subjuegos). Sustituyamos

entonces cada tno de estos ~upI.l~;'?~,!??rl~~
g~~S~!ls.de. uno d~7~ equilibrios de Nash.
Pensemos ahora en los nodos iniciales de estos ~?:bJ1:'ego~como los nodos temunales en
una versin truncada del juego Oligfua'I."Tctentiffquerriostodos los subjuegos menores de
este juego truncado que contengan estas nadas' ~e~es
Y: sustituyamos cada uno de estos
subjuegos con las ganancias de.uno _~~~us equilib~os de Nash. ProcedIendo de esta forma
hacia atrs a lo largo del rbol, s<;9~tje,'!tur ~qUlli~~o ~e Nash perfecto en subuegos,porque
las estrategias de los jugadores con~tit;uY~)l,
uneqllilibno de Nash (de hecho, un eqUlhbno de
Nash perfecto en subjuegosl en cada subjuego.- .
i"
.'
~.'.
'
:~
'<.;'
JlIegos di17l17icos C017 i17forl17aei17 completa
pero imf,,:rfeela
/127
126 / JUEGOS DINMICOS CON INFORMACIN COMPLETA (c. 2)
,/,'
soluciona. Finalmente, (ai,R:z(al)) es un equilibrio de Nash porque las

estrategias de los jugadores son mejor respuesta la una a la otra: o.i es una
mejor respuesta a R2(al), es decir, o.i maximiza 1J,1 (0.1,R2(0.1)), y R2(0.1) es
,',una mejor respuesta a ai, es d~dr,R2(ap maximiza do.i ,0.2)'
Los argumentos son anlogos' para los juegos considerados en la
seccin 2.2.A, de forma que nos ahorramos los detalles.
Definicin. En el juego en dos etapas con infonnacin'completa pero imperfecta
definido en la seccin 2.2.A, el resultado perfecto en subjuegos es {o.i ,o.i,0.3 (0.1' o.i),
0.4:(a1,ai)), pero el equilibrio de Nnshperfeeto
en subjuegos es (o.i,0.2;0.; (al ,0.2),
y D (que conduce a una ganancia de 2 por parte del jugador] despus

de que 2 juege 1'). Por tanto, la mejor respuesta de. 1 al comportamiento
previsto del jugador 2 es jugar D en la primera etapa, de forma que el
resultado por induccin hacia atrs del juego es (D,1'), como se indica con
la trayectoria en negrita que empieza en el nodo de decisin del jugador
1 en la figura 2.4.5. Hay una trayectoria en negrita adicional que emana
del nodo de decisin del jugador 2 que sigue a la de~isin 1 del jugildor 1.
Esta trayectoria parcial a lo largo del rbol indica que el jugador '2 habra
escogido D' sise hubiera llegado a ese nocla de decisin.
'a4:(aT~0.2)).
"'-:,'
En este juego, el par de acciones (a3(ai,a2),o,4:(a1,0.2

es el equilibrio de Nash del subjuego que juegan por separado los jugadores 3 y
4 (concretamente, el juego que queda despus de que los jugadores 1 y
~.escogen (ai,ai)), mientras que (aj(aJ,a2},a4:(al,0.i))
es una estrategia del
jugador 3 y una estrategia para el jugador 4, es decir unos planes de.accin
2ompletos que describen una respuesta a cada par de movimientos facFblesde los jugadores 1 y 2. En este juego, los subjuegos consisten en
la interaccin en la segunda etapa entre los jugadores 3 y 4, dadas las
acciones tomadas por los jugadores 1 y 2 en la primera ronda. Tal y como
exige.el equilibrio de Nash perfectO'en subjuegos, el par de estrategias
(a;(al,a,a'(al,a)
especifica un equilibrio de Nash,en cada uno de esto
subjuegos.
'Coriduim~sesta
seccin (y est:~aptulo) con un ejemplo que ilustra
el tema~principal del captulo: la perfeccin en los subjuegos elimina
los equilibrios de Nashque.s basan en'promesas o amenazas que no
son crebles. Recordemos el juego en forma extensiva de l figura 2.4.1.
Si hubiramos encontrado este juego en la seccin 2.1.A, lo habramos
resuelto poririduccin hacia atrs del siguente;nodo:
si el jugador 2
alcanza el riada de decisin que sigue a la decisin 1 del jugador 1, la
mejor respuesta de 2 es jugar D' (lo que proporciona una ganancia de 2)
en vez de jugar l' (que proporciona tina ganancia de 1). Si 2alcanza el nodo
de decisi.nque sigue al decis~nD..del jugador 1, la mejor respuesta de 2
es jugar l' (lo qu proporciotui\cii gahancia de l)'en vez de jugar Di (que
proporciona una ganancia de O). Dado que el jugador 1 puede resolver
el problema del jugador 2 tanto como el propio jugador 2, el problema
de 1 ,~I11a prrn~ra nmdas~ c~~Cre.ta en esoger entr r (que conduce a
gananCia. de 1 por parte del jugador 1 despus de que 2 juege D')
una
3
1
1
2
o
O
Figura 2.4.5
Recordemos que la representacin en forma normal de este juego se

dio en la figura 2.4.2. Si hubiramos encontrado este juego en forma
normal en la seccin 1.1.C, habramos hallado sus equilibrios de Nash
(con estrategias puras). stos son (D/D',!' e (!,(D',D')). Podemos
ahora comparar estos equilibrios de Nash en el juego en forma norIllal de
la figura 2.4.2 con los resultados del procedimiento por induccin hacia
atrs en el juego en forma extensiva de la figura 2.4.5: el equilibrio de Nash
(D,(D',J')) en la representacin en forma normal corresponde a todas las
trayectorias en negrita de la figura 2.4.5. En la seccin 2.1.A llamamos
a (D,J') el resultado por induccin hacia atrs del juego. Sera natural
llamar a (D,(D',1') el equilibrio de Nash por induccin hacia atrs del
juego, pero utilizaremos una terminologa ms general y lo lJamaretnos el
equilibrio de Nash perfecto en subjuegos. La diferencia entre e1resultado
y el equilibrio es que el resultado slo especifica la trayectoria en negrita
que empieza en el primer nodo de decisin del juego y acaba en un nodo
Lecturas adicionales / 129

128 / JUEGOS DIN..MICOS CON INFORMACIN
COMPLETA (e. 2)
terminal, mientras que el equilibrio tambin especifica la trayectoria en

negrita adicional que emana del nodo de decisin del jugador 2 que sigue a
la decisin 1del jugador 1. Es decir, el equilibrio especifica una estrategia
completa del jugador 2.
Pero, qu pasa con el otro equilibrio de Nash, (/(D',D'?
En este
equilibrio, la estrategia del jugador 2 es jugar D' no slo si el jugador 1
escoge I (como tambin ocurra en el primer equilibrio) sino tambin si el
jugador 1 escoge D. Dado que D' (si sigue a D) conduce a una ganancia
de Odel Jugador 1, la mejor respuesta de 1 a esta estrategia por parte del
Jugador 2 es jugar I, consiguiendo con ello una ganancia de 1 (despus de
que el jugador 2 escoja D'), que es mejor que O. Utilizando un lenguaje
vago pero sugerente, podra decirse que el jugador 2 est amenazando
con jugar D' si el jugilPor 1 juega D. (Estrictamente hablando, 2 no tiene
la ~~ortu~idad de llevar a cabo esta amenaza antes de que 1 escoja una
acclOn. SI la tuviera, estara incluida en la forma extensiva.) Si esta amenaza funciona (es decir, si 1 escoge jugar I), 2 no tiene la oportunidad de
llevar a cabo su amenaza. Sin embargo, la amenaza no debera funcionar
ya que no es creble: si al jugador 2 se le diera la oportunidad de llevarl~
a cabo (es decir, si el jugador 1 jugara D), 2 decidira jugar I' antes que D'.
De un modo ms formal, el equilibrio de Nash U,(D',D' no es perfecto
en su.bjuegos, porque las estrategias de los jugadores no constituyen un
eqUlhbno de Nash en uno de los subjuegos. En particular, la eleccin de
D' por parte del jugador 2 no es ptima en el subjuego'que empieza (y
acaba) en el nodo de decisin del jugador 2 que sigue a la decisin D del
jugador 1.
En un juego con informacin completa y perfecta, la induccin hacia
atr~s elimina las amenazas que no son crebles. I?ado que cada conjunto
de mformacin contiene un nico elemento, cada nodo de decisin del
rbol representa una contingencia posible en la que podra corresponderle
actuar a un jugador. El proceso de moverse hacia atrs a lo largo de la
forma extensiva, nodo a nodo, se concreta por tanto en forzar a cada
jugador a considerar llevar a cabo todas y cada una de las amenazas que
el Jugador pudiera hacer. En un juego con informacin imperfecta, sin
embargo, las cosas no son tan sencillas, ya que tales juegos co'ntienenal
men~s ~n conjunto de informacin con ms de un elem'ento. Aqu se
podna mtentar el mismo enfoque: proceder hacia atrs a lo largo de la
forma extensiva y alcanzar eventualmente un nodo de decisin contenido
en un conjunto de informacin con ms de un elemento. Pero forzar al
jugador a considerar lo que hara si se llegase a ese nodo de decisin no
es equivalente a forzar al jugador a considerar una posible con~ngencia

en la que le correspondera jugar, ya que si en el transcurso del Juego se
llega a ese conjunto de informacin, el jugador no sabe si se ha ~~~ado ~
ese nodo de decisin o no, precisamente porque el nodo de deClslOnesta
contenido eh un conjunto de informacin con ms de un elemento.
Una forma de tratar l problema de los conjuntos de informacin co~
ms de un elemento cuando se utiliza induccin hacia atrs, es proce'der hacia atrs a lo largo de la forma extensiva hasta que se encuentre
un conjunto de informacin con ms de un elemento, pero saltndoselo
y siguiendo hah arriba"en el rbblha~ta ~~~~nt;:ar~S~~!~t6'~e,,~r;:,.
formacin con unniw elemento. Uegados ahhabra que consIdera::'.
no slo lo que el jugador al que le corresponde jugar
~ecnjUrit'"
de informacin con unnicQ elemento hara'si sealCanzase:s itod"de
decisin, sino tambin la accin que tomara el ~ga:dr al que le'crres~
ponde jugar en cada ~o de los conjuntos de informaciIl.c'o~.'~~~~e.~
elemento que se han saltadO. "En trininospoco foIirlls, este procedi~
miento proporciona un ~qiiilibrio de NashI'erfctd'en~subjuego~::}:J-:i
segunda manera de tratar el problema 'es proceder' haCi~atrs:<il"Ya:rIf
de la forma extensiva hasta 'encontrar un conjrito'd-infomiioIi:'con
ms de un elemento; Forzar entcmces al jugador'alqe're"corrsp6fiCI~
jugar en ese conjunto' de illforma'cina considerarlo qiieha'riiaellegarsi~
a ese conjunto de inforindn:(Hacer esto requiere que eljugadot.teng:
una valoracin probabilistic'con reSpecto a:que'nodoseha;lle'g~d~e~:el
conjunto de informacin.,Tal~ valoracin depender Il.a~~eri~~,r~
posibles decisiones de lo~ jugadores 'queestn pr~Criia'~J:l!.:kf:tt~Y.,';g~'~
forma que una pasada de abajo arriba a.la lrgo delTbol1tiliZh:(l~st~:.; "
mtodo no puede proporcionar una solucin-),~n.t~os'inf()iin~~I
este procedimiento proporciona un equilibrio bayesiano perfedo.{vse
::.:',,,
en
','.'
(: '
.;:'
,....
,,'"
-,
captulo 4).
2.5 Lecturas adicionales

...-.,
Seccin 2.1: Sobre los salarios y el empleo en empresas con fuerte ~pl~~:
tacin sindical, vase ~ m~d~k, de negociacin repetida en.Espinosa y
Rhee (1989; ejercicio 2,lO}y un'modelo de tina nica negociacin en el que
las empresas pueden escoger negociar sobre salarios y empleo o slo sobre
salarios, en Staiger (199), Sobre la negociacin sucesiva, vase un modelo
al estilo de Rubinstein de negciacin entre una empresa y un sindicato en
Ejercicios
",
.',.-.
/ 131
COMPLETA (c. 2)
Fernndez y Glazer (1991), con la caracterstica nueva de que el sindicato

debe decidir si convocar o no una huelga despus de que el sindicato o
la empresa rechacen una oferta. Existen mltiples equilibrios perfectos
en subjuegos efi~ientes que incorporan, ~ su vez, equilibrios perfectos en
subjuegos ineficientes (es decir, que incluyen huelgas), aun cuadohaya "
informacin completa. El libro de Osborney Rubinstein (1990) examina'
muchos modelos de negociacin en teora de juegos, los relaciona con el
enfoque axiomtico de Nash sobre la negociaci6n y utiliza los modelos de
negociacin como base de la teora del mercad~.
',~
Seccin 2.2: Sobr~ los pnicos. bancarios, va~e JaCkJiny ,Bhattachary
(1988). El libro de, McJ\.1illan(1986)e.xmina l;ls.prjmer;lsapliciK~Qries-'d teora de juegos a la economainternaciolv~i;:vaseuntrabajo'ths
rec~ente sobre la deuda exterior en Bu19W..y Rogff(1989) .. Sobre los
torneos, consltese un modelo en el qu lbs trabajadores pueden tanto
aumentar su produccin como sabotear la de los dems, en Lazar (1989;
ejerc~cio2.8). Vaseen Rosen (1986) el tem.ade los premios necesarios
paraIT)antener los incentivos en Una,sucesi8n de torneos en los' que los
perdedores en una etapa no pasan a la siguiente.
.
Seccin 2.3: Benoit y Krishna (1985)analizan juegos repetidos finitos,
Sobre larenegociacin en los juegos repetidos finitos, consltese Benoit
y Krishna (1989), y en los juegos repetidos infinitos vase el artculo panormico de Farrell y Maskin (1989). :Tirole(1988, captulo 6) examina
modelos dinmicos de oligopolio. El libro de Akerlof y Yellen (1986) recoge algunos de los tra~ajos ms importantes sobre salarios de eficiencia
y frece una introduccin integradora. Sobre poltica monetaria, vase
en Ball (1990) un resumen de los hechos estilizados, una revisin de los
modelos existentes y un modelo que explica la trayectoria temporal de la
inflacin.
Seccin 2.4: Vase un tratamiento formal de los juegos en forma extensiva en Kreps y Wilson (1982), y un enfoque ms verbal en Kreps (1990,
captulo 11).
ingresOs [A e Ip y escoge una herencia,B, que dejar al hijo. La ganancil

del hijo es UUR + B); la del padre es VUp - 13)+ /,;UUR + B), donde /,;> O
refleja la preocupacin del padre por el bienestar del hijo. Supongamos
que la accin es un nmero no negativo, A ::::0, que las funciones de
ingreso I H(A) e Ip(A) son estrictamente cncavas Y tienen un Imximo
en AH >
Y Ap >
respectivamente, que la herencia B puede ser
positiva o negativa y que las funciones de utilidad U y V son crecientes
y estrictamente cncavas. Demustrese el teorema del "nif1o mimado":
en el resultado por induccin hacia atrs, el hijo escoge la accin LJue
maximiza elingreso agregado de la familia fH(A) + Ip(A), a pesilr de que
slo la funcin de ganancias del padre es de alguna forma altruista,
2.2 Supongamos ahora que padre e hijo juegan un juego diferente, analizado originalmente por Buchanan (1975). Los ingresos IH e Ip estn
fijados exgenamente. Primero, el hijo decide qu parte del ingreso If{
ahorrar (S) para el futuro, consumiendo el resto UR - S) hoy. En segundo lugar, el padre observa la eleccin de S por parte del hijo y escoge una herencia, B. La ganancia del hijo es la suma de las utilidades
presente y futura: Ul UR - S) + U2(S + B). La ganancia del padre es
V(Ip - B) + k[U1 (IR - S) + U2(S + B)]. Supongamos que las funciones de
utilidad Ul, U2, y V son crecientes yestrictamente cncavas. Demustrese
que hay un "dilema del samaritano": en el resultado por induccin hacia
atrs, el hijo ahorra demasiado poco, para inducir al padre a dejarle una
herencia mayor (es decir, tanto las ganancias del padre corno las del hijo
podran aumentar si S fuera convenientemente ms alto y B convenientemente ms bajo).
2.3 Supongamos que los jugadores en el juego de la negociacin con horizonte infinito de Rubinsteintienen factores de descuento diferentes: 81
corresponde al jugador 1 y {j2 al jugador 2. Adptese el argumento dado
en el texto para demostrar que en el resultado por induccin hacia atrs,
el jugador 1 ofrece el acuerdo
2.6 Ejercicios
2.1 S.upongamos que un padre y un hijo participan en el siguiente juego,
anahzado originalmente por Becker (1974). Primero el hijo toma una
accin, A, que.resulta en un ingreso para l, IR (A), yen un ingreso para
el padre;Jp(A).
(Pensemos en I H(A) corno el ingreso dl hijo, neto de
cualquier coste de, la accin A.) En segundo lugar, el padre bserv los
al jugador 2, quien lo acepta.

2.4 A dos socios les gustara completar un proyecto. Cada socio recibe la
ganancia V una vez el proyecto ha sido completado, pero ninguno de ellos
132/
JUEGOSDINMICOS CON I~JFOR\'IACINCOMPLETA (c. 2)
recibe ganancia alguna antes de que el proyecto se haya podido terminar.

El coste que queda hasta que el proyecto se complete es R. Ninguno de
los socios puede comprometerse a hacer aportaciones futuras de cara a
completar el proyecto, de forma que deciden establecer el siguiente juego
de dos periodos: En el periodo 1 el socio 1 escoge contribuir con el de cara
a completar el proyecto. Si esta contribucin es suficiente para completar
el proyecto, el juego se acaba y cada socio recibe V. Si esta contribucin no
es suficiente para completar el proyecto (es decir, Cl < R), en el periodo
2 el socio 2 escoge contribuir con C2con el fin de completar el proyecto.
Si la suma (sin descontar) de las dos contribuciones es suficiente para
completar el proyecto, el juego acaba y cada socio recibe V. Si la suma
es insuficiente para completar el juego, ste termina y ningn socio recibe
nada.
Cada socio debe obtener el dinero con el que contribuye a financiar
el proyecto de otras actividades lucrativas. La forma ptima de hacerlo
es sacar primero dinero de las alternativas menos rentables. El coste (de
oportunidad) que resulta de una contribucin es, por tanto, convexo con
respecto al tamao de la contribucin. Supongamos que el coste de una
contribucin e es e2para cada socio. Supongamos que el socio 1 descuenta
los beneficios del segundo periodo de acuerdo con el factor de descuento
5. Calclese el nico resultado por induccin hacia atrs de este juego
de contribuciones de dos periodos para cada tro de parmetros (V,R,5);
vase el caso con horizonte infinito en Admati y Perry (1991).
2.5 Supongamos que una empresa quiere que un trabajador adquiera
la preparacin necesaria para desarrollar una determinada tarea, pero
dicha tarea eS tan inconcreta que ningn tribunal podra verificar si el
trabajador ha adquirido o no la preparacin necesaria. (Por ejemplo,
la empresa podra pedir al trabajador que se familiarizase con "nuestra
forma de hlCerlas cosas", o se hiciera un experto en "este nuevo mercado
en el que podramos entrar".) La empresa,. por tanto, no puede firmar
un contrato para reembolsar al trabajador el coste de esta preparacin:
incluso si el trabajador adquiere esta preparacin, la empresa puede decir
que el trabajador no lo ha hecho, y ningn tribunal podra decidir quin
tiene razn. Del mismo modo, el trabajador no puede firmar un contrato
para adquirir esta preparacin si se le ha pagado por adelantado.
La empresa podra utilizar, como incentivo para que el trabajador
adquiera la preparacin, promesas (crebles) de ascenso de la siguiente
forma. Supongamos que hay dos trabajos en la empresa, uno fcil (E) y
Ejercicios I 133
otro difcil (D), y que la preparacin es til en los dos empleos, pero ms
. en el difcil: YDO < YEO < YES < YDS, donde Yij es lo que el trabajador
produce en el trabajo 'i (= E o D) cuando el trabajador tiene un nivel de
preparacin de j (~ O o S). Supongamos que la empresa puede comprometerse a pagar salarios diferentes en los dos empleos, 'WE y 'WD; pero
ningl,J.n9de estos dos salarios puede ser menor que el salario alternativo
del trabajador, que normalizamos a cero.
El desarrollo temporal del juego es el siguiente: En el momento O la
empresa escoge 'WE y 'WD Yel trabajador observa estos salarios. En el ~~mento 1 el trabajador entra a formar parte de la empresa y puede adqumr
el nivel de preparacin S a un coste C. (Ignoramos laproduccin'y los
salarios en el primer periodo. Puesto que el trabajador no ha adqUirido
an la preparacin, lo eficiente es que se le asigne el trabajo E.) Supongamos que YDS - YEO > e, de forma que al trabajador leconyiene adquirir
la preparacin. En el momento 2 la empresa observa si el trabajador ha
adquirido o no la preparacin y decide entonces si concederle el ascenso
al trabajo D o no durante el segundo (y ltimo) periodo de empleo qel
trabajador..
"".':Los beneficios de la eID:presa en el segundo periodo son Yij- 'W;,
donde el trabajador realiza el trabajo 'i y tiene un nivel de preparacin j.
La ganancia del trabajador por realizar eltrabajo i en el segundo periodo
es 'Wi o 'Wi - e, dep.endiendo de si el trabajador se ha preparado o no en el
primer periodo. Hllese el resultado por induccin hacia atrs, Vase un
modelo ms complejo en Prendergast (1992).
!.:::' .
0'-
.~.
2.6 Tres oligopolistas operan en un mercado con una demanda inversa

dada por P(Q) = a - Q, donde Q = ql + q2 + q3 Y qj es la cantidad producida:.
por la empresa j. Cada empresa tiene un coste margipal de produccin
constante, e, sin costes fijos. Las empresas escogen sus cantidades de la
siguiente manera: (1) la empresa 1 escoge ql ~. O; (2)las empresas 2y3
observanql y escogen entonces simultneamente q2 y q3 respectivamente.
Cul es el resultado perfecto en subjuegos?
2.7 Supo~gamos que un sindicato representa en su totalidad a la fuerza
de trabajo de todas las empresas de un oligopolio, comO el. Sindicato
.Unido de Trabajadores del Automvil en el caso de la General Motors,
Ford, Chrysler y otras. Sea la sucesin temporal de las jugadas anlog~ al
modelo de la seccin 2.1.C: (1) el sindicato realiza una demanda salanal,
"", en todas las empresas; (2) las empresas observan (y aceptan) 'W y las
ti:! I
Eje,.cici()~ / 135
COMPLETA (e. 2)
ganancias del sindicato escogen simultneamente los niveles de empleo,

.Li de la empresa i; (3) las ganancias del sindicato son CIJJ - 71Ja)L, donde 1IJa
es el salario que los miembros del sindicato podran ganar en un empleo
alternativo, L = L] + ... + Ln es el nivel total de empleo en las empresas,
y los beneficios de la empresa i son i(w,L). A continuacin se describen
. losdeterminantes de los beneficios de dicha empresa: todas las empresas
..tienen la siguiente funcin de produccin: el nivel de produccin es igual
al nivel de empleo; q = L. El precio de equilibrio es P(Q) = Q, - Q
cuando la cantidad agregada en el mercado es Q = q] + ... ' + qn. Para no
complicar las cosas, supongamos que las empresas no tienen ms costes
que los salariales. Cul es el resultado petfeto en subjuegos de este
juego? Cmo (y por qu) afecta el mimero de empresas a la utilidad del
sindicato en el resultado perfectb ..en subjuegos?
2.8 Modifiquemos el modelo de torneos d la seccin 2.2.D de forma
.que la produccin del trabajadori sea Y == e -'- (1/2)8j +E, donde Sj 2':
representa el sabotaje por parte del jugador j, y la desutilidad del esfuerzo
(productivo y destructivo) del jugador i es g(e) + g(8), como en Lazear
(1989). Demstrese que elpremio ptimo WA -W13 es menor que cuando
no hay posibilidad de sabotaje (como en el texto).
.".,;.,'
2.9 Consideremos dos pases. En la fec;l1a1, ambos pases tienen aranceles

.tan altos que no hay comercio entre ellos. Dentro de cada pas, los salarios
y el nivel de empleo se determinan como en el modelo de monopolio y
sindicato de la seccin 2.l.C. En la fecha 2, todos los aranceles desaparecen,
ahora cada sindicato fija el salario en su pas, pero cada empresa produce
para los dos mercados.
Supongamos que en cada pas la demanda inversa es P(Q) = Q, - Q,
donde Q es la cantidad agregada en el mercado de ese pas. Sea q = L la
funcin de produccin de cada empresa, de forma que los slariosson el
nico coste dela empresa, y sea U(w,L) = (w -wo)L la funci6n de utilidad
del sindicato, donde 71Jo es un salario alternativo para los trabajadores.
Calclese el resultado por induccin hacia atrs en la fecha l.
Considrese ahora el siguiente juego en la fecha 2. Primero, los dos
sindicatos escogen simultneamente los salarios, 1J)] y 1J)2. Las empresas
observan los salarios y escogen los niveles de produccin para los mercados interior y exterior, que denotamos mediante h y e en el caso de
la empresa del pas i. Toda la produccin de la empresa se realiza en
su propio pas, de fo.rma que el coste total es Vi(h + e). Calclese el
resultado perfecto en subjuegos. Demustrese que los salarios, nivel de

empleo y beneficios (y, por tanto, tambin la utilidad del sindicalo y el
excedente del consumidor) aumentan cuando los aranceles desapilrecen.
Vase otros ejemplos en la misma lnea, en Huizinga (1989).
2.10 El juego de decisin simultnea que a continuacin se describe se
juega dos veces, habindose observado el resultado de la primera etapa
antes de que empiece la segunda. No hay descuento. La variable T
es mayor que 4, de forma que (4, 4) no es una ganancia de equilibrio
del juego jugado una sola vez. Para qu valores de x es la siguiente
estrategia (jugada por ambos jugadores) un equilibrio de Nash perfecto
ensubjuegos?
Jugar Q en la primera etapa. Si el resultado de la primera etapa es
(Ql,Q2), jugar P en la segunda etapa. Si el resultado de la primera
etapa es (y,Q2) donde y =1 Q], jugar R~ en la segunda etapa. Si el
resultado de la primera etapa es (Q],z) donde z =1 Q2, jugar Si en
la segunda etapa. Si el resultado de la primera etapa es (y,z)donde
y =1 Q] y z =1 Q2, jugar Pi en la segunda etapa.
2,2
x,O
-1,0
0,0
O,x
4,4
-1,0
0,0
0,0
0,0
0,2
0,0
0, -1
0, -1
-1, -1
2,0
2.11 El juego de decisin simultnea que a continuacin se describe se

juega dos veces, habindose observado el resultado de la primera etapa
antes de que empiece la segunda. No hay descuento. Puede alcanzarse
en la primera etapa la ganancia (4,4) en un equilibrio de Nash perfecto en
subjuegos con estrategias puras? En caso afirmativo, especifquense las
estrategias que lo pem1ten. En caso negativo, demustrese por qu no.
1
A 3,1 0,0 5,0
lvI 2,1 1,2 3,1

B 1,2 0,1 4,4
136 I JUEGOS DINMICOS CON INFORMACIN COMPLETA Ce. 2)
2.12 Qu es una estrategia en un juego repetido? Qu es un subjuego en

un juego repetido? Qu es un equilibrio de Nash perfecto en subjuegos?
2.13 Recurdese el modelo de duopolio de Bertrand esttico (con produetos homogneos) del ejercicio 1.7: las empresas fijan los precios simultneamente; la demanda del producto de la empresa i es a - Pi si
Pi < Pj, es Osi Pi > Pj y es (a - p)/2 si Pi = Pj; los costes marginales son
e < a:-Considrese el juego repetido infinitamente basado en este juego
de etapa. Demustrese que las empresas pueden utilizar estrategias del
disparador (que significan jugar para siempre el equilibrio de Nash del
juego de etapa despus de cualquier desviacin) para mantener--~lnivel
de precios de monopolio de un equilibrio de Nashperfecto en subjuegos'
si ys~lo si O ~ 1/2.'
_
2.14 Supongamos que lldemanda flucta de formlaleatoria en el juego
de Bertrand repetido infinitamente, descrito en el ejercicio 2.13: en cada
.periodo, el punto de interaccin de la fu~cinde dema;nda con el eje de
abcisas es aA. con probabilidad 'Ir.y aB aA) co~ probabilidad 1 -::'Ir; las
demandas en los diferentes perlados son indep~nciientes. Supongamos
que en cada periodo el nivel de demanda es revelado a ambas empresas
antes de que stas escojan los precios de ese periodo. Cules son los
niveles de precios de monopolio (P.4 y PB) para los dos niveles de demanda? Calclese 0*, el fi1enor valorde 8 tal que las empresas pueden
utilizar estrategias del disparador para mantener estos niveles de precios
de monopolio (es decir, jugar Pi cuando la demanda es a para i = A,E)
en un equilibrio de Nash perfecto en subjuegos .. Para cada valor de O
entre 12 y 0* hllese el precio mximo p(o) tal que las empresas puedan
utilizar estrategias del disparador para mantener el precio p(o) cuando la
demanda es alta y el precio P B cuando la demanda es baja en lln equilibrio
de Nash perfecto en subjuegos. (Vase Rotemburg y Saloner 1986.)
2.15 Supongamos que hay 11 empresas en un oligopolio de Cournot. La
demanda inversa viene dada por P(Q) = a - Q, donde Q = q} + ... + q,..
Consideremos el juego repetido infinitamente basado en este juego de
etapa. Cul es el valor menor de -O tal que las empresas pueden utilizar
estrategias del disparador para mantener el nivel de produccin de monopolio en un equilibrio de Nash perfecto en subjuegos? Cmo vara la
respuesta al cambiar -n? Por qu? Si (j es demasiado pequeo para que
las empresas utilicen estrategias del disparador para mantener el nivel de
Ejercicios I 137
produccin de monopolio, cul es el equilibrio de Nash perfecto en subjuegos simtrico ms rentable al que puede llegarse utilizando estrategias
del disparador?
j'.'
2.16 En el modelo de salarios y nivel de empleo analizado en la seccin

2.1.C, el resultado por induccin hacia atrs no es socialmente eficiente.
En la prctica, sin embargo, una empresa y un sindicato negocian hoy los
trminos de un contrato por tres aos, renegocian al cabo de tres aos
los trminos de un segundo contrato y as sucesivamente. Por tanto, esta
. relacin se puede caracterizar con ms o menos exactitud como un juego
repetido, como en Espinosa y Rhee (989)..,-'-"
En este problem~ se denvan condiciones bajo las cuales un eqUilibrio
de Nash perfecto en subjUegos dl juego repetido infinitamente es superior:
en el, sentido de Paretoal resultado por induccin hacia atrs del juego
jugado una sola vez. Denotemos por U* y 'Ir * , respectivamente, la utilidad
del sindicato y los beneficios de la empresa en el resultado por induccin
hacia atrs del juego jugado una sola vez. Consideremos un par utilidad"-, ,
beneficio alternativo (U,'Ir) asociado con un par salari-empleo alteriatlv :
(w,L). Supongamos que ambas partes tienen elmisinofador de descu~i.to:
O (para cada periodo de tres aos). Dervense condiciones sobre (w,L)
tales que: O) (U,'Ir) domine en el sentido de Pareto a (U* ,'Ir:) y(2) (U,'Ir)
sea el resultado de un equilibrio de Nash perfecto en subjuegos del juego
repetido infinitamente, donde se juega (U* ,'Ir*) para siempre despus de
cualquier desviacin.
'.- -~
'':'''. ":/."
2.17 Consideremos el siguiente juego con horizonte infinIto entre una

nica empresa y una sucesin de trabajadores, cada uno de los cuales vive
durante un periodo del juego. En cada periodo, el trabajador decide. s
esforzarse y producir por tanto a un nivel y con un coste por elesfuerzo
de c, o no esforzarse, no producir nada y no incurrir en ningn coste. Lo
que se produzca es propiedad de la empresa, peto sta puede compartirlo
con el trabajador pagndole un salario como se describe a continuacin:
supongamos que al principio del periodo el trabajador dispone de una
oportunidad alternativa con un valor de cero (neto del coste por el esfuerzo) y que no se puede obligar al trabajador a aceptar un salario por
debajo de cero. Supongamos tambin que y > c de forma que esforzarse
es eficiente.
Dentro de cada periodo, el desarrollo temporal es el siguiente: primero el trabajador escoge un nivel de esfuerzo, a continuacin tanto la
(;::-:-'
:~
138 / JUEGOS OlNMICOS CON INFORMACIN
empresa corno el trabajador observan el nivel de produccin y finalmente

la empresa escoge un salario para pagar al trabajador. Supongamos que
no existe manera de hacer cumplIr los contratos salariales: no hay ninguna restriccin sobre la eleccin del salario por parte de la empresa.
En el juego de un periodo, sin embargo, perfeccin en subjuegos implica
que la empresa ofrecer un salario de cero produzca lo que produzca e!
trabajador, de forma que el trabajador no se esforzar.
Consideremos ahora el problema con horizonte infinito. Recordemos
que cada trabajador vive slo por un periodo. Supongamos, sin embargo,
que al principio del periodo t, la historia del juego hasta el periodo t - 1 es
conocida por el trabajador que trabajar eh el periodo t. (Pensemos como'
si esta informacin.setransrnitiese de generacin a generacin entre los
trabajadores.) S)lpongamosque)a empresa descuenta el futuro de acuerdo
con el factor de 'descuento 5 por periodo; Descnoanse las estrategias de:
la empresa y de cada trabajador en un equilibrio perfecto en subjuegos
del juego cOllhorizonte infinito en las que en equilibrio cada trabajador
se esfuerza y produce por tanto a un niyely, siempre y cuando el factor
de descuento sea lo suficientemente alto. Dse una condicin necesaria y
suficiente para ,que su equilibrio exista.
2.18 Qu es una estrategia (en un juego arbitrario)? Qu es un conjunto
de informacin? Qu es unsubjuego (eh un juego arbitrario)?
2.19En la versin de tres periodos del modelo de la negociacin de Rubinstein analizada en la seccin 2.1.D, calculamos el resultado por induccin
hacia atrs. Cul es el equilibrio de Nash perfecto en subjuegos?
2.20 Consideremos las siguientes estrategias.en la versin de horizonte
infinito del modelo de la negociacin de Rubinstein. (Recordemos la
convencin notacional de que la oferta (s,1 - s) significa que 'el jugador 1
obtendr s y el jugador 2 obtendr 1 - s, independientemente de quien
haga la oferta.) Sea s. = 1/(1 + ). El jugador 1 siempre ofrece (s" ,1 - s.)
y acepta una oferta (s,l - s) slo si s ~ s . El jugador 2 siempre ofrece
(1 - s. ,s*) y acepta una oferta (.s,l - s) slo si 1 - s ~ 5s.: Demustrese
que estas estrategias son un equilibrio de Nash. Demustrese que este
equilibrio es perfecto en subjuegos.
2.21 Proporcinense las representaciones en forma extensiva y normal del
juego de la granada descrito en la seccin 2.1. Cules son los equilibrios
".Ij
"'",'
Refrrencias
COMPLETA (c. 2)
/\39
de Nash en estrategias puras? Cul es el resultado por induccin hacia

, 7 'Cul es el equilibrio deNash perfecto en subJuegos?
atraso
2.22Proporcinense las representaciones en for~~ae;xtensiva y,nonnal del

.
d 1 pnico bancario discutido en la seCCIOn2.2.B. Cuales son Jos
Juego e
..
7
equilibrios de Nash perfectos en subjuegos en estrategIas puras.
2.23Un comprador y un vendedor desearan realizar un intercambio. Antes de hacerlo, el comprador puede efectuar una inversin que aumenta
el valor que asigna al objeto a intercanlbiar. Esta inversin no pued: ser
observada por el comprador y no afecta el valor que el vendedor aSIgna
al objeto; que normalizamos a cero. (Como ejemplo, pensel~~osen una.
empresa que compra otra. En algn momento antes de la [uslon, el comprador podra haber actuado en el sentido de cambiar los productos que
su empresa planea introducir en el mercado de forma que se complemen~
ten despus de la fusin con los productos de la ~mpr~sa comprada. SI
el desarrollo de un producto lleva tiempo y el CIclovItal del producto
es corto, no hay tiempo suficiente para que el comprador lleve ~ ~a~o
esta inversin despus de la fusin.) Para el comprador el valor IIllClal
del objeto es v > O; una inversin de 1 aumenta est~ v~lor a '/)+ 1, ?ero
cuesta 12. El desarrollo temporal del juego es el SIguIente: en pnmer
lugar, el comprador escoge un nivel de inversin 1e incurre en el cosle
12, En segundo lugar, el comprador no observa 1pero ofrece vender el
objeto por un precio p. En tercer lugar, el comprador a~epta o rechaza la
oferta del vendedor: si el comprador acepta, la ganancIa del comprador
es v + 1- p - 12Y la del vendedor es p; si el comprador rechaza, ~tas
ganancias son _12 y cero respectivamente. Demustrese que .no eXIste
ningn equilibrio de Nash perfecto en subjuegos con estrate?las puras
en este juego. Calclese el equilibrio de Nash perfecto en SUbJ1,legos.
con
estrategias mixtas en el que la estrategia mixta del comprador. solo.aSIgna
. probabilidad positiva a dos niveles de inversin y la e~trategla mIxta del
vendedor slo asigna probabilidad positiva a dos precIOS.
2.7 Referencias
ABREU,
D. 1986. "Extremal Equilibria of Oligopolistic Supergames."
of Economic Theory 39:191-225.
JOlll'1wl
140/
-.
JUEGOS DfNMICOS CON INFORMACiN
1988. "On the Theory of lnfinitely
COMPLETA (e. 2)
Repeated
Referencias / 141
Carnes with Discounting."
Ecollometrica 56:383-96.
ABJ~EU,D., D. PEARCE, y E. STACCHETTI. 1986. "Optimal
with Imperfect
o/ Economic
Cartel Equilipria
oumal o/ Economic Theonj 39:251-69.
Monitoring."
ADMATI, A., Y M. PERRY. 1991.
Review
"JointProjects
without
Commitment."
5tudies 58:259-76.
BALL, L. 1990. "Tirne-Consistent

Policyand
Persistent
Changes
Hation." National
Bureau of Econornic R.esearch Working Paper
(Decernber).
-
in In#3529
BARRO, E., Y D. CORDON. 1983. "Rules, Discretion, and Reputation

Model of Monetary.Policy."
oumal of Monetanj Economics 12:101-21.
"A Theory
o/ Economic
"A Non-cooperative
Equilibrium
for Supergames."
Studies 38:1-12.
FUDENBERG,D., Y E. MASKIN. 1986. 'The Folk Theorem

with Discounting
AKE1~LOF,C., Y J. YELLEN, eds. 1986. Efficiency Wage Models 'o/ the Labor
Market. Cambridge, Inglaterra: Cambridge University Press.
BECKER, G. 1974.
FRIEDMAN, J. 1971.
Review
and Incomplete
CREEN, E., YR. PORTER. 1984. "Noncooperative

Pricelnformation,"
Econometrica 52:87-100.
HUIZINGA, H. 1989. "Union
Stanford University, Mirneo.
in Repeated
Carnes
Econometrica 54:533c54.
Inforrnation."
Collusion
Wage Bargaining
Under Irnperfect
and Industry
Structure."
JACKLIN, c., y S. BHATTACHARYA. 1988. "DistinguishingPanics

formation~based
Bank Runs: yYelfare and Policy Implications."
Political Economy 96:568~92.
and In':
oumal of .
in a
KREPS, D. 1990. A Course in Microeconomie Theory. Princeton,
University Press.
NJ: Princeton
oumal of Political
of Social Interactions."
Economy 82:1063-93.
KREPS, D., Y R. WILSON.
1982.
"Sequential
Equilibrium:."
Eeonometne~
. .' ~;
BENOIT, J-P., y V Krishna.

53:905-22.
1985. "Finitely
-. 1989. "Renegotiation
in Finitely
School Working Paper #89-004.
Repeated
Econometrica
Carnes."
50:863-94..
E. i989. "Pay Equality

Eeonomy 97:561-80.
LAZEAR,
Repeated
Carnes."
Harvard
.
Business
BUCHANAN, J. 1975. "The Sarnaritan'sDilernrna."

In Altruism, Morality,
and Economic Theonj, E. Phelps, ed. New York: Russell Sage Foundation.
BULOW, J., y K. ROGOFF. 1989. "Sovereign
Debt:
Is to Forgive
to Forget?"
American Economic Review 79:43- 50.

D[AMOND, D., Y P. DYBVIG. 1983. "Bank Runs,
Liquidity." oumal of Political Economy 91:401~19.
Deposit
ESPJNOSA, M., y C. RHEE. 1989. "Efficient Wage Bargaining
Insurance,
and
as a Repeated
Carnes."
Carnes
lid t'conomic Behavior 1:327-60.

FERNNDEZ, R., Y J. CLAZER. 1991. "Striking for a Bargain Between
Completely
Informed Agents." American Economic Review 81:240-52.
Politics." oumal of Politieal
LEONTIEF, W. 1946. "The Pure Theory of the Cuaranteed

Contract." oumal of Political Eeonomy 54:76-79.
McMn:.LAN, J. 1986. Carne Theory in International
Harwood Acadernic Publishers.
as Optimum:
Annual
Wage
Economies. ChUT, Suiza:
OsBORNE, M., Y A. RUBINSTEIN. 1990. Bargaining and Markets. San Diego:

Acadernic Press.
PRENDERGAST,
in Repeated
and Industrial
LAZEAR, E., Y S. ROSEN. 1981. "Rank-Order

Tournarnents
Labor Contracts." oumal of Politieal Eeonomy 89:841-64.
Came." Quarterly oumal o/ Economics104:565-88.

FARRELL,J., y E. MAsKIN. 1989. "Renegotiation
:L'.iC,;
.:/
man Capital
e 1992.
Acquisition."
"The Role of Prornoton

De prxima
in Inducing
aparicin
Specific Hu-
en Quarterly oumal o/
Eeonomies.
Two
ROSEN, 5.1986.
"Prizes and Incentives
rican Economie Review 76:701-15.
in Elimination
Tournaments.'~
Ame-
1;;
. ~,.
142 / JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)
ROTEMBERG,
J., y G. SALONER.1986. "A Supergame-Theoretic Model of
Busmess Cycles and Price Wars during Booms." American Economic Review
76:390-407.
3. JUEGOS ESTTICOS
CON INFORMACIN INCOMPLETA
RUB~STEJ.'\I,
A. 1982. "Perfect Equilibrium in a Bargaining Model." Econometrzca 50:97-109.
..
, ,'
.~
,~:;
~i~TEN,R. 1965. "S~i~~~he~retis.che.

Behandlung eines Oligopolmodells
24. Nachfragetraghelt. Zeltslzcrift fr Gesamte Staatswissenschaft 121:301SHA~~D,.A., ~ J. SurrON. 1984. "Involuntary Unemployment as a Perfect
Equzh?numm ~ Bargaining Model." Econometrica 52:1351-64.
S~IRO,C., yJ.'STIGLITZ.1984. "Equilibrium Unemployrnent as a D' 'plme Device." American Economic Review 74:433-44.
ISCl
SOB _L,
L y J. T~HASHI. 1983. "A MultistageModel
Remew of Economlc Studies 50:411-26.
of Bargainin ."
g
STA~:I<ELBERG,
H. VON. 1934.. Marktform und Gle:hgewicht.
Spnnger.
Viena: Julius
STAIGER~
D. 1991. "Why Do Union Contracts Exclude Employment?" Stanford Uruversity, Mimeo.
TIROLE,J. 1988. The Theory o/ Industrial Organization.
Press.
.{,;',
ambridge: MIT
Con este captulo comienza nuestro estudio de los juegos con ill!0r1110Il
incompleta, tambin llamados juegos bayesianos .. Recordemos que en un
juego con infoIDlacin completa las funciones de ganancias de. los juga~
dores son informacin del dominio pblico. Por el contrario, en un juego
con informacin incompleta, al menos un jugador no est'seguro de la
funcin de ganancias de otro jugador. Un ejemplo comn de un juego
esttico con informacin incompleta es una subasta de sobre cerrado:
cada participante conoce su propia valoracin del bien subastado, pero no
conoce las valoraciones de los otros participantes, y las pujas se entregm
en sobres cerrados, por lo que las decisiones de los jugadores pueden considerarse simultneas. Sin embargo, la mayora de los juegos bayesianos
con inters econmico son dinmicos. Como veremos en el captuJo,4,
la existencia de informacin privada conduce de forma natural a que las
partes informadas intenten comunicar (o a confundirlos), y que las partes no informadas intenten conseguir informacin. Estas cuestiones son
intrnsecamente
dinmicas.
.
'
En la seccin 3.1, definimos la representacin en forma normal de
un juego bayesiano esttico y el equ.i1ib'nbayesiano de Nash en dicil~
juego. Puesto que estas definiciones son abstractas y algo complejas,
introduciremos las ideas principales con un ejemplo sencillo, el de l~
competencia a la Cournot bajo informacin asimtrica.
En la seccin 3.2 consideramos tres aplicaciones. En priiller lugar,
ofrecemos una discusin formal de la interpretacin de las estrategias
mixtas dada en el captulo 1: la estrategia mixta del jugador .i representa
la incertidumbre del jugador i con respecto a la estrategia pura que eligir
j, y la eleccin de j depende de una cierta informacin privada. En
segundo lugar, analizamos una suba sta "de sobre cerrado en la que las
valoraciones de los participantes son informacin privada, mientras que
la valoracin del vendedor es conocida. Finalmente, consideramos el
caso en el que un comprador y un vendedor tienen, cada UIlO de ellos,
informacin privada sobre sus valoraciones (como cuando una empresa
14.1/
JUEGOS EST..\TICOS CON INFOR,"IAClN
INCOMPLETA (e. 3)
Teorla: llegas bayesianos estticos y equilibrio bayesimlO de Nash / 145
conoce el producto marginal de un trabajador y el trabajador conoce las

oporl1midades alternativas de que dispone). Analizamos un juego de
intercambio llamado subasta doble: el vendedor anuncia un precio de
venta y el comprador anuncia simultneamente un precio de compra;
el intercambio tiene lugar al precio medio si el ltimo es mayor que el
primero.
En la seccin 3.3 enunciamos y demostramos el Principio de revelacin,
e indicamos brevemente cmo puede aplicarse al diseo de juegos cuando
los jugadores tienen informacin privada.
De modo similar, si el coste de la empresa 2 es bajo, q';(cB) ser la solucin

de
max[(a
Competencia a la Cournot bajo informacin asimtrica

Consideremos un modelo de duopolio de COlirnot con demanda inversa
dada por P(Q) = a - Q, donde Q = ql + q2 es la cantidad agregada en
el mercado. La funcin de costes de la empresa 1 es CI (ql) = cql. Sin
embargo, la funcin de costes de la empresa 2 es C2(q2) = crlq2 con probabilidad f) y C2(q2) = CM2 con probabilidad 1- B, donde CB < CA. Adems,
la informacin es asimtrica: la empresa 2 conoce su funcin de costes y
la de la empresa 1, pero la empresa 1 slo conoce su funcin de costes y
que el coste marginal de la empresa 2 es CA con probabilidad e y CB con
probabilidad 1- e. (La empresa 2 podra ser nueva en el sector o haber desarrolJado una nueva tecnologa.) Todo esto es informacin del dominio
pblico: la empresa 1sabe que la empresa 2 cuenta con mejoiinformacin,
y la empresa 2 sabe que la empresa 110 sabe, y as sucesivamente.
Naturalmente, la empresa 2 querr elegir una cantidad diferente (y
presumiblemente menor) si su coste marginal es alto que si es bajo. Por
su parte, la empresa 1 debera prever que la empresa 2 puede ajustar
su cantidad al coste de la manera indicada. Sean qi(CA) y qi(CB) las
cantidades elegidas en funcin de sus costes, y sea qi la cantidad elegida
por la empresa 1. Si el coste de la empresa 2 es alto, sta elegir qi(cA) tal
que sea una solucin de
qi -
q2) - cBlq2'
Finalmente, la empresa 1 sabe que el coste de la empresa 2 es alto con

probabilidad B y debera prever que la cantidad elegida por la empresa 2
ser qi(CA) o qi(CB), dependiendo del coste de esta empresa. Por taJ;lto,la
empresa 1 elige qi que resuelve
3.1 Teora: Juegos bayesianos estticos y equilibrio bayesiano

de Nash
3.1.A Un ejemplo:
q2
maxB
q
[(a -, ql - qi(cA)
'cJ ql
+ (l -
B) [(a -ql
q2
qi -
c] ql
para maximizar el beneficio esperado.

. , .,
Las condiciones de primer orden de estos problemas de optinuzaclOn
son
q2(CA) -
a -
qi -
CA
a-
qi -
CB
-2
qi(c~)
.,"
L...
B [a - qi(cA)
ql =
c]
+ (l 2
B)-[a - qi(CB) ~c]
'
Supongamos que estas condiciones de primeror.den caracteriz~i~isoluciones de los problemas de 'optimizacin anterires, '\Recotdem:~s.~el
ejercicio 1.6 que, en un duopolio de Coumot .C?-!1 ~oI1llacin.co.~gl~ta,
si los costes de las empressson lo'suficientemente diferentes entre s, la
empresa con el coste alto no produce nada en-equilibio. Corno ejeicoo,
hllese una condicin suficiente para excluir aqu problemas anlogos.)
Las soluciones a las tres condiciones de primer orden son
y
max[(a
- qi(CB) -
q2) - cAlq2-
qi =-
a -
2c +BCA + (l 3
B)cB
"
1 .:.::-
(
"-'.-
146/
(..,
.
s estlticos y eqllilib,'io bayesiallo de Nosl, ! 147
Teoria: Juegos bayesw,lO
INCOMPLETA (c. 3)
Comparemos q2:(CA), q2:(CB) y qj con el equilibrio de Cournot con

informacin completa y costes el y ez, Suponiendo que los valores de et y
Cz son tales que ambas cantidades de equilibrio son positivas, la empresa
i produce q = (a - 2Ci + cj)/3, en este caso con informacin completa, Por
el contrario, en el caso con informacin incompleta, q2:(cA) es mayor gue
(a - 2CA + c)/3 y qi(CE) es menor que (a - 2CB + c)/3, Esto ocurre porque la
empresa 2 no slo ajusta su cantidada su coste, sino que tambin respohde
al hecho de que la empresa 1 no puede hacerlo. Por ejemplo, si el coste
de la empresa 2 es alto, sta produce menos porque su costE4'esalto, pero
por otro lado produce ms porque sabe que la empresa 1 producir una
cantidad que maximice su beneficio esperado y qu, por ello, es menor
delo que producira sisupier que ~l cbstede la empresa 2 es alto, (Una
cara:tersticade este ejemplo que puede prestarse a confusin, es que qi es
exactamenteigliala las cantidades deC:ournot espetadas que la empresa 1
producira en los'dos juegos correspondientes con informacin completa.
Esto no es cierto normalmente; consideremos por ejemplo el caso en el
cual el coste total
la empresa i es cq'f)
de
3.1.B Representacin en forma nlirmal de los juegos bayesianos

estticos
Recordemos que la representacin en fOI1Jlanormal de un juego con informacin completa de n jugadores es G = {SI' , , . ,S~; u], ' , . 11,n}, donde S es
el espacio de estrategias del jugador i y 11,(Sl, ,., ,sn) es laganancia al jugador i cuando los jugadores ligen ras estrategias (S], ~.: ,~~),'S~
e~~~rgo,
como discutimos en la seccin 2,3,13" en un juego d decisin siriitnea
con informacin completa, para un jugador una estra~egia ~~s{mplemente
una accin, por laque podemos escribir G'; {Al .... ~,A~;11,],... 'Un}'
donde Ai es el espacio de acciones dei y 1Li(a], .. , ,an) es la ganancia
del jugador i cuando lo,sjugadores eligen las acciones (a]" , "an), Para
preparar nuestra descripcin del desarrollo temporal de un juego esttico
con informacin incompleta,describimos
la secuencia temporal de un juego
esttico con informacin completa del siguiente'modo: (1) ios jugadores
toman simultneam:ente sus decisiones (el jugador i elige del conjunto
factible A), y luego (2) reciben las ganancias 11,i(a], ' , . ,an).
a;
""-
Ahora queremos representar en forma normal un juego d decisin simultnea con informacin incompleta, tambin llamado juego bayesiano
esttico, El primer paso consiste en representar la Idea de que cadajugadar conoce su funcin de ganancias, pero puede no conocer las de otros
'bl es fun.,dones de ganancias de ., /),;(0.], ... ,0,,,; /,,),'

Sean la POSI
ugad ores.
,
'd'
pertenece a un conjunto de tlPOSPOS1.
!ttpO del Juga or 1" que
. .
donde t es e
'1
esponde a una de las fUllcJOlles
.
es aGiode tipos) 7';. Clda tIpO 'i corr ,
bies (o PI'
ador i podna tener.
de ganancias diferente que e Jug
~os que el J'ugador i tiene dos posi, plo abstracto, supongar.
. ,
Como eJem
'D"
s en este caso que el jugador'/. tlene
'ones
de
gananCIas.
]namo
.
.
J
}
f
l'
de tipos del J'ugador '1 es Ti = l.til,liz
.bies unCI
's
t. Y h que e espaCIO
. )
dos hpO, ,1
'~d
ias del jugador i son 11,i(al,' .. ,0,,,, til Y
Yque las dos funcpIOndesoesgua:::r la idea de que cada uno de los tipo.s
(
a 't-z)
o em
"d 1 f nciones de gananCIas
. d'fJ 'eren t e
tii al,' , ., "",
'
dar corresponde a una e as u
1'
d.e Juga
. ,
1fin de representar
de que
.
'. laposibilidad
.
1, ador podna tener, con e
que
e
ug
.
d'f
tes
conJ'untos
de
acciones
factibles,
como
.
d'
ador puede tener 1 eren
1
ca
a
Jug
,
"
.
S
s
por
eJ'emplo,
que
el
conjunto
.
os a contmuaCIOn, upongamo,
} ee
vereID
,
d ar t. es {b}
con probabilidad q y {o"b,c con
.
factibles del Juga
a,
(
aCCIOnes
d
afirmar que i tiene dos tipos ti1
bTd dI Entonces po emos
,
proba 11 a a r~babi1idad de til es q) y podemos decir que el conjunto
~:i~C:i:~:
~ac~bles de i es {a,b,c} para amb~s tipos, pero hacer que la

. d d 1 gir c sea -00 para el tlpO til'
ganancia de,nva l~ :: ;oncreto consideremos el juego de Cournot de la
p
Como
eem . Las aCCIones
'd'
, , nterior
e 1a s empresas son sus decisiones sobre
secclOn a
'L
2 tiene dos posibles funciones de costes
las cantidades ql y qZ' a empresa
.
y, por ello, dos posibles funciones de beneficios o gananCIas:
'1rZ('1l,'1Z; cn) = [(a - '11 - qz) - CE) qZ
y
1rZ(ql,qZ;
CA) = [(a, - '11 - '1z) - CA) '12
La empresa 1 slo tie~e una funcin de ganancias posible:

'1rl(ql,Qz;C)
= [(a - ql - '1z) -
e)
ql
. que e 1 espaCIO
'de tipos
de" la empresa 2 es Tz = {CB,CA} y
Podemos deCIr
.
qu el espacio de tipos de la empresa 1 es 7] = {c}',
l'
d
'"
del.' tipo de un jugador, decrr
Da d a esta d e fimCIOn
'1 que e ' Juga~' or
,.
.-'
.-';, d"e gananCIas
'es
equivalente " a deCIr que e Jugalor /.
1 conoce su fuhcIOn
" '.
,
d ..decir que el Jugador '1, puede no estar
conoce su tIpo, Del rmsmo mo o,
, I t .
de otros J'ugadores es
seguro d e las fuh'CIonesed ganancI'as
.
. equwa ene
d
'
a decir que puede no estar
seguro. de los tipos de otros Jugadores,
, r, e-I
t ). Utilizamos T-i para mucar e
notados por t- = (t],., . ,/i_l,t,+l".
.. , 'n
148/
INCOMPLETA (c. 3)
conjunto de todos los posibles valores de L y utilizamos la distribucin

de probabilidad Pi(LtlU para designar la conjetura sobre los tipos de los
otros jugadores, L, dado el conocimiento del jugador i de su tipo ti. En
cada aplicacin analizada en la seccin 3.2 (yen la mayor parte de la
literatura), los tipos de los jugadores son independientes, en cuyo caso
p(LtlU no depende de t'i, por lo que podemos escribir la conjetura del.
jugador i como Pi(Li). Sin embargo, hay contextos en los que los tipos
de los jugadores estn correlacionados, por lo que deberemos tenerlo en
cuenta en nuestra definicin de juego bayesiano esttico, escribiendo la
conjetura del jugador i como Pi(Ltlt;).1
Uniendo los nuevos conceptos de tipos y conjeturas con los elementos
ya familiares de la representacin en forma normal de un juego esttico
con informacin completa, obtenemos la representacin en forma normal
de un juego esttico bayesiano.
Definicin. La representacin ell onll a 110m/al deun juego bayesiano esttico
de JI jugadores exige concretar los espacios de acciones de los jugadores Al, ... ,An,
sus espacios de tipos T1, ... ,Tn, sus conjeturas PI/"',Pn
y sus fUnciones de
ganancias ul, ... ,un. El tipo del jugador i, t es collocido slo por el jugador
i, detennina la funcin de ganancias del jugador i, 'U(al, ... ,an; ti), y es un
elemento del conjunto de tipos posibles T;. La cOlljetura del jugador i, Pi(L Iti),
describe la incertidumbre de i respecto a los posibles tipos de 'los otros 1'1 - 1
jugadores, L dado el propio tipo de i, ti. Denotamos este juego como G
{Al,'"
,An;TI, ... ,Tn;PI,'"
,p,,;lL], ... Un}.
Siguiendo a Harsanyi (1967), suponemos que el desarrollo temporal

de un juego bayesiano esttico es la siguiente: (1) el azar determina un
vector de tipos t = (tI,' .. ,tn), donde ti se obtiene del conjunto de tipos
posibles Ti; (2) el azar revela ti al jugador i, pero a ningn otro jugador; (3)
los jugadores toman sus decisiones simultneamente; el jugador i elige ai
del conjunto factible A, y (4) se recibt;.nlas ganancias 'ui(a, ... ,an; ti). Con
la introduccin ficticia del azar en (1) y (2), hemos descrito un juego con
informacin incompleta como un juego con informacin imperfecta, donde
'1 Imaginemos que dos empresas estn compitiendo por desarrollar una nueva'tecnologia.
La posibilidad de xito de cada empresa depende en parte de la dificultad en desarrollar la '
tecnologa, dificultad que es desconocida, Cada empresa slo sabe si lo ha logrado o no, pero
no si la otra Jo ha conseguido. Sin embargo, si la empresa 1 ha tenido xito; es ms probable
que la tecnologia sea fdl de desarrollar y, por ello, tambin ms probable que la' empresa 2
la haya desarrollado. Por lo tanto, la conjetura de la empresa 1 sobre el tipo de la empresa 2
depende del conocimiento por parte de la empresa 1 de su propio tipo.
Teora: Juegos bayesianos estticos y equilibrio bayesiano de Nash / 149
con informacin imperfecta queremos decir (como en el captulo 2) que en

alguna ronda del juego el jugador al que le corresponde decidir no conoce
la historia completa del desarrollo anterior del juego. Aqu, como el azar
revela el tipo del jugador i al jugadori pero no al jugador j en el paso
(2),el jugador j no conoce la historia completa del juego cuando toma sus
decisiones en el paso (3).
Necesitamos tratar otras dos cuestiones algo ms tcnicas para completar la discusin sobre la representacin en forma normal de los juegos
bayesianos estticos. En primer lugar, existen juegos en los cuales el jugador i tiene informacin privada no slo sobre su propia funcin de
gananci.s,sino tambin sobre la funcin de ganancias de otro jugador.
Por ejemplo, en el ejercicio 3.2, cambiamos la informacin asimtrica del
modelo de Coumot de lasecin, 3.1.A de manera que los costes son
simtricos y del dominio pblico, pero una empresa conoce el nivel de
demanda y la otra no. Puesto que el nivel de demanda afecta lasfun~
ciones de ganancias de ambos jugadores, el tipo de la empresa informada
aparece en la funcin de ganancias de la empresa no informada. En el caso
de 1'1 jugadores, capturamos esta posibilidad permitiendo que la ganancia
del jugador i dependa no slo de las acciones (al,'.' ,an), sino
tambin de todos los tipos (tl, ... ,tn). Escribimos esta ganancia como
ui(at,
... ,an;tl,
,tn).
La segunda cuestin tcnica se refiere a las conjeturas Pi(Ltlti). SupOl\emos que es del dominio pblico que en el paso (1) del desarrollo
temporal del juego esttico bayesiano, el azar escoge un vector de, ,tipos
t = (tI, ... ,tn) de acuerdo con la distribucin a priori de probabilidad p(t\
Cuando el azar revela ti al jugador i, ste puede calcular laconjel:tiiPi(Lilti) utilizando la regla de Bayes:2'
a, "
Pi(Li Iti) =
p(L;,ti)
P(ti)
p(L;,ti)
p(L;,ti) .
t_iET_i
Adems, los otros jugadores pueden calcular las distintas conjeturas que
podra, formarse el jugador -i, dependiendo del tipo de i, concretame,nte
2 La regla de Bayes es una frmula para calcular P(AiB), la probablIidad (condidomida)
de ql.\e un suceso A ocurra dado que un suceso B ha ocurrido ya. Sean peA), P(B) y P(A,El
las prob,abilidaqes (a priori, es decir, las probabilidades antes de que A o B hayan podido
ocurri~) de qu~ A ocurTa, de que B ocurra y de'que ambos A y B ocurran respectivamente. La
regla de Bay",s establece que'P(AIB) ; P(A,B)/ P(B). Es decir, la probabilidad condicional
d", que se d /1es igual a la probabilidad de que se den tanto A como B, dividida por. la
pr~babilida'd
pri9ri de que ocurra B.
150/
JUEGOS ESTt\TICOS CON INFORMACiN
Teoria: Juegos bayesimws estticos y eqllibrio bayesllIo de Nasl / 151
INCOMPLETA (c. 3)
para cada ti en Ti' Como ya indicamos, vamos a suponer a

menudo que los tipos de los jugadores son independientes, en cuyo caso.
p;(Li) no depende de ti, pero se obtiene a partir de la distribucin a priori
p(t). En este caso, los otros jugadores conocen la conjetura de i sobre sus
tipos.
Pi(Lilti)
.,
"
3.1.C Definicin del equilibrio bayesiano deNash

Ahora queremos definir el concepto de equilibrio de los juegos bayesiano~,
estticos. Para ello, necesitar1osd~finir primero los espacios de estrategias,
de los jugadores en dicho jueg.~Retordemos de las setciones2.3.By:'
2AB qtle la estrategia de unjtigadot'esun partde accin completo, que; 1
establece una accih factible para cad contihgenciaenla que el jugadt ".'~
podra tener que actuar: Dada la scuencia temporal del juego esttico
, ~ayesino<en ehual el azar comienza el juego eligiendo los tipos
los>':
Jugadores, una estrategi'a (pura)deljugadr i debe establecer una acci6i{ ,
posible para cadunO de los tipos posibles del jugador i.
",
i.
,
-.-"{'
..~:
. ,t '~' .. ,' .' :~'
Definidri:Enet'uegobayeslm.iJestticoG=={AI,:.A'TI
.".,'
nI
' .. "' T 'PI
P":; Ul~' .. ,U,;}, una'estrategia
del jugador i es una funcin Si(t;) donde, para
cada tipo ti en Ti, Si(ti)'determiha la accin del conjunto factible Ai que el tipo ti
elegira si el azar determinara que el jugador es de este tipo.
_
nI
1."/
Al contrario que en ls jugos (tahto estticos como dinmicos) con

informacin completa, en 'un juego bayesiano; los espacios de estrategias
no se dan en la representaCin 'en forma normal del juego; sino que s
construyen a partir de los espacios de tipos y acCiones. El conjunto' de
posibles estrategias (puras) del jugador i, Sir es el conjunto de toda,s las
funciones posibles con dominio T; y recorrido Ai. Por ejemplo, en una
estrategia de separacin, cada tipo ti en Ti elige una accin diferente ai
d~ Ai. Por el contrario, en una estrategia de agrupacin, todos los tipos
elIgen la misma accin. Esta distinei6h entre estrategias de separacin y
de agrupacin es importante para la discusin de los juegos dinmicos con
ir;0rmacin incompleta del captulo 4. Introducimos la distincin aqu
solo para ayudar a describir la'grart variedad de estrategias que'pueden
construirse a partir de un determinado par de espacios de tipos y acciones;
TiyAi.
_ ",'
.
I)u,~de parecer innecesari~ exigir que la estrategia dl jugador i determine una accin factible para eada uno de los tipos posibles del jugado~
,'.'.
'
/. Despus de todo, una vez el azar ha elegido un tipo particular y se

lo ha revelado a un jugador, puede parecer que el jugador no necesita
preocuparse por las acciones que podra haber tomado de haber salido
elegido otro tipo. Sin embargo, el jugadori necesita tener en cuenta lo que
harn los otros jugadores, y lo que harn depende de lo que piensen que
har el jugador 'i para cada ti en Ti. Por 10 tanto, para decidir qu hacer
una v~i que un tipo ha sido elegido, el jugador i tendr que pensar qu
habra hecho vara cada otro tipo de Ti que podra haber sido elegido.
Consideremos, por ejemplo, el juego de Coumot con informacin
asimtrica de la seccin 3.1.A. Argumentamos all que la solucin del juego
tonsiSt enlaeleccin de tres cantidades: qi(CA), qi(cs) y qj .En trminos
dl;: defiJ:lidnde estrategia q~e acabani.s de dar;t'par (q~(cA),qi(cB
esla estrategia de la empresa 2 y qj es la estrategia ded,'empresa 1. Es
fcilimagihar que la empresa2 elegir dif~rentes c~tidal~s' dependietlq
de su coste. Sin embargo, es igualmel1te importante darse c~enta de qDe
li elecdn de la cantidad de la emp~s~ debera tener en cuenta quej~
. cantidad de la empresa 2 depender "el coste de la empresa 2. PoP 16
tanto, si nuestro concepto de equilibrio es requerir que la estrategi"J~
la empresa 1 sea tma mejor respuesta a la estrategia de la empresa;2;.Ia
estrategia de la empresa 2 debe ser un par de cantidldes, una para ca9a
posible coste tipo, o si no, la empresa 1 no podra calCUlarsi su estrategia
es efectivamente una mejor respuesta a la estrategia dela empresa 2., .
De forma ms general, no podramos apJicar la nocin de equilibrio de
Nash a juegos bayesianos si permitiramos que la estrategia de un jugadf?r
nespedficara lo que el jugador hara si algunos tips're~ultarap. el~gi40;
por el azar. Este ~rgumento es anlogo .~ ~no 'delcapfUl~ 2:' 'pll'dk
haber parecido Innecesario 'exigir que laestratei derjtig:dor i el1.t[;4
juego dinmico con informacin completa especlfic';;;seuna accinf<lctibie
para cada contingencia en la cual el jugador i podra haber tenido q
jugar, pero no podramos haber aplic<ldola nocin de equilibrio de Nash
a juegos dinmicos con informacin completa si hubiramos permitido
que alguna estrategia dejara sin determinar las acciones del jugador en
alguna contingencia.
. Una vez dada la definicin de estrategia en un juego bayesiano, abordamosahora la definicin del equilibrio bayesiano de Nash, A pesar d~
la.complejidad notacibrial de la definicin; la idea central es simple y familiar: la estrategia de cada jDgador debe ser una mejor respuesta a las
estrategias de los restantes jugadores. Es decir, un equilibrio bayesiaJio,.. '
de Nash es simplemente un equilibrio de Nash en un juego bayesiano.''
152/
JUEGOS EST..i.TICOS CON INFORMACiN
Aplicaciones / 153
INCOMPLETA (e 3)
Definicin. En el juego bayesiano esttico G = {Al,' .. ,:1n; TI, ... ,T,,; PI, .
estrategias
= (.~1',... ,"~) forman un equilibrio bayesiano
de Nash (con estrategias puras) si para cada jugador i y para cada uno" de sus
tipos ti en Ti, si (ti) es una solucin de
)J" ;(I, ... ,1,,} las
,,*
Pat
pera Boxeo
pera
2,1
0,0
Boxeo
0,0
1,2
Chris
Es decir, ningn jugador quiere cambiar su estrategia, incluso si el cambio supone
cambiar slo una accin para un tipo.
Es inmediato dem'ostrar que en un juego bayesiano esttico finito (es
decir, un juego en el cual TI es finito y (Al, ... ,A,,) Y (Tl, ... ,T,.) son todos
conjuntos finitos) existe un equilibrio bayesiano de Nash, tal vez con
estrategias mixtas. La demostracin es muy similar a la de la existencia
de un equilibrio de Nash con estrategias mixtas en juegos finitos con
informacin completa, por lo que la omitimos.
3.2 Aplicaciones
3.2.A Revisin de las estrategias mixtas
Como mencionamos en la seccin 1.3.A, Harsanyi (1973) interpret la
estrategia mixta del jugador j como la incertidumbre deTjugador i sobre
la estrategia pura elegida 'por el jugador j y que, a su vez; la eleccin de j
depende de cierta informacin privada. Ahora damos"i.m\~rlI1cido'ms
preciso de esta idea: un equilibrio de Nash con~str~tegi~~ 'mixtas en u~
juego con informacin completa puede (casi siempre) interpretarse como
un equilibrio bayesiano de Nash con estrategias puras en un juego muy
similar con algo de informacin incompleta. (No tendrem9sen cuenta los
casos raros en los cuales tal interpretacin no es posible.) De un modo ms
evocador, la caracterstica crucial de un equilibrio de Nashcori estrategias
mixtas no es que el jugador j elija una estrategia al azar, sirio'que el jugadr
i no sabe con certeza la eleccin del jugador j. Esta falta de certeza puede
provenir de algn suceso aleatorio o (ms probablemente) de tin poco de
informacin incompleta, como en el siguiente ejemplo.
-Recordemos que en la batalla de los sexos existen dos equilibrios de
Nash con estrategias puras, (pera, pera) y (boxeo, boxeo), y uno con
estrategias mixtas, en el que Chris elige la pera con probabilidad 2/3 y
Pat elige el boxeo con probabilidad 2/3.
La batalla de los sexos

Ahora supongamos que, aunque se conocen desde hace mucho tiempo,
Chris y Pat no estn seguros ele las ganancias del otro. En particular.' supongamos que: -la ganancia de Chris si ambos van a la p.era es 2+te, donde
te es informacin privada de Chris; la ganancia de Pat SI ambos van al boxeo es 2 + tp, donde tp es informacin privada de Pat, y te y tp se obtienen
independientemente de una distribucin uniforme en [O,;:;]. (La elec~~.
de una distribucin uniforme en [O,x] no es importante; la idea que queremos recoger es que los valores te y tp slo afectan ligeramente a las ganancias en el juego original, para lo cual podernos pensar que x es pequea.)
El resto de las ganancias son las mismas. En trminos del juego bayesiano
esttico abstracto en forma normal G = {Ae,Ap; Te,Tp; Pe,Pp; ue,up} los espacios de acciones son Ae = Ap = {pera, boxeo}, los espacios de tipos
son Te = Tp = [O,x], las conjeturas son Pe(tp) = )Jp(te) = l/~.para cada t~,Y
tp, Ylas ganancias son las siguientes:
Pat
pera
Boxeo
pera
2 + te,l
0,0
Boxeo
0,0
1,2 + tp
Chris
La batalla de los sexos con informacin incompleta

Vamos a construir un equilibrio bayesiano de Nash con estrategias
puras de la versin c()n i,nforrnacin incompleta de la batalla de l~~ sexos
en el cual Chris elige la pera si te es mayor que un valor cntico e -y
elige el boxeo en cualquier otro caso, y Pat elige el boxeo si tp es mayor.
""';
.','.
","
154/
,'.
\.~}
]VEGaS
Aplicaciones
INCOMPLETA (c. 3)
ESTTICOS CON INFORMACiN
que un valor crtico p y elige la pera en cualquier otro caso. En tal

equilibrio, Chris elige la pera con probabilidad (x - el/x y Pat elige el
boxeo con probabilidad (x - p)/x. Vamos a demostrar que, cuando la
informacin incompleta desaparece (es decir, cuando x tiende a cero), el
comportamiento de los jugadores en este equilibrio bayesiano de Nash en
estrategias puras tiende a su comportamiento en el equilibrio de Nash con
estrategias mixtas del juego original con informacin completa. Es decir,
tanto (x - el/x y (x - p)/xtienden a 2/3 cuando x tiende a cero.
Supongamos que Chris y Pat eligen las e;trategias qu~' acabamos de
describir. Para un valor dado de x vamos a determinar los valores de c y
p tales que las~str:ategiasf~rm~!} c~~qt4.l,ilJp9 J?~ye~ia,it2,.~eI::f
a,~!t,9ada
la estrategia d Pat, las gammcias esperadas de Clilis'"(el~gir la6pera y
el boxeo son'
,"
!
-.
E.(2+tc)+
j;
"
.,
[1- E...] .0=~(2:i-.t.c.)',< :'

X"
E. . + [1 '- E.] . 1 = 1 - E..'

'.
respectivamente. Por lo tanto, elegir la peraes ptiII1;~.

si y slo ?i
(3.2.1)
De forma similar, dada la estrategia de Chris,lasg~~ancias~spera1a,s

Pat por elegir. el boxeo y la pera son
'. '
[ 1--
C].
x
. O+ -(2 +
tp)
e.,
= -(2
de
.'
+ tp)
C]
ee
1-- .1+-.0=1--,
x
x
x
respectivamente. Parlo tanto, elegir el boxeo es ptimo si y slo si

x
tp .;::: ..-
:-
3 = p.
2:1;
+4:;
"
que tiende a 2/3 cuando :; tiende a cero. Por lo tanto, cuando la informacin incompleta desaparece, el comportamiento de los jugadores en
este equilibrio bayesiano de Nash con eslrategias puras del juego con
informacin incompleta tiende a su comportamiento en el equilibrio de
Nash con estrategias mixtas en el juego original con informacin completa,
3.2.B Una subasta
Consideremos la siguiente subasta de sobre cerrado al primer precio. Hay

.d.osparticipantes qu denminamos i = 1,2. El participante i tiene una
v~orad6n Vi del bien, es decir, si i consigue el bien y paga el precio
p;la gaiianCia' de i'es
'p. Las valoraciones de los dos participantes
iistfi urtifornementedistribUidas de fotina independiente en [O,1]. Las
pujas no pUEidensfnegativas .. Los participantes entregan sus pujas
simultneamente. La puja ms alta gana la subastay el ganador paga el
precio de su puja, mientras que el otro participante no obtiene nada ni paga
nada. En caso de empate, el ganador se determina lanzando una moneda.
Los participantes son neutrales al riesgo. Todo esto es informacin del
dominio pblico.
Para formular este problema como un juego bayesiano esttico, debe~
mas identificar los espacios de acciones, los espacios de tipos, las conjeturas y las funciones de ganancias. La accin del jugador i es entregar
una puja bi (no negativa) y su tipo es su vloracinvi' (En trminos del
juego abstraclo G = {A1,A2;T},1'z;Pl,P2;Ul,U2}'
el espacio de acciones es
Ai ~ [0,00) y el espacio de tipos es Ti = [0,1].) Como las valoraciones son
. independientes, el jugador i cree que Vj est uniformemente dislribuido
en [0,1], independientemente del 'valor de '1)i' Finalmen.te, la funcin de
ganancias del jugador i es
v; ~.
x'
-3 +)9
1------
/ 155
si bi > bj,
si bi = bj,
(3.2,2)
Resolviendo (3.2.1) y (3.2.2) simultneamente obtenemos p = e y p2 + 3px= O.'Reiolvlendo la ecuaCin de segundo gradase demuestra que la
probabilidad:deque Chris elija la pera; concretamente (x ::..c)/x, y la de
que Patel1ja ei boxeo, concretamente (x- p)/x, son'ambas iguales a.
si bi
<
bj.
Para obtener un equilib~io bayesiano de Nash de este juego comenzarnos construyendo los espacios de estrategias de los jugadores. Recordemos que en un juego bayesiano esttico, una estrategia es una funcin
que va de tipos a acciones. Por lo tanto, para el jugador i una estrategia
156/
JUEGOS ESTTlCOSCON
INFORMACIN
INCOMPLETA Ce. 3)
Aplicaciones / 157
es una hmcin bJv) que determina la puja que elegira cada uno de los
tipos (es decir, valoraciones) de i . En un equilibrio bayesiano de Nash, la
estrategia bl (VI) del jugador 1 es una mejor respuesta a la estrategia b2(V2)
del jugador 2 y viceversa. Formalmente, el par de estrategias (b1 (VI ),b2 (V2
constituye un equilibrio bayesiano de Nash si, para cada V en [0,1], b;(vi)
es una solucin de
max(v.-
b)
Prob{b >
bj(vj)}
-(v. - bi)
Prob{bi
= bj(uj)}.
Simplificamos la exposicin buscando un equilibrio lineal: bl (VI) =

+ clvl y ~(V2) = a2 + C2V2. Ntese que no estarnos limitando los espacios
de estrategias delos jugadores para incluir slo estrategias lineales, sino
que estamos permitiendo que los jugadores elijan estrategias arbitrarias
y nos preguntamos si existe un equilibrio lineal. Result!;que, puesto que
las valoraciones de los jugadores estn uniformemente distribuidas, no
slo existe un equilibrio lineal sino que ste es nico (en un sentido que
precisaremos). Veremos que b;(vi) = v;/2. Es decir, cada jugador,entrega
una puja igual a la mitad de su. valoracin ... Tal puja refleja el dilema
fundamental al que se enfrenta cualquier participante en una subasta de
este tipo: cuanto ms alta sea la puja ms posibilidades tiene de ganar;
cuanto nis baja sea la puja, mayor ser la ganancia si gana.
Supongamos que el jugador j adopta la estrategia Qj(Vj) = aj + CjVj.
Para un valor dado Vi la mejor respuesta del jugador i es una solucin de
al
n,ax(Vi - b) Prob{bi
>
aj
+ CjVj},
donde hemos utilizado el hecho de que Prob{bi = bj(vj)} =0 (puesto que

= aj + CjVj y Vj est uniformemente distribuida; tambin lo est bj).
Puesto que no ttene sentido que el jugador .i puje por debajo de la puja
mnima del jugador j y sera tonto por parte de ipujar por encima del
mximo del jugador j, tenemos que aj ::; bi ::; aj + Cj, por lo que
bj(v;)
P. ro b{b
.i
>
aj +Cjv]
} --
p.10 b { Vj
bi < ---
aj } = ---o
bi - aj
Cj
Por lo tanto, la mejor respuesta del jugador i es

si v. > a.JI
si Vi <aj.
l
5(0 < aj < 1, existen varios valores de Vi tales que Vi < aj, en cuyo caso
bi (V) no es lineal, sino plana al principio y con pendiente positiva despus.
Como estamos buscando un equilibrio lineal, excluimos O < aj < 1,
centrndonos en aj 2: 1 Y aj ::; O. Pero el primero no puede darse en
equilibrio: puesto que es ptimo para un tipo ms alto pujar tanto al
menos corno la puja ptima del tipo ms bajo, tenemos que Cj 2: O, pero
entonces aj 2: 1 implicara que bj(Vj) 2: Vj, lo que no puede ser ptimo.
Por lo tanto, si b;(vi) tiene que ser lineal, debemos tener aj ::; O, en cuyo'
caso b;(v.) = (Vi + aj)/2, por lo que ai = aj/2 y Ci= 1/2.
R9\:h~f\19s.
reRe!ir el D.1Smo
anlisis para el jugador j suponiendo que el
jugac!9i'iadOpta Iastrate&'ab;(vi) ~Q-i +civi,'con lo qu~ obtenernos ai::; O,
aj = a;/2 y Cj = 1/2:' Combinando estos dos conjuntos de resultados
tenemos que ai = aj = O Y c.-= Cj = 1/2, es decir, bi(Vi) = v;/2, como.
dijimos antes.
Podramos preguntarnos si hay otros equilibrios bayesianos de Nash
en este juego, y tambin cmo las pujas en equilibrio cambian cuando
la distribucin de las valoraciones de los jugadores cambia. Ningunacie
estas cuestiones puede reslverse utilG:ando la tcnica que acabaiTIosdi
aplicar (proponer estrategias .lineales y despus derivar los coeficientes
que l~s cOnvierten enequllibrio).
No conduce a niI:guna part~ inte~~..
taradivinar todas las formas funcionales que podran tener otros egi1ilibrios de este j~ego, y no existe equilibrio lineal para ninguna otra distribucin de valoraciones. En el apndice, derivamos un equilibrio bayesiano simtrico}. nuevamente para el caso de valoraciones uniformemente
distribuida;, Suponiendo _qu~.lasestrategias de los jugadores son estric~
tamentecrecientes y diferenciables, demostrarnos que el nic,?equilibi;i,~
bay~sianode NashsjII1~tIjcQ.e_s el equilibrio lineal que ya1erros' deri~
vadO. La tcnica que utilizarnos puede extenderse fcilmente a una clase
ms amplia.de distribuciones de las valoraciones, y tambin al caso de n
participil;ntes.4
Cj
3 Un equilibrio bayesiano de Nash se denomina simtrico si las estrategias de los jugadores

son idnticas. Es decir, en un equilibrio bayesiano de Nash simtrico existe una sola funcin
b(Vi) tal que la estrategia b(v) del jugador 1 es b(v) y la estrategia bz(vz) del jugador 2 es
b(vz), y esta nica estrategia es una mejor respuesta a s misma. Por supuesto, puesto que
las valoraciones de los jugadores sern normalmente diferentes, sus pujas tambin lo sern,
incluso si ambos utilizan la misma estrategia.
4 La omisin de este apndice no impedir la comprensin del resto del libro.
AplicacirJlles
/ 159
.158 I JUEGOS ESTTICOS CON INFORMACiN INCOMPLETA (e. 3)
Apndice
Supongam.os queel jugador j adopta la estrategia bO y supongamos que
N.) es estnctamente creciente y diferenciable. Entonces', para un valor
dado de Vi la puja ptima del jugador ies una solucin de
>
maX(Vi - bi) Prob{bi
b(vj)}.
donde k es una constante de,integracin. Para eliminar k necesitamos una

condicin de frontera. Afortunadamente, un razonamiento econmico
simple nos ofrece una: ningn jugador debera pujar por encima de su
propia valoracin. Por tanto, debe cumplirse que b(Vi) ::; Vi para cada
Vi.
En particular, debe ocurrir que b(O) ::; O. Puesto que las pujas estn
restringidas a ser no negativas, esto implica que b(O) = O,Yentonces k = ()
y b(Vi) = vf2, como dijimos.
bi
Sea b-1 (bj) la valoracin-que el participante j debe tener para pujar bj; esto
es, b-1(bj) = Vj sibj = b(vjtP.4esto que.vj est uniformemente clistribuida
en [O,ll,Prob{bi > b(1jt= Prob{b:2-I(b> v= b-1(bi). La condicin de
primer orden.para la opti~zacin del probletriadl jugador ies
.
-b-1(bi)
d'
+ (Vi ~ bi) db. b-(bi)
'1
= O.
.;
Esta condi<:i~es unaeclaciri iJ1pIcita d~ia m~jor~~sp'uesta del jugador

ta .la estrategIa b(.) jugada por j ddoqil~ la Viloracindei es Vi. Si la ..
estrategia bO tiene que ser un equilibrio bayesiano de Nash simtrico, es
necesario que la soluc_inala condicin de primer orden seab(vi). Es decir,
para cada una de las posibles valoraciones del pujador 7" ste no quiere
desvIarse de laestrategia bOdado que el jugador j utiliza esta est;ate~a.
Para imponer este requisito, sustituimos bi
b(Vi) en la condicin" de
primer orden, obtenielldo
+(Vi - b(Vi d: b-1(b(Vi
i
-b-l(b(~i
.'.
'.'
O.
Por supuesto;b-1(b(vi)'es simplemente v;. Adems, d{b-1(/j(Vi}/dbi

=
l/b'(vi).
Es decir, d{b-1(bi)}/dbi
mide cunto debe cambiar la valoraCin
del jugador i para produc: un cambio de una unidad en lapuja, mIentras
que b'(Vi) mide cunto cambia a puja en respuesta a un cambio de u~a
unidad en la valoracin .. Por lo tanto, bO debe satisfacer la ecuacin
diferencial de primer orden
1
-Vi + (Vi - b(Vi-b'(
.
t'i
) = O,
la cual~e expresa de un modo ms conveniente como b' (Vi)Vi +b( Vi) = Vi. La
parte izquierda de esta ecuacin diferencial es precisamente d{ b(Vi )Vi} /dVi.
Integrando ambas partes de la ecuacin obtenemos
1
b(v)v'
7.
t = -'Il
2 1_ + k ,
3.2.C Una subasta doble

A continuacin consideramos el caso en el cual un comprador y un vendedor tienen cada uno informacin privada sobre sus valoraciones, como
en Chatterjee y Samuelson (1983). (En Hall y Lazear [1984] el comprador es una empresa y el vendedor un trabajador. La empresa conoce el
producto marginal del trabajador, y el trabajador conoce sus olras oportunidades. Vase el ejercicio 3.8.) Analizamos un juego de intercambio
llamado subasta doble. El vendedor anuncia un precio de venta p." y el
compradorsimuItneamente anuncia un precio de compra p". Si Pb 2: P.,
el intercambio tiene lugar a un precio Ji = (Pb + Ji,) /2. Si Pb < ]J, no se da
el intercambio.
La valoracin por parte del comprador del bien del vendedor es /JI,;
la del vendedor es v.. Estas valoraciones son informacin privada y se
obtienen independientemente de distribuciones uniformes en [O,JI. Si el
comprador obtiene el bien por el precio p, su utilidad es v" - p; si no hlY
intercambio la utilidad del comprador es cero. Si el ,:,:endedor vende el
bien por el precio p, su utilidad es Ji - v.; si no hay intercambio su utilidad
es cero. (Cada. una de estas funciones de utilidad mide el cambio en la
utilidad de cada parte. Si no hay intercambio, no hay cambio en utilidad.
No cambiara nada definir, digamos, la utilidad del vendedor como Ji si
hay intercambio a till precio P y v . si no hay intercambio.)
En este juego bayesiano esttico, 1naestrategia del comprador es una
funcinp/,(vb)
que determina el precio que el comprador ofrecer para cada
una de sus posibles valoraciones. Del mismo modo, una estrategia del
vendedor es una funcin p,(v,) que especifique el precio que el vendedor
pedir para cada una de sus posibles valoraciones. Un par de estrategias
{Pb(Vb),p,(V,)}
constituye un equilibrio bayesiano de Nash si se cumplen
las dos condiciones siguientes. Para cada Vb en [O,1], Pb(Vb) es una solucin
de
max Pb [v b -
Pb+E[P,(v,)IPb>,,(U,)J]
2
Prob{p
.
>p
1) -
(7) )}
S
(3.2.3)
16Ll ! JUEGOS ESTTICOS CON INFOI{,'"IAClN INCOMPLETA (e. 3)
Aplicaciones!
donde E[psCuJlpb
2':f'JuJJ es el precio esperado que pedir el vendedor,
condicionado a que lo que pida sea menor que el precio ]lb ofrecido por el
cumprador. Para cada Vs en [0,1], J!s(Vs)es una solucin de
(3.2.4)
donde E[Pb(Vb)lpb(Vb)
2':PsJ es el precio esperado que ofrecer el comprador condicionado a que lo que ofrezca sea mayor que el precio Ps que pide
el vendedor.
Vb
Intercamqio
x
161
del vendedor es una mejor respuesta a la del comprador, ya que para los
tipos del vendedor que hacen que el intercambio se prefiera a la ausencia
de intercambio ste ocurre, y viceversa. El argumento anlogo demuestra
que la estrategia del comprador es una mejor respuesta a la del vendedor,
por lo que estas estrategias forman un equilibrio bayesiano de Nash. En
este equilibrio el intercambio se da para los pares (VsUb) indicados en la
figura 3.2.1; el intercambio sera eficiente para todos los pares (V"Vb) tales
que Vb ~. Vs, pero no se da en las dos regiones sombreadas de la figura.
Ahora derivamos un equilibrio bayesiano de Nash lineal de la subasta
doble. Como en la seccin anterior, no restringimos los espacios de estrategiasdelos jugadores de nianera que se incluyan solamenre las estrategias
lin~ales, sino que pennitimos que los jugadores elijan estrategias arbitrarias pero nos preguntamos si existe un equilibrio que sea lineal. Existen
muchos otros equilibrios adems de los equilibrios de precio nico y el
equilibrio lineal, pero el equilibrio lineal tiene propiedades de eficiencia
interesantes que describiremos ms adelante.
Supongamos que la estrategia del vendedor es Ps(vs) = as + CsVs'
Entonces Ps est uniformemente distribuido en [as,as + cs], por lo que
(3.2.3) se convierte en
as + Pb}]
max [Vb - -1 {Pb + .--Pb
2
2
(3.2.5)
"-; .:r.,:,,,: .,;_._~_
V.
Figura 3.2.1
Por lo tanto, si el vendedor utiliza una estrategia lineal, la mejor respueSt''

del comprador tambin es lineal. Anlogamente, supongamos. qtieJa.
estrategia del comprador es Pb(Vb) = ab + CbVb. Entonces, P~ est iUforrne.:mente distribuido en [ab,ab + Cb], por lo que (3.2.4) se convierte en
1{
Existen muchsimos equilibrios bayesianos de Nash de este juego.

Consideremos, por ejemplo, el siguiente equilibrio de precio nico en
el cual el intercambio ocurre a U!l nico precio si es que ocurre. Para
cualquier valor de x en [0,1], sea la estrategia del comprador ofrecer x
si Vb 2': x y ofrecer cero en cualquier otro caso, y sea la estrategia del
vendedor pedir x si Vs ::; x y pedir uno en cualquier otro caso. Dada la
estrategia del comprador, las posibilidades del vendedor se concretan en
un intercambio a x o en que no haya intercambio, por loque la estrategia
max [ -2 Ps +
. p,
Ps + ab + Cb }
....
Cs
Pb = 3"Vb + 3"as.
;';:
Pb - as
---,
cuya condicin de primer orden consiste en

2
,','
<:.
cuy? condicin de primer orden es

P. = ~vs + ~(ab + Cb).
(3.2:6)"
Por lo tanto, si el comprador utiliza una estrategia lineal, la mejor respuesta

del vendedor tambin es lineal. Si las estrategias lineales de los jugadores
han de ser mejores respuestas la una a la otra, (3.2.5) implica que Cb = 2/3
Apl icnCollcs
162/
JUEGOS ESTTlCOS CON INFORMACIN
163
INCOMPLETA (c. 3)
y CLb = CLs /3, y (3.2.6) implica que Cs = 2/3 Y as

las estrategias de equilibrio lineal son
(ab
Ch)
/3. Por lo tanto,
(3.2.7)
v,
v, = v, + 0/4)
V,=
v,
Intercambio
p,,(v.) =
3v., + "4
como muestra la figura 3.2.2.

p"p,
1
v,
3/4
Figura 3.2.3
3/4
1/4
".'
;..J'
V"
Vb
"
,
Figura
3.2.2
Recordemos que el intercambio en ia subasta doble se da si y slo si

Ph ~ P . Manipulando (3.2.7) y (3.2.8) se demuestra que el intercambio
ocurre en el equilibrio lineal si y slo si Vh ~ V. + (1/4), como muestra
l~ figura 3.2.3. (De acuerdo con esto, la figura 3.2.2 revela que, para los
tIpos del vendedor por encima de 3/4, se realizan demandas por encima
de la oferta ms alta del comprador Pb(l) = 3/4, Yque para los tipos del
vendedor por debajo de 1/4 se realizan ofertas por debajo de la oferta ms
baja del vendedor, P. (O) = 1/4.)
Comparemos las figuras 3.2.1 y 3.2.3 (las descripciones de los pares

de valoraciones para los cuales el intercambio aCUITeen los equilibrios
de precio nico y simtrico respectivamente). En ambos casos se da el
intercambio posible ms valioso (concretamentev. = O Y Vh.,= 1), Pero al
equilibrio de precio nic le faltanalgunos intercambiosyaliosos (corno
v. == O Y Vh = X - E, dnde E, es pequeo, y logra ,algunos intercambios
que casi no valen nada (como v. = x - E Y Vh = X +.E). Por el contra~io,
al equilibrio lineal le faltan todos los intercambios que casi no valen riada
pero logra todos los intercambios de valor al menos 1/4. Esto sugiere
que el equilibrio lineal puede dominar los equilibrios de precio nico
en trminos de las ganancias esperadas de los jugadores, pero tambin
plantea la posibilidad de que los jugadores pudieran estar incluso mejor
en un equilibrio alternativo.
Myerson y Satterthwaite (1983) demuestran que, para distribuciones
uniformes de las valoraciones como las consideradas aqu, el equilibrio
lineal consigue ganancias esperadas mayores que ningn otro equilibrio
bayesiano de Nash en subasta doble (incluyendo equilibrios mltiples).
Esto significa que no existe un equilibrio bayesiano de Nash en subasta
doble tal que el intercambio ocurra si y slo si es eficiente (es'decir, si y.slo
lb4 / JUEGOS
ESTTICOS
CON
INFOI<iVIACIN
INCOMPLETA
(e. 3)
El principio de revelacin / 165
si /lb 2:
ti..).
Tambin demuestran que este ltimo resultado es muy general:
SiUb est distribuida de forma continua en [Xb,YbJ y 'u" est distribuida de
forma continua en [:l:s,ys], donde Ys > Xb e Yb > x" no existe ningn juego
de negociacin al que quisieran jugar el comprador y el vendedor que
tenga un equilibrio bayesiano de Nash en el que el intercambio ocurra si
y slo si es eficiente. En la prxima seccin vamos a indicar cmo puede
utilizarse el principio de revelacin para demostrar este resultado general.
Concluimos esta seccin aplicando este resultado al modelo de empleo de
Hall y Lazear: si la empresa tiene informacin privada sobre el producto
marginal m del trabajador y el trabajador tiene informacin privada sobre
una oportunidad alternativa ti, no existe ningn je'gode negociacin que
la empresa y el trabajador quisieran jugar que 'produZca empleo si y slo
si es eficiente (es decir, si y slo si m2: v).
3.3 El principio
de revelacin
El principio de revelacin, debido a Myerson (1979) en el contexto de

los juegos bayesianos (yen otros en contextos relacionados), es Un ins~
trumento importante para disear juegos cuando los jugadores tienen
informacin privada. Puede aplicarse a los problemas de las subastas
y del intercambio bilateral descritos en las dos secciones anteriores, as
como a una amplia gama de problemas. En esta sec~in enunciamos y
demostramos. el principio de revelacin para juegos bayesianos estticos.
(La extensin de la demostracin' a juegos bayesianos dinmicos es in"
mediata.) No obstante, antes de hacerlo, vamos a indicar cmo se utiliza
el principio de revelacin en los problemas de subastas y de intercambio
bilateral.
'
Consideremos un vendedor que quiere disear una subasta que maximice sus ingresos. Sera una ardua tarea detallar todas y cada una de las
diferentes subastas posibles. En la subasta dela seccin ;3,2.B, por ejemplo,
el participante que puja ms alto paga al vendedor y consigue el bien
subastado, pero existen muchas otras posibilidades. Los participantes,
por ejemplo, pueden tener que pagar una entrada, De forma ms general,
algunos de los participantes que pierden pudieran tener que pagar dinero,
tal vez en cantidades que dependan de sus pujas y de las de los dems.
Tambin podra el vendedor establecer un precio de reserva, un precio
mnimo por debajo del cual no se aceptaran pujas. De forma ms general,
puede existir cierta probabilidad de que el vendedor se quede con el bien
o de que ste no siempre vaya a quien puje ms alto. Afortunadamente,

el vendedor puede utilizar el principio de revelacin para simplificar
considerablemente este problema de dos maneras. En primer lugar, el
vendedor puede limitar su atencin a la siguiente clase de juegos:
1. Los participantes hacen declaraciones (posiblemente falsas) sobre sus
tipos (es decir, sus valoraciones). El jugador i puede declarar ser cualquier tipo Ti del conjunto Ti de posibles tipos de i, independientemente
de cul sea el verdadero tipo i, k
2; Dadas las declaraciones de los participantes (TI,' .. ,Tn), el jugadori
ofrece Xi(Tlt .. "Tn) y recibe el bien subastado con probabilidad qih,
. .. ,Tn). Para cada posible;ombinacin de declaraciones h, ...,Tn),la
suma de las probabjlidades ql (TI,' , . ,Tn) + ". + qn(Tl," .,Tn) debe ser
menor o igual a uno.
Los juegos de esta clase (es decir, los juegos estticos bayesianos en los
cuales la nica accin del jugador es hacer una declaracin sobre su tipo)
se llaman mecanismos directos.
La segunda manera en la que el vendedor puede utilizar el principio de revelacin es limitando su atencin a los mecanismos directos, en
los cuales decir la verdad constituye un equilibrio bayesiano de Nash
para cada participante, es decir, a ls funciones de oferta y de probabilidad {Xl (TI", . ,Tn),. ,. ,Xn(Tl,' .. , Tn); ql (TI,' .. ,Tn), ... ,qn(Tl,'",
taun)}
tales que la estrategia de equilibrio de cada jugador i sea declarar Ti (t;) =ti
para cada ti en n. Un mecanismo directo en el cual decir la verdad constituye un equilibrio bayesiano de Nash se llama de incentivos compatibles.
Fuera del contexto del diseo de una subasta, el principio de revelacin puede seguir siendo utilizado de estas dos maneras. Cu~lquier
equilibrio bayesiano de Nash de un juego bayesiano puede representarse
<;:onun nuevo equilibrio bayesiano de Nash en un nuevo juego bayesiano
adecuadamente escogido, en el cual por "representado" queremos decir
que para cada posible combinacin de tipos de los jugadores (tit ... ,tn),
las acciones y las ganancias de los jugadores en el nuevo equilibrio son
idnticos a los del equilibrio original. Itdependientemente de cul sea el
juego original, el nuevo juego bayesiano es siempre un mecanismo directo;
independientemente del equilibrio original, el nuevo equilibrio siempre
consiste en decir la verdad. De manera ms formal:
r,:
".'.
166/
JuEGOS ESTTICOS CON INFORMACIN
INCOMPLETA (c. 3)
Teorema. (El principio de revelacin). Cualquier equilibrio bayesiano de

Nash en un juego bayesiano puede representarse mediante un mecanismo directo
de incentivos compatibles.
',':
En la subast~ analizada en la seccin 3.2.B supusimos que las valtaci-' .. '

nes de los prticipantes eran independientes entre s. Tambinsupusitnos
;;
(de forma implcita en la definicin de las valoraciones de los partiCipantes) que conocerla-valoraCin del jugador j no ambiaria la valoraci.del
jugador i (aunque tal con~chniento cart1biarianormalment~ la puja de i).
Caracterizamos estos dos supuestos diciendo que los participantes tienen
valores privadseindep~ndientes.
Eh'este caso, Myerson (1981)deter-'
mina qumecasmos directs"HnehUh ecjirilibrio de decirlaveidady
cules de estos equilibrios maximizan la ganancia esperada del vendedor.
El principio de revelacin garantiza entonces qu no hay otra subasta con
un equilibrio bayesiano de Nash que proporcione al vendedor una ga. nancia esperada ms alta, puesto que el equilibrio de tal subasta habra
sido representado por un equilibrio de decir la verdad de un mecanismo
directo; y ya consideramos todos los mecartisr'nq~directos de incentivos
comptibles. TambIn dinuestra'Mye~son que el equilibrio bayesia~o d~
Nash simtrico de la subasta analizada en la seccin 3.2.B es equivalente
a este equilibrio de decir la verdad maximizador de la ganancia (como los
equilibrios simtricos de otras conocidas subastas).
tomo seglindoejemplo derprin~ipio derevelaci.n, consideremos el
problema del ii1tercambiobilateral descrito en la seccin 3.2.C. All ana~
lizamos Unjuego 'de 'intercambio entre un comprador y un vehdJdor, h
subasta doble. En ese juego; si haba iiercarnbio; el comprador pagaba al
vendedor,'mientras CJuesino; no haba pag; sin embargo existehmuchas
otras posibiliddes.Podri. haber pagos (del comprador al vendedor o
viceversa) incluso sin intercambio, y la probabilidad de un intercambio
podriaestar estrictamente entre cero,yuno. Tambin, la regla para determinar si va haber intercambio podra exigir que la oferta del comprador
fuera mayor que la demanda del vendedor en una cierta cantidad (positiva o negativa); dicha cantidad podra incluso variar dependiendo de los
precios anunciados por las partes.
,".
..
.. :
Podemos capturar estas posibilidades considerando la siguiente clase

de mecanismos directos: el comprador y el vendedor realizan simultneamente declaraciones sobre sus tipos, Tb y T.., tras lo cual el comprador paga
al vendedor x(Tb,T
que puede ser positivo o negativo, y el comprador
recibe el bien coh probabilidad q(Tb,Ts)' Myerson y Satterthwaite deterB),
El principio de revelaci" / 167
minan qu mecanismos directos tienen un equilibrio de decir la verdild.

Luego imponen la restriccin de que cada tipo de cada parte quiera juga.r
(esdecir, que cada tipo de cada parte tenga una ganancia esperada en eqUllibrio no inferior a la ganancia que ese tipo podra conseguir negndose
a jugar, concretamente cero para cada tipo de compra~or y is para el
tipo de vendedor tB). Finalmente, demuestran qu~ en n1l1gl1l10de estos
mecanismos directos de incentivos compatibles, el mtercambJO se da con
probabilidad uno si y slo si el intercambio es eficiente .. El.~rincipio ~e
revelacin garantiza entonces que no hay juego de negOClaClonque qUJeranseguir el comprador y el vendedor que tenga un equilibrio bayesiano
de Nash en el cual se d el intercambio si y slo si es eficiente.
Para dar un enunciado formal y una demostracin del principio de revelacin, consideremos el equilibrio bayesiano de Nash s' = (si, ... ,s;,) en
el juego bayesianoesttico G = {Al,'"
,An; TI,' .. ,Tn;Pl,'"
,Pn; nI, ... ,un}'
Vamos a construir un mecanismo directo con un equilibrio de decir la
verdad que represente s*. El mecanismo directo adecuado es un juego
bayesiano esttico con los mismos espacios de tipos y de conjeturas que
G, pero con nuevos ~spacios de acciones y nuevas funciones de ganancias.
Los nuevos espacios de acciones son simples. Las acciones. factibles del
jugador i en el mecal1ismo directo son declaraciones (posiblemente falsas)
sobre sus posibles tipos. Es decir, el espacio de acciones del jugador i es
Ti. Las nuevas funciones de ganancias son ms complicadas. Dependen
no slo del juego original G, sino tambin del equilibrio original en dicho
juego, s". La idea crucial es utilizar el hecho de que s" es un equilibrio
en G para garantizar que de<:irla verdad es un equilibrio del mecanismo
directo, como vemos a continuacin.
Decir que s" es un equilibrio bayesiano de Nash de G, significa
que para cada jugador i, s; es la mejor respuesta de i a las estratemas (s"
s"
s~
s") de los dems ]'ugadores. Ms concretamente,
0&
'1""/
t-1' 'l+l,""'n
para cada uno de los tipos ti en Ti de i, S;(ti) es la mejor accin de A
que puede elegir i, dado que las estrategias de los otros jugadores son
(si, ... ,s:_l ,s:+l' ... ,s~). Por tanto, si el tipo de i es t y permitimos ai elegir una accin de un subgrupo Ai que incluye .5; (ti), entonces la eleccin
ptima de i sigue siendo 3;(ti), suponiendo de nuevo que las estrategias
de los otros jugadores son (si, ... ,.5;_1,3;+" ... ,s~). Las funciones de ganancias en el mecanismo directo se eligen para confrontar a cada jugador
con una eleccin exactamente de esta clase.
Definimos las ganancias en el mecan.isIl1o directo sustituyendo las
declaraciones de tipos de Jos jugadores en el nuevo juego T = (TI, ... ,Tn)
W3 / JUEGOS EST..\'"ICOS CON INFORMACiN
INCOMPLETA (e. 3)
Ejercicios I 169
en las estrategias deequilibrio del juego original, 8*, Yluego sustituyendo

las acciones resultantes en el juego original 8*(T) = (sih), ... ,:5~(Tn en
las funciones de ganancias del juego original. Formalmente, la funcin de
ganancias de . es
donde t = (t, ... ,tn). Se podra pensar que estas ganancias se dan porque
un observador imparcial se acerca a los jugadores y pronuncia el siguiente
discurso:
S que ustedes ya conocen sus tipos y que van jugar el

equilibno s' del juego G. Pero perIl1tanme que lespresente un nuevo juego, un mecanismo directo: En primer
lugar, cada uno de ustedes frn;.ar un contrato que me
permita a m dictar la accin que tornarn ruando jugUemos e.En segundo lugar, cada uno de ustdes escribir-' .
una declaracin sobre su tipo Ti y me la entregar~ Segui'-.
damente utilizar la declaracin del tipo de cada uno d
ustedes en el nuevo juego, Ti, junto consestfategia 'de ,;
equilibno en el juego original, si, para ca1culiir-;'l~
accin
que habran elegido en el equilibrio s' si su tipo fuera
verdaderamente Ti, concretamente si (T). Finalmente, determinar que cada uno de ustedes torne la accin que
he calculado, y recibirn las ganancias resultantes (que
dependern de estas acciones y de sus tipos verdaderos).
Concluirnos esta seccin (y la demostracin del principio de reve-'
lacin) demostrando que decir la verdad es un equilibrio bayesiano de
Nash de este mecanismo directo. Al declarar ser del tipo Ti de T, el juga~
dar i est en efecto escogiendo tornar la accin si'(Ti)deA.
Si todos los,
dems jugadoresdicen la verdad, estn efectivamente jugando las estrte-'
gias (si" .. ,s:_,s~+I'"
. ,si)' Pero discutirnos anteriormente que si juegan
esas estrategias, cuando el tipo de i es ti la mejor accin que puede elegir .-.
es ,st(t), 'Por tanto, si los otros jugadores dicen la verdad, cuando el tipo de
i sea t, el mejor tipo del que se puede declarar seres ti. Es decir, decir laver~
dad es un equilibrio. De un modo ms formal, jugar la estrategia de decir la
verdad T(ti) = ti para cada t. en T es un equilibrio bayesianode Nash del."
juego bayesiano esttico {TI," .,Tn;11, ... , Tn;PI," ',Pn;v, ... ,vn} para
cada jugador i.
3.4 Lecturas adicionales

Myerson (1985) ofrece una introduccin ms detallada a los juegos bayesianos, el equilibrio bayesiano de Nash y al principio de revelacin.
Consltese McAfee y McMillan (1987) para un examen de la literatura
sobre subastas, incluyendo una introduccin a la maldicin del ganador.
Bulow y J(lemperer (1991) extienden el modelo de subastas de la seccin
3.2.B para dar una interesante explicacin de los pnicos y de los hundimientos racionales en los (digamos) mercados de valores. Sobre el empl~o pajo informacin asimtrica consltese Deere (1988),quien analiza un
modelo dinmico en el cual el trabajador va encontrndose con distintas
eIIlpresa,s~ lo largod~l tiempo, cada una con su propio producton.argmal
conocido de fOrm:lprivada. Para aplicaciones del principio de revelacin
c~nsltese Baron:y Myerson (1982) sobre la regulacin de un monpolio
con costes desconocidos, Hrt (1983) sobre los contratos implcitos y el
paro inyolunt:lrioySappington (1983) sobre la teora de la agencia.
".,/
\ ..
35 Ejercicios
3.1 Qu es un juego bayesiano esttico? Qu es una estrategia (pura)
en tal juego? Qu es un equilibrio bayesiano de Nash (con estrategias
puras) en dicho juego?
\
3.2 Consideremos un duo polio de Cournot que opera en un mercado con

demanda inv~rsa P(Q) = a - Q, donde Q = qI + q2 es la cantidad agregada
en el mercado. Ambas empresas tienen unos costes totales de Ci(qi) = Cqi,
pero la demanda es incierta: es alta (a = aA) con probabilidad O y baja
(a. = aB) con probabilidad 1-0. Adems, la informacin es asimtrica. La
empresa 1 sabe si la demanda es alta o baja, pero la empresa 2 no lo sube.
Todo esto es informacin del dominio pblico. Las dos empresas eligen
c~tidades,simultneamente.
Cules son los espacios de estrategias de
l:l~.
g:ps'empresas? Hganse supuestos sobre aA, aB, e y C de manera que
todas las cantidades de equilibrio sean positivas. Cul es el equilibrio
bayesiano cie este juego?
3.3 Consideremos el siguiente modelo de duopolio de Bertrand con informacin asimtrica y productos diferenciados. La demanda que se dirige
a la empresa ' es qi(P',Pj) = a - Pi - bi . Pj. Los costes son cero para ambas
"1',
',.o',
Ejercicios
170/ JUEGOS ESTTICOS CON INFORMACIN INCOMPLETA (c. 3)
empresas. La sensibilidad de la demanda de la empresa 'i al precio de la

empresa j es o alta o baja. Es decir, bi es o bA o bB, donde b,4. > bE > O.
Para cada empresa, bi = bAcon probabilidad IJ y b '" b B con probabilidad. -'
1 - IJ, independientemente de bj Cada empresa conoce su propio biPe!6.,.
no el de su competidora. Todo esto es informacin del dominio pbliF '
Cules son los espacios de acciones, espacios de tipos, conjeturas y fUn~
ciones de utilidad en este juego? Cules son los espacios de estrategias!.
Qu condiciones definen un equilibrio bayesiano de Nash simtnc''8R
estrategias puras de este juego? Hllese dicho equilibrio .. "
3.4 Hllense todosJos. equilibrios bayesianos de Nash con esrrategiasp
ras en el siguiente juego bayesiano esttico:
.
1. El azar determina si las gananCias son Como en' el juego 1 o como, '
erjuego 2, siendo cada juego igttalmenfeprobable.,
2. El jugador lse entera de si el zarhaescgidoel
jUego! o el 2, per.
el jugador 2';0.
,. '"
.
.
. 3. El jugador. 1 elige A o B; simultneamente el jugador 2 elige Do 1.
4. Las ganancias son las que se dan en el jueg<lu~.deterrhin'iar:;.'
1
ID'-
j)
,o
A 1,1 0,0
A 0,0
B 0,0 0,0
B 0,0 2,2
Juega
Juega2
....
3.5 Recordemos de la Seccin 1.3 que el juegode las monedas (un jueg'.
esttico con informacin completa) no tiene equilibrios de Nash cori's~..
trategias puras; pero' tiene un 'equilibrIo de Nash con estrategias' 'Ilixhis;':';
cada jugador elige cara con probabilidad 1/2 ..
Jugador 2
cara cruz
cara 1,-1
-1,1
Jugador 1
cruz -1,1 1,-1
','
/171
HIlese un equilibrio bayesiano de Nash con estrategias puras del juego

.':',::.' correspondiente con informacin incompleta tal ql~e, conforme la 111[0:;;i,;o,lIlacin incompleta desaparece, la conducta de los Jugadores el: :1 ~qU1";"',',:
.'UbriObayesiano de Nash tienda a su comportamIento en eJ.~quJlbno ele
;(:"Nash con estrategias mixtas del juego original con mformaclOn completa,
3.6 Consideremos una subasta de sobre cerrado al primer precio en la cual

las valoraciones de los participantes estn distribuidas de forma indepen. diente y uniforme en [0,1]. Demustrese que si hay n participantes, la
""'<tr"t~giade Plljar (n - l)/n veces la propia valoracin es un equilibrio
.~"yesiano de Nash simtrico.
.
.~;
..tl~'f;'.~"
r$.7Cbnsideremos una subasta de sobre cerrado al primer precio en la cual

'.ias:va10iacionesde los participantes estn distribuidas indnticamente y
':deJorma independiente segn la densidad estrictamente positiva !(-u;) en
11~Calclese un equilibrio bayesiano de N ash simtrico para el caso de
"'dos partiCipantes .
"\ : .
;10;
..
~;'j:SCnsidrese al comprador y al vendedor de la subasta doble analizada

la seccin 3.2.C como una empresa que conoce el producto marginal 111.
'del trabajador y un trabajador que conoce su oportunidad alternativa 7),
como en Hall y Lazear (1984), En este contexto, un intercambio significa
q~El~l.tralJaj<\~orest empleado por la empresa, y el precio al cual las
;part~' negoCian es el salario del trabajador w. Si se da el intercambio,
.,la ganancia de la empresa es m ~ w, y la del trabajador es w; si no hay
\,4itercambio, la ganancia de la empresa es cero y la del trabajador v.
. Supongamos que m y v son obtenidos independientemente seg n Ulla
, distribucin uniforme en [0,1] como en el texto. Con fines comparativos,
ii;tlClense las ganancias esperadas de los jugadores en el equilibrio lineal
:'',de la subasta doble. Ahora consideremos los dos juegos de intercambio
'siguientes como alternativas a la subasta doble.
""r"l,'
.; . liega 1: Antes de que las partes conozcan su informacin privada,
\:fitman un contrato aceptando que si el trabajador es empleado por la
empresa, su salario ser w, pero tambin que cualquiera de las partes
:':puede romper la relacin de empleo sin coste alguno. Despus de que
las partes conocen los respectivos valores de su informacin privada,
,~nncian simultneamente si aceptan el salario 1)) o si lo rechazall, Si
h':'I;l:5os
anunCian que 10 aceptan, hay intercambio; si no, no, Dado 1.111
\ valor de v arbitrario en [0,1], cul es el eqtlilibrio bayesiano de Nash de
. en
172/
INCOMPLETA (c. 3)
Referencias
este juego? Dibjese un diagrama anlogo a la figura 3.2.3 mostrando los

pares de tipos para los que hay intercambio. Hllese el valor de 'lO que
maximiza la suma de las ganancias esperadas de los jugadores y calclese
esta Suma.
2: Antes de que las partes conozcan su informacin privada,
firman un contrato aceptando que el siguiente juego dinmico se utilizar
para determinar si el trabajador se une a la empresa y, si lo hace, con
qu salario. (Estrictamente hablando, este juego pertenece al captulo
4. Vamos a adelantamos al captulo 4 aduciendo que este juego puede
resolverse combinando las lecciones de este captulo con las del captulo 2.)
Una vez que las partes conocen los respectivos valores de su informacin.
privada, la empresa elige un salario 'lO que ofrece al trabajador, salario
que el trabajador acepta o rechaza. Analcese este juego utilizando el
procedimiento de induccin hacia atrs, tal como hicimos en la seccin
2.1.A con los juegos anlogos de informacin completa. Dados 'lO yv, qu
har el trabajador? Si la empresa prev lo que har el trabajador, dado m
qu har la empresa? Cul es la suma de las ganancias esperadas de los
jugadores?
[llego
3.6 Referencias
/ 173
_. 1973. "Carnes with Randomly Disturbed Payoffs: A New Rationale for

Mixed Strategy Equilibrium Points." International oumal of Game TheonJ
2:1-23.
HART,O. 1983. "Optimal Labour Contracts under Asymmetric Information." Review of Economic Studies 50:3-35.
McAFEE, P. y J. McMILLAN. 1987. "Auctions and Bidding." oumal of
Economic Uterature 25:699-738.
MYERSON,R. 1979. "Incentive Compatability and the Bargaining Problem."
-. 1981. "Optimal Auction Design." Mathematics
6:58-73~
of Operations Research
-. 1985. "Bayesian Equilibrium and Incentive Compatibility: An I.ntroduction." In Social Goals and Social Organization. L. Hurwicz, D. Schmeldler,
y H. Sonnenschein, eds. Cambridge: Cambridge University Press.
MYE~N, R., Y M. SATTERHWAlTE.
1983. "Efficient Mechanisms for Bilateral Trading." oumal of Economic Theory 28:265-81.
SAPPINGTON,D. 1983. "Limited Liability Contracts between Principal and
Agent." oumal o/ Economic Theory 21:1-21.
BA1<ON,
D., Y R. MYERSON.1982. "Regulating a Monopolist with Unknown
Costs." Econometrica 50:911-30.
BULOW,J., y P. KLEMPERER.1991. "Rational Frenzies and Crashes." Stanford University Craduate School of Business Research Paper #1150.
CHATTERjEE,K., Y W. SAMUELSON.1983. "Bargaining under Incomplete
Informabon." Operations Research 31:835-51.
DEmE, D. 1988. "Bilateral Trading as an Efficient Auction over Times."
[ol/rIlal of Political Economy 96:100-15.
.
HALL,R., Y E. LAZEAR.1984. "The Excess Sensitivity of Layoffs and Quits
lu Demand." [ournal of Labor Econ01nics 2:233-57.
HARSANYI,J. 1967. "Cames with Incomplete Information Played by Bayesian Players Parts 1 II and I1I." Management Science 14:159-82, 320-34~
486-502.
~3
4. JUEGOS DINMICOS
CON INFORMACIN INCOMPLETA
En este captulo presentamos un concepto ms de equilibrio, el equilibrio

bayesiano perfecto, con lo que tenemos cuatro conceptos de equilibrio en
cuatro captulos: el equilibrio de Nash en los juegos estticos con informacin completa, el equilibrio de Nash perfecto en subjuegos enlos juegos
dinmicos con informacin completa, el equilibrio bayesiano de Nash en
los juegos estticos con informacin incompleta y el equilibrio bayesiano
perfecto en los juegos dinmicos con informacin incompleta. Podra parecer que nos inventamos un nuevo concepto de equilibrio para cada clase
de juegos que estudiamos pero, de hecho, estos conceptos de equilibrio
estn estrechamente relacionados. A medida que vamos considerando
juegos ms completos, vamos reforzando el concepto de equilibrio para
excluir los equilibrios poco verosmiles que sobreviviran en los juegos
ms ricos si aplicramos los conceptos de equilibrio adecuados a los juegos ms simples. En cada caso, el concepto de equilibrio ms poderoso
difiere del ms dbil slo en los juegos ms ricos, no en los ms simples;
En particular, el equilibrio bayesiano perfecto es equivalente al equilibrio bayesiano de Nash en ios juegos estticos con ,informacin completa,
equivalente al equilibrio de Nash perfecto en subjuegos en los juegos
dinmicos con informacin perfecta y completa (yen muchos juegos
dinmicos con informacin perfecta pero incompleta, entre los que se
incluyen los que hemos discutido en las secciones 2.2 y 2.3) y equivalente
al equilibrio de Nash en los juegos estticos con informacin completa.
El equilibrio bayesiano perfecto se invent para refinar (es decir, para
reforzar los requisitos de) el equilibrio bayesiano de Nash, del mismo
modo que elequilibrio de Nash perfecto en subjuegos refina el equilibrio
de Nash. Igual que introdujimos la perfeccin en subjuegos en juegos
dinmicos con informacin completa porque el equilibrio de Nash no
capturaba la idea de que las amenazas y promesas deban ser crebles,
ahora limitamos nuestra atencin al equilibrio bayesiano perfecto en jue-
176
I J;ECOS
OIN,\IICOS CON I.\iFOR,\'/AClN
L\iCOMPLETA (e. 4)
gas dinmicos con informacin incompleta porque el equilibrio bayesiano

de Nash presenta el mismo inconveniente. Recordemos que si las estrategias de los jugadores han de formar un equilibrio de Nash perfecto
en Subjuegos, no slo deben formar un equilibrio de Nash en el juego
completo, sino tambin constituir un equilibrio de Nash en cada subjuego. En este captulo reemplazamos la idea de Subjuego por la idea
ms general de juego de continuacin, que puede comenzar en cualquier
conjunto de informacin (ya sea de un nico elemento o no), y no slo en
conjuntos de informacin con un nico elemento. A continuacin procedemos por analoga: si las estrategias de los jugadores tienen que formar
un equilibrio bayesiano perfecto, no slo deben Constituir un equilibrio
bayesiano de Nash para el juego completo, sino tambin constituir un
equilibrio bayesiano de Nash en cada juego de continuacin.
En la seccin 4.1 presentamos de modo informal las principales caractersticas de un equilibrio bayesiano perfecto. Para ello, adoptamos
temporalmente una segunda perspectiva (complementaria) que cambia
el nfasis anterior: el equilibrio bayesiano perfecto refuerza los requisitos
del equilibrio de Nash perfecto en Subjuegos analizando explcitamente
las conjeturas de los jugadores, Como en un equilibrio bayesiano de Nash.
Esta segunda perspectiva surge porque, siguiendo a Harsanyi (1967),describimos un juego con informacin incompleta como si fuera un juego Con
informacin imperfecta; el azar revela el tipo del jugador i a i pero no a i,
por 10que j no conoce la historia completa del juego. Por lo tanto, un Concepto de equilibrio diseado para reforzar el equilibri~ bayesiano de Nash
en los juegos dinmicos con informacin incompleta puede tambin reforzar el equilibrio de Nash perfecto en subjuegos en los juegos dinmicos
con informacin completa pero imperfecta.
En la seccin 4.2 analizaremos la cla?e de juegos Con informacin incompleta aplicada con ms frecuencia: los juegos de seiializacin. Enunciado
de un modo abstracto, un juego de sealizacin consta de dos jugadores
(uno Con informacin privada, el otro sin ella) y dos rondas (primero una
seal enviada por el jugador informado y despus una respuestaadop_
tadapor el jugador desinformado). La idea clave es que la comunicacin
puede darse si un tipo de jugador informado quiere enviar una seal que
sera demasiado cara de enviar por parte de otro tipo. En primer lugar
definiremos el equilibrio bayesiano perfecto en juegos de sealizacin y
describiremos los distintos tipos de equilibrios (que corresponden a distintos grados de comunicacin, entre cero y completa) que pueden existir.
A continuacin consideraremos el modelo original de sealizacin en el
__
eM@_!.O!' ~!i!!!E'!!!!!'!'!!'!'
:t,"""'~ ..""__..
._.
."_
Introduccin
al equilibrio bayesl/lO pertixto
I 177
merca do de trabaJ'ode Spence (1973), el modelo de inversin'. empresarial

de Myers y Majluf (1984) y el modelo de poltica monetana de Vlckers
(1986).
En la seccin 4.3 describiremos otras aplicaciones del equilibrio bayesiano perfecto. Comenzaremos c0r:. el. an~~isis de juegos con parloteo
(cheap-talk games) (es decir, juegos de sena1JZacJOnen los cuales los mensajes no cuestan nada), entre cuyas aplicac.ion~sse incluyen 1.asamenazas d~
to
ve Presidencial a las decisiones del legIslativo norteamencano, los
. anun
.
cios de poltica por parte de la autoridad monetaria y las comurucaclOnes
(o "voz") en las organizaciones. En los juegos con parloteo, el ~cance de
la comunicacin se determina por los intereses comu~es de los Ju~adores
ms que por los costes de las seales de los diferentes tipos. EstudIaremo~
a continuacin el modelo de negociacin sucesiva de Sobel y Takahashi
(1983), en el cual una empresa debe tolerar una huelga para den:ostrar
que no puede permitirse pagar salarios ms .altos.(cfr. el.mo~elo ge negociacin con informacin completa de Rubmstem que mclwmos en la
secclOn
. en equilibrio). Finalmente,
..
.
" 2.1.D , en el cual las huelgas no se dan
exploraremos la explicacin clsica de Kreps, Milgrom, ~~bert~ y WIlson
(1982)del papel de la reputacin en el logro de la coopera~~~ raCJOnale~,el
dilema de los presos repetido finitamente (cfr. la proposlclon en ~asecCloIl
2.3.A concerniente al nico equilibrio de Nash perfecto en subJueg~s .de
un juego repetido finitamente basado en un juego de etapa con un m:1CO
equilibrio de Nash).
.:,
En la seccin 4.4 volveremos a la teora. Aunque es la seccin final
del libro, sirve para indicar lo que podra venir a continuaciIl.~~ql.!~
como culminacin de los temas analizados. All describireII10seustraremos dos refinamientos (sucesivos) del equilibrio bayesiano perfecto, el
segundo de los cuales es el criterio intuitivo de Cho y Kreps (1987).
4.1 Introduccin al equilibrio bayesiano perfecto

Consideremos el siguiente juego dinmico con informacin :ompleta pero
imperfecta. En primer lugar, el jugador 1 elige en~e tres acclO~es,~,Cy D.
Si el jugador 1 elige D, se acaba el juego sin que Juegue el 2. 51el Jugador
1 elige 1 o C, el jugador 2 se da cuenta de que D no ha sido .elegida,(per?
no de si ha sido elegida lo C) y entonces elige entre dos aCCIOnes,
1 yD,
tras lo cual se termina el juego. Las ganancias se muestran en la forma
extensiva de la figura 4.1.1.
. Introduccin
178 I JUEGOS, PINA1v[jCO~ CON INFORMACIN INCOMPLETA (C 4)
o'
O
2
O
1
Utiiza~d la rep!esent~ci6n'enfonnan9pnal
de este juego4ad~~
la figura 4.1.2, observ~mq~ que existen~().seqi1ibrios deNash con estra:;:
tegias puras, (1,1') y (D,D'),
(ieterminat SI estos equiiibri~;'d ],{f;h
son perfectos en subjuegos utiHz!Ull0slarepresentacin en {antia e~t~ri~
'.
'
"",'
,'"
,
, ", 'jl'!'
siva para definir los subjuegos del juego. Puesto que un' juego ,esdefr{j~9.,
de modo que comienza en, un nodo de decisin, que no es ~s que~~:
conjunto deinformacin cbn un nico elemento (aunque no es eipri~EJ-,
n~do de decisin del jueg()), el juego'delafigura .l no tiene subjug~~~"
SI un juego no tiene subjuegos, el r~q,uisitode perfeccin en subjuegos
(~o~cretamenteque las estrategias d' los jugadores c~mstituyan un equi~
hbno de Nash en cada subjuego) se cumple de forma trivia( Por tano:
encualquierjuego que no tenga subjuegos la definicin de equilibrio de.
Nash perfec~ en subjuegosles equivalent a la definicin de equilibriocl~
Nash, por lo que en la figura 4.1.1 tanto (1,!') como (D,D') son equilibrios
'de Nash perfectos en subjuegos. No obstante, (D,D') depende claramente
d,euna amen,aza que n resultacreble: si llega el tumo del jugador 2,jugar
1 domma a Jugar D', por 10 que el jugador 1 no debera verse inducido a
jugar D por la amenaza d;l jugador 2 de jugar Di si llega a mover.
r~r
Jug~dor 2
D'
.,:'1:';'
2,1
0,0
0,2
0,1
1,3
.:.:J:"
Jugadorl'
,;~~
Ii"
1,3
I liCJ
"t
1 En cada conj'unto de inFormacin el j'ugador que decide debe
RequISl o .
' J'
'
.
formarse una conjetura sobre el nodo del conjunta ~te injorm,acln al que se 1m
llegado en el juego. Para un conjunto de 111f~,:maclOncon mas de un ele1l1:/lfO,
una conjetura es una distribucin de probabl11dad sobre los nodos del conju/lto
de infonnacin; para un conjunto de informacin con un nico. el:mento, la
conjetura del jugador asigna probabilidad uno al nico nodo de declslO11.
"Figura 4.1.1
l'
perj)"
Una manera de reforzar el concepto de equilibrio para excluir el equi. d Nash perfecto en subJ'uegos (D D') de la figura 4.1.1 es imponer
libno e
' ,
los dos requisitos siguientes:
'o
2
1
,,1 c'1'lliIJl'io bayesiallo
..".
Requisito 2. Dadas sus conjeturas, las estrategias de los jugado~~s deben ~~,.
sucesivamente
racionales.
Es decir, en cada conjunto de mformaclOn, la aCClO1l
tomada por el jugador al que le toca tirar y su estrategia subsiguie~te debense.r
ptimas, dada la c01fjetura del jugador en ese conjunto d~ informaclOn y las :llbSl,~
guientes estrategias de los dems jugadores (donde una estra.tegla subslg,Ulente
es un plan de accin completo que cubre cada contmgencla que podna darse
despus de haberse alcanzado el conjunto de informacin).
. En la figura 4.1.1, el requisito 1 significa que si el juego alcanza el

conjunto de informacin con ms de un elemento del jugador 2, ste debe
formarse una conjetura sobre el nodo que se ha alcanzado (o, de forma
equivalente, sobre si el jugador 1 ha jugado 1 o C).Esta conjetura se
representa con las probabilidades p y 1 - p ligadas a los nodos relevilntes
en el rbol, como muestra la figura 4.1.3.
.Dada la conjetura del jugador 2, la ganancia esperada porjugar D' es
p. 0+(1 - p).l = 1 - p, mientras que la ganancia esperada por jugar j' es
p.1 + (1- p) .2 = 2 - p. Puesto que 2 - p > 1 - p para cualquier valor
". de p, el requisito 2 hace que el jugador 2 no elija D'. As, basta con exigir
_. que cada jugador tenga una conjetura y acte ptimamente de acuerdo
con ella para eliminar el equilibrio inverosmil (J],D') eneste ejemplo.
, Lo~requisitos 1 y 2 insisten en que los jugadores se formen conjeturas
:y,act~n de forma ptima segn stas, pero no que estas conjeturas sean
'tazonables,.Para imponer requisitos adicionales a las conjeturas de los
jt1gadt~s; distinguimos entre conjuntos de informacin que estn en la
trayectoria de equilibrio y los que estn fuera de la trayectoria de equilibrio. ,.
180
! JUECOS
DIN,VIICOS CON INFORMACIN
INCOMPLETA (c. 4)
Introduccin
o
1
o
2
o
1
Figura 4.1.3
Definicin. Para un equilibrio dado en un cierto juego en fionna extensiv

t d . fi
',.
,
. .
a, un
ollJun o e In onnaclOn esta en la trayectoria
de equilibrio si' se . 1
, '.
b b Td d
..
a canza
LOI/.pro.a 1 I a positiva cuando .el juego se desarrolla segn las estrategias de
~qullzbrlO, ~ fuera de la trayectorza de equilibrio si es seguro que no se alcanza
Llllmdo el Juego se desarrolla segn las estrateO"as de equilibrio (donde u .
11' "
"
.
. '
,equI1 mo. puede significar equilibrio de Nash, perfecto en subjuegos, bayesiano o
lmyeslano perfecto).
c'
"
equl~Ito 3.
En conjuntos de infonnacin sobre la trayectoria de equilibrio

las conJ~turas se determinan de acuerdo con la regla de Bayes y las estrategias d;
eqllllzbrzo de los jugadores.
'. Por ejemplo, e~ el equilibrio de Nash perfecto en subjuegos (1,1') de la
figur~ 4.?.3, la conjetura del jugador 2 debe ser p = 1: dada la estrategia de
eqUIhbno del jugador 1 (concretamente 1), el jugador 2 sabe qu nodo se ha
al~anz~~o en el conjunto de informacin. Como una segunda ilustracin
(lupotetica) del requisito 3, supongamos que en la figura 41 3 . t'
u
Tb .
. . eXls lera
n eqUl I no en estrategias mixtas en el cual el J'ugador 1 elein'a 1
.
o.
con
Prob ~.b IT1d a d ql, e con probabilidad q2 y D con probabilidad
1- q -'
El
requisito 3 obligaria a que la conjetura del jugador 2 fuera p = q /~q ~. ).
Los tr
. '.
1
1 q2
es reqUlsItos capturan el espritu de un equilibrio bayesiano
perfecto. La nueva caracterstica crucial de este concepto de eqw'll'b .
debe Kr
.
no se
a eps y Wllson (1982): en la definicin de equilibrio las conJ'etur
~&.. va.n a)'111lve de importancia de las estrategias. Formalmente u
eqUIlIbno ya no consiste simplemente en una estrategia para cada jugad:
al equilibrio
bayesiano
perfecto / 181
sino que ahora tambin incluye una conjetura para cada jugador en cada
conjunto de informacin en el que el jugador tenga que jugar.1 La ventaja
de hacer explcitas las conjeturas de los jugadores de esta manera es que,
igual que en captulos anteriores insistimos en que los jugadores eligen
estrategias crebles, ahora podemos insistir en que se forman conjeturas
razonables, tanto dentro de la trayectoria de equilibrio (en el requisito 3)
como fuera de sta (en el requisito 4 que sigue y en otros de la seccin 4.4).
En aplicaciones econmicas simples, que incluyen el juego de sealizacin de la seccin 4.2.A y el juego con parloteo de la seccin 4.3.A,
los tres requisitos no slo capturan el espritu del equilibrio bayesiano
perfecto, sino que tambin constituyen su definicin. Sin embargo, en
aplicaciones econmicas ms complejas, se necesita imponer msrequisitos con objeto de eliminar equilibrios inverosmiles. Distintos autores han
utilizado. diferentes definiciones del equilibrio bayesiano perfecto. Todas
las definiciones incluyen los tres requisitos; algunas tambin incluyen el
requisito 4 y algunas imponen requisitos adicionales.2 En este captulo
tomamos los requisitos 1 a 4 como definicin del equilibrio bayesiano
perfecto.3
1 Kreps y Wilson formalizan esta perspectiva de equilibrio definiendo el equililJrio secuencial,

un concepto de equilibrio equivalente al equilibrio bayesiano perfecto en muchas aplicaciones
econmicas, pero en algunos casos algo ms restrictivo,
El equilibrio secuencial es ms
complicado de definir y aplicar que el equilibrio bayesiano perfecto, por lo que la mayora de
los autores ahora utilizan este ltimo. Algunos se refieren (de modo impreciso) al concepto de
equilibrio que aplican corno equilibrio secuencial. Kreps y Wilson muestran que en cualquier
juego finito (es decir, cualquier juego con un nmero finito de jugadores, tipos y jugadas
posibles) existe un equilibrio secuencial. Esto significa que en cualquier juego finito existe un
equilibrio bayesiano perfecto.
2 Para dar una idea de las cuestiones que no son tratadas por los requisitos 1 a 4, supongamos que los jugadores 2 y 3 han observado los mismos acontecimientos y a continuacin
ambos observan una desviacin del equilibrio por parte del jugador 1. En un juego con informacin incompleta en el cual el jugador 1 tiene informacin privada, deberan los jugadores
2 y 3 formarse la misma conjetura sobre el tipo del jugador 1? En un juego con informacin
completa, deberan los jugadores 2 y 3 formarse la misma conjetura sobre las decisiones previas no observadas del jugador 1? De modo similar, si los jugadores 2 y 3 han observado los
mismos acontecimientos y entonces el jugador 2 se desvia del equilibrio, debera el jugador
3 cambiar su conjetura sobre el tipo del jugador 1 o sobre las decisiones no observadas del
jugador 1?
3 Fudenberg y TIrole (1991) dan una definicin formal del equilibrio bayesiano perfecto
para una amplia clase de juegos dinmicos con informacin incompleta. Su definicin trata
cuestiones como las que hemos planteado en la nota 2. Sin embargo, en los juegos simples
analizados en este captulo. estas cuestiones no se plantean, por lo que su definicin es equivalente a los requisitos 1 a 4; Fudenberg y TIrole ofrecen condiciones bajo las cuales su equilibrio
bayesiano perfecto es equivalente al equilibrio sucesivo de Kreps y Wilson.
,,
''-.'
'.'
'.
\~ ..'
182 / JUEGO 5 DINA.\IICOS

''
-
CON INFOR,\IAClN
INCO~II'LET,\
Introduccin
re .)
Requisito 4. En conjuntos de informacin f/lera de la tral/eeto'

t
''b '
d
na [ e eqru 1 no
,
Iras se eterminan segn a regla de Bll1es y as ' t' t ' d
'
Jugadores donde sea posible,
es la egzas e los
las eOndl
Definicin U q ''b . b
duras que s'at n, e ul1 no .ayesiano perfecto
lS aeen os requIsItos 1 a 4.
consiste en estrategias y eon-
, Sera por supuesto til enunciar el requisito 4 de un modo m

'
eVItando la vaga instruccin "donde sea posible" L h
s preCISO,
una d 1
r
'
. o aremos en cada
eas
ap lCaClOneseconmicas analizadas en las siguientes se '
or
ahora
utir
l'"
CClOnes.
P
. Izaremos os Juegos de tres jugadores de las ti ras 4 1 4
~~.5 para Ilustra: y fundamentar el requisito 4. (De arriba abafc:se indi~a~
pagos de los Jugadores 1, 2 Y3 respectivamente.)
L
ni equilibrio
bnycsinno
perfccto
/ 183
l a 3, Tambin satisfacen de forma trivial el requisito 4, puesto que

no existe ningn conjunto de informacin fuera de esta trayectoria de
equilibrio, por lo que constituye un equilibrio bayesiano perfecto.
A
2
L'
O
O
A
Figura 4.1.5
Ahora consideremos las estrategias (L,!,!') junto con la conjetura p =

O. Estas estrategias constituyen un equilibrio de Nash; ningn jugador
-,,} .. _---
O
1
1
Figura 4.1.4
Este juego ti ne
b'
,
con un n'
un su Ju~go: comIenza en el conjunto de informacin
este sub' ICOe emento ~el Jugador 2. El nico equilibrio de Nash en
Juego entre los Jugadores 2 3
(1 D'
equilibrio de Nash e
. y es , ), por lo que el nico
Estas estrate 'as 1p rfe:to en subJuegos del juego completo es (A,!,D').
g Y a conJetura p = 1 del jugador 3 satisfacen los requisitos
quiere desviarse unilateralmente. Estas estrategias Yla conjetura tambin

satisfacen los requisitos 1 a 3; el jugador 3 tiene una conjetura y acta
de forma ptima con respecto a sta, y los jugadores 1 y 2 actan de
forma ptima dadas las estrategias subsiguientes de los otros jugadores.
Pero este equilibrio de Nash no es perfecto en subjuegos, porque el nico
equilibrio de Nash del nico subjuego del juego es U,D'). Por tanto,
los requisitos 1 a 3 no garantizan que las estrategias de los jugadores
constituyan un equilibrio de Nash perfecto en subjuegos. El problema es
que la conjetura del jugador 3 (p = O) es inconsistente con la estrategia
del jugador 2 (l), pero los requisitos 1 a 3 no imponen restricciones a
la conjetura de 3 porque el conjunto de informacin de 3 no se alcanza
si el juego se desarrolla segn las estrategias indicadas. No obstante, el
requisito 4 fuerza a que la conjetura del jugador 3 est determinada por
la estrategia del jugador 2: si la estrategia de 2 es I, la conjetura debe ser
184/
JUEGOS DlN,\;lICOS CON INFORMACIN
Jllegos de sealizacin / 185
INCOMPLETA (e. 4)
= 1; si la estrategia de 2 es D, la conjetura de 3 debe ser p = O. Pero si

la conjetura de 3 es p = 1, el requisito 2 fuerza a que la estrategia de 3 sea
D', con lo que las estrategias (L,1,1') y la conjetura p = Ono satisfacen los
requisitos 1 a 4.
Como segunda ilustracin del requisito 4, supongamos que la figura

4.1.4 se modifica como muestra la figura 4.1.5. El jugador 2 dispone ahora
de una tercera accin po~ible, L' que termina el juego. (Para simplificar
ignoramos las ganancias' en este juego.) Como antes, si la estrategia de
equilibrio del jugador 1 es L, el conjunto de informacin del jugador 3 est
fuera de la trayectoria de equilibrio, pero ahora el requisito 4 puede no
determinar la conjetura de 3 a partir de la estrategia de 2. Si la estrategia
de 2 es L', el requisito 4 no pone restricciones en la conjetura de 3, pero si
la estrategia de 2 es jugar 1 con probabilidad q, D con probabilidad q2 y
' con probabilidad 1 - ql - q2, donde ql + q2 > O,el requisito 4 dicta que
la conjetura de 3 sea p = qj(q + q2).
Para concluir esta seccin, relacionamos de modo informal el equilibrio bayesiano perfecto con los conceptos de equilibrio presentados en los
captulos anteriores. En un equilibrio de Nash, la estrategia de cada jugador debe ser una mejor respuesta a las estrategias de los otros jugadores,
por lo que ningn jugador elige una estrategia estrictamente dominada.
En un equilibrio bayesiano perfecto, los requisitos 1 y 2 equivalen a exigir
que la estrategia de ningn jugador est estrictamente dominada comenzando en cualquier conjunto de informacin. (Vase la :;eccin 4.4 para
una definicin formal de dominancia estricta comenzando en un conjunto
de informacin.) El equilibrio de Nash y el equilibrio bayesiano de Nash
no comparten esta caracterstica en conjuntos de informacin situados
fuera de la trayectoria de equilibrio, como los conjuntos de informacin
que no estn contenidos en ningn subjuego. El equilibrio bayesiano perfecto tapa estos agujeros: los jugadores no pueden amenazar con jugar
estrategias estrictamente dominadas al comienzo de cualquier conjunto
de informacin fuera de la trayectoria de equilibrio.
Como indicamos anteriormente, una de las virtudes del concepto de
equilibrio bayesiano perfecto es que hace explcitas las conjeturas de los
jugadores para imponer no slo los requisitos 3 y 4, sino tambin otros
requisitos (sobre conjeturas fuera de la trayectoria de equilibrio). Puesto
que el equilibrio bayesiano perfecto no permite que el jugador' juegue una
estrategia estrictamente dominada comenzandQ en un conjunto de informacin fuera de la trayectoria de equilibrio, tal vez no sea razonable que
el jugador j crea que el jugador ' jugar tal estrategia. Sin embargo, puesto
que el equilibrio bayesiano perfecto hace que las conjeturas de los jugadores sean explcitas, este equilibrio no puede reconstruirse procediendo
hacia atrs en el rbol del juego, como hicimos para construir el equilibrio
de Nash perfecto en subjuegos. El requisito 2 determina la accin de un
jugador en un conjunto de informacin.dado basado en parte en la conjetura del jugador sobre dicho conjunto de informacin. Si el requisito 3
o el requisito 4 se aplican a este conjunto de informacin, determinan la
conjetura del jugador a partir de las acciones de los jugadores situados
ms arriba en el rbol. Pero el requisito 2 determina las acciones situadas
ms arriba en el rbol, basndose en parte en las estrategias subsiguientes
de los jugadores, incluyendo la decisin en el conjunto de informacin
original. Esta circularidad implica que una sola pasada ha~a atrs a lo
largo del rbol (normalmente) no es suficiente para calcular un equilibrio
bayesiano perfecto.
4.2 Juegos de sealizacin

4.2.A Equilibrio bayesiano perfecto en juegos de sealizacin
Un juego de sealizacin es un juego dinmico con informacin completa
y dos jugadores: un emisor (E) y un receptor (R). El desarrollo del juego
es el siguiente:
, '!li
.r'
1. El azar escoge un tipo ti del conjunto de tipos factibles T = {tI,' .. ,tI}

que asigna al siguiente emisor segn una distribucin de probabilidad
p(t;), donde p(ti) > Opara cada i y p(tl) + ... + p(tI) = 1.
2. El emisor observa ti y elige un mensaje

factibleslv! = {mI,' .. ,m}}.
mj
del conjunto de mensajes
3. El receptor observa mj (pero no ti) y elige a continuacin una accin

Uk de un conjunto de acciones factibles A = {al" .. ,aK}.
4. Las ganancias vienen dadas por
UE(ti,mj,ak)
UR(ti,mj,ak).
En muchas aplicaciones, los conjuntos T, M Y A son intervalos de la

recta real, en lugar de conjuntos finitos como los considerados aqu. Es
inmediato permitir que el conjunto de mensajes factibles dependa del tipo
que determina el azar, y que el conjunto de acciones factibles dependa del
mensaje que enva el emisor.
, 'Jt
_rJ
\
(
(
J'
Juegos de SeJllllizIlCi,ill / 187
186 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (e. 4)
Los modelos de sealizacion han sido aplicados extensamente en el

anlisis econmico, Para indicar la diversidad de posibles aplicaciones
mterpretamos brevemente la estructura formal en 1-4 en trminos de las
tres aplicaciones que sern analizadas en las secciones 4.2.B,4.2.C y 4.2.0.
En el modelo de sealizacin en el mercado de trabajo de
Spence (1973)elemisor esun trabajador, el receptor es el
mercado de posibles empresarios, el tipo es la capacidad
productiva del trabajador, el mensaje es la eleccin' del
nivel de educaci9n.c;leltrabajador yla accin es el salario
,pagado Eor el mercado.
'"
".
"
;',
:- - .:.'
En el modelo deinversirtempresarial
y estruc~rade
capital de Myers y Majluf (1984),el emisor es una empresa
que necesita capital para financiar WI nuevo proyecto, el
receptor es un inversor potencial; el tipo es la rentabilidad
de los activos existentes de la empresa, el mensaje es la
oferta de una participacin en l beneficio de la empresa
a cambio de financiacin y llaccin es la decisin de si
invertir ano por parte del inversor.
expectativa de inflacin por parte de los empresarios precede al juego de seii.alizacin, y la eleccin de la autoridad
monetaria de inflacin en el segundo periodo la sigue,
En el resto de esta seccin analizarnos el juego de seii.alizacin abstracto dado en 1 a 4, ms que estas aplicaciones. La figura 4.2.1 ofrece
una representacin en forma extensiva (sin ganancias) de un caso simple:
T == {tlh}, NI == {ml,m2}, A. == {o.l,o.2}YProb{t] } == p. Ntese que el juego
no se desarrolla desde el nodo inicial en la parte superior del rbol hasta
los nodos terminales en la parte inferior, sino desde una jugada inicial
iterminada por el azar en mitad del rbol hasta los nodos terminales en
los extremos izquierdo y derecho.
Emisor
a,
a,
m,
:
a,
'. ,1: .~.
'
,
,
Receptor
Azar
,
,
,
1 - J
a,
m,
t,
ai
En el modelo de poltica monetaria de Vickers (1986), la

autoridad monetaria posee informacin privada sobre su
voluntad' de aceptar inflacin para aumentar el nivel de
empleo pero, por lo dems, el modelo es una versin en ,',
dos etapas del juego 'repetido con informacin completa
del modelo analizado en la seccin 2.3.E.As, el emisor es
la autoridad monetaria'. el receptor es la patronal, el tipo la
voluntad deja autoridad monetaria de aceptar una cierta
inflacin para aumentar el nivel de emple, el mensaje la
eleccin deja inflacin en el primer periodo por parte dela
autoridad monetaria y la accin la expectativa de inflacin
en el segundo periodo' por parte de los empresarios. La
a,
Receptor
E~ algunas aplicaciones, un juego de sealiza~i~.f9rm~parte de un juego

mas complejo. Por ejemplo, el receptor pdra tri~r ~ud'cisill antes de
que el emisor eligiese el mensaje en la segunda ~f~pa y~'elemisor podra
tornar su decisin despus de que el receptor tomase la suya en la etap~ 3
(o simultneamente). ,
m,
t,
a,
m,
a,
Emisor
Figura 4.2.1
Recordemos que (en cualquier juego) la estrategia de un jugador es un
plan de accin completo; una estrategia detalla una accin factible para
cada contingencia en la cual el jugador pudiera tener que actuar. Por lo
tanto, en un juego de seii.alizacin, una estrategia pura del emisor es una
funcin m(ti) que especifica qu mensaje elegir para cada tipo que el
azar pueda detemIinar, y una estrategia pura del receptor es una funcin
o.(mj) que especifica qu accin elegir ante cada mensaje que .el emisor
pueda enviar. En el juego simple de la figura 4.2.1, tanto el emIsor como
el receptor cuentan con cuatro estrategias puras.
188/
Estrategia 1 del emisor: Jugar

azar determina t2.
INCOMPLETA (e. 4)
Juegos de selializacin / 189
si el azar determina t] y jugar m] si el
mI
Estrategia 2 del emisor: Jugar m] si el azar determina t] y jugar

azar determina t2.
m2
si el
Estrategia 3 del emisor: Jugar TI12si el azar determina t] y jugar m] si el

azar determina t2'
'
Estrategia 4 del emisor: Jugar
azar determina t2.
m2
si el azar determina t] y jugar
m2
si el
Estrategia 1 del receptor: Jugar a] si el emisor elige m] y jugar a] si el

emisor elige m2.
Estrategia 2 del receptor: Jugar a] si el emisor elige m] y jugr
emisor elige m2.
.
,
ai si el
Estrategia 3 del receptor: Jugar a2 si el emisor elige m] y jugar a] si el

emisor elige m2.
Estrategia 4 del receptor: Jugar
emisor elige m2.
a2
si el emisor elige m] y jugar a2 si el
Llamamos a las estrategias primera y cuarta del emisor de agrupacin,

porque cada tipo enva el mismo mensaje, y a la segunda y a la tercera de
separacill, porque cada tipo enva un mensaje diferente. En un modelo
con ms de dos tipos tambin existen estrategias de agrupacin parcial (o de
semi-separacin) en las cuales todos los tipos en un determinado conjunto
de tipos envan el mismo mensaje, pero diferentes conjuntos de tipos
envan mensajes diferentes. En el juego con dos tipos de la figura 4.2.1
existen estrategias mixtas anlogas llamadas estrategias hfbridas, en las
cuales (digamos) t] juega m] pero t2 escoge aleatoriamente entre m] Y'1112.
Ahora traducimos los enunciados informales de los requisitos 1, 2 Y3
de la seccin 4.1 a una definicin fOfilal del equilibrio bayesiano perfecto
en un juego de sealizacin. (La discusin sobre la figura 4.1.5 implica que
el requisito 4 es vacuo en un juego de sealizacin.) Para simplificar las
cosas, limitamos nuestra atencin a las estrategias puras; las estrategias
hn)ridas se discutirn brevemente en el anlisis de la sealizacin en el
mercado de trabajo de la prxima seccin, Dejamos como ejercicio la
definicin del equilibrio bayesiano de Nash en un juego de sealizacin
(vase el ejercicio 4.6).
Puesto que el emisor conoce la historia completa del juego cuando
elige un mensaje, esta eleccin se da en un conjunto de informacin con
un lnico elemento. (Existe un conjunto de informacin de esa clase para
cada tipo que el azar pudiera determinar.) Por tanto, el requisito 1 es trivial
cuando se aplica al emisor. El receptor, por el contrario, elige una accin

despus de observar el mensaje del emisor pero sin conocer el tipo de ste,
por lo que la eleccin del receptor se da en un conjunto de informacin con
ms de un elemento. (Existe un conjunto de informacin de esa clase para
cada mensaje que pudiera elegir el emisor y cada uno de estos conjuntos de
informacin tieneun nodo para cada tipo que pudiera haber determinado
el azar.) Aplicando el requisito 1 al receptor obtenemos:
Requisito 1 de. sealizacin.
Despus de observar cualquier mensajemj d~
M, el receptor der~formarseuna
conjetura sobre,qu tipos. podran haberenVld~
rn. Denotelrios'esta conNttira con la distribuciii de probabilidad(tilmjt
dj~4e, .
J
.'
.' ... '
.....
...
.'
.
..
. ....'
,
.,'
'.'
.(t;lmj)~Opara"cdati'im
T y'"
"
L .(tjmj)
1.
tiET
Dados el mensaje del emisor y la conjetura del receptor, es inme~iat?

caracterizar la accin ptirrl del receptor. " Aplicando el requisito','f::il:!,.'
"T'-, '.,;--:;,'.~t '
receptor obtenemos:
", /~:
Requisito fR de sealizacin.
Para cada mj en NI, la accin del receP-!
tor a*(mj) debe maximizar la utilidad esperada del receptor dada la conjetura
.(tdmj) sobre qu tipos podran haber enviado "mj. Es decir, a*(mj) es una
solucin de
El requisito 2 tambin se lplica al emisor, pero ste tieneinf0:mac;:in

completa (y por tanto una conjetura trivial), y adems decide sorament~
al principio del juego, por lo que el requisito 2, e~ simplemen~e que la
estrategia del emisor sea ptima dadala estrategia d! receptor:
Requisito2E <lesealizacin.
Para cada ti enT: elmensaje del emisor m * (ti)
debe maximizar la utilidqd del emisor d,qda la estrategia del receptor a*(mj). Es
decir, m~(ti) es una solucin de
,'.
'.','
Juegos de se1alzalf
:," >
~inalmente, dada la estrategia del emisor m *( ,

'
j
tipos que envan el mensaje m Es de'
t
t.), sea T el conjunto de
T si m*(l)
= m.
S' T
'J' ,
,Clr, .i es un elemento del conjunto
,
J'
1 j no esta vaclO, el con'
t d .
.,
j
rrespon,diente al mensaJ'e mj es t'a en 1a trayect Jun
co'd o e mformaclOn
'"
contrario ningu'n tl'PO' ,
ona e eqUIlIbno; en caso
,
enVla m. por lo qu 1
.
correspondiente est fu
d' 1 J'
, e e conjunto de informacin
era e atrayectona de e Tb'
en la trayectoria deequI'll'b'no 1a ap l'IcaClondel
.,
qUI..1 no,
3 Para mensajes
del receptor resulta en:
reqUISIto a las conjeturas
Requisito 3 de seializacin. Para cada m.'
"
'
.
n:*(ti) .~ mj, la c01"ijetu;adel re;'ton;n el'c/: en M, s~ eXIste t~/n Ttal que
dIente a mj debe derivarsed . l
P, d'
. yunto de tnformaclOn correspone a reg a B~yes y la estrategia del emisor:
'
,
/.'
'
P(ti)
E.p(ti) .
".
;':
'\.
"
/ IlJ 1
INCOMPLETA (c. 4)
t,ET,
Definicin, Un equilibrio
bayesiano
erfi t
.'.
.
juego de sealizacin consiste en ," dP ec o ,CO~l estrategIas puras en un
' t
unpar eestrategzasm*(t')ya*(m)
je ura At 1m )
. fi
'j
,yen una
con
(3).
' 'J que satls acen los requisitos de sealizacin (1), (2R), (2E) Y
Si la estrategia del emisor es de agrupacin o de separacin, llamamos

al equilibrio de agrupacin o de separacin, respectivamente.
Concluimos esta seccin hallando los equilibrios bayesianos perfectos
en estrategias puras en el ejemplo con dos tipos de la figura 4.2.2. Ntese
que cada tipo tiene las mismas posibilidades de ser elegido al azar; utlizam<?s(p,l _ p) y (q,1 - q) para denotar las conjeturas del receptor en sus
dos conjuntos de informacin.
Los cuatro posibles equilibrios bayesianos perfectos con estrategias
puras de este juego con dos mensajes Y dos tipos son: (1) Agrupacin en
Ii (2) AgrUpacin en Di (3) Separacin con tl eligiendo J Y t2 eligiendo
D, y (4) Separacln con tl eligiendo D Y t2 eligiendo J. A continuacin
analizamOs estas posibilidades.
1. Agrupacin en J. Supongamos que hay un equilibrio en el cual
la estrategia del emisor es U,!), donde (mi ,-m") significa que el tipo 1.1
elige m' Y el tipo t2 elige mil. Entonces, el conjunto de informacin del
receptor que corresponde a J est en la trayectoria de equilibrio, por lo que
la conjetura del receptor (p,l - p) en este conjunto de informacin viene
determinada por la regla de Bayes y la estrategia del emisor: p = 0,5, que
es la distribucin a priori. Dada esta conjel1.lra(o cualquier otra conjetura),
la mejor respuesta del receptor que sigue a J es elegir a, de manera que
105 tipos del emisor tl y t2 alcanzan ganancias de 1 y 2respectivanlPnte.
Para determinar si ambos tipos del emisor quieren elegir J, necesitamos
establecer cmo reaccionara el receptor a D. Si la r~spuesta del receptor
a D es a, el pago al tipo ti por elegir D es 2, 10 que es mayor que el pago
de 1 que recibe por elegir J. Pero si la respuesta del receptr a D es b,
h Y t2 alcanm unas ganancias de y 1 respectivamente por elegir D,
mientras queson de 1 y 2 respectivamente por elegir J. Por lo tanto, si
existe Ufl equilibrio en el cual la estrategia delenisor es U,I), la respuesta
del receptor a D debe ser b, de manera. que la estrategia del receptor debe
ser (o.,b), donde (e' ,e") significa que el receptor elige c' despus de r y
e" despus de D. Queda por considerar la conjetura del receptor en el
conjunto de informacin correspondiente a D y la optimalidad de elegir
b dada esta conjetura. Puesto que elegir 1) es ptimo para el receptor
para cualquier q S 2/3, tenemos que [U,J),(o.,b),p == 0,5,q] es un equilibrio
'.\
bayesiano perfecto de agrupacin para cada q S 2/3.

2. Agrupacin en D. A continuacin supongamos que la estrategia
del emisor es (D,D). Entonces q = 0,5, de manera que la mejm respuesta
del receptor a D esb, obtenindose unas ganancias de para l., y 1 pnra
t2. Pero ti puede conseguir 1 eligiendo J, puesto que la mejor respuesta
1)12 JUEGOS DINMICOS CON INFOI~IVI~C10'N

I';CO
'"tvIPLETA
Liegos de sealizacin / 193
(e. 4)
del receptor a ,[ es a para cualquier valor de )

l
'
equilibrio en el cual el
"
j y, por o tanto, no eXIsteun
emISOrJuegue (D,D).
3. Separacin con eleccin de I or a
'.
la estrategia de separacin U D) l Pd P rte de tI' SI.el emIsor elige
receptor estn en la tra
t ~ :1' os os conjuntos de informacin del
yec ona l e equilib .
l
se delenl1inan por la regl d BIno,
por o que las conjeturas
y I} '" O Las'
a e ayes y a estrategia del emisor: p '" 1
a y b res~ectiva::~;:s
drespuestas del receptor a dichas conjeturas _son
, '
,e manera que ambos tipos del'
.
ganancias de 1 Qued
.
emIsor, conSIguen
dada la estrat~gia de~por compr(obar sIla estrategia del emisor es ptima
receptor a b) No lo es' si - l ti
eligiendo I en lugar de DI'
.
.
e po t2 se desva
,e receptor responde con
1
una ganancia de 2
' ,
a, con o que t2 recibe
elegir D.
' que es mayor que la ganancia de 1 que recibe t2 al
4. Separacin con eleccin de D or
d
.
estrategia de separaci (D I) 1
~ parte e tI' SI el emisor elige la
(/ _ 1 d
'
n,
,as conjeturas del receptor deben ser p - O
- , e manera que la mejo
dI'
- y
consiguen unas ganancias d: r;s~~esta e re~eptor .e~(a,a) y ambos tipos
reaccionara con a'la g
. ci
tI s~ deSVIaraelrgIendo 1, el receptor
incentivo para qu~ 1 s:r;nCl~ de t s]ena ent~nces de 1,c,on lo que no hay
eSVIe e D Del rrusmo mod
.t
d
'
de D, el receptor reaccio'
.1
' o, SI 2 se esviara
nana con a' a ganancia de t
'
1, con lo que no existe'
.'
2 sena entonces de
[(D,I),Ca,a),p = O _ 1] mcent1vo p.ar~ que t2 'se desve de l. Por lo tanto,
,q es un eqUIlIbno bayesiano perfecto de se paraclOn.
'
.,
4.2.B Sealizacin en el mercado de trabajo
La Senorme
literatura sobre' Juegos d e senalrzaclOn
_.
. , comienza con el model
de
'
pence (1973), que precedI tanto ala amplia utilizacin dI'
o
e los Juegos en
f orma extensiva para des cn'b'Ir pro bl emas econmic
de conceptos de equilib .
1d
'"
os como a a definicin
no como e e eqUIlrbno bayesiano perfecto
" replanteamos el modelo d S
.
_ En esta seCClOn
'.
lorma extensiva y luego d
'b'
l
e pence como un Juego en
escn IrnOSa gunos de sus
'l'b'
b
perfectos' en la s
.,
.,eqm
1 nos ayesianos
ba
.'
_ eCClOn4,.4 aplrcaremos un refinamiento del eq 'I'b .'
yesIano perlecto a est'
El
m 1 no
e Juego.
desarrollo temporal es el siguiet:lte:
1. El azar determin
puede ser o alta ~; ~?~Cl~)d rOdUCtiv~ ~e un trabajador, 1), la cual

2. El'
aja
. a probabIlIdad de que 1) = A es q.
trabajador averigua
'd d
'
cacin e ~ O.'
su capacI a y entonces elige un nivel de edu-
':.
3. Dos empresas observan la educacin del trabajador (pero no su capa4

cidad) y entonces le hacen ofertas salariales de forma simultnea.
4. El trabajador acepta la oferta salarial ms alta, lanzando una moneda
en caso de empate. Sea -w el salario que acepta el trabajador.
",
Las ganancias son las siguientes: -w - c('I),e) es la del trabajador, donde

c(r,e) es el coste en el que incurre un trabajador con capacidad '1) para
obtener una educacin e; y(r,e) - -w es la de la empresa que emplea al
trabajador, donde y(r,e) es la produccin de un trabajador con capacidad
r qu~ ha ot>!enido una educacin e; y cero es la de la empresa que no
empleaal trabajador.
Vamos a centramos (aqu en cierto modo y ms en la seccin 4.4) en un
equilibrio bayesiano perfecto en el cual las empresas interpretan la educacin como una seal de capacidad y, en consecuencia, ofrecen un mayor
salario al trabajador con ms educacin. La irona del trabajo de Spence
(1973) es que los salarios pueden aumentar con la educacin incluso si la
educacin no tiene efecto alguno sobre la productividad (es decir,irIcluso
si la produccin del trabajador con habilidad r es y(r), independientemente de e). El trabajo de Spence (1974) generaliza el argumento al irIcluir
la posibilidad de que la produccin aumente no slo con la. capacidad,
sino tambin con la educacin; la conclusin anloga es entonces que los
salarios aumentan con la educacin ms de lo que puede explicarse por
el efecto de la educacin en la productividad. Seguimos este enfoque ms
general.s
Es un hecho bien establecido que los salarios son mayores (en promedio) para los trabajadores con ms aos de escolaridad (por ejemplo,
vase Mincer [1974]). Este hecho invita a irIterpretar la variable- e como
los aos de escolaridad. En un equilibrio de separacin podramos pensar que un trabajador con capacidad baja tiene una educacin de grado
medio y que un trabajador con capacidad alta tiene una educacin universitaria. Desgraciadamente, interpretar e como los aos de escolaridad
plantea cuestiones dinmicas que no tratamos en el juego simple en 1--4,
como la posibilidad de que una empresa haga una oferta salarial despus
,',,'-,
i
','
4 La presencia de dos empresas en el papel del receptor deja este juego ligeramente fuera
de la clase de juegos analizada en la seccin previa; pero vase la discusin que precede a la
ecuacin (4.2.1).
5 Formalmente, suponemos que trabajadores con alta capacidad sbn ms productivos (es
decir, y(A,e) > 'y(I3,e) para toda e), y que la educacin no reduce la productividad (es decir,
Ye(TI,e) ~ Opara cada 'TI y cada e, donde ye('r,e) es la productividad
marginal de la educacin
",
para un trabajador de capacid"d TI con una educacin e).
____________________
(:;:"
..J.
fuegos de sClia/izacin
194
:""r
/195
INCOMPLETA (c. 4)
del primer ao de universidad de un trabajador (es decir, despus de

que un trabajador de baja capacidad haya terminado sus estudios pero
antes de que uno de alta capacidad lo haya hecho). En un juego ms
complejo el trabajador podra elegir cada ao si aceptar la mejor oferta
del momento o volver a estudiar otro ao. Noldeke y Van Damme (1990)
analizan un juego ms rico en esta lnea demostrando que: (i) hay muchos .
equilibrios bayesianos perfectos; (ji) despus de aplicar un refinamiento
estrechamente relacionado cbn el que aplicaremos en la seccin 4.4, slo
uno de estos equilibrios sobrevive, y (iii) este equilibrio que 'sobrevive es
idntico al nico.equilibrio del juegosimple en 1,-4 quesobrevive despus
de aplicar el refinamiento de la seccin. 4.4, ..Por lo tanto, podriamos interpretar vagamente e como los aos deescoiaridad enel juego simple en
1,-4, porque los resultados son lbs mismos. en el juego ms rico.
En su lugar; vamos a evitar estas cuestiones dinmicas interpretando
las diferencias en e como diferencias en la calidad del rendimiento de un
estudiante, 110 como diferencias n la d~racin de la escolaridad de dicho
estudiante. Por tanto, ei juego en t-4 podra aplicarse a un grupo de
estudiantes que han. terminado los estudios mediO,s~esdecir, trabajadores
con doce aos. de educacin exaCtamente) o.a tUl grupo de icenciados
universitarios, o a un grupo de estudiantes con un mster en direccin de
empresas. Bajo esta interpretacin, e mide el nmero y el tipo de asigna:.turas estudiadas y las notas y premios conseguidos durante un programa
acadmico de duracin fija. Los costes de la enseanza (si existen) son entonces independientes de e, de manera que la funcin de costes c(7],e) mide
los costes no monetarios (o psquicos): estudiantes cn una capacidad
ms baja encuentran ms difcil conseguir notas altas en una institucin
determinada, y tainbin ms difcil conseguir las mismas notas en una
institucin ms competitiva. As, la utilizacin de la educacin por parte
de la empresa como seal, refleja el hecho de que las empresas contratan
y pagan m~s a los mejores estudiantes de una institucin determinada y
a los estudiantes de las mejores instituciones.
El supuesto crucial en el modelo de Spence es que los trabajadorescon
poca capacidad encuentran la sealizacin ms cara que los trabajadores
con capacidad ms alta. De un modo ms preciso, el coste marginal de
la educacin es ms alto para trabajadores de baja capacidad que para los
de capacidad alta: para cada e,
donde Ce (''I,e) denota el coste marginal de la educacin de un trabajador de

capacidad 7] y educacin e.Para interpretar este supuesto consideremos
un trabajador con educacin el al que se le paga un salano 11J], como
muestra la figura 4.2.3,y calculemos el aumento salarial que sera necesario
para compensar a este trabajador por un aument~ eneducac~nde el a
e2. La respuesta depende de la capacidad del trabajador: tra~~Jado:'~scon
capacidad baja encuentran ms difcil adquirir una educaClon adlCJonal,
or lo que requieren un aumento salarial ms alto (hasta IJ)B en lugar de
~lo hasta WA) para compensarles por ello. La interpretacin grfica de
este supu.esto e~q}le}s~ trabajadores con capacidad baja tienen c:Jrvas de
indiferencia '~ii.'mayorpendiente que los trabajadores con capaCIdad alta
(compresej~
co~ IAenlafigura).
.
IR
lA
::.
v
w,
~.
Figura 4.2.3
Tambin supone Spence que la competencia entre las empresas har

que los beneficios esperados sean cero. Una forma de incorporar este
supuesto a nuestro modelo sera sustituyendo las dos empresas en la
etapa (3) por un nico jugador llamado mercado que hace una oferta .s~larial nic'a w y que recibe la ganancia -[Y(T7,e) - w]2 (Esto cOl1vertma
el modelo en uno de la clase de juegos de sealizacin con un receptor
definidos en la seccin anterior.) Para maximizar la ganancia esperadil,
196/
JUEGOS DINMICOS CON INFORMACJN
INCOMPLETA (e. 4)
Juegos de sealizacin / 197
como pide el requisito 2R de sealizacin, el mercado ofrecera un salario

ib'lJal al producto esperado de un trabajador con educacin e, dada la
conjetura de! mercado acerca de la capacidad del trabajador despus de
observar e:
w(e)
= .L(Ale)
. y(A,e)
+ [1 -
.L(Ale)] . y(E,e),
Curvas de
indiferencia
para capacidad
(4.2.1)
y(n,e)
donde .(.4Ie) es la probabilidad que el mercado asigna a que la capacidad

del trabajador sea A. El propsito de tener dos empresas compitiendo
entre ellas en la etapa (3) es conseguir el mismo reslta.dosm '~t::~mr a.
un jugador ficticio llamado mercado. Sin embargo, par g.arimftzar que
las empresas siempre ofrezcan un salario igual al produtoesperado del
trabajador, necesitamos imponer otro supuesto: tras observar la eleccin
de educacin e, ambas empresas se forman la misma conjetura sobre la
capacidad del trabajador, nuevamente denotada por .L(Ale). Puesto que
e! requisito 3 de sealizacin determina la conjetura que ambas empresas deben formarse despus de observar la eleccin de e que est en la
trayectoria de equilibrio, nuestro supuesto es realmente que las empresas
tambin comparten una misma conjetura tras observar la eleccin de e que
est fuera de la trayectoria de eqllibrio. Dado este supuesto, ~e deduce
que en cualquier equilibrio bayesiano perfecto ambas empresas ofrecen
e! salario w(e) dado en (4.2.1), tal como en el modelo de Bertrand de la
seccin 1.2.Blas empresas ofrecen ambas un precio igual al coste marginal
de produccin. Por tanto, (4.2.1) sustituye al requisito 2R de seal.izacin
en el modelo con dos receptores de esta seccin.
Para preparamos para el anlisis de los equilibrios bayesianos perfectos ele este juego de sealizacin, consideramos primero el juego anlogo
con informacin completa. Es decir, suponemos temporalmente que la
capacidad del trabajador es informacin del dominio pblico entre los
jugadores, en vez de infoffi1acin privada del trabajador. En este caso, la
competencia entre las dos empresas en la etapa (3) implica que un trabajador con capacidad TI y educacin e recibe el salario w(e) = Y(TI,e)~ Parlo
tanto, un tTabajador con capacidad TI elige e, que soluciona
e*(iz)
(';,
;
Figura 4.2.4
Ahora volvemos (deforma permanente) al supuesto de que la capacidad del trabajador es informacin privada. Esto abre la posibilidad d~ que.
un trabajador con capacidad baja pueda tratar de pasar por un trabaJa~or
de capacidad alta. Pueden plantearse dos casos. La ~gura 4.2.5 des~nbe
el caso en el que le resulta demasiado caro a un trabajador con capacIdad
baja adquirir una educacin e*(A), incluso si esto permitier~ engaa~ a las
empresas y hacer que le pagaran el salario w*(A). Es deCIr,en la figura
4.2.5, w*(B)
- c[B,e*(B)]
>
w*(A)
- c[E,e*(A)].
'-:
lA
y(A,e)
w
w*(A)
,',
y(B,e)
w*(B)
e
w*(-,) = Y[',e*Cr)].
e*),
como muestra la figura 4.2.4, siendo
e*(B)
e'(A)
Figura 4.2.5
"
'".'
e')
max y(-r,e) - c(-r,e).
Denotamos la solucin con
},
':,:,
,,
Juegos de se>lalizacll
198/ JUEGOS DINMICOS CON [NFORMAClN INCOMPLETA (c. 4)
La figura 4.2.6 describe el caso contrario, en el cual podra decirse

que el trabajador con capaCidad baja envidia el salario y nivel de edu~
cacin del trabajador con capacidad alta (es decir, ?U'(E) - dE,e'(E)]
<
?U'(A) - dE,e'(A)]).
Este ltimo caso es ms realista y (como veremos)
ms interesante. En un modelo en el que la capacidad del trabajador tiene
ms de dos valores, el primer caso se plantea slo si cada valor posible de
capacidad es suficientemente diferente de l~s valores posibles adyacentes.
Si la capacidad es una variable continua, por' ejemplo, entonces se da el
ltimo caso.
w*(B}
Para completar la descripcin de equilibrio bayesiano perfecto ele agrupacin nos falta (i) determinar la conjetura ele la~ empresas p,(A le) para
las elecciones de educacin e =1 ep fuera del eqUlltbno, que entonces determina el resto de la estrategia de las empresas ll)(e) por medio de (4.2.1),
y (ii) demostrar que la mejor respuesta d: ambos tipos de trabajador a
la estrategia w(e) de las empresas es elegIr e = ep' Est~s dos pasos 1 epresentan los requisitos 1 y 2E de sealizacin respechvame~te: CO~l~O
apuntamos anteriormente (4.2.1) sustituye al reqUlsJto2R de senaltzaclon
en este modelo con dos receptores.
Una posibilidad es que las empresas crean que cualquier niv.elde ed~lcacin distinto de ep indica que el trabajador tiene Wla capaCIdad baja:
p,(A!e) = O para todo e =1 ep' Aunque esta conjetura ,podra parecer extraa, nada en la definicin de equilibrio bayesiano perfecto la e~c1L1ye,
porque los requisitos del 1 al 3 no imponen restricci~~es a las conjeturas
situadas fuera de la trayectoria de equilibrio y el reqwsJto 4 es vacuo en un
juego de sealizacin. El refinamiento que aplicamos en la seccin 4.4 restringe la conjetura del receptor fuera de la trayecto~ia de equilibri~ en un
juego de sealizacin; en particular excluye la conJ::ura que anahzamos
aqu. En este anlisis de los equilibrios de agrupaclOn ~~s cent:3mos en
esta conjetura para simplificar la exposicin, pero tamblen conSIderamos
brevemente conjeturas distintas.
Si la conjetura de la empresa es
__
,_,__
.
e*(B}
/ '199
~L(Ale)
e*(A)
apara
e =1 ep
{ q para e = ep
(4.2.3)
entonces (4.2.1) implica que la estrategia de las empresas es

Figura 4.2.6
w(e)
;: ..
'.:.",'
-.':: .
Como describimos en la seccin anterior, en este modelo pueden existir tres casos de equilibrios bayesianos petf~i:tos: de' ~i;rupacin, de separacin e hbrido. Normalmente existen numerososdsos de cada clase de
equilibrio; aqu l~mitamos nuestra atertci6riiirios cant~s ejemplos. En
un equilibrio de agrupacin, los dos tipos del trabajador eligen un nivel de
educacin nico, digamos ep' Elrequisit03'de seilicin impli<;aque
la conjetura de las empresas despus de observar ep debe ser lac'onjetura
a priori p,(Alep) = q, que, a su vez, exige que el salario ofrecido despus de
observarep
sea
(4.2)
_ {Y(E ,e)
wp
Un trabajador con capacidad
7]
para e =1 ep
para e,. -- e-p'
(4.2.4)
escoge por lo tanto e como solucin de
max'w(e)
- c(7/,e).
(4.2.5)
La solucin de (4.2.5) es simple: un trabajador con capacidad 7] elige o

epa el nivel de educacin que maximiza 'y(13,e) - c(T/,e). (Este ltimo es
precisamente e'(E) en el caso del trabajador de capacidad baja.) E.n el
ejemplo descrito en la figura 4.2.7, lo primero es ptimo para .ambos t.lpOS
del trabajador: la curva de indiferencia del trabajador de baja capaCldad
que pasa por el punto [e'(B),w'(B)
queda por debajo de la curva de
indiferencia del mismo tipo que pasa por el punto (ep,wp), y la curva
2(JO ! JUEGOS DINMICOS CON INfORMACiN
INCOMPLETA (c. 4)
Juegos de seiializncin / 201
de indiferencia del trabajador con capacidad alta que pasa por el punto
(ep'll)p)
est por encima de la funcin de salario tu = y(B,e).
trab~jador constituyen otro equilibrio bayesiano de agrupacin. Como

ejemplo de lo ltimo, supongamos que la conjetura de las empresas es
cOffi9 en (4.;2.3), con la excepcin de que cualquier nivel de educacin por
encima de el! se interpreta como que el trabajador se escoge al azar de la
distribu.cin de capacidades:
y (A,e)
O
q y(A,e)
+ ( 1 - q)
L(Ale) =
y(R,e)
e'
para e :S el! excepto cuando e =

para e = el'
para e > el!;
el'
"
1.:.;.
donde el! en la figura 4.2.7 es el nivel de educacin en el cual la curva

de indiferencia del trabajador con capacidad alta que pasa por el punto
(ep'wp) corta la funcin de salarios w = q . y(A,e) + (l - q) . y(B,e).
La
estrategia de las empresas es entonces
(R,e)
.
e*(B)
q
{ q
w(e)
{Y(B,e)
wq
Wq
para e :S el! excepto cuando e =

para e = el'
para e> el!.
el'
-,.Esta conjetura y esta estrategia de las empresas, y la estrategia (e(B) =

-e;,e(A)
= el') deltrabajdor constituyen un tercer equilibrio bayesiano
perfecto de agrupacin.
Ahora vamos a tratar equilibrios de separacin. En la figura 4.2.5;
(el caso donde no hay envidia) el equilibrio natural bayesiano perfecto
~-d~
separacin incluye la estrategia [e(B) = e'(B),e(A)
= e'(A)] del tTab'i.
j'ldor. El requisito 3 de sealizacin determina entonces la conje~
de
---lasempresas despus de observar cualquiera de estos dos niveles deeducacin (concretamente L[Ale'CB)] = OY L[A\e'CA)] = 1), por lo que C4.2.1)
implica que w[e'CB)] = w'(B) y w[e'(A)l
= w'CA). Corno enla discusin
de los equilibrios de agrupacin, para completar la discusin de estos
_.equilibriosbayesianos perfectos de separacin nos queda: (i) establecer la
conjetura L(A[e) de las empresas para elecciones deniveles de educacin
f}1eradel equilibrio (es decir, valores de e Pistntos de e'CB) o e'CA)), la
- ~ c~al determina entonces el resto de las estrategias wCe) de las empresas a_
.. partir de (4.2.1), y (ii) demostrar que la mejor respuesta de un trabajador
de capacidad r a la estrategia w(e) de las empresas es elegir e = e'Cr).
Figura 4.2.7
En resumen, dadas las curvas de indiferencia, las funciones de produccin y el valor de el' en la figura 4.2.7,la estrategia [efE) = ep,e(A) = el']
del trabajador, y la conjetura L(Ale) en (4.2.3)y la estrategia w(e) en (4.2.4)
de las empresas constituyen un equilibrio bayesiano perfecto de agrupacin.
Existen muchos otros equilibrios bayesianos perfectos de agrupacin
en el ejemplo definido por las curvas de indiferencia y las funciones de
produccin de la figura 4.2.7. Algunos de estos equilibrios incluyen una
eleccin de un nivel de educacin diferente por parte del trabajador (es
decir, un valor de el' distinto del de la figura); otros incluyen la misma
eleccin de un nivel de educacin pero difieren fuera de la trayectoria de
equilibrio. Como ejemplo de lo primero, sea e un nivel de educacin entre
ep y el, donde el en la figura 4.2.7 es el nivel de educacin en el eualla curva
de indiferencia del trabajador de baja capacidad que pasa por el punto
(e'(B)w'(B)
corta la funcin de salario w = q . y(A,e) + (l - q) . y(B,e).
C"
'.
01 sustItUImos el' en (4.2.3) y (4.2.4) por e, la conjetura y la estrategia
resultantes de las empresas, junto con la estrategia [e(B) = e,e(A) = e] del
(,',
"
0'
",<
,'.
'.',',','
1'.>.,
Una conjetura que cumple estas condiciones es que el trabajador tenga

capacidad alta si e es al menos e'CA), y capacidad baja en cualquier otro
caso:
"
________
.:..--
1::'
202 / JUEGOS DlNMICOS CON INFORMACIN
Juegos de selaliznci"
INCOMPLETA (e. 4)
2m
y(A,e)
O
p,(Afe) = { 1
para e < e'(A)

para e.2: e'(A).
10
(4.2.6)
La estrategia de las empresas es entonces
( _ { y(E,e)
we ) y(A,e)
para e < e'(A)

para e 2: e'(A).
Puesto que e'(A) es la mejor respuesta del trabajador con capacidad alta.
a la funcin de salariosw = y(A,e), tambin es la mejor respuesta aqu.
Con respecto al trabajador de baja capacidad, e7(B) es la mejor respuesta
de dicho trabajador cuando la funcin de salarios eSw == y(E,e), de manera que w'(E) -e[B,e'(E)]
es la mayor ganancia.que el trabajador puede
lograr de entre todas las elecciones de e < e'(A), Puesto que las cur~.
vas de indiferencia del trabajador de baja capacidad tienen mayor pen.:
diente que las del trabajador de alta capacidad; w~(A) - e[E,e'(A)] es
la mayor ganancia que puede conseguir; aqu un trabajador de baja capacidad de entre todas las elecciones de e 2: e'(A).
Por tanto, e'(E)
es la mejor respuesta de un trabajador de baja capacidad, puest? qu~
w'(E) - dE,e'(E)]
> w'(A) - dE,e'(A)] en el caso en que no hay envidia_
A partir de aqu ignoramos el caso en el que no hay envidia. Como
sugerimos anteriormente, la figura 4.2.6 (el caso con envidia) es ms inte"'
resante. Ahora el trabajador con capacidad alta no puede ganar el salario
alto roCe) = y(A,e) simplemente eligiendo la educacin e'(A) queelegia
bajo informacin completa. En su lugar, para sealizar su capacidad, el
trabajador con capacidad alta debe elegir e., > e'(A), .como muestra la
figura 4.2.8, puesto que el trabajador con capacidad baja imitar cualquier
valor de e entre e'(A) y es si hacerlo lleva a las empresas a creer que tiene
capacidad alta. Formalmente, el equilibrio natural bayesiano perfecto de'
separacin incluye ahora la estrategia [e(E) = e'(E),e(A) = es] del trabajador y las conjeturas de equilibrio p[Ale'(E)] = O Y{t[Ales] = 1 Ylos salarios
de equilibrio w[e'(E)] = w'(E) y w(es) = y(A,es) de las empresas. ste es
el nico comportamiento en equilibrio que sobrevive al refinamiento que
aplicaremos en la seccin 4.4.
y(A,e,J
w'(A)
y(B,e)
w'
(L)
e*(B)
e'(A)
es
Figura 4.2.8
.,
de e uilibrio, de las conjeturas de las emjJr~sas
Una expreslOn, fuera
.q
., .
Itrabajador tIene
que sustenta este comportamiento de e~Ulhbno es que ~o'
capacidad alta si e 2: e., y capacidad baja en caso contra .
O
para e
p,(Aje) = { 1 para e
< es
2: e.,.

y(E ,e)
-- w(e) = { y(A,e)
para e < es
para e 2: es.
.
cidad baja tiene dos
Dada esta funcin de salarios, el trabaJado.r con capa.
ar' (A,e,).
". .. .
l . '(E)
ganar 1}! (B) y elegIr es y gan.l/
.
mejores respuestas: e eglr e
y
.
f
d p'(JJ)' al.
ue esta indiferencia se resuelve en avor e ~
,
Vamos a suponer q
.'
f dad arbitrariamente
. '"
d 'amos aumentar es en una can 1
.
temativamente po n
..
'd d b J'aprefiriera estnc- d
ue el trabajador con capaCl a a
pequena e manera q
,...
'd d alta las elecciones
tamente e'(E), En cuanto al trabajador con capan a
,
.'
d
.
.
> e'(A). :Puesto que
las LUlvas e
. de e > e son lnfenores a e" ya que e.,.
,
'j'
s
.
'dad baJ'a llenen mas pem lente que
indiferencia del trabaJador con capacI
.
1 '1 .
.d d lta la curva de indiferenCla de u t11110
las del trabajador con capacl a a ,
.,
1 .'
que pasa por el punto ( e"y. (A ,es est por encima de la funclOn de s.a allos
b"
.
1 que las. elecciones de e < es son tam len
w = y(B,e) para e < e" por o
Juegos de sealizncin / 205
20-1 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (c. 4)
inferiores. Por lo tanto, la mejor respuesta del trabajador con capacidad

alta a la estrategia de las empresas w(e) es e.
Como en el caso de los equilibrios de agrupacin, existen otros equilibrios de separacin que incluyen diferentes elecciones de niveles de
educacin del trabajador con capacidad alta (el trabajador con capacidad
baja siempre se separa en e*(B); vase lo que sigue) y otros equilibrios de
separacin que incluyen las elecciones de educacin e*(E) y es pero difieren fuera de la trayectoria de equilibrio. Como ejemplo de lo primero,
sea e un nivel de educacin mayor que es pero lo suficient~mente pequeo como para que el trabajador con alta capacidad prefiera sealizar
su capacidad eligiendo e en lugar de inducir a pensar que tiene capacidad baja: y(A,e) - c(A,e) es mayor que y(B,e) - c(A,e) para cada e. Si
sustituirnos es por e en L(Ale) y w(e) que acompaan a la figura 4.2.8, la
conjetura y la estrategia resultantes para las empresas, junto con la estrategia re(E) = e*(E),e(A) = e] del trabajador constituyen otro equilibrio
perfecto de Nash de separacin. Corno ejemplo de lo ltimo, sea la conjetura de las empresas sobre niveles de educacin que estn estrictamente
entre e*(A) y es estrictamente positiva pero lo suficientemente pequea,
de manera que la estrategia resultante w(e) est estrictamente por debajo
de la curva de indiferencia del trabajador con baja capacidad que pasa por
el punto (e* (B),w* (B.
Concluirnos esta seccin con una breve discusin sobre los equilibrios
hbridos, en los cuales un tipo elige unnivel de educa<;in con certeza,
pero el otro tipo elige aleatoriamente entre la agrupacin con el primer
tipo (eligiendo el nivel de educacin del primer tipo) y la separacin del
primer tipo (eligiendo un nivel de educacin diferente). Analizarnos el
caso en el cual el trabajador con baja capacidad escoge aleatoriamente; el
ejercicio 4.7 trata el caso complementario. Supongamos que el trabajador
con capacidad alta elige un nivel de educacin eh (donde h quiere decir
hbrido), pero el trabajador con capacidad baja elige aleatoriamente entre
eh (con probabilidad 7f) y eH (con probabilidad 1 - 7f). El requisito 3
de sealizacin (convenientemente extendido para incluirlas estrategias
mIxtas) determina entonces la conjetura de las empresas tras observar eh
() ea. Con la regla de Bayes se obtien
y la inferencia usual tras la separacin da M(.4.leB) = O.Tres observaciones

pueden ayudamos a interpretar (4.2.8): en primer lugar, puesto que el
trabajador con capacidad alta siempre elige eh, pero el trabajador con
capacidad baja slo lo hace con probabilidad 7f, observar eh indica que es
ms probable que el trabajador tenga capacidad alta, con lo que M(Aleh) >
q. En segundo lugar, cuando 7f tiende a cero, el trabajador con capacidad
baja nunca se agrupa con el de capacidad alta, por lo que L(Aleh) tiende a
urio. En tercer lugar, cuando 7f tiende a uno, el trabajador con capacidad
baja casi siempre se agrupa con el de capacidad alta, por lo que M(Aleh)
tiende a la conjetura a priori q.
Cuando el trabajador con capacidad baja se separa del que tiene capacidad alta eligiendo eB, la conjetura M(AleB) = O implica el salario
w(eB) = y(B,eB)'
Se deduce entonces que eB debe ser igual a e*(B): la
nica eleccin del nivel de educacin en la cual el trabajador con capacidad baja puede ser inducido a separarse (probabilsticamente corno aqu
o con certeza, corno en los equilibrios de separacin discutidos anteriormente) es la eleccin de educacin con informacin completa e*(B) de
dicho trabajador. Pa~a ve'r esto, supongamos que el trabajador con capaddad baja se separa eligiendo algn eB '1 e*(B). Tal separacin alcanza la
ganancia y(13,eB) - c(B,eB), pero de elegir e*(E) obtendra una ganancia
de al menos y[E,e*(B)]
- c[E,e*(B)]Ca
de ms si la conjetura de lasempresas M[Aie* (E)] es mayor que cero) y la definicin de e*(B) implica que
y[E,e*(E)]
- c[E,e*(E)]
es mayor que y(E,e) - c(E,e) para cada e '1 e*CB).
Por lo tanto, no existe una eleccin de nivel de educacin eB '1 e*CE)
tal que el trabajador con capacidad baja pueda ser~inl:l1J:ci~?_
<l. separarse
eligiendo eB.
Para que el trabajador con capaqgad baja est dispuesto. aescoger ~eatoriamenteentre separarse en e*(E) y agruparse en eh, el salario w(eh) = Wh
cl~behacer que el trabajador sea indiferente entre ambo~:
w*(B)
- c[B,e*(E)]
= 'Wh - c(E,eh).
\:.'
"
;;'
'.'
,"
"
(4.2.9)
.Sin embargo, p?U'aque 'Whsea un salario de equilibrio para las empresas,

(4.2.1) y (4.2.8) implican que
,
(4.2.8)
Recordemos de la nota 2 ele! captulo 3 que la regla de Rayes establece que P(AIB) =
p(A.m/
P(8). Para derivar (4.2.8), reformulemos la regla de Bayes como P(A,E) = P(BIA).
1-'(04), por lo que P(AIE) = P(BIA).
1-'(04)/ P(B).
6
q
Wh = ---~.
q + (l - q)7f
.
y(A,e.)
(1 - q)7f
q
(1
).
7f
y(E,eh).
(4.2.10}
....
JlIegos de sel1alizIlcirll / 207

INCOMPLETA (c. 4)
Para un valor determinado de eh, si (4.2.9) da que '/1)h < y(A,eh), entonces
(4.2.10) determina el valor nico de que constituye un equilibrio hbrido
en el cual el trabajador con capacidad baja escoge aleatoriamente entre
e*(E) y eh, mientras que si '/1)h > y(A,eh),
no existe ningn equilibrio
hbrido que incluya eh.
7["
de la figura 4.2.8. Ciertamente, cuando eh tiende a es, r tiende al, :ie

manera que rrtiende a cero. Por tanto, el equilibrio de separacin descnt~
en la figura 4.2.8 es el lmite de los equilibrios hbridos conSIderados a~ul.
Para completar la descripcin del equilibrio bayesiano perfe:to hb:ldO
de la figura 4.2.9, sea la conjetura de las empresas que el trabajador t1ene
capacidad baja si e < eh yen cualquier otro caso, que tiene capacidad alta
con probabilidad r y baja con probabilidad 1 - r:
O
/.L(A\e) = { r
y(A,e)
para e < eh
para e 2': e".
r y(A,e)
+ O - r)
y(E,e)
w(e) = { r . y(A,e)
.
y(B,e)
+ (l - r) . y(B,e)
para e <
para e 2':
eh
eh.
Slo queda por comprobar que la estrategia del trabajador (e(B) = e" con
probabilidad 7[",e(B)
e*(E) con probabilidad 1 - 7[";e(A) = eh) es una
mejor respuesta a la estrategia de las empresas. Para'el trabajador con
capacidad baja,la e < eh ptima es e*(B) y la e 2': eh ptima es el~' Para el
trabajador con capacidad alta, eh es superior a todas las alternatlvas.
w~
q y(A,e)
+,0-
q) y(B,)
,
,,
,
4.2.C Inversin empresarial y estructura de capital
y(B,e)
'~
. 1:,
w*(B)
' ..
'
'.'
e*(B)
Figura 4.2.9
La figura 4.2.9 ilustra de forma implcita el valor consistente con el

valor indicado de eh. Dado eh, el salario 11Ihes una solucin de (4.2.9); por
lo que el punto (eh/wh) est en la curva de indiferencia del trabajador con
baja capacidad que pasa por el punto [e*(E),11I*(E)].
Dado 11Ih < y(A,eh),
la probabilidad r es una solucin de r . y(A,eh) + (l - r) . y(E,eh) = 11Ih.
Esta pr~ba~~lidad es la conjetura en equilibrio de las empresas, por lo que
(4.2.~)s~~fica que = q(l-r)/r(l
- q). La figura tambin muestra que la
restrlCclOn11Ih-< y(A,eh) es equivalente a eh < es, donde es es la educacin
elegida por el trabajador con capacidad alta en el equilibrio de separacin
7["
.....
7["
o.'
Consideremos un empresario que ha formado una empresa pero necesita

financiacin exterior para llevar a cabo un nuevo y atractivo proyecto. El
empresario tiene informacin privada sobre la rentabilidad actual de la
empresa, pero la ganancia del nuevo proyecto no se puede separar d: ~a
ganancia de la empresa; lo nico que se puede observa:..es el benefJC~o
agregado de la empresa. (Podramos permitir tambin que el empresano
tuviera informacin privada sobre la rentabilidad del nuevo proyecto,
pero sera una complicacil innecesaria.) Supongamos que el e~l~resario
ofrece a un inversionista potencial una participacin en los benefiCJosde la
empresa a cambio de la financiacin necesaria. Bajo qu circunstancias
se llevar a cabo el nuevo proyecto y cul ser la participacil11"enlos
beneficios de la empresa?
Para transcribir este problema a un juego de sealizacin, suponga IDOS
que los beneficios de la empresa antes del proyecto pueden ser altos o
bajos:
= A b E, donde A > B > O. Para capturar la idea de que el
nuevo proyecto es atractivo, supongamos que la inversin requerida es 1,
la ganancia ser R, la rentabilidad alternativa para el inversor potencial r
7["
::'08;' JUEGOS DINMICOS CON INfORMACiN
)' n
Juegos de sel1aliZJlcin
INCOMPLETA (c. 4)
> JO + 1'). Describimos a continuacin el desarrollo temporal
y las
ganancias:
pB
1. El azar determina el beneficio de la empresa antes del proyecto. La

probabilidad de que 1f == B es p.
2. El empresario conoce 1f y ofrece al inversor potencial una participacin .'
en los beneficios de la empresa, s, donde O::; s ::; 1.
.,
3. E~inversor observa s (pero no 1f) y decide si aceptar o rechazar la
oterta.
4. S el inversor rechaza la oferta, su ganancia es lO + r) y la del empresano es 1f. Si el inversor acepta s, su ganancia es de s(1f + R) Yla del
empresario O - s)(1f + R).
Myers y Majluf (984) analizan un modelo como ste, aunque consideran una empresa grande (con accionistas y un consejo de administracin).
en lugar de un empresario (que es a la vez el director y el nico accionista).
Discuten diferentes supuestos sobre cmo ls intereses de los accionistas'
podran afectar la utilidad de los directivos; Dybvig y Zender (991) deri~.
van ~l contrato ptimo que los accionistas pueden ofrecer a los directiv~s ..
Este es un juego de sealizacin muy simple en dos aspectos: el
conjunto de acciones factibles del receptor es muy limitado, y el del emisor
es mayor pero poco influyente (cOri10veremos). Supongamos que tras
reCIbir la oferta .5 el inversor cree que la probabilidad de que 1f == B es q.
Entonces el inve,!sor aceptar s si y slo si
s[qB+
(l - q)A + R]
2:
1(1 + r).
(4.2.11)
En cuanto al empresario, supongamos que los beneficios de la compaa

ant.es del proyecto son 1f, y consideremos si el empresario prefiere recibir
la financiacin a cambio de la participacin en los beneficios de la empresa
o renunClar al proyecto. Lo primero es superior si y slo si
R
s<--1f+R
(4.2.12)
En un equilibrio bayesiano perfecto de agrupacin, la conjetura del

debe ser q == p despus de recibir la oferta de equilibrio. Como
la reslTccin en la participacin (4.2.12) es ms difcil de satisfacer para
Ir == A q~e ~ara 1f == B, la combinacin de (4.2.11) y (4.2.12) significa que
un equlhbno de agrupaci1 slo existe si
Inversor
1(1 +1')
R
.
< --o
+ (1 - p)A + R - A + R
!209
(4.2.13)
Si p est lo suficientemente cerca de cero, (4.2.13) se cumple porque R >

1(1 + 1'). Sin embargo, si p est lo suficientemente cerca de uno, (4.2.13) se
cumple slo si
R - 1(1 + 1') 2:
1(1 + r)A
R
- B.
(4.2.14)
Intuitivamente, la dificultad de un equilibrio de agrupacin es que el tipo

de beneficio alto debe subvencionar al tipo de beneficio bajo: haciendo
queq == pen (4.2.11) obtenemos s 2: 1(1 +1')/[pB+(1-p)A+RJ,
mientras que
si el inversor supiera con seguridad que 7r == A (es decir, q == O),. entonces
aceptara una participacin menor en los beneficios s 2: 1(1 +1')/(A+R). La
mayor participacin en la empresa exigida por un equilibrio de agrupacin
es muy cara para la empresa con beneficios altos, tal vez tan cara como para
hacer que la empresa con beneficios altos prefiera renunciar al proyecto.
Nuestro anlisis muestra que existe un equilibrio de agrupacin si pest
cerca de cero, por lo que el coste de la subvencin es pequeo, o si (4.2.14)
se cumple, de manera que el beneficio del nuevo proyecto sobrepasa al
coste de la subvencin.
Si (4.2.13) no se cumple, no existe equilibrio de agrupacin. Sin
embargo, siempre existe uno de separacin. El tipo de beneficio bajo
ofrece s == 1(1 + 1')/(B + R), que el inversor acepta y el tipo de beneficio
alto ofrece s < 1(1 + 1')/(A + R), queel inversor rechaza. En tal equilibrio
la inversin es ineficientemente baja: el nuevo proyec~o es rentable con
toda seguridad, pero el tipo de ao beneficio renuncia a la inversin. Este
equilibrio ilustra en qu sentido el conjunto de seales factibles del emisor es poco efectivo; el tipo de alto beneficio no tiene forma de sobresalir;
unos trminos de financiacin que son atractivos para el tipo de beneficio
alto son an ms atractivos para el de beneficio bajo. Como observan
Myers y Majluf, en este modelo las empresas se ven empujadas hacia el
endeudamiento o hacia fuentes de financiacin interna.
Concluimos considerando brevemente la posibilidad de que el empresario pueda tanto endeudarse como ofrecer participaciones en los beneficios. Supongamos que el inversor acepta ofrecer un crdito D. Si el
empresario no quiebra, la ganancia del inversor es D y la del empresario
1f + R - D; si el empresario quiebra, la ganancia del inversor es 1f + R
Y la del empresario es cero. Como B > O, siempre existe un equilibrio
de agrupacin: los dos tipos de beneficios ofrecen el contrato de deuda
Jegos de sializnci')/1
210 I JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (c. 4)
JO + r), que el inversor; acepta. Sin embargo, si B fuera lo suficientemente negativo como para queR +B < JO + 7"), el tipo de beneficio
bajo no podra devolver su deuda, por lo que el inversor no aceptara el
contrato. Aplicaramos un argumehto'similar siH y A fueran benefiCiti;:'
esperados (y no beneficios seguros). Supongamos que el tipo 7f Sil;nifit~ .
que los beneficios actuales de !l empresa sern 1r+ J{ con probabilidad
1/2 y 1r- J{ con probabilidad 1/2. Ahora, si B - J{ + R < JO + r), hay
una probabilidad de 1/2 de qu el tipo de beneficio bajo no sea capaz
de devolver la deuda D = J(1 + r), por 10 que el inverSOftlo aceptar el
contrato.
.
D =
I 211
modelo con dos periodos es, por tanto, el siguiente:

1. El azar determina el tipo e de la autoridad monetaria. La probabilidad
de que e =Des p.
2. Los empresarios forman sus expectativas de inflacin para el primer
periodo, 1rj.
3. La autoridad monetaria observa 1rj y escoge el nivel real de inflacin
del primer periodo, 1rI.
4. Los empresarios observan 1rI(pero no e) y forman sus expectativas de
inflacin para el segundo periodo, 1r2.
5. La autoridad monetaria observa 1r2y escoge el nivel real de inflacin
del segundo periodo, 1r2.
4.2.D Poltica monetaria

~n esta seccin aadimos informacin pTivada ~ unaver~in condospe~,
nodos del juego repetido de poltical)1onetaria analizado. en la stdif
2.3.E. Como en el modelo de Spence, eXisten mucho~ equilibrios baye~ia~'
nosperfectosd agrupacin,lubridos yde s~parac!r( Como ya discti'G
mas estos' equilibrios con detalle enJa seccin4.2.S; aqu slo esb~zillio~>
los tenasms'importantes.VaseVlckers
(986) piriFlos detlle~de~
un anlisis similar con dos periodos yBarro (986) para un modelo de,.
reputacin con muchos periodos.
Recordemos, de la seccin 2.3.E, que la ganancia por periodo de la
autoridad' monetaria es
.
Como indicamos en la seccin 4.2.A, hay un juego de sealizacin de un

periodo incluido en este juego de poltica monetaria con dos periodos. El
mensaje del emisor es la eleccin de la inflacin por parte de la autoridad
monetaria en elprimer periodo, 1rI-y la accin del receptor es la expectativa
de inflacin' de los empresarios en el segundo periodo, 1r2. La expectativa
dlos empresarios en el primer periodo y la eleccin del nivel de inflacin
de la autoridad monetaria en el segundo preceden y siguen al juego de
sealizacin respectivamente.
Recordemos que en el problema con un periodo (es decir, en el juego
de etapa del juego repetido analizado en la seccin 2.3.E) la eleccin
ptima de. 7r por parte de la autoridad monetaria dada la expectativa
de los empresarios, 1re, es
'
'"t
donde 1res elnivelreal de inflacin, 1reesJa expectativa de inflacin d~Jo~

empresarios e y* es el nivel eficiente de produccin. Para los empresarios,:
la ganancia por periodo eS~(1r-1re)2;
En nuestro modelo con dos periodos,
la ganancia de cada jugador es simplemente la suma de sus ganancias eh
cada periodO('vV(1rI,1rj)+ W(1r2,1r2) y -(1rI _1rj)2 - (1r2 - 1r2)2, donde1rt es
el nivel.real de inflacin en el periodo t y 1ri es la expectativa (al priricipio
del penado t) de inflacin en el periodo~ por parte de los empresarios.
El parmetro e en la funcin de ganancias W(1rrre) refleja el dilema de
la autoridad monetaria entre los objetivos de inflacin cero y produccin
eficiente. En la seccin 2.3.E, este parmetro era inlonnacin del dominio
pblico. Suponemos ahora, en cambio, que esteparmetroes inlonnacin
privada de la autoridad monetaria: e = Fa D (por "fuerte" y "dbil'~ en
la lucha contra la inflacin); donde F > D > O. El desarrollo temporal del
1r*(1re) = ~2[(l
c+d
- b)y* + d1re].
El mismo argumento indica que si el tipo de la autoridad monetaria es c,

su eleccin ptima de 1r2dada la expectativa 1r2es
~[O-
c+d
b)y' + d1r21
=. 1r:i.(1r2'c).
Previndolo, si los empresarios empiezan el segundo periodo creyendo

que la probabilidad de que e = D es ,!,se formarn la expectativan2(q) de
forma que maximice
(42.15)
~ 12
! JUEGOS
INCOMPLETA (e. 4)
En un equilibrio de agrupacin, ambos tipos escogen la misma inflacin para el primer periodo, digamos 7r*,por lo que la expectativa de ,
los empresarios en el primer periodo es 7rj = 7r*. En la trayectoria de
equilibrio, los empresarios empiezan el segundo periodo creyendo que la
probabilidad de que e = D es Ji, por lo que se forman la expectativa 7r2(p).
La autoridad monetaria de tipo c escoge entonces su inflacin ptima para'
el segundo periodo dada esta expectativa, concretamente 7ri[7r2(P),c],finalizando con ello el juego. Para completar la descripcin de este equilibrio,
queda (como siempre) definir las conjeturas del receptor fu~~a del equi-.
Iibrio para calcular las correspondientes decisiones fuera del equilibrio
utilizando (4.2.15), y comprobar que estas decisiones no crean ningn
incentivo a desviarse del equilibrio para ningn tipo del emisor.
En un equilibrio de separacin, los dos tipos escogen niveles de inflacin diferentes en el primer periodo, digamos 7[D y 7rF, por lo que la
expectativa de los empresarios en el primer periodo es 7r = P7[D+(1-phF.
Despus de observar 7[D, los empresarios empiezan el segundo periodq'
creyendo que e = Dy se forman por ello la expectativa 7[2(1);delmi~IJ;l9
modo, observar 7[F cOJ;lducea7[2(0).En equilibrio, el tipo dbil e~coge ei1~
tonces 7[i[7[2(1),D] y el tipo fuerte 7[i[7r2(O),F], finalizandoel juego. Par~
completar la descripcin de este equilibrio,. no.'slo queda, corno antes~
detallar las conjeturas y acciones fuera del equilibrio del receptoricorii~
probar que ningn tipo del emisor tiene incentivos para desviarse, sino
tambin comprobar que ningn tipo tiene incentivos pala imitar el cmn-,
pOltamiento en equilibrio del otro. Aqu, por ejemplo, el tipo dbil podra
pensar en escoger 7[F en el primer periodo, induciend() co!,ell.o a qtle !
expectativa de los empresarios en el segurido periodo fuera 7[2(0),pero
escoger 7[i[7[2(0),D], finalizando el juego. EscL~jr, incluso si 7[F fuera
demasiado baja para el tipo dbil, la expectativa consiguiente 7[2(0)podra
ser tan baja que el tipo dbil recibiera una ganancia enorme debido a la
inflacin inesperada 7[i[7[2(O),D] - 7r2(O) en el segundo periodo. En un
equilibrio de separacin, la inflacin escogida en el primer periodo por el
tipo fuerte debe ser lo suficientemente baja corno para que el tipo d~bil
no sienta la tentacin de imitarle, a pesar del ben~ficio que obtendra por
la inflacin inesperada en el segundo periodo. Para muchos valores de
los parmetros, esta restriccin hace que 7[F sea menor que ei nivel d~
inflacin que el tipo fuerte elegira bajo informacin completa, delrrJsmo
modo que el trabajador con capacidad alta invierte ms de la cuenta en
educacin en un equilibrio de separacin del modelo de Spence.
Otras aplicaciones del equilibrio bayesiano perfecto! 213
4.3 Otras aplicaciones
del equilibrio
bayesiano
perfecto
4.3.A Juegos con parloteo (cheap-talk games)

Los juegos con parloteo son anlogos a los juegos de sealizacin, pero en
aquellos juegos los mensajes del emisor consisten en un mero parloteo (carente de coste alguno, que no es vinculante, y cuyo contenido son declaraciones no verificables), Tal parloteo no puede ser informativo en el juego
de senalizacih' de 'Spence: un trabajador que simplemente anuIlciara
"mi capacidades ?Ita" nI? sera credo. Sin embargo, eIl otros c:ontxfos:
este tipo de comicaciri previa puede ser informativo. Como ejemplo
sencillo, consideremos las posibles interpretaciones de la frase "sube la
bolsa"? En aplicaciones conrrf1iyor inters econmico; Stein' (1989)'decmuestra que las meras declaraciones de la autoridad monetaria pueden
ser informativas aunque no puedan ser demasiado precisas, y Matthews
(1989)estudia cmo una amenaza de veto por parte del presidente de los
Estados Unidos puede influir en la forma corno se aprueba el presupuesto,
en el Congreso norteamericano. Adems de analizar elefecto,delparl6~
teo en:un contexto determinado, uno tambin puede preguntarse cmo
disear contextos para' aprovechar esta forma de comunicacin~ En 'este
sentido, Austen-Smith (1990) demuestra que, en algunos casos, debates
entre legisladores que actan segn su propio inh;rs acaban mejorando el
valor social de la legislacin que se aprueba, y Farrelly Gibbons (1991)demuestran que, en algunos casos, la implantacin sindical en uIla empresa
mejora el bienestar social' (a pesar de la distorsin que crea:n el nivel .de
empleo descrita en la seccin2.1.C) porque facilita la coIInicacinentr
la fuerza de trabajo y la direccin."
,c,
..
El parloteo no puede ser informativo en el modelo de Spence porque todos los tipos del emisor tienen las mismas preferencias en relacin
con las posibles acciones del receptor: 'todos los trabajadores prefieren
salarios altos, independientemente de su capacidad. ~ara ver por qu tal
uniformidad de preferencias entre los tipos del emisor vicia el parloteo
(en el modelo de Spence y ms en general), supongamos que existiera un
equilibrio con estrategias puras en el cual uri subconjunto de los tipos del
7 En la versin en ingls
bus!", que puede traducirse
de endiendo del contexto.
ca~ellano que puede tener
sta es la idea que el autor
del libro, la frase que originalmente aparece es "Hey, look out for that
como "Cuidado con ese autobs!" o como "Espera ese autobs!",
La fraseqe nosotros incluimos aqu es una de las muchas frases en
signifiadosc?mpl"tamente
diferentes dependiendo del contexto. '
quiere eXpresar. (N. de los T.).
(i.
,
~.'.
"
':
,r.
Otras aplicaciones
emisor, TI, enva un mensaje mI, mientras que otro subconjunto de tipos;
T2, enva o.tro mensaje, m2. (Cada Ti podra contener slo un tipo, como
en un equilibrio de separacin, o muchos tipos, como en un equilibrio de
separacin parcial.) En equilibrio, el receptor interpretar que mi viene de
Ti y tomar por tanto la decisin ptima, a dada su conjetura. Come:,to"
dos los tipos del emisor tienen las mismas preferencias sobre las acciones
a tomar, si un tipo prefiere (digamos) al a 0.2, todos los tipos tienen esta
preferencia y enviarn el mensaje mI en lugar de m2, destruyendo con ello
el equilibrio putativo. Por ejemplo, en el m~dei~' deSpence; 'si elpaii~teo
resultara. en un mensaje indicativo <leun saJaria,alto, mientras que otro
tipo de parloteo indicaraunsalario b~jo,lo~ trai:>aJ?dores'de'"~~lqier nivel d~ capacidad enviaran.el primer ni.ensaje~porlo que npuede' existir
,un equilibrio en el que. el parloteo afecte los salari()s.
,
',.'
,,/
del equilibrio
bayesinno
prr!,'cfo
/ 215
INCOMPLETA (c. 4)
Por 10 tanto, para que el parloteo sea informativo, una condicin necesaria es que diferentes tipos del emisor tengan preferencias diferentes en
relacin con:las acciOliesdeLreceptor, Una segunda condicin necesaria,
por supuesto, es que el.receptor prefiera acciones,giferentesdependiendo
del ti'p:del emisor .. (Tanto la selizacincomQ;ja.comurucacinp~yia
son intiles si las preferencias del receptor sobre sus acciones' son inde~
pendientes del tipo del emisor.). Una terceracondiciitnecesaria para que
el parloteo sea 'informativo es que las preferencias del receptr sobre sus
acciones nlJ sean completamente opuests alasd~emisor. Para adelantar
un ltimo. ejemplo,supongamos que elr~~epto{prefiere.acciones bajas
cuando el tipo deLemisor es bajo y acciones altastuando es.alto; Siemisores de tipos bajos prefieren acciones baja~ y los de tipos altos acciones
altas, puede haber comunicacin, pero si efemisor tiene ias preferencias
opuestas no puede existir comunicacin, ya que al emisorle gustara cone
fundir al receptor. Crawford y Sobel (1982) lIlalizanunmodelc5 abstracto
que satisface estas tres condiciones necesarias y establecen d()s resultados
intuitivos: en trminos informales, puede existir ms comunicacin por
medio del parloteo cuando las preferencias. de las jugadores estn ms
ntimamente relacionadas, pero no puede existir comunicacin perfecta a
no ser que las preferencias de los jugadores estn perfectamente alineadas ..
Cada una de .las aplicaciones econmicas que acabamos de. describir
(parloteo por parte de la autoridad monetaria, amenazas de veto, debates
parlamentarios y presencia sindical) incluyen no slo un juego sencillo
con parloteo sino tambin una modelizacion ms completade un entorno
econmico. Analizar una de estas apii<:acionesexigira describir no s<$loel
juego sino tambin el modelo completo, lo que desviara nestr<i atencin
de las fuerzas bsicas que operan en los juegos con parloteo. En esta
seccin, por lo tanto, nos apartamos de nuestro estilo anterior y.analizamos
slo juegos abstractos con parloteo, dejando las aplicaciones como lectura
adicional.
El desarrollo temporal del juego con parloteo ms sencillo es idntico
al del juego de sealizacin ms sencillo; slo cambian las ganancias.
1. El azar escoge un tipo ti del emisor, de un conjunto de tipos factibles

T = {tlJ ... ,tI}, de acuerdo con una distribucin de probabilidad pe!,;),
donde p(ti) > O para cada y p(tl) + ... + ]J(t[) = 1.
2. El emisor observa ti y escoge Ul1 mensaje mj de un conjunto de lnensajes factibles M = {mI,' .. ,mj}.
3. El receptor observa mj (pero no ti) y escoge entonces una accin
un conjunto de acciones factibles A = {al,' .. ,al(}.
4. Las ganancias vienen dadas por U E(tiak) y U R(tiak).
(J.k
de
La caracterstica clave de este juego es que el mensaje no tiene efecto directo rusobre la ganancia del emisor ni sobre la del receptor. La nica
manera en la que el mensaje puede importar es a travs de su contenido
informativo: cambiando la conjetura del receptor sobre el tipo del emisor,
un mensaje puede cambiar la decisin del receptor y, por tanto, afectar
indirectamente a las ganancias de los dos jugadores. Como la misma informacin puede ser comurucada en diferentes lenguajes, diferentes espacios
de mensajes pueden alcanzar los mismos resultados. El espritu del parloteo es que puede decirse cualquier cosa; en consecuencia, formalizar este
concepto exigira que M fuera un conjunto muy grande. Por el contrario,
suponemos que M es lo suficientemente rico para decir lo que haga falta
decir; es decir, M = T. Para los propsitos de esta seccin, este supuesto
es equivalente a permitir que se diga cualquier cosa; sin embargo, para
los propsitos de la seccin 4.4 (refinamientos del equilibrio bayesiano
perfecto), este supuesto debe ser reconsiderado.
Puesto que los juegos con parloteo y de sealizacin ms sencillos
tienen el mismo desarrollo temporal, las definiciones de equilibrio bayesiano perfecto en los dos juegos son tambin idnticas: un equilibrio
bayesian perfecto con estrategias puras en un juego con parlol<;:oes un
par de estrategias m'(ti) y a'(mj), y una conjetura .t(tdm) que satisfacen
los requisitos (1), (2R), (2E) Y (3) de sealizacin, aunque las funciones
de ganancias U R(tmj,o,k) Y U ECt111.j,G.k) en los requisitos (2F,)y (2E) de
216/
INCOMPLETA (e. 4)
sealizac.in son ahora equivalentes a URUi,aJ y Udt."rtk) respectivamente. Sm embargo, una diferencia entre los juegos de sealizacin y los
Juegos con parloteo es que en estos ltimos siempre existe un equilibrio
de agrupacin. Puesto que los mensajes no tienen un efecto directo sobre
las'
. dI'
.
> gana~l.C1ase emI~or, SIel receptor va a ignorar todos los mensajes, la
atrupaclOn es una. mejor respuesta del emisor. Puesto que los mensajes no
tIenen un efecto dIrecto sobre las ganancias del receptor, si el emisor est
jugando agrupacin, ignorar todos los mensajes es una mejor respuesta
del receptor. Formalmente, sea a* la accin ptima del.receptor en un
equIlIbno de agrupacin; es decir, a* es una solucin de
Es.un equilibrio b.ayesiano perfecto de agrupacin que el emisor juegue

cu::.qL1lerestrategI~ de agrupac~n, que el receptor mantenga la conjetura
a FIOn pU') despues de cualqUler mensaje (en la trayectoria de equilibrio
~ fuer~ de ella) y ~~e.~l receptor tome la accin a* despus de cualquier
len~aje. La cuestion mteresante en un juego con parloteo, por tanto, es
SI eXIsten equilibrios de no agrupacin. Los dos juegos abstractos con
~arloteo 5ue discutimos a continuacin ilustran sobre los equilibrios de
separaclOn y de agrupacin parcial respectivamente.
.
Em,pezamos con un ejemplo con dos tipos y dos acciones' T = {t t }
P l( )
"
B, A ,
ro) tB ~ p, y A = {aB,a.,!}. Podramos utilizar un juego de sealizacin
COl~dos tIpO.S,dos mensajes y dos acciones, anlogo al de la figura 4.2,1
pal a descnblr las ?anancias en este juego con parloteo, pero las ganancias
del par .(t,ak) son mdependientes de qu mensaje fue escogido, por lo que
descnblmos los pagos utilizando la figura 4.3.1. La primera ganancia en
cada caSIlla es la del emisor, y la segunda la del receptor, pero esta figura
//0 es un juego en forma normal, simplemente recoge las ganancias de los
jugadores para cada par tipo-accin.
tB
tA
aB
1:,1
y,O
(LA
Z,O "W,1
Figura 4.3.1
Otras aplicaciones del equilibrio bayesimlO perfecto / 217
Como en nuestra discusin anterior sobre las condiciones necesarias

para que el parloteo sea informativo, hemos escogido las ganancias del
receptor de forma que prefiera la accin baja (aB) cuando el tipo del
emisor es bajo (tB) y la accin alta mando el tipo es alto. Para ilustrar
la primera condicin necesaria, supongamos que los dos tipos del emisor
tienen las mismas preferencias respecto de las acciones: x > Z e y > "w,
por ejemplo, de forma que los dos tipos prefieren aB a aA' Entonces,
a los dos tipos les gustara que el receptor creyera que t = tB, por lo
que el recepto~ no puede creer tal afirmacin. Para ilustrar la tercera
conciicin necesaria, supongamos que las preferencias de los jugadores
son totalmente opuestas; z > x e y > w, .deforma que eltipo bajo:
del emisor prefiere laaccin alta y el tipo alto la. baja, Ep.t()nces,aJB
le gustara que el receptor <;reyera que t = tA, Y a tA le gustara que
creyera que t. = tB, por lo que el receptor no puede creer ninguna de
estas afirmaciones. En este juego con dos tipos y dos acciones, el nico
caso que cumple la primera y la tercera condiciones necesariasesx. ~~.z
e y ~ 'W (los intereses ci~los jugadores estn perfectamente alineados en
el sentido de que, dado el tipo del emisor,jos jugCl~~rescoincideIl~l1Ja
accin que debera tomarse) .. ' Formalmente, en un equilibrio bayesiano
perfecto de separacin de este juego COI1 parloteo, la estrategia del emisor:
es [mUB) = tB,m(tA) ~ tAL las conjeturas deL receptor son.t(tB!tB)."")
y.t(tB\tA)
= 0, y la estrategia del receptor. es [a{tB)=
aB,aUA) ,= aA]'
Para que estas estrategias y conjeturas formen un equilibrio, cada tiPe>del
emisor, t debe preferir de~iI:la verdad, induciendo con ello la acciI.\ui'
a mentir, induciendo con ello aj. Por lo tanto, un equilibrio cieseparacin
existesiyslosix;:::iey~w.'
.. ~ .
,';.,
Nuestro segundo ejemplo es un caso eSpecial del model~ de Crawford y Sobe!' Ahra, ls espacios de tipos; mensajes y acciones son continuos: el tipo del emisor se distribuye unifrni.emente entre cero y uno
(formalmente, T = [0,1] Y p(t) = 1 para todo.terrT);,e1'espacio de mensajes es el espacio de tipos (M = T); y el espacio de acciones es el intervalo de cero a uno (A = [0,1]). La furiCin de ganancias del receptor es
UR(t,a) = -(a - t)2, Y la del emisor es UB(t,a) :"':"-[a ~ (t+ b)]2, de forma
que cuando el tipo del emisores t, la accin ptima del receptor es a ';"t,
pero .1i:i acdn ptiina' del' e-mi'sores =- t + b. Por 10 tanto, diferentes
tipos dei emisor tienen diferentes preferencias respecto de las acciones
del receptor (ms precisam~nte, tipos altos prefieren acciones altas), y
las preferencias de los jugadores no son completamente opuestas (ms
precisamente, el parmetro b'> o mide la similitud de las preferencias de
',
.... '
a.
\',"
..
218
!JUEGOS
DlNMICOS CON INFORMAClN'lrKOMPLETA
(c. 4)
los jugadores, cuando b est cerca de tero los intereses de los jugadores
estn ms alineados),
.t
:'
".;.'
,"
,,'
",:,"
Crawford y Sobel demuestran que todos los equilibrios bayesianos

perfectos en este modelo (yen una amplia clase de modelos relacionados) ,
son equivalentes a un equilibrio de agrupacin parcial d la siguiente
forma: el espacio de tipos est dividido en n intervalos [O,.');I),[XI,X2),'
."
[xn_l,l];
todos los tipos en un mismo intervalo envan el mismo mensaje,
pero tipos en intervalos diferentes envan mensajes diferentes, Como
indicamos anteriormente, un equilibrio de agrupacin (n = U'siempre
existe, Demostraremos que, dado el valor del parmetro de similitud de
preferencias b, ,existe uh nmero mximo de intervalos (o "escalones")
que pueden darse en equilibrio, denotado poi n*(b), y existen equilibrios
de agrupacin parcial para cada n = 1,2,. , . ,n*(b), Una disminucin de b
aumenta n*(b) (en este sentido, puede haber ms comunicacin a travs
del parloteo cuando las preferencias de los jugadores estn ms alineadas),
Adems, n*(b) es finito para todo b > 0, pero tiende a' ihfimto cuando b
tiende a cero (no puede existir comunicacinperfect<:i a:no ser que las
preferencias de los jugadores estn perfectillnte'alineadas),
Concluimos esta seccin caracterizando este equilibrio de agrupacin
parcial, empezando con un equilibrio de dos escalones (n = 2) como
ilustracin. Supongamos que todos los tipos en el escaln [O,XI)envan
un mensaje mientras los que estn en [xI,l] env~n otro., Despus de
recibir el mensaje de los tipos [O,XI),el receptor creE;;rque el emisor est
distribuido uniformemente en [O,XI),poi 10 que su'.accin ptima ser
xJ/2;del mismo modo, 'despus de recibir el mensaje de los tipos [Xi,l],
la accin ptima del receptor ser (Xl + 1)/2. Para que los tipos en [O/Xl)
quieran enviar su mensaje, debe pasar que todos estos tipos prefieran la
accin xJ/2 a (Xl + 1)/2; del mismo modo, todos los tipos por encima de
Xl deben preferir (Xl+ 1)/2 a X] /2.
Puesto que las preferencias del emisor son simtricas con respecto a
su ptima accin, el tipo t del emisor prefiere xJ/2 a (Xl + 1)/2si el punto
medio entre estas dos acciones es mayor que la accin ptima de ese tipo,
t + b (como en la figura 4.3.2),pero prefiere (x] + 1)/2 a Xl/2 si t + b es mayor
que el punto medio. Por lo tanto, para que exista un equilibrio de dos
escalones, Xl debe ser el tipo t cuya accin ptima t + b sea exactamente
igual al punto medio entre las dos acciones:
Xl
+b =
1]
X] +
2:1 [X]2 + -2-
Otras aplicaciolles
o Xl = 0/2)
positivo, por
para &:?: 1/4
para permitir
del equilibrio
bayesiallo
pa/cfo
! 219
- 2&, Como el espacio de tipos es T = [0,1], T] debe ser

lo que un equilibrio de dos escalones existe slo si .') < 1/4;
las preferencias de los jugadores son demasIado cl1ferentes
incluso esta comunicacin tan limitada.
Punto medio
a=l
t+b
U,(t,a)
Figura 4.3.2
Para completar la discusin de este equilibrio de dos escalones, tratamos el tema de los mensajes que estn fuera de la trayectoria de equilibrio.
Crawford y Sobel establecen la estrategia (mixta) del emisor de (orn:a ~l~e
estos mensajes no existan: todos los tipos t < X] escogen un mensaje
aleatoriamente de acuerdo con una dish'ibucin uniforme en [O,X]); todos
los tipos t :?: X] escogen un mensaje ale'atoriamente de acuerdo con una
distribucin uniforme en [xI,l]. Como hemos supuesto que M = '1', no
hay ningn mensaje del que podamos estar seguros que no se enviar en
equilibrio, por lo que el requisito 3 de sealizacin detemna la conjetura
del receptor despus de cualquier mensaje posible: la conjetu.ra del receptor despus de observar cualquier mensaje de [O,X]) es que t se distribuye
uniformemente en [O,XI),y la conjetura del receptor despus de observar
cualquier mensaje de [xI,l] es que t se distribuye wUformemente en [:1;1,11.
(El uso de distribuciones uniformes en la estrategia mixta del emisor no
tiene nada que ver con el supuesto de una distribucin uniforme del tipo
del emisor; la estrategia mixta del emisor podra utilizar tambin cualquier
otra densidad de probabilidad estrictamente positiva sobre los intervalos
220/
JUEGOS DINM1COS CON INFORMACiN
INCOMPLETA (e. 4)
indicados.) Como alternativa al enfoque de Crawford y Sobel, podramos

determinar una estrategia pura del emisor pero escoger conjeturas del receptor ['uera de la trayectoria de equilibrio. Por ejemplo, sea la estrategia
del emisor que todos los tipos t < Xl enven el mensaje Oy que todos los
tipos t ~ :1:1 enven el mensaje Xl, y sea la conjetura del receptor fuera
de la trayectoria de equilibrio despus de observar cualquier mensaje de
(0,:1:1) que t se distri~uye uniformemente
en [O,XI), y despus de observar
cualquier mensaje de (Xl)] que t se distribuye uniformemente en [XI,1].
Para caracterizar un equilibrio de n escalones, aplicamos repetidamente la siguiente observacin sobre el equilibrio de dos escalones: el
escaln superior, [Xbl], es 4b ms grande que el inferior, [O,XI)' Esta observacin se deriva del hecho que, dado el tipo del emisor (t), su accin
ptima (t + b) es mayor que la accin ptima del receptor (t) en b. Por
lo tanto, si dos escalones adyacentes tuvieran la misma longitud, el tipo
frontera entre los escalones (Xl en el equilibrio de dos escalones) preferira estrictamente enviar .el mensaje asociado con el escaln superior;
efectivamente, los tipos ligeramente por debajo del tipo frontera tambin
lo preferiran. La nica forma de hacer que el tipo frontera sea indiferente
entre los dos escalones (y conseguir con ello que los tipos por encima y por
debajo de la frontera prefieran estrictamente sus respectivos escalones) es
hacer que el escaln superior sea convenientemente ms grande que el
inferior, de la siguiente forma.
Si el escaln [Xk-I,Xk)
tiene una longitud de c (es decir, X* - Xk-l = c),
la accin ptima del receptor correspondiente a este escaln (concretamen
te, h;k + Xk_I)/2)
est (c/2) + b. por debajo de la accin ptima del tipo.
frontera Xk (concretamente, Xk + b). Para hacer que el tipo frontera sea
indiferente entre los escalones [Xk-I,Xk)
Y [Xk,Xk+I), la accin del receptor
correspondiente al ltimo escaln debe estar (c/2) + b por encima de la
accin ptima para :;k:
Xk+l
+ :1;k
2
-
(
Xk
b)
= 2: +
Olras aplicaciones del equilibrio bayesimlO pelfeclo ! 221
\~.
En un equilibrio de n escalones, si el primer escaln tiene una longitud ti,el segundo debe tener una longitud d + 4b, el tercero d + 8b Y as
sucesivamente. El n-simo escaln debe acabar exactamente en 1, por lo
que de~emosterer
~. d + (d + 4b) + ... + [d + (n - 1)4b] = 1.
Utilizando el hecho de que 1 + 2 ~ ... + (n

n .d
+ n(n
- 1) = n(n - 1)/2,
- 1) . 2.b
= 1.
tenemos que
(4.3.1)
Dado c~aiquiern tal que n(n -1). 2b < 1,existe' un vaJor de d cue~luci0I1a
(4.3.1). Es decir, para cualquier n talque n(n-l).2b
<1, existeunequilibri
de agrupaci~parcial de n escalones, y la longitud del primer escaln es
el valor de d que soluciona (4.3.1). Corno la longitud del primer escaln
debe ser positiva, el nmero mximo de escalones en este equilibri?, n *(b);
es el valor msaIto den tal que n(n - 1) .2b < 1. Utilizando la frmula
de la ecu"acin "de segundo grado, se obtiene que n*(b) es el mayor enter?
por debajo de
~.[1 + JI
+ (2/b)}.
Consistente con la derivacin del equilibrio de dos escalones, n*(b) = 1

para b ~. 1/4: no hay comunicacin posible si las. preferencias de J<)S
jugadores son demasiado diferentes. As mismo, corno hemos dicho aI\!~.s~
n*(b) es decreciente en b pero tiende a infinito slo cuandob
tiende.a
cero: puede haber ms comunicacin a trav~s del parloteo cuand() l~s
preferencias de los jugadores estn ms alineadas, pero no puede existir
comunicacin perfecta a no ser que las preferencias de los jugadores estn
perfectamente alineadas.
4.3.B Negociacin sucesiva bajo informacin asimtrica
Por lo tanto, cada escaln debe ser 4b ms largo que el anterior.
Consideremos una empresa y un sindicato negociando sobre salarios.

Para simplificar, supongamos que el nivel de empleo es fijo. El salario de
reserva del sindicato (es decir, la cantidad que los miembros del sindicato
ganan si no son empleados por la empresa) es wr. Los beneficios de la
empresa, que <;ienotamos mediante 'Ir, se distribuyen uniformemente en
hB,KA], pero el valor real de K es conocido slo por la empresa. Esta
infom1acin privada podra, por ejemplo, reflejar un mejor conocimiento
(,
por parte de la empresa de los nuevos productos en fase de planificacin.

Simplificarnos el anlisis suponiendo que wr = 1rB = O.
El juego de negociacin dura dos periodos corno mximo. En el primer periodo, el sindicato realiza una oferta salarial, Wl' Si la empresa
acepta esta oferta el juego concluye: la ganancia del sindicato es Wl y la
de la empresa 1r - Wl' (Estas ganancias son los valores presentes de las
sucesiones de salarios y beneficios [netos] que los jugadores acumulan a
lo largo de la duracin del contrato que se est negociando, normalmente
tres aos en Estados Unidos.) Si la empresa rechaza esta ofe~ta, entonces el juego pasa al segundo periodo. El sindicato realiza una segunda
oferta salarial, W2. Si la empresa acepta la oferta, los valores presentes de
las ganancias de los jugdores (medidas tm el primer periodo) so~ 8w~
pa.:a el sindicato y 8('Ir- W2) para la empresa, dond~ 8 refleja tanto el
descuento corno la corta vida de lo que queda de contrato despus dei
primer periodo. Si la empresa rechaza la segunda ofertadel sindicato,
el juego finaliza y las ganancias son cera pa ambos jugado~es: Un modelo J!1srealista podra permitir que la I).egbci~cineontinuara hasta que
una oferta furaaceptada, o podra obligar las 'partes a someterse a una
decisin arbitral vinculante despus de una hulga prolongada. Aqt sacrificamos realismo para ganar claridad. (Vase Sobel y Takahashi [1983]
, y el ejercicio 4.12 para un anlisis con horizonte infinito.)
Definir y hallar un equilibrio bayesiano perf~cto es algo eomplicado en
estemodelo; pero la solucin eventual es simpl'~;eintuitiva, Empezarnos,
por lo tanto, esbozando el nico equilibrio b!yesiano perfecto de este
juego.
'
"'
La oferta salarial del sindicato en el primer periodo es
};~
'11)1
(2 - 8)2
=
2(4 -38)
'Ir
A.
Si el beneficio de la empresa es mayor que
1rl
Otras aplicaciol1es del equilibrio bayesial10 perfeclo ! 223
INCOMPLETA (c. 4)
2w
2- 8
= 2-8 = 4-"381rA
J~ empresa acepta wj; encaso contrario, la empresa rechaza wj.

SI su oferta es rechazada en el primer periodo, el sindicato actualiza
su conjetura sobre los beneficios de la empresa: el sindicato cree que
1r se distribuye uniformemente en [O,irjJ.
'
La oferta salarial del sindicato en el segundo periodo (condicionada a
que wj sea rechazada) es
UJ2
1rj
2=
Si el beneficio de la empresa,
en
Caso
2 -
-2-(4---3--)
1r,
/'
KA
,ltJ],
es mayor que
1))2'
sta acepta la oferta;
contrario, la rechaza.
. do las empresas con beneficios altos aceptan

Por lo tanto, en cad a peno ,
la oferta del sindicato, mientras que las de beneficios bajos la rechazan, y
la oferta del sindicato en el segundo periodo refleja el hec~10de q~e las
empresas con beneficios altos aceptaron la oferta en e~ pnme: p:n~do.
(Ntese el ligero cambio en la terminologa: n~s .refenr:mos l1llhstmtamente a una empresa con muchos tipos de beneficlOs pOSIbleso.a.m~lchas
empresas cada una con su propio nivel de beneficios.) En .eqUlhbno, las
empresas con beneficios bajos toleran una huelga de.un p:nodo para canindicato de que tienen beneficios bajos e mduClr con ello a una
vencer al S
. d S'
oferta salarial menor por parte del sindicato en el segundo pe~o o.. 111
embargo, las empresas con beneficios muy bajos encuentran que mclus~;a
oferta del segundo periodo es intolerablemente alta y, por tanto, tambIen
la rechazan.
Empezamos nuestro anlisis describiendo las estrategia~ y conjeturas
de los jugadores, tras lo cual definimos un equilibrio b~yesIano perfe:l:o.
La figura 4.3.3ofrece una representacin en forma extenSIVade una.ver.slon
simplificada del juego: slo hay dos valores de 'Ir(1r B Y 1rA), Yel smdlCato
slo tiene dos ofertas salariales posibles (lUB y WA)'
En este juego simplificado, al sindicato le co~espo~de decidir en tres
conjuntos de informacin, por lo que su estrategIa conSIste en tres ofertas
salariales: la oferta del primer periodo, WJ, y dos ofertas en el ,segundo
periodo, W2 despus de que Wl = WA sea rechazada y W2 despues ~e que
Wl = WB sea rechazada. Estas tres decisiones tienen lugar en tres conjuntos
de informacin con ms de un elemento, en los que las conjetura.s del
sindicato son (p,1 - p), (q,l - q) y (r,1 - r) respectivamente. En el J:lego
completo (a diferencia de lo que pasa en el juego simplicad~ de la fJ~ura
4.3.3), una estrategia del sindicato es una oferta w~ en el pnmer pe:l0do
y una funcin de oferta W2(Wl) en el segundo penado que deternuna la
oferta lU2 a realizar despus de que cada oferta Wl sea recha~:da. Cac~a
una de estas decisiones tiene lugar en un conjunto de informaCll111
COll.mils
de un elemento. Hay un conjunto de in.formacin en el seguJldo per~odo
para cada oferta salarial que el sindicato podr~ hacer e~:l pruner perto::lo
(por lo que hay un continuo de conjuntos de mformaClon en vez de solo
224/
JUeCOS DIN;MICOS CON INFOI<,\IAClN
Otras aplicaciones del equilibrio bayesillno perfecto / 225
INCOMPLETA (c. 4)
Azar
lO,
,WE}
lC,1 -
wa
7tH
'- wB
juego completo, denotamos la conjetura del sindicato en el primer periodo,

mediante l(T), y la del segundo (despus de que la oferta lOl del primer
periodo haya sido rechazada) con JL2(Tlwl).
Una estrategia de la empresa incluye dos decisiones (tanto en el juego
simplificado como en el completo). Sea Al (wll'lr) igual a uno si la empresa
aceptase la oferta Wl del primerperiodo cuando su beneficio es T;y cero si
la empresa rechazase Wl cuando su beneficio es T. Del mismo modo, sea
A2(W2IT/Wl)igual a uno si la empresa aceptase la oferta 'W2 del segundo
periodo cuando su beneficio es 'Iry la oferta del primer periodo fue lOl,Y
cero si la empresa rechazase '!U2 en tales circunstancias. Una estrategia de
la empresa es un par de funciones [Al(lOll-ir),A2(102iT,lOl)J.
Puesto que la
empresa tiene informa~incorripleta durante iodo el juego, sus c~jehIias
son triviales.
Las estrategias ['Wl/W2(lOl>f
y [Al(WllT),A2(W2IT,Wl)],
y las conjetur~s
[JL 1(T), J.l2(TIWl)] constituyen un equilibrio bayesiano perfecto si satisfacen'
los requisitos 2,}, y4 dy las.eccin 4.1. (El requisito 1 se satisfac~:p~I
la simple existencia de las~onjeturas del sindicato.) Vamos ae~?straE
que existe un nico equilibrio bayesiano, perfe00, L(1parte ITI~j'~~Hlf
del arguplentoes aplicar el reqllisito 2 ala decisind~la empr~:;;aen.el
segundo periodo A2(102IT/Wl):
puesto q~~ ~te. es liltimo'Il}?~iirri:i~\~.
del juego, la d,ecisin ptima de la empresa es aceptar lO2 sLY:.,~lo.~~
T~ lO2; lOl es irrelevante. Dada ~sta parte de la estrategia dela
es inmediato aplicar el requisito 2 a la elec~in' de' ~na ~ferta:sai~i;
por parte del sindicato en el segundo periodo:.102 deb~r~ ".!"'''''~-'''''~'''''''!~h~t:};
ffi'~t'/:i~:,,'..:~~::ganancia esperada pore~ sindic~to, dada la contetura d~~~~~ J:?-L7rJ'W~r,x:;:.',' , ;'"
la consiguiente estrategia de la empresa A2(10217l:,lOl)' :L,apart;e
WE.iPHPI;~;",;t;"1:;,:,
.. 1.".,,,
.,..>.',~_ ...,...'-'>.":".~,.":'~~~;:~~~~:.;-._~.~~::.,.~
..~:.~-',.:.-.-~'
del argumento es deterIninar la c;onjetura JL2(:r1'UJ1)d~f_
Il1od(),.~igpf~I1t.~;J]~:t'?,~?~~)
Comenzamos considerando momentneamen,t~ el siguiel.'\te,Pll~lZ~:"""
,...
de negociacin de un periodo, (Utilizaremos IJ;lstarsIe l?s~e.~~t~~P~,tr'
este problema como la solucin en el segundo periodo del juegomndos
periodos.) En el problema con un periodo/supo~garnos
que.~_s~~~~i?
cree que el beneficio de la empresa se distribuY~UI;iformement. en [9~1[A
donde Tl es por el momento arbitrario. Si el sindicato ofrece ,w, la mej?X
respuesta de la empresa, es clara: aceptar lO~iys910 si T~ 'w. Por lotapt9'
el problema del sindicato puede formularse co~o:;
",,'
ei,
O.
O
lO"
IT, - lO,
O
O
e~p're~~:
O
O
lO,
1t.~- IVg
,.
,,-
O
O
Figura 4.3.3
dos com.o en la figura 4.3.3). En cada conjunto de informacin, la conjetura
del sIndIcato es una distribucin de probabilidad sobre estos nodos. En el
O
O
'_.
-,>.
_.
o'"
-'
..
'
maxUJ'
w
Prob{la empresa acepta
lO}
+ O. Prob{la empresa no acepta
.'
lO},
;.
donde Prob{la empresa acepta w} = (TI-'w) /Tl para los valores relevantes
.....
...
....
Otras aplicacio'l1es del equilibrio bayesiano perfecto / 227
226 / JUEGOS DINMICOS CON lJ'JFORMAClN INCOMPLETA (e. 4)
,','
,~,',
de las ofertas salariales (concretamente, O ~ W ~ 7fl)' La oferta salarial

ptima es, por lo tanto, W*(7fl) = 7f1l2.
Volvemos ahora (definitivamente) al problema con dos periodos. Demostramos en primer lugar que, para valores arbitrarios de Wl y W2, si el
sindicato ofrece Wl en el primer periodo y la empresa espera que ofrezca
W2 en el segundo periodo, todas las empresas con beneficios lo suficientemente altos aceptarn Wl y todas las dems lo rechazarn. Las posibles
ganancias de la empresa son 7f-Wl por aceptar '11)1, (7f - W2) por rechazar
Wl y aceptar W2, y cero si rechaza ambas ofertas. Por lo tanto, la empresa
prefiere aceptar Wl a aceptar W2 si 7f- Wl > (7f - W2), o
....}
;-
y la empresa prefiere aceptar W1 a rechazarlas do~oferta~ si 7f-W1 > O.por

lo tanto, para valores arbitrarios dewl y W2, empresas con 1i" >mx{ 7f*(Wl,
W2), Wl} aceptarn Wl y empresas con 7f <1l].!,\x{7r*(Wl,Wi),W1}
lo rechazarn. Como elrequisito 2 establece que la inpresa acta ptimamente
dadas las subsiguientes estrategias de los jugadores, podemos obtener
Al (wll7f)para un valor arbitrrio de '11)1: empresas con 'Ir>max{ 7f*(-Wl,'U)2)
,wt} aceptarn Wl y empresas-con 7f <~ax {7f*(Wl, W2), wt} lo rechazarn,
donde W2 es la oferta salarial del sindicato,en el segundo periodo W2(Wl).
Podemos ahora obtener f-l2(?rlwl);la onjetura del sinc;licatoen el segundo periodo en el conjunto de i1.formacinal que se llega si la oferta Wl
del primer periodo es rechilza-dir. El requisito 4 implica que la conjetura
correcta es qu ?rosedistribuya uniformemente en [O,7f(Wl),
donde 7f(Wl)
es el valor de 7f que hace que la empresa sea indiferente entre aceptar
Wl y rechazarlo para aceptar f;;ierta
pti~a del sindicato en el segundo
periodo dada esta conjetura (concretamente, W"(7f(Wl = 7f(wl)/2, como
obtuvimos en el problema de un periodo), Para ver esto, recordemos
que el requisito 4 establece que la conjetura del sindicato debe obt~nerse
a partir de la regla de Bayes'y de la estrategia de la empr~sa. Por lo
tanto, dada la primera parte-de la estrategia de la empresa A1(WII7f)que
acabamos de hallar, la conjetura del sindicato debe ser que los tipos que
quedan en el segundoperiode;se
distribuyen uniformemente eiJ.[O,7fl],
donde?rl =max{ 7f*(W},W2),Wt} y W2 es la oferta salarial del sindicato en
el se~do
periodo W2(Wl).Dda esta conjetura, la oferta ptima del sindicato en el segundo periodo debe ser W"(7fl) = 7ft/2, lo que proporciona
una ecua,q.n implcita de 7flen,funcin de Wl:
7fl= max{7f"(w,7f,j2),Wl}'
Para resolver esta ecuacin implcita, supongamos que Wl ~ 7f"('U],irtl2).
7f*(Wl,7fl/2). Por lo tanto,
7fl -- Wl, lo que contradice Wl >
Enances
t
Wl
< 7f"(W},7fl/2),de manera que 7fl = 7f*(1JJl:rj2),o

21JJl
7fl(Wl)=2_
Wl
W2(w1)=2_'
Hemos reducido el juego a un problema de optimizacin en un periodo para el sindicato: dada la oferta salarial del sindicato en el prime.r
periodo, 1JJl,hemos hallado la respuesta p~m~ ~e la empresa en e~pnmer periodo, la conjetura del sindicato al pnnc~plO del segundo p:n~do,
la oferta ptima del sindicato en el segundo penado y la respuesta 0.pt1ll1a
de la empresa en el segundo periodo. Por lo tanto,.l,a oferta salanal del
sindicato en el primer periodo debera ser una soluclOn de
max. Prob{la empresa acepta 1IJ}

w
+ W2(Wl)
Prob{la empresa no acepta
Wl
+ . O. Prob{la empresa no acepta 71Jlni
pero acepta 1JJ2}

.
W2}'
Ntese que Prob{la empresa acepta IUl}no es simplemente la probabilidad

de que 7fsea mayor que Wl, sino la probabilidad de que 7fsea mayor que
7fl('11)1):
7fA - 7fl(Wl)
Prob{la empresa acepta w}
=7fA
La solucin de este problema de optimizacin es wi, dado al principio del

anlisis, y ~i ywi, dados por 7f(llJ)Y W2(Wi> respectivamente,
4.3.C La reputacin en el dilema de los presos repetido finitamenle
En el anlisis de los juegos con informacin completa repetid~s finitaJ~el.'te
de la seccin 2.3.A, demostramos que si un juego de etapa tIene un UnJco
equilibrio de Nash, cualquier juego repetido finitamente basa~o en este
juego de etapa tiene un nico equilibrio de Nash perfecto el~~u~Juegos: en
cada etapa, despus de cualquier historia, se juega el eqUIlIbno de Nash
del juego de etapa. En contraste con este resultado terico, buena parte. ~e
la evidencia experimental sugiere que frecuentemente se da cooperacJOl1
(.
228/
JUEGOS DIN'>'MICOS CON INFOllMACIN
INCOlvlPLETA (e. 4)
en dilemas de los presos repetidos finitamente, especialmente en etapas

que no estn demasiado cerca del final. (Vase algunas referencias en
Axelrod [1981].) Kreps, Milgrom, Roberts y Wilson (1982) demuestran
que un modelo de reputacin ofrece una explicacin de estos hechos.8
La explicacin ms simple de un equilibrio de reputacin en el dilema
de los presos repetido finitamente incluye una manera nueva de modelar
la informacin asimtrica. En lugar de suponer q\le un jugador tiene
informacin privada sobre sus ganancias, supondremos que el jugador
tiene informacin privada sobre sus estrategias factibles. En particular,
supondremos que con probabilidad p, el jugad~)Tfilapuede jug~sqlo l?
estrategia del Talin(tit-fot-tat) (qll~ empieza el juego repetido cooperando
e imita en lo sucesivo la jugada q~lterior de su oponente), rnjent:rasque
con probabilidad 1 - pel jugadqr fila puede utilizar cualquit:~rade las
estrategias disponibles en eljuego rep~tido infinitamente (incluida la del
Talin). De acuerdo con la terminologa habitual, llamaremos "racional"
al jugador fila. La ventaja expositiva de esta fommlacinse debe al hecho
de que si el jugador fila se desva alguna vez de la estrategia del Talin,
pasa a ser informacin del dominio pblico que el jugador fila es radonal.
La estrategia del Tali9n es simple y atractiva, y fue adems la ganadora
en el torneo del dilema de los' presos de Axelrod. No obstante, se podra
cuestionar el supuesto de que un jugador tiene slo una estrategia, incluso
si sta es atractiva. A costa de perder algo de simplicidad expositiva, se
podra suponer que ambos tipos del jugador fila pueden jugar cualquier
estrategia, pero con probabilidad p las ganancias del jugador son tales
que la estrategia del Talin domina a cualquier otra estrategia del juego
repetido. (La exposicin se complica bajo este supuesto, porque una desviacin de la estrategia del Talin no hace que sea informacin del dominio
pblico que el jugador es racional.) Estas ganancias difieren de las que se
suponen nomlalmente en los juegos repetidos: para que la intacin de la
decisin previa del jugador columna sea un ptimo, las ganancias en este
periodo del jugador fila deben depender de la jugada del jugador columna
en el periodo anterior. Como tercera posibilidad (de nuevo a costa de sacrificar simplicidad expositiva), se podra permitir que un jugador tuvief~
informacin privada sobre sus ganancias en el juego de etapa, per()i~istir
8 Demo>tramos en la seccin 2.3.Bque puede existir cooperacin en el dilema de l~pre'sos
repetido infinitamente. Algunos autores se refieren a tal equilibrio como un equilibrio de
"reputacin", aun cuando las ganancias y oportUnidades de ambos jugadores son informacin
del dominio pblico. Por claridad, se podra describir ese equilibrio cmoun:~qciIibri~
basado en "amenazas y promesas", reservando el trmino "reputacin" a los jtegb~ 'en'los
que al menos un jugador tiene algo que aprender sobre otro, como ocurre en esta seccin: .,
Otras aplicaciones del equilibrio bayesiano perfecto / 229

1\
en que la ganancia en una etapa dependa slo de las jugadas de esa etapa,
y que la ganancia total del juego repetido sea la suma de las ganancias en
cada una de las etapas del juego. En particular, se podra suponer que
con probabilidadp la mejor respuesta del jugador fila a la cooperacin
es la cooperacin. Kreps, Milgrom, Roberts y Wilson (KMRW en lo sucesivo) demuestran que la existencia de informacin asimtrica unilateral
de este tipo no es suficiente para producir la cooperacin en el equilibrio;
al contrario, no cooperar (confesar) es lo que ocurre en cada etapa, al igual
que bajo informacin completa. Sin embargo, tambin demuestran que si
la asimetra informativa es bilateral (es decir, existe tambin una probabilidad q de qli.e'la mejor respu~sta del jugador columna a la cooperacin
sea la cooperacin) puede existir entonces un equilibrio en el que los dos
jugadores cooperen hasta que;uede muy poco para que el juego se acabe.
Para repetirlo otra vez, supondremos que con probabilidad p el jugador fila slo puede jugar la estrategia del Talin. El espritu del anlisis
de KMRW' es que' incluso si p es muy pequea (es decir, incluso si el
jugador' colrnna tiene slo una ligera sospecha de que el jugador fila
podra no ser racional) ,sta incertidumbre puede tener un gran 'efecto"e:n
el siguiente sentido. KMRW demuestran que existe una cofa superior,.al
nmero de etapas en las que algn jugador no coopera en equilibrio. Esta
coti;lsuperior depende de p y de las ganancias en el juego de etapa, pero
no del nmero de etapas en el juego repetido. Por lo tanto, en cualquier
equilibrio de un juego repetido lo suficientemente largo, la fraccin deetapas en las que ambos jugadores cooperan es grande. (KMRWestablecen
su resultado para el equilibrio sucesivo, pero sus argumentos tamb~~~~e
pueden aplicar al eq\lilibrio bayesiano perfecto.) Dos pasos claveel1 ~l
argumento de KMRW son: (Osi el jugador fila se desva de la estrategia
del Talin,.pasa a ser informacin del dominio pblico que el jugador es
racional, por lo que ningn jugador' cooperar en lo sucesivo, de manera
que el jugador fila racional tiene un incentivo para imitar la estrategia del
Talin, y (ii) dado un supuesto que i.I;npondreJI,t,os
ms, adelante sobre las
ganancias del juego de etapa, la mejor respuest del jugador columna a la
~stategia del Talin sera coope~ar hasta. la ltima etapa del juego.
.
Para entende:ulsson los elementos bsicos del modelo de KMWR,
con~iderarem~s eicompieII1ertt?riricie su ~liSis:.en lugar de suponer q~e
p es baja y analizar los juegos rep,etldc,>sdelarga duracin, supondremos
qlle p es lo suficientemente alta ~oIl1oyara que exista un equilibrio de
.un juego repetido corto en el qud9!i dos jugadores cooperen en todas las
etapas menos
en las dos
l9~Ill.~,Empezamos con el caso de dos periodos.
.
.
.
,(
Olras aplicaciones
riel equilibrio
bayesillllO perfecto
/ 231
230 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (c. 4)
initada por la estrategia del Talin en el segundo periodo, como se ve en

la trayectoria de equilibrio en la figura 4.3.5.
El desarrollo temporal es:

1. El azar determina un tipo para el jugador fila. Con probabilidad p, el
jugador fila slo dispone de la estrategia del Talin; con probabilidad
1 - p, puede jugar cualquier estrategia. El jugador fiJase entera de su
tipo, pero el jugador columna no se entera del tipo del jugador fila.
2. Los jugadores fila y columna juegan al dilema de los presos. Sus
decisiones en esta etapa pasan a ser informacin del dornini.o pblico.
3. Los jugadores fiJa y columna juegan al dilema de los presos por segunda y ltima vez.
4. Se reciben las ganancias. Para el jugador fila racional y el jugador
columna stas son la suma (sin descuento) de sus ganancias enJas dos
etapas. El juego de etapa se presenta en la figura 4.3:4.
"o
";
1=2
1=1
Estrategia del Talin
Jugador racional fila
NC
NC
Jugador columna
NC
Figura 4.3.5
Para hacer de este juego de etapa un dilema de los presos, suponemos que
a > 1 yb < O.KMRWtambin suponen que a + b < 2,de forma que (como
indicamos anteriormente en (ii la mejor respuesta del jugador columna
a la estrategia del Talin es cooperar hasta la ltini'etpa del juego; en
lugar de ir alternando entre cooperar y no cooperar.
1=1
1=2
1=3
NC
NC
Jugador columna
NC
Columna
Figura 4.3.6
Cooperar,No coop~rar
-,
.,:
Cooperar
1,1
b,a
No cooperar
a,b
0,0
Fila
Figura 4.3.4
Al igual que en el ltimo periodo de un dilema de los presos rejJetido
finitamente coninformacin completa, no cooperar (NO) driliaestric
tamente a cooperar (O) en l~ltima etapa de este juegod~ dos'peii6dos
con informacin incompleta; tanto para el jugador fila r.;tcional
para
el jugador column. Dado que el jugador columna no coopetaren"la
ltima etapa, no existe ninguna razn para que el jug~dorfila r~ional10
hagaen larrimera etapa. Ahora bien, la estrategia delTalin empieza
el juego con cooperacin. Por lo tanto, la nica decisi6n que hace falta
determinar es la del jugador columna en el primer periodo, (X), 'que ser
c?mo
"
Escogiendo X = O, el jugador columna recibe la ganancia esperada

1 + (1 - p) . b en el primer periodo, y p . a. en el segundo. (Cmno la
estrategia del Talin y el jugador fila racional eligen jugadas diferentes
en el primer periodo, el jugador columna empezar el segundo periodo
sabiendo si el jugador fila es racional o juega la estrategia del Talin. La
ganancia esperada en el segundo periodo p . a refl~ja la incertidumbre
del jugador columna sobre el tipo del jugador fila a la hora de decidir si
cooperar o no en el primer periodo.) Escogiendo X = NO, en cambio, el
jugador columna recibe p . a en el primer periodo y cero en el segundo.
Por lo tanto, el jugador columna cooperar en el primer periodo siempre
p .
que
p + (1 - p)b
O.
Supondremos en lo sucesivo que (43.2) se cumple.
(4.32)
232/
JUECOS DINMICOS CON INFORMACIN
INCOMPLETA (c. 4)
Otras aplicaciones del equilibrio bayesiano pe/feelo / 233
Consideremos ahora el caso con tres periodos. Dado (4.3.2), si el

jugador columna y el jugador fila racional cooperan en el primer periodo,
la trayectoria de equilibrio en el segundo y tercer periodos vendr dada
por la figura 4.3.5, con x= e y los nmeros de los periodos cambiados.
Derivaremos condiciones suficientes para que el jugador columna' y el
Jugador fila racional cooperen en el primer periodo, como se indica en la
trayectoria de equilibrio de tres periodos en la figura 4.3.6.
En este equilibrio, la ganancia del jugador fila racional es 1 + a y la
8.anancia esperada del jugador columna es 1 +p+ (1- p)b+pa. Si el jugador
tila racional no coopera en el primer periodo, pasa a ser informacin del
dominio pblico que el jugador fila es racional. Por lo tanto, la 'ganancia
del jugador fila racional por no cooperar en el primer periodo es a~'que
es menor que la ganancia 1 + a de equilibrio, por lo que el jugador fila
racional no tiene incentivos para desviarse de la estrategia implcita en la
figura 4.3.6.
Dada (4.3.2), una condicin suficiente para que el jugador columna no se

desve es
1 + pa ~ a.
(4.3.3)
Alternativamente, el jugador columna podra desviarse no cooperando

en el primer periodo pero cooperando en el segundo, en cuyo caso la
estrategia del Talin cooperara en el tercer periodo, por lo que el desarrollo
del juego sera como se indica en la figura 4.3.8. La ganancia esperada del
jugador columnap?r esta desviacin es a + b + pa, que es menor que su
glnanciaesperada en' equilibrig siempre que
,'o,,'
',,-;.",
1 + p + (1 - p)b + pa ~, a + b + pa.
1= 1
1= 2
1= 3
Estrategia del Tali6n
NC
Jugador raCional fila
NC
NC
Jugador columna'
NC
NC
-.
1= 1
1= 2
NC
NC
1=3
NC
"---'
Jugador columna
NC
NC
NC
Figura 4.3.8
Figura 4.3.7
Nos ocupamos ahora de si el jugador columna tiene algn inentivo

para desviarse. Si el jugador columna no coopera en el primer periodo;
la estrategia del Talin tampoco lo har en el segundo, y el jugador fila
~'acional no cooperar en el segundo periodo, porque es' seguro que' el
Jugador columna no lo har en el ltimo periodo. No habiendo cooperado
,en el primer periodo, el jugador columna debe decidir si cooperar o no
en ~l segundo periodo. Si el jugador columna no coopera en el segund
?enodo, la estrategia del Talin tampoco lo har en el tercero, por lo queel
Juego se desarrollar corno indica la figura 4.3.7. La ganancia deljugador
columna por esta desviacin es a, que es menor que su ganancia esperada
en equilibrio siempre que
1 + p + (l - p)b + pa ~ a.
Dada (4.3.2), una condicin suficiente para que el jugador columIla no se

desve 'es
'
, ';!
a+b:::;1.
'(4.3.4)
Hemos demostrado que si (4.3.2), (4.3.3)y (4.3.4) se cumplen, el desarrollo

del juego descrito en la figura 4.3.6 es la trayectoria de equilibrio de un
equilibrio bayesiano perfecto del dilema de los presos con tres periodos.
Dado un valor dep, las ganancias ay b satisfacen estas tres d'esigualdades
si pertenecen a la regin sombreada' d&la;figura 4.3.9. A medida que p
tiende a cero, la regtnsombreadaq,esapare.ce,consistentemente
con la
observacin anterior de queeri~stasecci6nanalli:amos
la cooperacin en
el equilibrio en juegos cort~s con valores altos de p, mientras que KMRW
~e centran en juegos de larga duracin con valores bajos de p. Por otra
parte, si p es lo suficieht~mentealta. como para sustentar la cooperacin
en un juego corto, es suficientemente' alta para hacerlo en un juego largo.
(,
Otras aplicaciol1es del equilibrio bayesiano perfecto / 235
INCOMPLETA (c. 4)
Formalmente, si a, by p satisfacen (4.3.2), (4.3.3) Y (4.3.4), para cualquier

T > 3 finita existe un equilibrio bayesiano perfecto en el juego repetido T
periodos, en el cual el jugador fila racional y el jugador columna cooperan
hasta el periodo T - 2, tras el cual los periodos T - 1 Y T son tal como se
describen en la figura 4.3.5. (Vase el apndice para una demostracin de
esta afirmacin.)
a=l
a=l/(l-p)
= -p/(l-p)
Figura 4.3.9
Apndice
"'c
",
Por razn de brevedad, nos referiremos a un e4ulibri~~1yeSianoperfedO

del dilema de los presos repetido T periodos, como un equilbrio cooperativo
si el jugador fila racional y el jugador columna cooperan hasta el periodo
T - 2, tras lo cual los periodos T - 1 Y T se describen en la figura 4.3.5.
Vamos a demostrar que si Ct, by p satisfacen (4.3,2),.(4.3.3) y (4.3.4), existe
~nequilibrio cooperativo para cada T.;> :3 finito. Argumentamos por
mduccin: dado que para cada T = 2, 3, ... ,T ~ 1 existe un equilibrio cooperativo en el juego con T periodos, demostramos que existe
equilibrio
cooperativo en el jugo con T periodos.;.
....
..'
en el periodo T - 1, o (T - t - 1) + u, por lo que no cooperar no resulta

rentable para ningn t < T - 1. El argumento referente a.la figura 4.3.5
implica que el jugador fila racional no tiene incentivos para desviarse en
los periodos T - 1 o T.
Demostramos a continuacin que el jugador columna no tiene incentivos para desviarse. El argumento referente a la figura 4.3.5 significa que el
jugador columna no tiene incentivos para desviarse cooperando hasta el
periodo T - 2 Ydejando de cooperar en el periodo T -1; el argumento referente a la figura 4.3.6 implica que el jugador columna no tiene incentivos
para desviarse cooperando hasta el periodo T - 3 Y dejando de cooperar
en el periodo T - 2. Por lo tanto, necesitamos demostrar que el jugador
columna ha tiene incentivos para desviarse cooperando hasta el periodo
t - 1 Y dejando de cooperar en el periodo t, donde 1 ::; t ::; T - 3.
Si el jugador columna no coopera en el periodo t, la estrategia del
Talin tampoco lo l~ar en el periodo t+ 1, por 10 que el jugador fija racional
tampoco lo har (ya que no cooperar domina estrictamente a cooperar en
la (t + 1)-sima etapa del juego, despus de lo cual no cooperar de t + 2
a T proporciona una ganancia cero como mnimo, mientras que cooperar
en t + 1 hara que fuera informacin del dominio pblico que el jugador
fila es racional, resultando en una ganancia de exactamente cero a partir
de t.+ 2 hasta T). Dado que tanto la estrategia del Talin como el jugador
fila racional cooperan hasta elperiodo t y dejan de cooperar en el periodo
t + 1, la conjetura del jugador columna al principio del periodo f; + 2 es
que la probabilidad de que el jugador fija sea la estrategia del Talin es
p. Por lo tanto, si el jugador columna coopera en el periodo t + 1, el juego
de continuacin que etnpiezaen el periodo t + 2 ser. idntico a un juego
de T periodos con T = T - (t + 2) + l. Por la hiptesis de induccin; existe
un equilibrio cooperativo en este juego de continuacin de T periodos;
supongamos que se juega este equilibrio. Entonces1a ganancia del jugador
columna en los periodos t a T por no cooperar en el periodot y.cooperar
en el periodo t + 1 es
un
Demostramos primero que el jugador fila raCio~~l no tiene incentivos

para desviarse del equilibrio cooperativo en el juego con T periodos, Si
el jugador fila no fuera a cooperar en ningn period t < T'- 1, llegara a
ser del dominio pblico que el jugador fila esracional, por l que recibira
una ganancia a en el periodo t y cero en cada periodo siguiente. Pero la
ganancia en equilibrio del jugador fila es 1 en los periodos t a T - 2, Y a
+ b + [T
- (t
+ 2) - 1] + 11 + (1 -
p)b
+ pa,
que es menor que la ganancia de equilibrio del jugador columna en los

periodos t a T,
2 + [T.-
(t
+ 2) - 11 + p + (1 -
p)b
+ pu.
(43.5)
D6 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA Ce. 4)
Refinamientos
Hasta ahora hemos demostrado que el jugador columna no tiene incentivos para desviarse cooperando hasta el periodo t - 1 Y dejando de
cooperar en el periodo t, dado que se jugar el equilibrio cooperativo en
el juego de continuacin que empieza en el periodo t + 2. Ms en general,
el jugador columna podra cooperar hasta el periodo t - 1, no cooperar
en los periodos t a t + s y volver a cooperar en el periodo t + s + 1. Hay
tres casos que son triviales: (1) si t + s = T (es decir, si el jugador columna
nunca coopera despus de no haberlo hecho en el periodo t), la ganancia
es a en el periodo t y cero en lo sucesivo, que es menor que (4.3.5); (2) si
t + s -1- 1 = T, la ganancia del jugador colunma de t a T es a + b, peor que
en (l), y (3) si t + s + 1 = T - 1, la ganancia del jugador colunma de t a l'
es a + b + pa, que es menor que (4.3.5). Quedan por considerar los valores
de ~ para los que t + s + 1 < l' - 1. Al igual que en elcaso anterior con
s = O, existe un equilibrio cooperativo. en el juego de. continuacin que
empieza en el periodo t + s + 2; supongamos que se juega este equilibrio.
Entonces, la ganancia del jugador columna en los periodos ta T por jugar
esta desviacin es
a + b + [1' - (t + s + 2) - 1] + p + (1 -p)b+
el jugador 1 C es una estrategia estrictamente dominada: la ganancia de 2

por utilizar D es mayor que cualquiera de las ganancias que el jugador 1
recibira por utilizar C, O y 1. Por tanto, no es razonable que el jugador 2
crea que el jugador 1 puede haber elegido C; formalmente, no es razonable
que 1 - p sea positivo, por lo que p debe ser igual a 1. Si la conjetura
1 - p > O no es razonable, tampoco lo es el equilibrio bayesiano perfecto
(D,D',p ::;1/2), quedando (I,I',p = 1) como el nico equilibrio bayesiano
perfecto que satisface este requisito.
D
2
2
---------------2
pg,
que es, de nuevo, menor que (4.3.5).

4.4 Refinamientos del equilibrio bayesiano perfecto
En la seccin 4.1 definimos un equilibrio bayesiano perfecto como las estrategias y las conjeturas que satisfacen los requisitos 1 a4, y'observamos
que en tal equilibrio ninguna estrategia de ningn jugador puede estar estrictamente dominada a partir de ningn conjunto de informacin. Ahora
consideramos dos requisitos adicionales (sobre conjeturas fuera de la trayectoria de equilibrio), el primero de los cuales formaliza la idea siguiente:
puesto que un equilibrio bayesiano perfecto impide que el jugador i jueglIe una estategia estrictamente dominada a partir de algn conjunto de
informacin, no es razonable que el jugador j crea que i utilizar esa
estrategia.
Para concretar ms esta idea, consideremos el juego de la figura 4.4.1.
Existen dos equilibrios bayesianos perfectos en estrategias puras: (I,I',p =
1) y (D,D',p ::; 1/2).9 La caracterstica clave de este ejemplo es que para
. 9Derivar la representacin en forma nonnal revela que existen en este juego dos equilibnos de Nash con estrategias puras: ([,JI) y (D,D/). Puesto que no hay subjuegos en la forma
del equilibrio bayesimlO perfecto / 237
3
1
------7
Figura 4.4.1
Otras dos caractersticas de este ejemplo merecen una breve mencin.
En primer lugar, aunque C est estrictamente dominada, 1 no. Si Eestu~
viera estrictamente dominada (corno ocurrira si la ganancia de 3 por parte
del jugador 1 fuera, por ejemplo, 3/2) el mismo argumento implicara que
no es razonable que p sea positiva, lo que implica que p debe ser cero, pero
esto contradira el resultado anterior de que p debe ser uno.,.En tal caso,
este requisito no restringir! lqs conj~turas fuera del equilibrio d~i jugador
2. (Vase la definicin formal'que damos ms adelante)
,
.
1
.,_,'
En segundo lugar, el ejemplo no ilustra el requisito .~escrito inicialmente, porque C no slo est estrictamente dC;IDinadaa partir de algn
conjunto de info~acin, sino estrjctarr;f~t~~ominada en el sentido ms
,.
. ..
."
o.
~
.
extensiva, ambos equilibrios de Nash sOn perfectos en subjuegos. En u,1') el conjunto de

informacin del jugador 2 est en la trayectpri", de equilibrio, por lo que el requisito 3 establece
que p = L En (D,D') este conjunto d~ infqrm,!.cin est fuera de la trayectoria de. equilibrio,
pero el requisito 4 no impone ningna restriccin a p. Por lo tanto, slo requerimos que la
conjetura p de 2 haga que la accin D' sea ptima, es decir, p ~ 1/2.
Refil1amiel1lus riel equilibrio bayesial10 perfecto / 239
238 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (c. 4)
pleno. Para ver la diferencia, recordemos de la seccin 1.1.B que una

estrategia .5; es estrictamente dominada si existe otra estrategia Si tal que
para cada posible combinacin de estrategias de los dems jugadores, la
ganancia de 'i por jugar Si es estrictamente mayor que la ganancia por
jugar
Ahora consideremos una versin expandida del juego en la
figura 4.4.1, en la cual el jugador 2 tiene que jugar antes que el jugador 1,
y cuenta con dos opciones en esta jugada ihcial: acabar el juego o pasar
el control de ste a 1 en el conjunto de informacin de 1 tal como aparece
en la figura. En este juego expandido, e est an estrictamente ltominada
a partir de algn conjunto de informacin, pero no est estrictamente
dominada, puesto que si 2 termina el juego en el nodo inicial, J, e y D
obtienen la misma ganancia.
Puesto que e est estrictamente dominada en la figura 4.4.1, no es
razonable que el jugador 2 crea que 1 puede haber elegido e, pero la dominancia estricta es una condicin demasiado fuerte y, por lo tanto, hace
que este requisito sea demasiado dbiL (Puesto que hay ms estrategias
estrictamente dominadas a partir de algn conjlmto de informacin que
estrategias estrictamente dominadas,. requerir, qi, jno !=reaque. i puede
haber elegido una de las primeras pone ms restricciones sobre las conjeturas de j de las que habra si j no creyera que i pueda haber utilizado
una de las ltimas.) Seguidamente, nos quedarnos con el requisito tal
corno lo enunciamos originalmente: el j';lgador j no debera creer que
el jugador i ha elegido una estrategia estrictamente dom1;ada a partir de
algn conjunto de informacin. A continuacin enunciamos este requisito
formalmente.
s;.
",
Requisito 5. Si es posible, cada una de las conjetllras del jugador fuem de In

trayectoria de equilibrio debera asignar una probabilidad cero a los nodos que
se alcanzan slo si otro jugador utiliza una estrategia que est estrictamente
dominada a partir de algn conjunto de informacin.
La expresin "si es posible" en el requisito 5 incluye el caso que podra
plantearse en la figura 4.4.1 si D dominara tanto a e corno a J, como
ocurnra si la ganancia de 3 del jugador 1 fuera 3/2. En tal caso, el
requisito 1 precisa que el jugador 2 tenga una conjetura, pero no es posible
que esta conjetura asigne una probabilidad cero a los nodos que siguen a
e y a J, por lo que el requisito 5 no se aplicara en este caso.
3,2
a
1,
[pI
b
2,0
Receptor
1,0
[}- pI
1,
1,1
Figura 4.4.2
Definicin. Consideremos un conjunto de informacin en el cual le toca decidir al jugador i:" La estrategia s; est estrictamente
dominada a partir de
este conjunto de. informacin
s(existe otra estrategia Si tal que, para cada
conjetura que pudiera fonnarse i 'e-n el conjunto de informacin' dado, y para
cada posible combinacin' de las esttaiegiils subsiguientes de .los otros jugadores
(donde una "estrategia subsiguiente" es un plan completo de accin que cubre
cada contingencia que pudiera presentarse una vez se ha alcanzado el conjunto
de inforrr;zaciridado) la ganancia esperada de i al tomar la accin indicada por Si
en el conjunto de informacin dado 'y al jugar la estrategia subsiguiente indicada
por Si s :estr,ictamente ;nayor que la ganancia esperada al tomar la accin y jugar
la estrategia subsiguiente especificadas por s;.
Corno segunda ilustracin del requisito 5 consideremos el juego ele

sealizacion de la figura 4.4.2. Al igual que en la seccin 4.2.A, la estrategia del emisor (m',m") significa' que el tipo t1 elige el mensaje m' y el tipo
t2 elige m",y la esti:ategi elel receptor (a' ,a") significa que el receptor elige
la accin a' siguiendo a J y a" siguiendo a D. Es inmediato comprobar que
las estrategias y conjeturas [(I,I),(7J"d),p = O,5,q] constituyen un equilibrio
bayesiano perfecto ele agrupacin para cualquier q ~ 1/2. Sin embargo, la
caracterstica esencial de este juego de sealizacin es que no tiene sentido
que t1 elija D. Formalmente, las estratgias del emisor (D,I) y (D,D) (es
decir, las estrategias en las cuales tI elige D) estn estrictamente domj-
2-10/
jGEGOS DIN;;;IICOS CON INFOR;.L...CIN INCOMPLETA (e. 4)
nadas a partir del conjunto de informacin del emisor correspondiente a

Por lo tanto, el nodo t en el conjunto de informacin del receptor que
sigue a O se alcanza slo si el emisor utiliza una estrategia que est estrictamente dominada a partir de algn conjunto de informacin. Adems,
el nodo t2 en el conjunto de informacin del receptor que sigue a D puede
alcanzarse por medio de una estrategia que no est estrictamente dominada a partir de algn conjunto de informacin, concretamente U,D). Por
In tanto, el requisito 5 establece que q = O. Como [U,I),(n,d),p
= 0,5,q] es
un equilibrio bayesiano perfecto slo si q 2 1/2, tal equilibrio'no puede
cumplir el requisito 5.
Un modo equivalente de imponer el requisito Sal equilibrio bayesiano perfecto del juego de sealizacin definido en la seccin 4.2.A es el
siguiente.
ti .10
Definicin. En un juego de sealizacin, el mensaje mj de lvI est dominado

para el tipo ti de T si existe otro mensaje mj de M tal quela menor ganancia
posible de ti por utilizar mj es mls alta que la mayor ganancia posible de ti por
utilizar mj:
min U E(tim
akEA
j'
,CLk) >
max U E(tmj,ak)'
Refinamientos del equilibrio bayesiano perfecto / 241
en lugar de Oy 1 como en la figura 4.4.2. Ahora [(I,I),(u,d),p

= 0,5,q] es
un equilibrio bayesiano perfecto de agrupacin para cualquier valor de
q, por lo que [(I,I),(u,d),p
= O,5,q = O]es un equilibrio bayesiano perfecto
que satisface el requisito 5 de sealizacin.
En algunos juegos, existen equilibrios bayesianos perfectos que parecen poco razonables y sin embargo satisfacen el requisito 5. Una de las
reas de investigacin ms activas en teora de juegos se ha preocupado
de las dos siguientes cuestiones: (i) cundo es un equilibrio bayesiano
perfecto poco razonable y (ii) qu requisito adicional puede aadirse a
la definicin de equilibrio para eliminar estos equilibrios que no son razonables~ Cho y Kreps (1987) hicieron una contribucin original y muy
influyente en est rea. Vamos l concluir esta seccin discutiendo tres
aspectos de su trabajo: (1) el ju~go de sealizacin "cerveza y quiche",
que ilustra cmo ciertos equilibrios bayesianos perfectos quena son razonablespueden satisfacer el requisito 5 de sealizacin; (2) una versin
ms fuerte (pero de ninguna manera la ms fuerte posible) del requisito 5
de sealizacin, llamada el criterio intuitivo; y (3) la aplicacin del criterio
intuitivo al juego de sealizacin en el mercado de trabajo de Spence ....
1,1
ukEA
Req uisito 5 de sealizacin. Si el conjunto de informacin que sigue a 'mj est

fllera de la trayectoria de equilibrio y mj est dominado para el tipo ti, entonces
(si es posible) la conjetura del receptor j1.(t.; Imj) debera asignar ~robabilidad cero
al tipo ti. (Esto es posible siempre que m] no est dominado para todos los tipos
Duelo
[pI
,
,
Quiche
t,
[ql
Cerveza
..
No
0,5
:
.,,
3,0
Receptor
10 Como el conjunto de infonnadn

del emisor COITespo~diente a tI slo tiene un elemento,
las conjeturas del emisor no juegan ningn papel en la definidn de dominancia estricta a
partir de este conjunto de inforrnadn.
Demostrar que (D,n y (D.D) estn estrictamente
duminadas a partir de este conjunto de informacin se reduce a ofrecer una estrategia alternativa al emisor que proporcione la ganancia mayor a tI para cada estrategia que el receptor
pudiera jugar. (l,D) es esa estrategia: proporciona 2 a tI en el peor de los casos, mientras que
(D,)) y (D,D) propordonan
1 en el mejor de los casos.
0,1
Cobardica
Duelo
en T.)
En el juego de la figura 4.4.2, el equilibrio bayesiano perfecto de separacin

rU,D),(u,n),p = 1,q = O]satisface el requisito 5 de sealizacin trivialmente
(porque no hay conjuntos de informacin fuera de esta trayectoria de
equilibrio). Como ejemplo de un equilibrio que satisface el requisito
5 de sealizacin de forma no trivial, supongamos que se invierten las
ganancias del receptor cuando el tipo t2 juega D: 1 por jugar d y Opor'u,
....
0,-1
2,0
,,
,,
,
,,
,,
,,
"
"::'"
1,-1
0,5
Duelo: ,
,
,
[l No
2,0
Reeptor
Azar
pI
Quiche
1,
Duelo
Cerveza
Malas pulgas
[1 -
~:
...
qI
No
3,0
Figura 4.4.3
En el juego de sealizacin "cerveza y quiche", elemisor es uno de los
dos tipos: t ="cobardica" (con probabilidad 0,1) Y t2 = "malas pulgas"
(con probabilidad 0,9). El mensaje del emisor es su eleccin de cerveza
c.
242 / JUEGOS DINMICOS CON lNFORMAClN
..
'"
',
..:.;
o quiche para desayunar; la accin del receptor es decidir si batirse en

duelo o no con el emisor. Las caractersticas cualitativas de las ganancias
son que el tipo cobardica preferira tomar quiche para desayunar, el malas
pulgas preferira cerveza, ambos preferiran no tener que batirse con el
emisor (y esto les importa ms que sus desayunos), y el receptor preferira
batirse con el cobardica antes que con el malas pulgas. (Por lo tanto,
utilizando la terminologa ms convencional para los tipos, mensajes; y
acciones, este juego podra ser un modelo de barreras de entrada, como
el de Milgrom y Roberts [1982].) En la representacin en fomaeextensiva
de la figura 4.4.3, la ganancia por desayunar lo que se prefiere es 1 para
ambos tipos del emisor, la ganancia adicional potevitar un duelo. es.de 2
para los dos tipos, Y las ganancias del receptor por, batirse en duelo con
el cobardica o con el malas pulgas son 1 o -1 respectivamente;. todas las
dems ganancias son cero.
En este juego, [(qui~he, quiche), (no~duel65, p''; ,9;q] es unequilibri
bayesiano perfecto de agrupacin para q 2: 1tt~~d.ms, este equilibrio
satisface elrequisit05de sealizacin,yaqu, J~~lhYet~no estdominad~
para ningiln tipo del emisor. En particular, nad' gr'ahtiza que el cobardica
vaya a estar mejor por tomar quiche (una ganancia de 1 en el peor de los
casos) que portorriar cerveza (una ganariciade 2 en el mejor de los casos).
Por otra parte, la conjeturadel receptor fuera de lltraye~toria de equilibrio
parece sospechosa: si el receptor obserVa:inesp~}~dn;\ente que el emisor
elige cerveza, concluye que es al menos tan prbable 'Itieel em~sor sea
cobardica como que sea malas pulgas (es decir, q 2:1/2), aun cuando (a)
el cobar~icano puede mejorar de ninguna manenl su ganancia de 3 en
equilibrio tomando cerveza en vez de quiche, mientras que (b) el malas
pulgas podra mjorar su ganancia de 2 en equilibrio y recibir una ganancia
de 3 si el receptor mantuviera la conjetura de que q < 1/2. Dados (a) y
(b), cabra esperar que el malas pulgas escogiera cerveza y pronunciara el
siguiente discurso:
Verme escoger cerveza debera convencerte de que soy del
tipo malas pulgas: escoger cerveza no podri'a de ninguna
manera haber mejorado la ganancia del tipo cobardica, por
(a); y si escoger cerveza te convenciera de que soy del tipo
.malas pulgas, e~tonces hacerlo mejorara mi ganancia, por
(b).
Refinamientos
INCOMPLETA Ce. 4)
del equilibrio
bayesimlO perjec/o
/ 24:1
Si este discurso fuera credo, establecera que q = 0, lo que es incompatible con este equilibrio bayesiano perfecto de agrupacin.
Podemos ahora generalizar este argumento a la clase de juegos de
sealizacin definida en la seccin 4.2.A; con ello obtenemos el requisito
6 de sealizacin.
Definicin. Dado un equilibrio bayesiano perfecto en un juego de serlalizacil1,
el mensaje mj est dominado en equilibrio para el tipo ti de T si la gl7J1I1ncia
en equilibrio de t que denotamos mediante U'(t;), es ms alta que la mayor
ganancia posible para ti por utilizar 7)Ij:
Requisito 6 de sealizacin. ("El criterio intuitivo", Cho y Kreps 198'7):

Si el conjunto de informacin que sigue a mj est fuera de la trayectoria de
equilibrio y mj est dominado en equilibrio para el tipo t entonces (si es lJOsilJle)
la conjetura del receptor IJ,(ti 1m) debera asignar probabilidad cero al tipa 1:;.
(Esto es posible siempre que mj no est dominado eH equilibrio para torios los
tipos de T.)
Cerveza y quiche muestra que un mensaje mj puede estar dominado en
equilibrio para ti sin estar dominado para t;. Sin embargo, si mj est dominado para t mj debe estar dominado en equilibrio para t por lo que
imponer el requisito 6 de sealizacin hace que el requisito 5 sea redundante. Cho y Kreps utilizan un resultado ms poderoso debido a Kohlberg
y Mertens(1986) para demostrar que cualqier juego desealizacin de
la dase definida en la seccin 4.2.A tiene un equilibrio bayesiano perfeetcJ
que satisface el requisito 6 de sealizacin. Se dice a veces que los argumentos de este tipo utilizan la induccin hacia delante, porque al interpretar
una desviacin (esto es, al formarse la conjetura p,(t; mj el receptor se pregunta si el comportamiento pasado del emisor podra haber sido racional,
mientras que en induccin hacia atrs se supone que el comportamiento
futuro ser racional,
Para ilustrar sobre el requisito 6 de sealizaCin, lo aplicamos al caso
con envidia del modelo de sealizacin en el mercado de trabajo, analizado
en la seccin 4.2.B.
Recordemos que existe una enorme cantidad de equilibrios bayesianos perfectos de agrupacin, de separacin e luoridos en este modelo.
Sorprendentemente, uno de estos equilibrios es consistente con el recui-
.~,
/
,
~-'
(,,1
2,1-1 / JUEGOS DINMICOS CON INFORMACIN
Refinamientos
INCOMPLETA (c. 4)
sito 6 de sealizacin, el equilibrio de separacin en el cual el trabajador

con baja capacidad escoge el nivel de educacin de informacin completa
y el trabajador con capacidad alta escoge la educacin mnima necesaria para hacer que el trabajador con capacidad baja sea indiferente entre
imitarle o no, como ilustra la figura 4.4.4.
1,
(A,e)
y(A, e,)----.-.-----
~Y(Bre)
w*(B)
e*(B)
e.
Figura 4.4.4
En cualquier equilibrio bayesiano, si el trabajador escoge un nivel de

educacin e y las empresas creen en consecuencia que la probabilidad de
que el trabajador tenga capacidad alta es .t(Ale), el salario del trabajador
ser
w(e) = .t(Ale) . y(A,e)
+ [1 -
J.l(Ale)] . y(B,e).
Por lo tanto, la utilidad para el trabajador con capacidad baja al escoger e'(B) es corno mnimo yfB,e*(B)]
- c[B,e*(B),
que es mayor que su
utilidad al escoger cualquier e > e., independientemente de lo que la
empresa crea despus de observar e. Es decir, en trminos del requisito 5
de sealizacin, cualquier nivel de educacin e > es estdom:inado para
el tipo de capacidad baja_ Utilizando lID lenguaje informal, el requisito 5
de sealizacin implica que la conjehlra de la empresa debe ser .t(Ale) = 1
para e > e., lo que a su vez implica que un equilibrio de separacin en el
del eqllilibrio bayesial10 perfecto / 245
cual el trabajador con capacidad alta escoge un nivel de educacin e> es

no puede satisfacer el requisito 5 de sealizacin, ya que en tal equilibrio
las empresas deben creer que J.l(Ale) < 1 para niveles de educacin entre
es y e. (Un enunciado preciso es: el requisito 5 de sealizacin implica
que J.l(Ale) = 1 para e > es siempre que e no est dominado para el tipo
con capacidad alta, pero si existe un equilibrio de separacin en el que el
trabajador con capacidad alta escoge un nivel de educacin e > es entonces los niveles de educacin entre es y e no estn dominados para el tipo
con capacidad alta, de forma que el argumento es vlido.) Por lo tanto, el
nico equilibrio de separacin que satisface el requisito 5 de sealizacin
es el equilibrio que se muestra en la figura 4.4.4.
Una segunda conclusin se deriva tambin de este argumento: en
cualquier equilibrio que satisfaga el requisito 5 de sealizacin, la utilidad
del trabajador con capacidad alta debe ser como mnimo y(A,es) - c(A,e.).
A continuacin demostramos que esta <;onclusinsignifica que algunos
equilibrios lubridos y de agrupacin no- pueden satisfacer el requisito 5
de sealizacin_ Existen dos casos, dependiendo de si la probabilidad de
que el trabajador tenga capacidad alta (q) es lo suficientemente baja para
que la funcin de salario w = q . y(A,e) + (1- q) . y(B,e) est por debajo de
la curva de indiferencia del trabajador con alta capacidad que pasa por el
punto [e.,y(A,es)]'
Suponemos en primer l,ugar que q es baja, como se muestra en la figura
4.4.5. En este caso, :ningn equilibrio de agrupacin satisface el requisito 5
de sealizacin, porque el trabajador con capacidad alta no puede alcanzar
la ~tilidad y(A,es) - c(A,es) en este equilibrio. Del mismo modo, ningn
eq~ilibrio lubrido en el que el trabajador con capacidadalta se comporte
aleat9riaIl1ente ?,tisface el requisito 5 de sealizacin, porque el punto
(educacin, salario) en el que hay agrupacin en este equilibrio est por
debajo de la funcin de salario w = q. y(A,e) + (1 - q). y(B,e). Finalmente,
:ningn equilibrio lubrido en el cual el trabajador con capacidad baja se
comporte aleatoriamente satisface el requisito 5 de sealizacin, porque
el punto (educacin! salario) en el que hay agrupacin en este equilibrio
debe estar en la curva de indiferencia del trabajador con capacidad baja
que pasa por el punto [e*(B),w*(B)],
como en la figura 4.2.9, y est por
tanto por debajo de la curva de indiferencia del trabajador con capacidad
alta que pasa por el punto[es;y(A,es)]'
Por lo tanto, en el caso de la figura
4.4.5, el nico equilibrio bayesiano perfecto que satisface el requisito 6 de
sealizacin es el equilibrio de separacin que muestra la figura 4.4.4.
,','
1,'.
;;',
246 / JUEGOS DlNMICOS CON INFORMACIN
Re!ill11111ielllos
INCOMPLETA (e. 4)
qy
(A,e,)
parcelo / 247
bayesiallo
(A,e)
del equilibrio
(A,e)
(B,e)
si e' < e < e", el requisito 6 de sealizacin implica que la conjetura de

la empresa debe ser L(Ale) = 1, lo que a su vez significa que el equilibrio
de agrupacin indicado no puede satisfacer el requisito 6 de sea lizacin,
ya que en tal equilibrio las empresas deben creer que L(Ale) < 1 para las
elecciones de educacin entre e' ye". Este argumento puede repetirse par8
todos los equilibrios de agrupacin e hbridos en la regin sombreada de
la figura, por lo que el nico equilibrio bayesiano perfecto que satisface el
requisito 6 de sealizacin es el equilibrio de separacin mostrado en la
figura 4.4.4.
y
w*(B)
(A,e)
e,
e*(B)
e '
qy
y (A ,e, )
(A,e)
Figura 4.4.5
Suponemos ahora que q es alta, como se indica en la gura 4.4.6. Como

antes, los equilibrios hbridos en los que el tipO ~on capacidad baja se comporta aleatoriamente no pueden satisfacer el requisito 5 de sealizacin,
pero ahora los equilibrios de agrupacin y eqtiilibris lubri<losen los que
el tipo con capacidad alta se orripOrta aleatoriamente pueden satisfacer
este requisito si la agrupiiie da en un ptirito (educacin, salario) de la
regin sombreada de la figura. Sin embargo, estos equilibrios no pueden
satisfacer el requisito 6 de sealizacin.
Consideremos el equilibrio de agrupacin en ea mostrado en la figura
4.4.7. Las elecciones de nivel de educacin e > e' estn dominadas en equilibrio para el tipo con baja capacidad porque incluso el salario ms alto
que podra pagarse a un trabajador con educacin e, concretamente y(A,e),
da un punto (educacin, salario) por debajo de la curva de indiferencia del
trabajador con baja capacidad que pasa por el punto de equilibrio (ea,11Ja).
Las elecciones de nivel de educacin entre e' y e" no estn dominadas en
equilibrio pa~a el tipo con capacidad alta. Sin embargo, si esta eleccin
convence a las empresas de queel trabajador tiene capacidad alta, stas
ofrecern el salariO y(A,e), lo que har que el trabajador con capacidad
alta est mejor que en el equilibrio de agrupacin indicado. Por lo tanto,
y U3,e)
w*(B)
e,
e*(B)
Figura 4.4.6
24j /
J llEGOS
Ejercicios / 249
INCOMPLETA (c. 4)
(A,e)
qy
(A,e)
nes" se dan frecuentemente y que su modelo puede explicar muchos de

los datos empricos sobre huelgas. Sobre reputacin, vase la "teora de
la credibilidad" de Sobel (1985), en la cual una parte informada puede ser
un "amigo" o un "enemigo" de un agente decisor desinformado en una
sucesin de juegos con parloteo. Finalmente, vase Cho y Sobel (1990)
para ms informacin sobre refinamientos en los juegos de sealizacin,
incluyendo un refinamiento que selecciona el equilibrio de separacin
eficiente del modelo de Spence cuando hay ms de dos tipos.
(B,e)
4.6 Ejercicios
4.1 En los siguientes juegos en forma extensiva, dervese el juego en forma
normal y hllense todos los equilibrios de Nash con estrategias puras, los
perfectos en subjuegos y los bayesianos perfectos.
e* (L)
ep
e'
e"
e,
e
,-.. .-;:"
a.
D
Figura 4.4.7
2
2
4.5 Lecturas
adicionales
MilgTOny Roberts (1982) ofrecen una aplicacin clsica de los juegos de

sealizacin en temas de organizacin industrial. En economa financiera,
Bhaltacharya (1979)y Leland y Pyle (1977) analizan la poltica de dividendos y de propiedad empresarial (respectivamente) utilizando modelos de
sealizacin. Sobre poltica monetaria, Rogoff (1989) pasa revista a los
juegos repelidos, los de sealizacin y los modelos de reputacin, y Ball
(1990) utiliza cambios (inobservables) en el tipo de la autoridad monetaria
para explicar la trayectoria temporal de la inflacin. Para aplicaciones de
juegos con parloteo, vanse los trabajos de Austen-Smith (1990), Farrell
y Gibbons (1991), Matthews (1989), y Stein (1989) descritos en el texto.
Kennan y Wilson (1992) examinan la literatura sobre los modelos tericos
y empricos de negociacin bajo informacin asimtrica, subrayando sus
aplicaciones a huelgas y pleitos. Cramton y Tracy (1992) permiten que
un sindicato escoja entre ir a la huelga y continuar trabajando al salario
vigente; muestran que, de acuerdo con los datos, estas "ltimas sihlacio-
4
1
O
1
3
O
b.
D
2
4
1
3
1
2
4
O
4
O
3
3
.-;,":
",:.,
Ejercicios / 251
250 / JUEGOS DlNMfCOS CON INFORMACIN lNCOMPLETA (c. 4)
".,'
1")
4.2 Demustrese que no existe ningn equilibrio bayesiano perfecto con

estrategias puras en el siguiente juego en forma extensiva. Cul es el
equilibrio bayesiano perfecto con estrategias mixtas?
(1/3)
1,0
: b
Receptor
1,1
2,1
, a
a
1
1,
(1/3)
, "
,."','.
'~4':.'
0,0
,
,
Receptor
2
2
<0'
b
1,0
0,0
O
1
3
O
\$.
k'
;t
Receptor
Receptor
4.3 a. Descnbase un equilibrio bayesiano perfecto de agrupci6n en el que

los dos tipos del emisor juegan D en el siguiente juego de sealizacin.
Azar
1,
(1/3)
a
1
0,5
4.4 Descnbanse todos los equilibrios bayesianos perfectos de agrupacin y

de separacin con estrategias puras de los siguientes juegos de sealizacin.
1,
3,0
2,0
a.
2,2
1,1
a
1
Receptor
Azar
Receptor
1,
0,5
O,n
2,0
Receptor
Azar
Receptor
t,
1,0
0,5
1
3,1
2,1
0,0
0,1
1,2
0,0
0,0
2,2
b. El siguiente juego de sealizacin con tres tipos empieza con una

jugada del azar, que no aparece' en el rbol y que determina uno de los tres
tipos con igual probabilidad. Descnbase un equilibrio bayesiano perfecto
de agrupacin en el que los tres tipos del emisor juegan J.
0,0
1
0,1
0,5
t,
.1,0
1,1
252 /
b,
J UECOS I)IN,vllCOS
30)
0,0
a
O
IJ
0,5
1,1
4,1
3,3.
0,5
Receptor
Azar
Receptor
0,1
Ejercicios / 253
CON INFORMACiN INCOMPLETA (e. 4)
1,
1,2
4.7 Dibjense las curvas de indiferencia y las funciones de produccin

para un modelo de sealizacin en el mercado de trabajo con dos tipos.
Descrbase un equilibrio bayesiano perfecto hfbrido en el cual el trabajador
con capacidad alta se comporta aleatoriamente.
4.8 Hllese el equilibrio bayesiano perfecto con estrategias puras en el
siguiente juego con parloteo. Cada tipo tiene la misma posibilidad de ser
escogido por el azar. Como en la figura 4.3.1, la primera ganancia de cada
casilla es la del emisor, y la segunda la del receptor, pero la figura no es
un juego en forma normal, sino que simplemente expresa las ganancias
de los jugadores para cada par tipo-accin.
\:,.'
\.
'.
'.
b
2,0
4.5 Hllense todos los equilibrios bayesianos perfectos con estrategias

puras del ejercicio 4.3 (a) y (b).
4.6 El siguiente juego de sealizacin es anlogo al juego dinmico con
infon11acin completa pero imperfecta de la figura 4.1.1. (Los tipos t y
t2 son anlogos a las jugadas 1 y e del jugador 1 en la figura 4.1.1; si
el emisor escoge D en el juego de sealizacin, el juego se acaba, igual
que cuando el jugador 1 escoge D en la figura 4.1.1.) Hllense (i) los
equilibrios bayesianos de Nash con estrategias puras y (ti) los equilibrios
bayesianos perfectos con estrategias puras de este juego de sealizacin.
Relacinense (i) con el equilibrio de Nash y (ii) con el equilibrio bayesiano
perfecto de la figura 4.1.1.
',',
0,1 0,0 0,0

1,0 1,2 1,0
0,0 0,0 2,1
4.9 Considrese el ejemplo del modelo con parloteo de Crawford y?obeI

discutido en la seccin 4.3.A: el tipo del emisor se distribuye uniforri1e~
mente entre cero y uno (formalmente, T = [0,1] Yp(t) = 1 paratodo ten T);
el espacio de acciones es el intervalo de cero uno (A = [0;1]); la furicin
de ganancias del receptor es UR (t,a) = - (a - t)2, Yla funcin de ganancias
del emisor es UE(t,a) = -[a - (t + b)]2. Para qu v<ilresdb xste:un
equilibrio de tres escalones? Es la ganancia esperada/del recepto~;mr
alta en un equilibrio de tres escalones que en uno de dos escalnes?'QUe
tipos del emisor estn mejor en un equilibrio de tres escalones que' eIi"t.mo
de dos escalones?
4.10 Dos socios deben disolver su sociedad.
El socio 1 posee una participacin s en la sociedad, el socio 2 posee 1 - s.' Los socios estn de
acuerdo en jugar el siguiente juego: el socio 1 anuncia un precio para la
sociedad, p, y el soci02 escoge entonces si comprar la participacin de 1
por ps o vender la suya por pO - s). Supongamos que es informacin del
dominio pblico que las valoraciones de los socios de ser propietarios d
toda la sociedad son independientes y se distribuyen uniformemente en.
[0,1], pero que la valoracin deeada socio es informacin privada. Cul
es el equilibrio bayesiano perfecto?
.'
I\'.~J
Ejercicius / 255
254/
INCOMPLETA (e. 4)
4.11 Un comprador y un vendedor tienen valoraciones 'Ve y Vv respectivamente, Es informa,cin del dominio pblico que el intercambio es
rentable (es decir, que Ve > vv), pero la magnitud de esta rentabilidad es
informacin privada de la siguiente manera: la valoracin del vendedor se
distribuye uniformemente en [0,1];la valoracin del comprador Ve = k '1)",
donde k > 1 es informacin del dominio pblico; el vendedor conoce Vv
(y por tanto ve) pero el comprador no conoce Ve (o vv)' Supongamos que
el comprador realiza una nica oferta p que el vendedor acepta o rechaza.
Cul es el equilibrio bayesiano perfecto cuando k < 2? Ycuando k> 2?
(Vase Samuelson 1984.)
del sindicato, cuando los beneficios de la empresa estn uniformemenle

distribuidos entre cero y 1r*,es V(7r') = d7r', Demustrese que b = 2d,
c= 1/[1 +~]
yqued= [~(1- 6)/25.
4.13 Una empresa y un sindicato juegan el siguiente juego de la negociacin con dos periodos. Es informacin del dominio pblico que el
beneficio de la empresa, 1r,est uniformemente distribuido entre cero y
uno, que el salario de reserva del sindicato es 1JJr y que slo la empresa
conoce el verdadero valor de 1r. Supongamos que O < Wr < 1/2. Hllese
el equilibrio bayesiano perfecto del siguiente juego:
1. Al comienzo del primer periodo, el sindicato realiza una oferta salarial
..
,,)
4.12 Este problema considera la versin con horizonte infinito del juego
de la negociacin con dos periodos analizado en la seccin 4.3.B. Como
antes, la empresa tieneinformacin privada sobre sus beneficios' (1r),que
estn uniformemente distribuidos en [O,1ro],
y elsindicafo realiza todas las
ofertas salariales y tiene un s~Jariode. rese~.va JJr ":::O. ,l
En el juego candas periodos, la ~npre~Kacepta la, primera oferta del
sindicato (Wl) si 1r'> 71'1,donde el tipo con:beneficlos,.1rl es indiferente
entre (i) aceptar Wl y (ii) rechazar Wl pero aceptar la oferta del sindicato en
el segundo. periodo (W2), y W2 es la oferta ptima del sindicato dado que
los bem~ficiosde la empresa estn uniformemente distribuidos en [O,1rl]
y que slo queda un periodo de negociacin. En cambio, en el juego
con horizonte infinito, W2 ser la oferta ptima del sindicato 4ado que el
beneficio deja emprsaest uniformemente distribuido en [O,1rl]y que
queda un n~er6infi.nito,de periodos de negociacin (potencial). Aunque
el tipo con beneficlos 1rlserotra vezndiferente entre las opciones (i) y
(ii), el cambio en W2 harq~e cambie el vlor de 1rl.
El juego de continuacin que empieza en el segundo periodo del
juego de horizonte infinito es una versin a escala del juego completo:
existe un nmero infinito de periodos de negociacin (potencial), y los
beneficios de la empresa estn otra vez uniformemente distribuidos entre
Oy una cota superior; la nica diferencia es que la cota superior es ahora
1rl en lugar de1ro. Sobel y Takahashi (1983)demuestran que el juego
con horizonte infinito tiene un equilibrio bayesiano perfecto estacionario.
En este equilibrio, si los beneficios de la empresa estn uniformemente
distribuidos entre Oy 1r*,elsindicato realiza una oferta salarial w(7r*) = b1r*,
por lo que la:primera oferta es b1ro, la segunda b1rl' etc. Si el sindicato utiliza
esta estrategia estacionaria, la mejor respuesta de la empresa proporciona
1rl = C7ro,7r2= C7rl,etc., y el valor presente esperado de las ganancias
a la empresa, Wl'
2. La empresa o acepta o rechaza 1JJI' Si acepta, hay produccin en
los dos periodos, por lo que las ganancias son 2WIpara el sindicalo
y 2(1r- Wl) para la empresa. (No hay descuento.) Si la empresa no
acepta 1))1,no hay produccin en el primer periodo, y las ganancias del
primer periodo son cero tanto para la empresa como para el sindicato,
3. Al comienzo del segundo periodo (suponiendo que la empresa rechaz Wl) la empresa realiza una oferta salarial al sindicato, W2. (Al
contrario que en el modelo de Sobel y Takahashi, el sindica to no realiza
la oferta.)
4. El sindicato o acepta o rechaza W2. Si lo acepta hay produccin en
el segundo periodo, con lo que las ganancias del segun<:ioperiodo (y
totales) son W2 para el sindicato y 7r- W2 para la empresa. (Recordemos
que las ganancias del primer periodo fueron cero.) Si el sindicato
rechaza W2 no hay produccin, por lo que el sindicato gana un salario
alternativo Wr en el segundo periodo y la empresa cierra y gana cero.
4.14 Nalebuff (1987) analiza el siguiente modelo de la negociacin previo
a un posible pleito entre un demandante y un demandado. Si el caso
va a juicio, el demandado se ver obligado a pagar al demandante una
cantidad d por daos. Es informacin del dominio pblico que d est
uniformemente distribuida en [0,1] y que slo el demandado conoce el
verdadero valor de d. Ir a juicio le cuesta al demandante C < 1';2, pero
(por simplicidad) no le cuesta nada al demandado.
El desarrollo temporal es el siguiente: (1) El demandante propone
un acuerdo, s. (2) El demandado o acepta el acuerdo (en cuyo caso la
ganancia del demandante es s y la del demandado es -s) o lo rechaza. (3)
<.256 / JUECOS DlNivllCOS CON lNFORivlAClN
INCOMPLETA (e. 4)
Si el demandado rechaza 8, el demandante decide si ir a juicio, donde la

ganancia del demandante ser d - e y la del demandado -d, o retirar los
cargos, en cuyo caso la ganania cie ambos jugadores es cero.
En la etapa (3) si el demandante cree que existe una d* tal que el
demandad o aceptara el acuerdo si y slo si d > d*, cul es la decisin
ptima del demandante con respecto al pleito? En la etapa 2, dada la
propuesta de acuerdo 8, si el demandado cree que la probabilidad de que
el demandante vaya a juicio si 8 es rechazada es p, cul es la decisin
ptima para llegar a un acuerdo por parte del demandado de tipo d?
Dada una oferta s > 2c, cul es el equilibrio bayesiano perfecto del juego
de continuacin que comienza en la etapa 2? Y dada una oferta s < 2c?
Cul es el equilibrio bayesiano perfecto del juego eompleto si e < J /3?
Y si 1/3 < e < 1/2?
4.15 Consideremos un proceso legislativo en el que las decisiones factibles
varan continuamente desde p = Ohasta p = 1. La decisin ideal desde el
punto de vista del Congreso es e; pero el status quoes s, _dondeO < e < s <
1; es decir, la decisi;' ideal est a la izquierda del status quo. La deci;in
ideal para el Presidente es ti que se distribuye uniformemente en [O,llpero
es informacin privada del Presidente. El desarrollo temporal es simple:
el Congreso propone tma decisin p, que el presidente puede -ratificar
o vetar. Si p es ratificada las ganancias son -(e - p)2 para el congreso
y -(t - p)2 para el Presidente; si es vetada las ganancias son -(c - s)2
y ~(t - sf. Cul es el equilibrio bayesiano perfecto? Veriliquese que
e < ji < s en equilibrio.
Supongamos ahora que el Presidente puede comunicarse (en el sentido
de enviar un mensaje del tipo que hemos llamado de parloteo).antes de
que el Congreso proponga una decisin. Consideremos un equilibrio
bayesiano perfecto de dos escalones en el que el Congreso propone PB o
P.-I, dependiendo del mensaje que el Presidente enve. Demustrese que tal
equilibrio no puede tener e < pa < PA < s. Explquese por qu se deduce
que no puede haber equilibrios que incluyan tres o ms propuestas por
parte del Congreso. Dervense los detalles del equilibrio de d(?sescalones
en el que e = PB < PA < s: qu tipos envan qu mensajes?, y cul es el
valor de PA.? (Vase Matthews, 1989.)_
4.16 Considrese los equilibrios de agrupacin descritos en el ejercicio 4.3
(a) y (b). Para cada equilibrio: (1)determnese si el equilibrio p~ecie ser
sustentado por conjeturas que satisfagan el requisito 5 de sealizacin;
Referencias
/ 257
l
"'
..
(ii) determnese si el equilibrio puede ser sustentado por conjeturas que

satisfagan el requisito 6 de sealizacin (el criterio intuitivo).
4.7 Referencias
AUSTEN-SMITH,
D. 1990. "Information Transrnission in Debate." American
oumal
o/ Political
Science 34:124-52.
AxELROO,R. 1981. "The Emergence of Cooperation Among Egoists." American Political Science Review 75:306-18.
BALL!L. 1990. "Tune~Consistent Poliey and Persistent" Changes in lllfl~tion." National Bureau of13conornic Researeh Working Paper #3529
(December).
.
BARRO,R. 1986. "Reputation in a Model ofM~metary Policy with Incomplete Information." oumal o/ Monetary Economics 17:3-20.
BHAITACHARYA;
S. 1979. "Imperfect Information, Dividend Plicy: anc
the 'Bird in the Hand' Fallacy'" Bell oumal of Economics 10:259-70:
.. ,.. ~
CHO, J.-K., y D. KREPS.1987. "Signaling Carnes and Stable Equilibria."
-.'
'.'
'-:.
~
.
Quarterly oumal of Economics 102:179-222.
CHO, l.-K., y J. SoBEL.1990. "Strategie Stabilit}r and Uniqueness in Signaling Carnes." oumal o/ Economic Theory 50:381-413.
CRAMTON,
E, y J. TRAcy. 1992. "Strikes and Holdouts in Wage Bargainirg:
Theory and Data." American Economic Review 82:100-21.
.':
:-',.
'"
'i,;.
CRAWFORO,
v., y J. SOBEL. 1982. "Strategie Infornation Transrnission."
DYBVIG,
E, Y J. ZENOER.1991. "Capital Structure and Dividend Irrelevance
with Asymmetric Information." Review o/ Financial Stlldies 4:201-19.
FARRELL,
L y R. CIBBONS.1991. "Union Voice."Mimeo, Comell University.
FuDENBERG,D., Y J. TIROLE. 1991. "Perfeet Bayesian Equilibrium and
Sequential Equilibrium." oumal o/ Economic Theory 53:236-60.
HARSANYI,
J. 1967. "Carnes with Incornplete Information Played by Bayesian Players, Parts 1, n, and III." Management Science 14:159-82,320-34,
486-502.
RefercI1cil15
258 I JUEGOS DINMICOS CON INFORMACIN
I 259
INCOMPLETA (e. 4)
50BEL, J., Y 1. TAKAHASHI. 1983. "A mullistage

Review of Economic StLuties 50:411- 26.
KENNAN,J., y R. WILSON. 1992. "Bargaining with Priva te Information."

De prxima aparicin en Joumal of Economic Literature.
Model of Bargaining,"
SPENCE,A. M. 1973. "Job Market Signaling." Quarterly oumal of EcolllIlics

KOHLBERG,E., YJ.-F. MERTENS.1986. "On the 5trategic 5tability of Equili-
87:355-74.
bria." Econometrica. 54:1003-38.

1<REPS,D., Y R. WILSON. 1982. "5equential Equilibrium."
5PENCE,A. M. 197+. "Competitive and Optimal Responses to Signaling:

An Analysis of Efficiency and Distribution." Joumal of ECOllomic T11eory
Econometrica
50:863-94.
8:296-332.
1<REPS,
D., P. MILGROM,J. ROBERTS,y R. WILSON. 1982. "Rational Cooperation in the Finitely Repeated Prisioners' Dilernma." Joumal of Economic
Theory 27:245-52.
.
..,
STEIN,J. 1989. "Cheap Talk and the Fed: A Theory of 1mprecise Policy
Announcements." American Ecol1omic Review 79:32-42.
VICKERS,J. 1986. "Signalling in a Model of Monetary Policy with Incol1lplete Information." Oxford Economic Papers 38:443-55.
LELAND,H., y' [). PYLE.. 1977. "Ihf~rmatior\.~l Asymmetries, Financial

5tructure, and Financial intermedi~tin." Jouma/of Finance 32:371-87.;
MATIHEWS,S. 1989. "VetoTI1reats: Rhetoric in a Bargaining Game." Quarterly Joumal of Econoinics 104:347-69.
'
MILGROM,P.i Y J. ROBERTS.1982., "Limit Pricing and Entry under Incomplete Information: AnEquilibrium Analysis." Economeica40:443-59.
,
MINSER,J, 1974: E)chooling; Experience, and Eamings. New York: Coiumbia
University Press for the NBER.
.. .
.'.
MYERS,S., Y N. MAJLUF. 1984. "Corporate Financing and Investment
Decisions When Firms Have lnformation that Iilvestors Do Not Have;"
Joumal of Financial Economics 13:187-221.
.:-'.
NALEBUFF,B. 1987. "Credible Pretrial Negotiation." Rnnd Joumal of Econo~

mics 18;198-210.
NOLDEKE,G., Y E. VANDAMME. 1990. "5ignalling in a Dynamic Labour
Market." Review of Econ01nic 5tudies 57:1- 23.
ROGOFF,K. 1989. "Reputation, Coordination, and Monetary Policy." En
Modem Business Cycle Theory. R. Barro, ed. Cambridge: Harvard University Press.
5AMUELSON,
W.1984. "Bargaining Under Asyrnmetric Information." conometrica 52:995-1005.'
SOBEL,J. 1985. "A Theory of Credibility." Review of Economic 5tudies 52:557-
'
.,
INDICE ANALTICO
Abreu, D., 98, 104,106
Axelrod, R., 228

Ball, L., 130, 248
BaCon, 0.,169
Barro, R., 54, 112, 210
batalla de los sexos, la:
con informacin incompleta, 153-54
ejemplo de juego con mltiples
equilibrios de Nash, 11-12
ejemplo de equilibrio de Nash con
estrategias mixtas, 12116,40-45, 152
acuerdo, sobre ,mo jugar un juego

posibilidad d;q~e no haya acuerdo,
12n6,59
relacin con el equilibrio de Nash,
9,12
Admati, A., 132
agrupacin, equilibrio de, vase
agrupacin parcial, eq~ilibrio de;
bayesian~ perfecto,' equilibri~;
agrupacin estrategia de
agrupacin, estrategia de, 150~188
vase tambin bayesiano ~rfecto,
equilibrio; agrupacin, equilibrio de
agrupacin parcial, equilibrio de
en el juego de Crawford y Sobel, 28
juegos con parloteo~ 216'
vase tambin bayesiano perfecto,
equilibrio
Akerlo, G., 130
amenazas y promesas, credibilidad de
las, 53, 55, 85, 87, 126
aranceles, juego de los, 73-77
ejercido 2.9,134-35
arbitraje
convencional, 23
contenido informativo de las ofertas,
48
.~ .;-~
ofertas salariales de equilibrio de
Nash en oferta final, 23-27
rbol del juego, 56, 116-17,vase tambin
forma extensiva, juego en
Aumann, R., 7, 32n14, 35n15
Austen-Smith, D., 213, 248
.,'
'".'
batallas, estrategias mixtas en, 31
"\
bayesiano, juego, 143,vase tambin

informacin in-completa, juego con;
informacin incompleta
bayesiano de Nash,'equilibrio
compatibilidad de incentivos, 161 -.
definido, 148-52
ejercicios 3.1-3.8,1690172
ejercicio 4.6,.249
en el principo de revelacin, 165
en la batalla de los sexos con
informacin incompleta, 153-55
en subasta doble, 159
en subastas, 155
limitaciones del, 174
lineal, en subasta, 155-57
lineal, en subasta doble, 159-61
precio nico, en subasta doble, 160
relacin con el equilibrio bayesiano
perfecto, 175-76
simtrico, en subasta, 157-58, 166-67,
157n3,
":'.
NDICE
262 /
NDICE
AN,\J.TICO
/263
ANALT1CO
vase tambin bayesiano, juego;

informacin incompleta;
bayesiano perfecto, equilibrio
bayesiano dinmico, juego, vase
negociacin, juego de; comunicacin
previa, juego con; bayesiano
perfecto, equilibrio; reputacin;
sealizacin, juego de
bayesiano esttico, juego
ejercicios 3.1-3.8,169-172
mecanismo directo;165
representacin en forma normal de,
146-50
subasta, 155-57
subasta doble, 159-64
vase tambin bayesiano de Nash,
equilibrio; principio de revelacin
construccin informal del, 129
definicin del, 182
definicin del, en juegos con
parloteo, 215
definicin del, en juegos de
sealizacin, 190
ejercicios 4.1, 4.5, 4.6, 4.8, 4.10-4.15,
48,249,252,253,253-56
en el dilema de los presos repetido
finitamentecon informadn
asimtrica, 227-36
en juegos dinmicos con .
informacin completa pero
imperfecta, 177-85
en juegos dinmicos con
informacin incompleta, 175-76
en negociacin sucesiva con
informacin asimtrica, 221-27
refinamientos del, 236-48
vase tambi/l negociacin; juego de
la; conjeturas; parloteo, juegos con;
hbrido; equilibrio; agrupacin ..
parcial, equilibrio de; agrupacin,
equilibrio de; refinamiento;requisitos
1-4; separacin, equilibno de;
sucesivo, equilibrio; sealizacin,
juego de la; perfecto en subjuegos,
equilibrio de Nash
bayesiano perfecto hbrido, equilibrio

ejercicio 4.7, 253
en sealizacin en el mercado de
trabajo, 205-207
bayesiano perfecto con estrategias
mixtas, equilibrio
ejercicio 4.2, 250
bayesiano perfecto de agrupacin,
equilibrio
definicin de, en juegos de
sealizacin, 190
ejercicios 4.3, 4.4, 4.16,250, 251, 256
ejemplo de, 191
en juegos cOh p~r1oteo; 215~16
en un juego de sealizacin de
estructura de capital, 208-10
en un juego de sealizacin en
poltica inonetaria, 210
en sealizacin en el mercado de
trabajo, 189.~201
bayesiano perfecto de separacin,
equilibrio
definicin de~ en juegos de
sealizacin, 190
ejemplo de,192
ejercicio 4.4, 251
en juegos con parloteo, 217
en un juego de sealizacin
en el m~rcado de trabajo, 199-204
estructura de capital, 208
poltica monetaria, 211-12
Becker, G., 130
bisbol, estrategias mixtas en el, 30, 40
Benoit, J.-P., 130
Bertrand, J., 2, 15n1
Bertrand, equilibrio de, 60n4
Bertrand, juegode duopolio de, 21, 23;59
con informacin asimtrica: ejercicio
3.3,169-70
con productos homogneos: ejercicio
1.7,49
en juegos repetidos: ejercicios 2.13,
2.14,136
vease tambin duopolio, juego de
Bhattacharya, S., 130, 248

Brandenburger, A., 47
Brouwer, teorema de punto fijo de, 45
Buchanan, J., 131
Bulow, L 112, 130, 169
colusin
en el duopolio de Coumot
dinmico, 101-106
en modelos dinmicos de duopolio,
105-10.
vase tambin repetido, juego
compatibilidad de incentivos, 164-65
competencia internacional, 70
conjeturas.
en conjuntos de informacin con uno
y ms de un elemento, 179
en equilibrio bayesiano
perfecto,181,185
en juegos bayesianos estticos, 148
en refinamientos del equilibrio
bayesiano perfecto, 236-47
vase tambin informacin imperfecta;
informacin incompleta
conjunto deinformacin
con ms de un elemento,l22, 129,
176,178,189
definido, con ejemplos, 222-23
en la definicin deinformacin
imperfectar.121
en la definicin de informacin
perfecta, 121
vase tambin conjeturas; nodo de
decisin; trayectoria de equilibrio;
informacin imperfecta; informacin
incompleta
continuacin, juego de, 176, 235
ejercicios 4.12, 4.14, 254, 256
cooperacin
infinitainnte con informacin
asimtrica, 227-36
en el modelo de salarios de
eficiencia,l07-108
en juegos repetidos infinitamente,
89-90,101-102,228n6
en juegos repetidos finilamente con
informacin completa, 82-86
vase tambin repetido, juego
correlacionado, equilibrio, 35n 15
correspondencia de mejor respuest~
como funcin de mejor respuesl~,
42-43
definida, 36
de n jug~dores, 47
intersecciones de, 39, 41
representaciones grfic~s de, 35, 38,
42-44
Cournot, A., 2, 11
Coumot, juego de duopoli%ligopolio
de
con informacin asimtrica, 143,
144-146,147,151
con informacin complet~, 15-21,
59-62,75-76,145-146
ejercicio 3.2, 169
ejercicios 1.4-1.6, 48-49
ejercicio 2.15, 176
en juegos repetidos, 101-106
vase tambin juego de duopolio
Cournot, equilibrio de, 60n4
Cr~mton, P., 248
Crawford, V., 177, 214,253
credibilidad en los juegos dinmicos, 53
vase tambin amenazas y promesas
Criterio intuitivo, vase requisito 6 de
sealizacin
Chatterjee, K., 159

Cho, l.-K., 177, 241, 243, 249
lJ~sgupta, P. 48
decisin, teora de In, uni- frenle ~
multi-personal, 61
Deere, D., 169
Diamond, D., 54, 73
dilema de los presos, el
cooperacin en, 89-91, 227-236
equilibrio de Nash en, 10
;,.
26-1 / NDICE
estrategia dd disparador en, 90

estrategia del Talin en, 228
estrategias dominadas en, -1
ganancia de reserva en,81-82
repetido finilamente, 80-82
repdido finilamente con informacin
asimtrica, 227-36
repetido infinitamente, 87-90, 90.95
representacin
de, 120
en forma extensiva
representacin en forma normal de,

213
dilema del samaritano, 131
dinmico, juego
con informacin completa pero
imperfecta, 70, 120-121
con informacin completa y perfecta,
55
con informacin incompleta, 176

estrategia en, 91,117
vase tamu" induccin hacia atTs;
fDrma extensiva, juego en; bayesiano
perfcto, quilibrio; repetido juego;
perfCto en subjuegos, equilibrio de
Nash
disparad(r (/rigger), estrategia del, 90,
95,99, 103,106, vase tambin
repetido, juego
dmninada, estrategia, vase
estriclalllt.~nte donnada, estrategia
duopolio, juego de,vase Bertrand,
jUgn de duo polio de; Coumot, juego
de duopoli%ligopolio
de;
supervisin imperfecta, juegos con;
Stackelberg, juego de duopolio de;
variables de estado, juego con
Dybvig, 1'.5-1,73, 208
ejid'ls, el prublema de los, 27-28

elilninacin
NDICE
ANALTICO
iterativa de estrategias
estrictamente dominadas; 4-8, 13-15

en juegos de aligo polio de Coumot,
19.21
vase tamu" estrictamente

dominada, estrategia
equilibrio, vase bayesiano de Nash,

equilibrio; bayesiano perfecto,
equilibrio; de agrupacin, equilibrio;
de separacin, equilibrio; hlbrido,
equilibrio; lineal, equilibrio; Nash,
equilibrio de; perfecto en subjuegos,
equilibrio de Nash; agrupacin
parcial, equilibrio de
espado de estrategias
ejercicios 3.2,3.3,169
en equilibrio lineal, 155-56, 160
en el juego de duopolio de Bertrand,
21
"
en el juego de duo polio de
Coumot,15
en j~egos con informacin completa,
3
en juegos dinmicos con informacin
completa, 118
en juegos estticos con informacin
completa, 92
incompleta; 150-51
en subastas, 155
vase tambin forma extensiva, juego
en; forma normal, juego en
espacio de tipos
en el juego de Coumot cdn
infomlacin asinltrica, 147
en juegos bayesianos estticos, 147-48
en la batalla de los sexos con
informacin incompleta, 153
Espinosa, M., 67,129,137
esttico, juego
con informacin completa, 1-2
con informacin incompleta, 143
vase tambi" ba yesiano de
Nash, equilibrio; Nash, equilibrio de;
fonna normal, juego en; etapa, juego
de
estrategia, vase conjetura; el palo y la

zanahoria, estrategia de; equilibrio;
mixta, estrategia; pura, estrategia;
estrictamente dominada, estrategia;
disparador, estrategia de
estrictamente dominada, estrategia
definicin de, 5
vase tambin eliminacin iterativa de
estrategias estrictamente dominadas
etapa, juego de
con mltiples equilibrios de Nash,
82-87
de decisiones sucesivas, 109, 111
en el teorema de Friedman, 92
91-92
en juegos repetidos infinitamente
informacin completa, 82
86,
con
en juegosrep~tid()s io'!fulitan,ere con

informacin incomple,\a,;2,27
vase tambin repetido, ju~go
expectativas ..
en un juego repetido de poltica
monetaria, 112-115
vase tambin expectativas racionales
expectativas racionales, 3
ANALTICO
265 .
ejercicio 4.1,249
relacin con juegos en forma
extensiva, 118-19
transcripcin del enunciado informal
de un problema a un, 15-16,21-22,
153, 155
en
Friedrnan, L 15n1, 54, 96,101
Friedman, teorema de, 88
demostracin del, 97, 99-101
enunciado del, 96
frontera, de Pareto, 87 .
Fudenberg, D., 98, 181n3
funcin de mejor respuesta, 35-37,
como correspondencia de mejor
respuesta, 42-43
como estrategia, 125
en el juego de duopolio de Coumot,
17-21,39
en el juego delos aranceles,. 75
funciones de ganancias, en jue~s"
factor de pescuento, 66, 16n7
bayesianos estticos"146,1.49
completa, 4
efecto de valores bajos del, 99,

102-106,
93,
97
Farber, H., 2, 23
farol, en pquer, 30
Farrell, J., 86,120,213,248
Fenlndez,Fl,129
finito,juego: 34,45, 181n1. Vas~ tambin
repetido finita mente, juego
forma extensiva, juego en, 4, 115-117
ejercicios 2.21, 2.22, 138-39
relacin con la forma normal,119
vase tambin nodo de decisin;
conjunto de info,rmacin; forma
nomlal, juego en
forma normal, juego en:
definicin de, par,! ti!' juego con
informacin completa, 3, 4
definicin de, para un juego
esttico con informacin incompleta,
146-150
ejercicios 2.21,2.22, 138-39
ganancia factible, 95
ganancia medio, 96
ganancia de reserva,
97, 98,.
.
ganancias, informacin del dominio~"
pblico sob;e as, 117,143
".
."
determinados por estrategias, 2

esperados a partir de
estrategias mixtas, 36:
incertidumbre sobre los, 143, 146-147
vase tambin ganancia factible;
ganancia meclia; ganancia de reserva
Gibbons, El,48, 213, 248
Glazer, J., 129
Gordon, D., 54, 112
granada, juego de la
"
amenazas no crelbles en el, 53-54
como juego con informacin
completa y perfecta, 55
ejercicio 2.21, 138-39
,(;"
-266
NDICE ANALTICO
NDICE ANALTICO
vase tambin amenazas y promesas

Creen, E.,106
Hall, R., 159, 171

Hardin, C"V., 27
Harsanyi, J., 31, 148, 152, 176
Hart, O., 168
hfbrida, estrategia, 188
morida, equilibrio., vase bayesiana
perfecta, equilibrio.; hfbrida,
estrategia
hiptesis de racianalidad; en induccin
hacia atrs, 57-59
Hatelling, H., 50
Huizinga, H., 135
Hume, D., 2, 27
ignarancia de jugadas anteriares, izO-21

vase tambin infarmacin imperfecta
induccin hacia atrs
en equilibrio. bayesiana perfecta, 185
en equilibrio. de Nashperfecta en
subjuegas, 124, 129
en juegas dinmicas can infarmacin
campleta y perfecta, 56
en juegas dinmicas can infarmacin
incampleta, ejercicio. 3.8; 171-72
hiptesis subyacentes de, 57-59
vase tambin resultada par induccin
hacia atrs
induccin hacia adelante, 243
infarmacin
en teara de la decisin uni- frente a
multipersanal,61
vase tambin infarmacin asimtrica;
infarmacin campleta; infarmacin
imperfecta; infarmacin incampleta;
infarmacin perfecta; infarmacin
privada
infarmacin asimtrica
ejercicias 3.2, 3.3, 169
ejercicio. 4.12, 254
en el dilema de las presas repetida
finitamente,227,236
dudas sabre la racianalidad
en el madela de duapalia de
Caumat, 144-146
en el madela de negaciacin
sucesiva, :221-27
vase tambin infarmacin incampleta;
infarmacin privada
infarmacin campleta, 1, 143, vase
tambin informacin incampleta
informacin campleta y perfecta, juega
can, 55, vase tambin induccin hacia
atrs; repetida, juega; perfecta en ~
subjuegas, equilibrio. d Nash
infarmacin campleta.pero irriperfda,
juega can, 70, 120-121 .
en das etapas, 92, 117 .
vase tainbin infarmaan
impeTf~da; bayesiand prfeCta,
.equillbda; repetida, juega; perfecta
en subjuegas, eijilibria de Nash
infarmacin del daminio pblica, 7
en el juega de dopalia de Caumat
con informacin asimtrica, 144
en juegas can infrmati6n corhpleta
y perfcta; 11i, 143
sabre la racianalidad
de las
jugadares, 7, 56-59
sabre,las fvncianes de ganancias de
las juga49'res, 1
infarmacin il'iperfecta .
definida, 53
en el juega de las aranceles, 73-77
en el juego de las pnicas bancarias,
71-73
en el juega de tameo, 77-80
en juegas repetidas finitamente, 80'87
en juegas repetidas infinitamente,
87-105
juegas dinmicas con; 10
vase tambin infamacin completa
Kennan, J., 248

Klemperer, P., 169
K!vfRW (Kreps, Milgram, Raberts,
Wilsan) madela de, 229-34
152-55
en las juegas de sealizacin,
185-213,236-47
en un juega esttica, 146-150
vase tambin infarmacin asimtrica;
Kahlberg, E., 243

Kreps, D., 48, 115n117, 130, 177, 180,
bayesiana de Nash, equilibrid;

infarmacin campleta; infarmacin
imperfecta; bayesiana perfecta,
equilibrio.; infarmacin privada;
reputacin; principia de revelacin
infarmacin incampleta, juega can, 143,
176, vase tambin bayesiana, juega;
bayesiana de Nash, equilibrio.;
parlatea, juegas con; infarmacin
incampleta; bayesiana perfecta,
equilibrio.; sealizacin, juega de
infarmacin perfecta
definida, 53, 121
juega dinmico can, 54
vase tambin induccin hacia atrs;
dinmica can infarmacin campleta
y perfecta, juega; Infarmacin
imperfecta; perfecta en su bjuegas,
equilibrio. de Nash
infarmacin privada
diseando. juegas can, 164
ejercicias 3.6-3.8, 171
en subastas, 155-58
en subastas dables, 159-64
vase tambin infarmacin
asimtrica; bayesiana de Nash,
equilibrio.; infarmacin incompleta;
bayesiana perfecta, equilibrio.;
principia de revelacin
;.
Jacklin, C. 130
jugadares racianales, 4-7
perfecta en subjuegas, equilibrio. d

Nash
infarmacin incampleta
Kakutani, tearema de, 45, 47
53nl
en juegas can parla tea, 213-21
en la reinterpretacin del equilibrio.
de Nash can estrategias mixtas, 40,
pera imperfecta, juego can;

informacin incompleta; canjunta de
infarmacin; bayesiana perfecta,
equilibrio.; infarmacin perfecta/o
cama,
I 267
Kakutani, S., 45
228,241,243
KrisllOa, V., 130
Lazear, E., 54, 77,130,134,159,171

Leland, H., 248
Leontief, W., 54,55,62
McAfee, P., 169

McMillan, L 130, 169
Majluf, N., 177, 186,208
Maskin, E., 48, 86, 98, 130
matriz binaria, 3
Matthews, S., 213, 248
mecanismo. directa;-165
campatibilidad de incentivas, 165
decir la verdad en, 166-68
para subasta dable, 166
vase tambin principia de revelacin
mensaje daminada, vase requisita 5
de sealizacin
mensaje daminado en equilibrio,vase
requisita 6 de sealizacin
Mertens, J.-F., 243
Milgrom, P., 177, 228, 241,248
Mincer, J., 193 .
mixta, estrategia
definicin de, 32
ejercicjo 2.23, 139
ejercicio. 3.5, 170-71
ejercicio. 4.2,250
ejercicias 1.9-1.14, 50-51
reinterpretacin de, 40
vase tambin Nash, equilibrio. de;
Nash, tearema de; pura, estrategia;
estrategia
manedas, juega de las (matcJi/g pe,mies), 29
carrespandencia de mejar respuesta
2b:i
1 NDICE
NDICE
ANALTICO
en el, 35
equilibrio de Nash con estrategias
mixtas en el, 37-39
eSlra legias mixtas en el, 39
ganan.:ias esperadas en el, 33
siendo ms listo en el, 30
Mont;omery, J., 51
Myers, S., 177, 186,208
l'vIyerson, R., 163, 164, 166, 169
Nash, J., 2,11,45

Nash, equilibrio de
con amenazas o promesas
increbles, 53, 126-129
con estrategias mixtas, 10n4, 37-45
definicin de, con estrategias
mixtas, 37
definicin de, con estrategias puras, 8
ejemplos de, 9-10
ejercicio 2.21, 138-39
ejercicios 1.4-1.8,48-49
en el juego de arbitraje de oferta final,
23-26
en el juego de duopolio de.
Berlrand, 21
en el juego de duopolio de
Cmrnot, 16-19
en el juego de la moneda, 37-39
en el juego de los pnicos bancarios,
72-73
en juegos en dos etapas cen
informacin completa pero
imperfecta, 70-71, 72,74,76,78-79
en juegos repetidos en dos etapas, 81,
83-8~
90-91,99,102,109-111,114-15
existencia de, en juegos finitos, 33-45
fundamentacin del, 8-9
limitaciones del, 177
mlliples, 11,
relacin con eliminacin

iterativa de estrategias estrictamente
dominadas, 10-11, 12-15,19-21
vase tambi" bayesiano de Nash,
equilibrio; convenio; eliminacin
iterativa de estrategias estrictamente
dominadas; bayesiano perfecto,
equilibrio; perfecto en subjuegos,
equilibrio de Nash
Nash, teorema de, 33, 45, 124
demostracin del, 45-47
extensin del, 47
negociacin con horizonte finito, juego de
la
con informacin asimtrica, 221-27
ejercicio 2.19,138
ejercicios 4.10-4.14, 253-56
resultado por induccin hacia atrs
del,66-68
negociacin con horiionte infinito, juego
dela
ejercicios 2.3, 2.20, 131, 138
resultado por induccin hacia
atrs de Rubinstein, 68-69
negociacin de Rubinstein, juego de la,
54,55,66,88,117
ejercicios 2.3, 2.19, 2.20, 131, 138
nio mimado, teorema del, 130
nodo de decisin
en juegos en forma extensiva, 117,
119-21. Vase tambin conjeturas;
informacin imperfecta; conjunto de
informacin; nodo terminal
nodo terminal
en juegos en forma extensiva, 117
en subjuegos, 125n19
vase tambin nodo de decisin; forma
extensiva, juego en
Noldeke, G., 194
Osbome, M., 130
na existencia con estra tegias puras,

29
reinterpretacin con estrategias

mixtas, 40, 152-155
palo y la zanahoria, estrategia del, 105,

106
pnicos bancarios, juego de los, 70, 71-73

ejercicio 2.22, 139
parloteo, juego con (cheap-talk game),177,
213-21
desarrollo temporal de, 215
ejercicios 4.8,4.9,4.15,253,256
equilbrio de agrupacin parcial en,
213-21,
equilibrio bayesiano perfecto en, 177,
215
bayesiano perfecto, lC'luilibrio;
sealzacin, juego de.
Pearce, D., 321114,16.
penalizacin, 87
desencadenamiento
accidental de
una, 106
ms fuerte creble, 98, 104-105
vase tambin palo y la zanahoria,
estrategia del; supervisin
imperfecta, juego~~on; disparador,
estrategia pe!
.,
perfecto en subjuegos, equilibrio de
Nash, 57, 89:91, 99, 124-126
definicin de, 94;
ejercicios 2.10-2.13, 2.19-2.23,
135-36, 138-39
vase tambin induccin hacia atrs,
resultado por induccin hacia atrs;
Nash, equilibrio de; resultadoperfecto
en subjuegos; bayesiano perfecto,
equilibrio
Perry, M., 132
pquer, 30
Porter, R., 106
prediccin
en teora de juegos, 8, 9
equilibrio de Nash como, 7, 8
por induccin hacia atrs, 56-59
Prendergast, c., 133
principio de revelacin
en el diseo de subastas, 164-165;
enunciado.fomlal del, 166
vase tambin mecanismo directo,
compatibildad de incentivos;
informacin privada
ANALTICO
1269
probabilidad
de que se acabe un juego repetido, 90
distribucin, 24nll
en estrategias mixtas, 31
funcin de densidad, 23n10
vase tambin regla de Bayes conjetura
problema de teora de juegos, 4
punto fijo, teorema del, 45-47
pura, estrategia:
definicin de, 93, 117
ejercicio 2.18, 138
ejercicios 3.1, 3.3,169-70
en juegos bayesianos estticos, 151-52
en juegos de sealzacin, 188
completa, 93
en juegos repetidos con informacin
completa, 93
vase tambin estrategia; mixta,
"\
estrategia
Pyle, D., 248
racionaldad.sucesiva,
179.
refinamiento
del equilibrio bayesianoperfecto,
177,194,199,202,236,248
del equilibrio de Nash, 84
ejercicio 4.16, 256
regla de Bayes, 149112,180,204n6
renegociacin, 86-86, 11 ...
repetido finitamente, juego:
con informacin completa, 80-87
definicin, 82
dilema de los presos con iriformacin
incompleta, 227-36
renegociacin en un, 86-87
repetido infinitamente, juego: 87-101
definido, 92
estrategia del disparador en, 90
estrategia en, 93
ganancias en 95
subjuego en, 94
vase tambin ganancia media
cooperacin; colusin; factor de
descuento; ganancia factible;
.....
't.a
te::.
NDICE
270 /
';,
.L/
NDICE
tradicin orat teorema de; ganancia

de reserva; perfecto en subjuegos,
equilibrio de Nash; disparador,
estrategia del
representacin de un juego
representacin en forma
extensiva, 115-116
representacin en forma normat 34,
146-150
en; forma normal, juego en
reputacin
comparacin con el teorema
de tradicin oral, 228-30
finitamente, 227-36
vase tambin informacin incompleta;
repetido finitamente, juego; repetido
infinitamente, juego
requisito 5 de sealizacin (para
refinamiento del equilibrio bayesiano
perfecto), 240, 243, 245-46
ejercicio 4.16, 256
requisito 5, para refinamiento del
equilibrio bayesiano perfecto, 239
requisito 6 de sealizacin (para
refinamiento del equilibrio ba yesiano
perfecto), 243-44, 246-47
ejercicio 4.16,256
requisitos 1, 2R, 2E,3 de sealizacin
(para equilibrio bayesiano perfecto
en juegos de sealizacin), 188-90,
237n6
aplicaciones de, 196, 198-99, 201-204
requisitos 1-4, para equilibrio bayesiano
perfecto, 178-85, 188-90, 199, 225-26,
236
resultado, comparado con equilibrio, 126
vase tambin resultado por induccin
hacia atrs; resultado perfecto en
subjuegos
resultado perfecto en subjuegos
ejercicios 2.6-2.9, 133-134
en el juego de etapa de poltica
monetaria, 113
~.)
ANM.II(,()
/2'71
ANALTICO
en el juego de los pnicos bancarios, 72

en el juego de los aranceles, 76
en el juego de salarios de eficiencia, 108
completa pero imperfecta, 71
en juegos repetidos en dos etapas, 82,
83-84
relacin con el equilibrio de Nash
perfecto en subjuegos, 126-127
vase tambin resultado por
induccin hacia atrs; perfecto en
subjuegos, equilibrio de Nash
resultado por induccin hacia atrs, 54
ejercicios 2.1-2.5, 130-132
en el juego de duopolio de
Stackelberg, 60
en el juego de negociacin con tres
periodos, 67
en el juego de salarios y nivel de
empleo,.65
en juegos de etapa, 83n 113
en juegos de negociacin con
horizonte infinito, 68-69
perfecta y completa, 56
vase tambin equilibrio de Nash
pi-fecto en subjuegos
Rhee, c., 65, 129, 137
Roberts, L 177, 228, 241, 248
Rogoff, K, 112, 130, 248
Rosen, S., 54, 77, 130
Rotemberg, J., 106, 136
Rubinstein, A., 130
Rubinstein, juego de negociacin de la,
54,55,66,88,117
ejercicios 2.3, 2.19, 2.20, 131, 138
salarios de eficiencia, juego de los,

106-112
ejercicio 2.17, 136
salarios y nivel de empleo en una
empresa con fuente implantacin
sindical, 62
con muchas empresas, ejercicio 2.7,
133-34
en un juego repetido, ejercicio 2.16,

137
Saloner, G., 106, 136
Samuelson, W., 159,254
Sappington, D., 169
Satterthwaite, M., 163
Scheinkman J., 48
secuencial, equilibrio, 181n1, vase
tambin bayesiano perfecto, equilibrio
Selten, R, 94,124
sealizacin, juegos de: 176-77, 181
definicin de, 185-92
ejercicios 4.3-4.7, 250-53
juego de estructura de capital,
207-210
juego de mercado de trabajo, 192-207
juego de poltica monetaria, 210-213
refinamientos del equilibrio
bayesiano perfecto en, 239-248
comunicacin previa, juego con;
separacin, equilibrio de, vase
Shaked, A., 68
Shapiro, c., 54, 107
Sobet J., 66, 177, 214, 222, 248, 249, 253
Spence, A.M., 177, 186, 192, 193-95
Stacchetti, E. 106
Stackelberg, H. van, 15nl
Stackelberg, equilibrio de, 60, 61n4
Stackelberg, juego de duopolio de, 54,
55,59-62,117
ejercicio 2.6, 133
vase tambin duopolio, juego de
Staiger, D., 129
Stein, L 213, 248
Stiglitz, J., 54,107
subasta
de sobre cerrado, 155-159
doble, 159-164
reinterpretacin en el mercado de
trabajo: ejercicio 3.8,171-72
subjuego
definicin en juegos en forma
extensiva, 123-24
definicin en juegos repetidos finita e
infinitamente, 93
en el dilema de los presos rel,elicio
infinitamente, 94
en el duopolio de Cournot repetid"
infinitamente, 105
en el juego de poltica mone!"ria, n5
en el modelo de salarios de eficiencia,
111
en el teorema de tradicin oral, 101

vase tambin induccin hacia atd,
continuacin, juego de; perfecto en
supervisin imperfecta, juegos can,
105-106,106-112
Sutton,
J., 68
Takahashi, L, 66, 177, 222, 254

Talin (Tit Jor Tat), estrategia del, en
el dilema de los presos repetido,
228-32
tipo
en el juego de sealizacin de
estnlclura de capital, 186
en el juego de sealizacin de poltica
monetaria, 186
en el juego de sealizacin en el
mercado de trabajo, 186
en juegos bayesianos estticos, 147,
148
en juegos de sealizacin, 185
en subastas, 155
vase tambin informacin incompleta
Tirole, J., x, 130, 181n3
torneo, 70, 77-80
ejercicio 2.8,134
Tracy, L 248
tradicin oral, teorema de, 5'1, 88nl6
vase tambin Friedman, teorema ele
trayectoria de equilibrio
definicin de, 210-13
conjeturas en conjuntos de
informacin en la, 180
conjeturas en conjuntos ele
informacin fuera de la, 1S2
vase tambirl bayesiano perfecto,
'-"#;"
;-~;:C"l
equilibrio; refinamiento; perfecto en

valor prente,
89
Van Damme, E., 194

variables de estado, juego con, 105-106
Vicker" J., 177, 186,210
Wilson, R., 115n17, 130, 177, 180, 228, 248
Ydlen, J., 130
Zender,
Facultad
r., 208
U 1'1~,il S IVI
de Cielic;;s EClr1micils
DCANi\TO
I ,fBRO
l.
CO;\lPR,\DO
SE"'JESTRE
2006 1
(;~

Un Primer Curso de Teoria de Juegos - Robert Gibbons

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Un Primer Curso de Teoria de Juegos - Robert Gibbons

Загружено:

Авторское право:

Доступные форматы

52/

JUEGOS ESTTICOS CON INFORMACiN

COURNOT,A. 1838. l\echerches Sllr les Principes Mathmatiques de la Thorie

GIBBONS,R. 1988. "Learning in Equilibrium Models of Arbitration." AmerieclrlEconomic Review 78:896-912.

the Commons." Science 162:1243-48.

HARSANYI,J. 1973. "Games with Randornly Disturbed Payoffs: A New

of Brouwer' s Fixed Point Theorem."

54 / JUEGOS DINMICOS CON INFORMACIN

dar 2 toma su decisin con lo que concluye el juego. Eljuego de la granada

l presentada en el captulo 1. Definimos tambin el equilibrio de

2.1Juegos dinmicos con informacin completa y perfecta

El juego de la granada es un representante de la siguiente clase de juegos

56 / JUEGOS DINMICOS CON INFORMACiN COMPLETA (c. 2)

Supongamos que para cada ajen Al, el problema de optimizacin del

Supongamos que este problema de optimizacin del jugador 1 tiene

Juegos dinmicos con informacin completa y perfecta / 57

en subjuegos: un equilibrio de Nash es perfecto en subjuegos si ignora

: . ..;,.:_a..;.:.:_:.:.:.l._.~:.,~. ;--:~.:.'~..<S- .., .: l:..:'::.~~'

Esta descripcin verbal puede trlducirse al siguiente,juego en femp.dg

58 / JUEGOS DINMICOS CON INFORMACIN

jugador 1 prev que si el juego llega a la segunda etapa el jugador 2 elegir

Este argumento establece que el resultado por induccin hacia atrs

itera tiva de las,."~tr~tegiasest:ric~~~ente

Stackelberg (1934) pr!Jpuso un modelo dinmico de duopolio en el cu~l

60 / JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)

Juegos dinmicos con informacin completa y perfecta I 61

cantidad agregada es Q ==qI + q2, j e es el coste marginal constante de

siempre, queql < a-e .. La misma' ecuacin pr_aR2(ql) apareCi en

Recordemos que en el equilibrio de Nash del juego de Cournot del

Juegos dinmicos con infonlwcin completa y perfecta /

62 I JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)

empresas deciden simu1tneamente.5 Por lo tanto, que la empresa 1 sepa

cuya condicin de primer orden es

2.1.C Salarios y nivel de empleo en una empresa con fuerte

Supongamos que el desarrollo telT\pora1del juego es: (1) el sindicato

En el modelo de Leontief, (1946) de relacin entre una empresa y un

Esto es un ejemplo de la afirmacin hecha en la seccin 1.1.A:en';,n Juego en forma normal

(L,u/) sea tangente a la restriccin

64 / JUEGOS DfNAMICOS CON INFOR1ACIN COMPLETA (c. 2)

Juegos dinmicos con informacin completa y perfecta / 65

Consideremos ahora el problema del sindicato en la etapa (1). Dado

En trminos de las curvas de indiferencia representadas en la figura

luegos dilllm.icos con informacin

Una descripcin ms detallada de la secuencia temporal del juego de

Los jugadores 1 y 2 negocian el reparto de una peseta. Hacen ofertas

tres periodos es la siguiente:

68/ JUEGOS DINMICOS CON INFORMACIN COMPLETA (c. 2)

que el jugador 2 puede recibir 1 - 8i en el segundo periodo rechazando

Juegos en dos etapas de informacin / 69

por induccin hacia atrs, el jugador 1 ofrecer el acuerdo (j(s),lf(s

2.2 Juegos en dos etapas con informacin completa

Juegos elldos etapas de illfomwcilI

'70 I JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)

1. Los jugadores 1 y 2escogen simultneamente las acciones

Supongamos que (0.1,0.2) es el nico equilibrio de Nash de este juego de

72 / JUEGOS DINMICOS CON INFOJ<MAClN COMPLETA (c. 2)

de los inversores saca el dinero en la fecha 2, el banco devuelve R a cada

JlIegos en dos etapas de infonnacin / 73

ganancias de (r,r); (2) ninguno de los inversores saca el dinero en la fecha

El primero de estos resultados puede interpretarse. como el de un

2.2.C Aranceles y competencia internacional imperfecta

74 I JUEGOS DINMICOS CON INFORMACiN COMPLETA Ce. 2)

empresa iexporta ei al pas ,7 cuando el gobierno j ha establecido una tasa

=[0. - (hi+ ej)Jhi + [a - (ei + hj)Jei