Академический Документы
Профессиональный Документы
Культура Документы
,',
COMPLETA (e. 1)
'.'.'
2. JUEGOS DINMICOS
CON INFORMACIN COMPLETA
DASGUPTA,
P, y E. MASKIN,1986. "The Existence of Equilibrium in Discontinuous Economic Games, 1:Theory." ReviC'U!of Economic Studies 53:1-26.
FARBER,H., 1980, "An Analysis of Final-Offer Arbitration."Journal
flict Resolution 35:683-705.
FRIEDMAN,J. 1971. "A Noncooperative
Review of Economic Studies 28:1-12.
Equilibrium
for Supergames."
Reedicin.
Londres:
J. M.
KREPS,D., y J. SCHElNKMAN.1983. "Quantity Precommitrnent and Bertrand Competition Yield Cournot OutcolIles." Bell JOL/rnal of Economics
4:326-37.
MONTGOMERY,
J. 1991. "Equilibrium Wage Dispersion and Interindustry
Wage Differentials." Qllarterly JOl/mal of Economics 106:163-79.
NASH,J. 1950. "Equilibrium Points in n-Person Games." Proceedings of the
National Aeademy of Sciences 36:48-49.
PEARCE,O, 1984. "Rationalizable Strategic Behavior and the Problem of
Perfection." Econometrica 52:1029-50.
STACKELBERG,
H. VON, 1934, Marktfonn
Springer.
c\
'.','.
of Con-
L/nd Cleichgewicht.
Viena: Julius
Ijnestecaptulo
presentamos los juegos dinmicos. De nuevo, limi~amas nue~tra atencin a los juegos con informacin completa. (es ddr;
juegos en los que las fundones de ganancias de los jugadores so~ Wormacinqel dorinio pblico); vase una introduccin a 10s'jugOs con
informacin incompleta en el captulo 3. En la seccin 2.1 analiZarnos
los juegos dinmicos no slo con informacin completa, sino tambii:co~
informacin perfecta, lo que significa que en cada momentodeI'j1ego;~1
jugador a quien le corresponde decidir conoce la historia cmple'f:de
todas las decisiones tornadas hasta ese momento. En las secciries'i;2';
2.4, considercunos los juegos con informacin completa pero imperfet~:
en algn momento ~~l juego el jugador a quien le corresponde decidirno
conoce toda lahistoria del juego.
.
El tema central en todo juego dinmico es el de la credibilidad. Como
ejemplo de una amenaza que no resulta creble, consideremos el siguiente
juego de dos tiradas. Primero, el jugador 1 escoge entre dar 1.000 pesets
al jugador 2 () no darle nada, n segundo lugar, el jugado.r2 observa la
decisiridel jugador 1 y de~ide si hacer estallar o no una granada que
los matara a los dos. Supongamos que el jugador 2 amenaza' c;on hacer
estallar la granada a no ser que el jugador 11e page las 1.000 pesetas. Si
el jugador. 1 cree que puede cumplirse la amenaza, su mejor respuesta es
la de pagar las 1.000 pesetas. Pero el jugador 1 no debera creerse una
amenaza semejante: si al jugador :2 s~ le diera la oportunidad de ejecutar
dicha amenaza, escogera no hacerlo., Por tanto, el jugador 1 no debera'
pagar nada al jugador 2.1
En la seccin 2.1 analizamos los siguientes casos de juegos dinmicos
con informacin completa y perfecta: el jugador 1 decide primero, acto
seguido el jugador 2 observa la decisin dl jugador 1 y finalmente el juga1. El jugador 1 podra preguntarse si un o?>n~nie que amenaza con hacer explotar una'
granada est loco. Este tipo de dudas se modelali como informacin incompleta, porque el
jugador 1 no est seguro de la funcin d ganancias del jugador 2 (vase captulo 3).
(,
1",'
:',
'..
-,
1
Juegos dillmicos
COMPLETA (e. 2)
COI 'formacin
completa
y perfecta
/ 5.5
1J,1
(a1,o.z) y'Uz(al,o,z).
z
Muchos problemas econmicos se ajustan a esta descripcin. Dos ejemplos (que ms adelante discutiremos con mayor detalle) so~ el mo~elo d,e
duopolio de Stackelberg y el modelo de Leontief, de sal~~lO~y mv~l de
empleo en una empresa con fuerte implantacin ~~ un smdIcato .. ?lros
problemas econmicos pueden modelarse si permItimOS una suce:J7n de
movimientos ms amplia, ya sea aadiendo ms jugadores o penmllendo
q~e los jugadores tiren ms de una vez. (El modelo de negoci~ci.nde Rubinstein discutido en la seccin 2.1.0 es un ejemplo de este ultImo caso.)
Las caractersti~as clave de un juego dinmico con informacin completa
y perfecta son que (1) las decisones se toman de manera sucesiv~, .~2)
todas las decisiones anteriores son conocidas antes de tomar la deOSlon
2 Se podra permitir que el conjunto fa~tH:'I~'del jugador 2, Az, dep:n~iera de la accin
del jugador 1, al' Tal dependencia podra d~notarse con AZ(aI) O podna Incorporarse en la
funcin de ganancias del jugador 2 estableoendo que 11:z(a1'0,z) =
para valores de a2
do a Algunos movimientos del Jugador 1 podnan mcluso poner
que no son fac ti'bles d al'.'
. An
al juego sin dar la oportunidad de move~ a~jugador 2; para tales valores de al, el conJ'.~nto
de acciones factibles Az(o,J) contiene un umco elemento. de forma que el Jugador 2 no tiene
-ex:
eleccin posible.
",.'.
siguiente y (3) las ganancias de los jugadores para cada combinacin posible de jugadas son informacin del dominio pblico.
Resolvemos un juego por induccin hacia atrs de la siguiente forma:
cuando al jugador 2 le corresponda decidir en la segunda etapa del juego,
se enfrentar al siguiente problema, dada la accin al previamente adoptada por el jugador 1:
max
'u2(.l,az).
azEAz
'Ul (al,Rz(al).
alEA]
c.
(,
...
Juegos
COMPLETA (e. 2)
::~::
dil1tmicos
COI1 il1formacill
completa
y perfecta
/ 59
.
dor 2 lo sea: si 1piensa que 2 podra no ser racionill,
ro no que el Juga
1"
O'
pe
.
ger D en la primera etapa confiando en que 2 e 19wril, en
1 podna esCO
'.
'
I"
1 tercera
se nda, dando con ello la oportunida~.a 1 de Jug~r.
~n.8
la ; Otra osibilidad es quesea informaClon del dommlO ~ubhco q.ue el
~taPd' 2 Pracional pero no que el jugador 1 sea racional: sIl es raClonal
Juga or. es.que 2 cree que 1 podra no ser racional, 1 podna. escoger /) en
pero pIensa
.
l
.
' tapa confiando en que 2 pensara que 1 no es raClona, y, por
la pnmera e
"1
t
El
.
DI con la esperanza de que 1jugara D en a tercera e ilpa._"
tanto, Jugara
1 '. d D
r 'parte
USO de la induccin.hacia
atrs presupone que la e eCClOn e po.
eda
explicarse siguiendo este razonamiento. Para algunos Juegos,
,d e l pu
.
l'
. D arque 1
sin embargo, podra ser ms razonable suponer que J~go
~.'
.
.
.'
1
En
tales
J'uegosel
uso
de
la
mducClon
hacla
es, efectivamente, lrraClOna .
, . .
..
atrs pierd~ mucho de su atractivo como predlCclOn del J~ego,. tal como
le a'sa al equilibrio de Nash en juegos en los que la teona de Juegos no
p
.'
una solucin nica y no cabe esperar acuerdo alguno enbe
proporclOna
los jugadores.
2.1.B El mod~lo de duopolio de Stackelberg
,.'0
,
temporal del juego es el sig'uiente: (1) La empresa 1
escoge una can t'd
1 a d ql >
_ O., (2) la empresa 2 observa ,11 .y escoge entonces
.
una cantidad q2 ? O; (3) las ganancias de la empresa ~Vlenen dadas pOI la
funcin de beneficio
'7ri(q;,qj)
donde P(Q)
= qi[P(Q)
el,
a - Q es el precio de equilibrio
de mercado cuando la
ql -
q2 -
qz 2:0
el,
lo que resulta en
R2(ql) =="
a-ql-e
'
,.'
,.'
==maxqIfa - ql - R2(qi)
Ql2:0 .
. '.
-:- el
.
.. a- ql.""'"C
==maxql
'2
. ,.
Q2:0
lo que resulta' en
a-c
qi == -. -2-
a-c
R2(qi) ==-4-
que es el resultado por induccin hacia atrs del juego del duopolio de
Stackelberg.4
'..
'.
4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" se
refieren tpicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mencin
del "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas en
vez de ~u:nultneas. Sin embargo, como se ha constatado en la secci'nanterior, los juegos
con deaslones sucesivas poseen a menudo mltiples equilibrios de Nash, de los cuales slo
uno est asociado can el resultado obtenido por induccin hacia atrs del juego, Por tanto, el
"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como al
uso de unrnterio de solucin ms poderoso que el mero equilibrio de Nash.
..
'
".
,"
1\3
= O.
=maxR(L)
L2:0
- wL,
max7r(w,L)
L2:0
Pendiente =
R(L)
L * (w)
Figura 2.1.1
Para garantizar que la condicin de primer orden R'(L) -w =. O ~enga
solucin, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la
figura 2.1.1.
La figura 2.1.2 representa L * (w) en funcin de tu (pero ~tiliza l~s e!es
de forma que faciliten la comparacin con grficos postenores) e lnchca
que L*(w) corta cada una de las curvas de isobeneficio de la e~1presa
en su punto mximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.anto
mejor cuanto menor sea w, de forma que las curvas :sobenefIClo Dfenores
representan niveles de beneficio ms altos. La fi.gura 2.1.3 representa
las curvas de indiferencia del sindicato. Mantemendo L constante, el
sindicato est tanto mejor cuanto ms alto sea w, de forma que las curvas
de indiferencia ms altas corresponden a niveles de utilidad mayores del
sindicato.
6 Esta
dado 'UJ.
concreta
beneficio
ltima propiedad es simplemente otra manera~e decir que L *('UJ) maximiza 7f( ["w)
Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa se
en la eleccin de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel de
posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por
'UJ
1J)'.
L *(w)
'
...'
Curva de indiferencia
del sindicato
w*
L*(w)
L
Curvas de isobeneficio de la empresa
L*
(w*)
Figura 2.1.2
'Figura
2.1.4.
,
w
L
Curvas de indiferencia del sindicato
Figura 2.1.3
(w,L*(w).
'.
',.,.,'
"~o
'.:
.'
66
1 JUEGOS
OlNMIC05
CON INFORMACIN
COMPLETA (e. 2)
completa y I",rleeta
67
w
Curva de beneficio
w*
de la empresa
L * (w*)
Figura 2.1.5
2.1.D Negociacin secuencial
Empezamos con un modelo de negociacin de tres periodos perteneciente
a la clase de juegos estudiada en la seccin 2.1.A. Pasamos luego a discutir el modelo de Rubinstein (1982), en el que. l nmero de periodos
. es (potencialmente) infinito. En ambos modelos se llega a un acuerdo
inmediatamente, no hay negociaciones prolongadas (como huelgas). En
el modelo de Sobel y Takahashi (1983) de negociacin secuencial con
informacin asimtrica, en cambio, pueden ocurrir huelgas en el nico
equilibrio (bayesiano perfecto) con probabilidad positiva (vase la seccin
4.3.B).
se
'"
1',
\.'
,
'"
,~
"
Analizaremos el siguiente juego sencillo, al cual (sin mucha inspiracin) llamaremos juego en dos etapas con informacin perfecta pero
incompleta:
1. Los jugadores 1 y 2 escogen simultneamente las acciones al y az de
los conjuntos factibles Aly Az respectivamente.
2. Losjugadores 3 y 4 observan el resultado de la primera etapa, (al,az), y
escogen entonces simultneamente las acciones 0.3 y 0.4 de los conjuntos
factibles A3 y A4 respectivamente.
.
~
3. Las ganancias sonui(al,az,a3,a4)
para i = 1,2,3,4.
Muchos problemas econmicos se ajustan a esta descripcin.8 Tres ejemplos (que discutiremos ms adelante con mayor detalle) son los pnicos
bancarios, los aranceles y la competencia internacional imperfecta y los
torneos (por ejemplo, la lucha entre varios vicepresidentes de una empresa
por ser el prxno presidente). Otros problemas e~xJl1micospueden modelarse si permitimos una mayor complejidad, ya sea aadiendo ms
jugadores o permitiendo que los jugadores jueguen en ms de una etapa.
Podra incluso hab~r~enos jugadores: en algunas aplicaciones.los jugadores 3 y 4 son los jugadores 1 y 2; en otras, bien el jugador 2 o el 4 no
aparece.
Resolvemos un juego de esta clase utiizando un enfoque parecido
~!_qe la induccin haci~ atrs, pero est~ vez, el primer paso quedamos
cuando nos movemos hacia atrs desde el final del juego exige la resolucin de un juego real(el juego siinultneoentre los jugadores 3 y 4 en
la segUnda etapa, dado el resultado de la primera etapa) en vez de resolver un problema de optnizacin para un nico individuo como en la
seccin anterior. P.arano complicar las cosas; supondremos en esta seccin
que para cada resultado factible de la primera etapa, (0.1,0.2), el juego que
queda pendiente enla segunda etapa entrylos jugadores 3 y 4 tiene un
nico equilibrio de Nash que denominam()s (a;(al,az),a(al,az.
~ la
seccin 2.3.A (sobre juegos repetidos) consideramos las consecuencias de
prescindir de este supuesto.
Si los jugadores 1 y 2 prevn que el comportamiento en la, segunda
etapa de los jugadores 3 y 4 vendr dado por (a;(al,a2~,-a(al,az,
la interaccin entre los jugadores 1 y 2 en la primera etapa se concreta en el
siguiente juego de decisiones simultneas:
8 Como en la seccin anterior, los conjuntos de ~ccioIies factibles de los jugadores 3 y 4 en
la segunda etap~, A:>! A4, podran depender del resultado de la primera etapa (al,a2)' En
particular, podnan eX1stirvalores (al,a2) que finalizaran el juego.
.. ,:'
1/,1
TI
"-z de
Sacar
Sacar
No sacar
r,r
D,2r - D
No Sacar 2r - D,D
R,R
Figura 2.2.1
Sacar
No sacar
Sacar
T,T
D,2r-'--D
No Sacar
2r - D,D
siguiente etapa
Fecha 1
Sacar
Sacar
R,R
NoSacar
D,2R - D,
No sacar
2R-
D,D
R,R
Fecha 2
Para analizar este juego procedemos hacia atrs. Considrese el juego
en forma normal correspondiente a la fecha 2. Como R > D (y por
tanto 2R - D > R), "sacar" domina estrictamente a "no sacar", de forma
que existe un nico equilibrio de Nash de este juego: ambos inversores
sacan el dinero, lo que conduce a unas ganancias de (R,R). Como no hay
descuento, podemos simplemeI1te sustituir estas ganancias en el juego en
forma normal correspondiente a la fecha 1, tal como indica la figura 2.2.1.
Dado que r < D (y por tanto 2r - D < 1'), esta versin de un periodo del
juego de dos periodos tiene dos equilibrios de Nash en estrategias puras:
(l) ambos inversores sacan el dinero, lo que conduce a unas ganancias
de (,.,.,.);(2) ninguno de los dos inversores saca el dinero, lo que lleva a
unas ganancias de (R,R). Por tanto, el juego original del pnico bancario
de dos periodos tiene dos resltados perfectos en subjuegos (y, por tanto,
no se ajusta totalmente a la clase de juegos definida en la seccin2.2.A):
(1) ambos inversores sacan el dinero en la fecha 1, lo que conduce a unas
-,
.,
fllegos
.....
...,.'
1r'i(ttj,hi,ehj,ej)
",
Wi(ttj,h"e"hJ,ej)
+ e;) -
tje
='2Qf
+ 1r'i(titjhi,ei,hj,ej)
+ tiej,
'!'~
Como 1r'i(t"tj,h"e"h;,e;)
puede escribi~e como la sum~ de los benefi~io,sde la empresa i en ~l.mercado i (los cuales son funcin de hi y e;
Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cuales son funcin, de ei, h;.y tj. nicamente), el problema de optimizacin
en los dos mercados para la empresa i se simplifica al separarse en dos
problemas, uno para cada mercado: hi debe solucionar
, max
h,::::O
.-~
+ eJ~)-
hi[a - (hi
'
cL
y ei debe solucionar
maxei[a
<,::::0
- (ei
+ 11,*) - el J
te'.
J
'
9 S'
.
1 un consUffildor compra un bien a un, precio,p cua~dohab'r
estado dispuesto a
pagar un valor v, se beneficiade un excedente de v '-' p. Dada la i:ufV~de deinilcla inversa
Pi(Qi) ~ a - Q" si la cantidad vendida en ei mercado i es Qi, puede demostrarSe que el
excedente agregado del consumidor es (l/2)Qr
Suponiendo que
e; :::;a -
eH
dos etapas de
ill{omlOc/I
I 75
c, tenemos que
1(
,,)
11,; =
a - ej - e ,
'2
(22,1)
e - tj ) .
(2.22)
(Los resultados que derivamos son coherentes con ambos supuestos,) Las
dos funciones de mejor respuesta (2.2.1) y (2.2.2) deben cumplirse para
cada i = 1,2. Por tanto, tenemos cuatro ecuaciones con cuatro incgnitas
(hi,ei,hi,ei).
Afortunadamente, este sistema de ecuaciones puede simplificarse dividindose en dos grupos de dos ecuaciones con dos incgnitas,
Las soluciones son
h~ =
,
0.-
'3
+ ti
ei
0.-
C -
2tj
(2,23)
/,-.
76/
Ce.
2)
(2.2.3). Si (ti Ji) es un equilibrio de Nash de este juego entre los gobiernos,
entonces, para cada i, ti debe solucionar
max
W;*(ti,t*).
ti~O
Pero
W;*(t,tiJ
es igual a
(2(a - e) - ti?
(a - e + ti)2 + (a - e - 2t~?
1
18
+ t(a
t
- e - 2t)1
3'
por tanto
2.2.0 Torneos
a-e
t~ =--
e~ = a - e
como las cantidades escogidas por las empresas en la segunda etapa. Por
tanto, el resultado perfecto en subjuegos de este juego -de aranceles es
(ti
(a - e)j3,hj=hi=
4(u-:- e)j9,ej = ei = (a --' e)j9)~
'
En el resultado perfecto en subjuegos, la cantidad agregada en cada
mercado es S(a - e)j9. Sin embargo, si los gobiernos hubieran escogido
unas tasas, ar~ncelarias iguales a cero, la cantidad agregada en cada mercado habna SIdo 2(a - e)/3, exactamente igual que en el modelo de Cournot. Por tanto, el excedente de los consumidores en el mercado i (el cual,
como hemos visto anteriormente, es simplemente la mitad del cuadrado
de la cantidad agregada en el mercado i) es menor, cuando los gobiernos
esc?ge.n l~s tasas arancelarias que son estrategias dominantes, de lo que
~ena SIelIgieran unos aranceles iguales a cero. De hecho, unos aranceles
Iguales a cero son socialmente ptimos en el sentido de
=5 =
max
W(t],t2)
Consideremos a dos trabajadores y su capataz. El producto del trabajador i (i = 1 o 2) es Yi = ei + E donde ei es esfuerzo y Ei es ruido. El
proceso de produccin es el siguiente: Primero, los trabajadores escogen
simultneamente sus niveles no negativos de esfuerzo: ei ?: O. En se--'
gundo lugar, los valores de ruido E] y 1'2 se obtienen independientemente,
de acuerdo con una funcin dedensidad f(E) con media cero. Entercer
lugar, el producto de los trabajadores es obsen:ado pe~ono su
Los salarios de los trabajadores,' por tanto, pueden depender de lo que
han producido, pero no (directamente) de su esfuerzo.
Supongamos que el capataz decide inducir a los trabajadores a esforzarse ms y para ello les hace competir en un torneo;.tal y como originalmente analizaron Lazear y Rosen (1981).10 El salario recibido 'por el
vencedor del torneo (es decir, el trabajador quems:produica)eswA;"el
salario recibido por el perdedor es WB. La ganancia:deun trabajador que
reciba un salario W y realice un esfuerzO e es u(w,e) = w - g(e), donde la
desutilidad del esfuerzo, g(e), es creciente y convexa (es decir; g'(e) > O Y
g"(e) > O). La ganancia del capataz es Yl + YF-WA - WB.
Transcribimos ahora esta aplicacin'a lostrininos de la clase de juegos
discutida en la seccin 2.2.A. El capat~~'~"eIRg~dor 1~cuya accin al es
escoger lbs salarios W A y W B que se pagarn en el torneo. No hay jugador
2. Los trabajadores son los jugadores 3 y4;quienes observan los salarios .
escogidos en la primera etapa y deci~e,!-1~n.t,?~cessnultneamente sus
acciones a3 Y a4, es decir los esfur~o~'~l'y'~:(Consideraremos ms de-
e~fu~i~o~
+ Wi(t2,tl),
tl,t2~O
... ".
78 / ]VEGaS
COMPLETA (e. 2)
lante la posibilidad de que, dados los salarios elegidos por el capataz, los
trabajadores prefieran no participar en el torneo y acepten en cambio una
oferta de empleo alternativo.) Finalmente, las ganancias de los jugadores
son las establecidas anteriormente. Dado que lo que se produce (y por
tanto tambin los salarios) es funcin no slo de las decisiones de los jugadores sino tambin de los trminos de ruido El y (.2,operaremos con las
ganancias esperadas de los jugadores.
Supongamos que el capataz ha elegido los salarios WA y WB. Si el
par de esfuerzos (ei,ei) es un equilibrio de Nash del juego festante entre
los trabajadores, para cada i, ei ha de maximizar el salario esperado del
trabajador i menos la desutilidad del esfuerzo: ei debe ser una solucin
dell
,','
-_:;,'
Prob{Yi(e;) >
Yj(ej)}
=Prob{Ei >
' =1
ej +
e;}
Prob{Ei>e;+Ej-e,IEj}f(Ej)dEj
. j
/[1 -
F(ej
- ei
+ Ej)JJ(Ej)dEj,
WB)
J(e;
- ei + Ej)f(Ej)dEj
= g'(ei)'
e,,,=O
, = (WA
::.
donde
"',1::'"
Yi(ei)
- WB)
Yj(e;)}
Prob{Yi(ei) >
,,',
Yj(e;)}
+ WB
-' g(ei)
(WA - WB)
(2.2.4)
~ g(ei),
Como
-,,) :
(WA _
,-,~~tl
~~~,
.,::- ..'
~:',
.",.!:.'
--");
"
__
,~i
:;
~~','
"o,}'
,)~
.~}
,",.l~
'. '-,'
'
..../
~_l.>t'
)8Prob{Yi(ei) >
WB
8
ei
Yj(e;)}
- 9
'(
,)
e,.
(2.2.5)
.'
Es decir, el trabajador i escoge ei de forma que la desutilidad marginal de
un esfuerzo extra, g'(e;), sea igual al beneficio marginal de ese esfuerzo
adicional, que es el producto de lo que se gana en salario por venCer en el
torneo, WA '-w B, y el aumento marginal de la probabilidad de ganar.
Por la regla de Bayes,12
11 Al escribir (2.2.4),supusimos
que la funcin de densidad del ruido (e) es tal que el
suceso en el qU lostrabaj~dores producen exactamente lo mismo OCurrcon probabilidad
cero y, por tanto;no es necesario considerarlo en la funcin de utilidad esperada del trabajador
i. (Ms formalmente, suponemos que la funcin de densidad (E) es no atmica) En una
descripcin completa del torneo, sera natural (pero innecesario) especificar que el ganador se
determina a cara o cruz, o (lo que en este modeio resulta eqttivalente) que ambos trabajadores
reciben(wA
+wB)/2
(2.26)
:1
"
;:\
. j
l2La regla de Bayes proporciona una frmula para P(AIB), la probabilidad (condicional)
de que un suceso A ocurra dado que el suceso B ha ocurrido. Sean P(A), P(B) Y P(A,B)
las probabilidades (a priori) (es decir, las probabilidades antes de que tanto A como B hayan
tenido la oportunidad de ocurrir) de que A ocurra, B ocurra y de que ambos A y B ocurran
respectivamente.
La regla de Bayes establece que P(AIB) = P(A,B)/ P(B). Esto es, la
probabilidad condicional de A dado B es igual a la probabilidad de que ambos 'A y B ocurran
dividida por la probabilidad a priori de que B ocurra.
?:
:1
que satisfagan
-w,
2 ,~ + 2-wB
- g(e*)
>- Ua.
Juegos repetidos / 81
(2.2.7)
Jugador 2
(
Iz
D2
1,1 5,0
Jugador 1
WB
= 2Ua
+ 2g(e*) -
WA.
WB)
f(j)2dj
1,
Y (2.2.8)determina entonces
0,5 4,4
(2.2.8)
WA Y"illB.
2.3Juegos repetidos
En esta seccin analizarnos si las amenazas y promesas sobre el comportamiento futuro pueden influir en el comportamiento presente en situaciones que se repiten en el tiempo. Buena parte de lo que hay que entender
en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas
nuevas se requieren para entender los juegos con un horizonte infinito.
Hemos definido tambin el equilibrio de Nash perfecto en subjuegos. Esta
defircin tiene una expresin ms sencilla para el caso especial de los juegos repetidos que en el general de los juegos dinmicos con informcin
completa que considerarnos en la seccin 2.4.B. La introducirnos aqu para
tacilitar la exposicin posterior.
. '.
2.3.A Teora: Juegos repetidos en dos etapas
Consideremos el dilema de los presos dado en forma normal de la figura
2.3.1. Supongamos que hay dos participantes en este juego que deciden
simultneamente en dos ocasiones, habiendo observado el resultad"ode li,'l
primera decisin antes de decidir por segunda vez, y supongamos que las
('.
Figura 2.3.1
Jugador 2
Iz
D2
2,2 6,1
Jugador 1
1,6 5,5
Figura 2.3.2
Llamaremos a este juego repetido el dilema de los presos en:dos etapas.
Este juego pertenece a la clase de los juegos analizada en la seccin 2.2.A.
Aqu los jugadores 3 y 4 son idnticos a los jugadores 1 y 2, los espaCios
de acciones A3 y A4 son idnticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l
son simplemente la suma de las ganancias en la'pnmera etapa (i.;a2)
y en la segunda etapa (a3,a4)' Adems, el dilema de los presos en d.s
etapas satisface el supuesto que hicimos en la seccin 2.2.A: para cada
resultado factible de la primera etapa del juego, (al,a21, el juego restant.e
en la segunda etapa entre los jugadores 3 y 4 tiene un nico equilibrio
de Nash, que denotamos por (a3(al,a21,a,i(al,a2'
De hecho, el dilema
de los presos en dos etapas satisface este supuesto de forma clara, como
seguidamente indicamos. En la seccin 2.2.A peTInitini.osla posibilidad de
que el equilibrio de Nash del juego restante en la segunda etapa dependa
del resultado de la primera etapa -de aqu la notacin (a; (al ,a2) ,a (al ,a2
en vez de simplemente (aj,a). (En el juego de los aranceles, por ejemplo;
las cantidades de equilibrio escogidas por las empresas en la segunda
etapa dependan de los aranceles escogidos por los gobiernos en la primera
etapa.) Sin embargo, en el dilema de los presos en dos tapas, el nico
~'.
[IleSOS
82 / JuEGOS DINMICOS CON INFORMACIN COMPLETA (c. 2)
...
}:
Definicin. Dado un juego de etapa G, G(T) denota el juego r.epetido finitamente en el que G se juega T veces, habiendo los jugadores observado los
resultados de todas las jugadas anteriores antes de que empiece la siguiente. Las
ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de .
etapa.
Proposicin. Si el juego de etapa G .tiene un nicQequilibrio de Nash, entonces,
para cualquier T finito, el juego repetido G(T) tiene un ~ico resultado perfecto
en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3
13 Se ~btienen resUltados anlogos si el juego de etapa G es un jego dinmic con informadn completa. Supongamos que G es un juego dinmico con inJonndn completa y
perfecta de la clase definida en la secdn 21.A. Si G tiene un rjco resultado por inducdn
hada atrs, G(T) tiene un nico resultado perfecto en subjuegos: en cada etapa se juega el
resultado por inducdn hacia atrs de G. Sinillarmente, supongamos que G es un juego en
repef idos / 83
lora al caso de dos periodos, pero consideramos la posi.. vodlvdemqo:::1 J'uego de etapa G tenga mltiples equilibrios :le ..NilSh,
blhda
e
. d
. d
[y C ll1utan 1
3 3 1~as estrateglils enOillma as ./. d /
en l a fi gura 2 ..,
. 1
como
enOJ1Unal
.
de los presos d e l a fi gura 23.. I , pero las estrategias
. 'b .ilS
dIlem; sido aadidas al juego de forma que ahora existen dos eqUlh nos
Di ha
'.
(1 J) como en el dilema de los presos, y
,2
.
"1'
I
N h en estrategIas puras.
de as d
1
' (D D) Natura men te, es artl' f)' cial aadir un eqUllt mo a
a~ora a de~as pr~~os2de esta manera, pero nuestro inters en este juego
dIlema, e os 't'vo que sustan h' va. En la prxima seccin veremos que
es mas exposll
, 'h d
uilibrios
.
tidos infinitamente comparten este espm I e eq ..
los Juegos ~epe
'1'
d etapa que se repiten infinitamente tienen
. "
u'Iti les mc1uso SI os Juegos e
m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en
un UNCOeq.
.
de etapa artificial en el contexto Sl1nple
. , n analIZamos un Juego
est~::cC1:riodos, y nos preparamos con ello para el anlisis poster~or de
de
p
..'
'co en un contexto con honzonte
un juego de etapa con mteres economl ,
infinito.
1-:'"
--
1,6
]1 1,1
1,1 1,1
~''!.
Figura 2.3.4
Existen tres equilibrios de Nash con estrategias puras en el juego
de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2,
los equilibrios de Nash de este juego de una etapa corresponden a los
resultados perfectos en subjuegos del juego repetido original. Denotemos
con w,x),(y,z)
un resultado del juego repetido: (w,x) en la primera etapa
y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4
corresponde al resultado perfecto en subjuegos (1],[Z),(1],[2 del juego
repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z)
como consecuencia de cualquier resultado en la primera etapa excepto de
(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura
~.3.4 corresponde al resultado perfecto en subjuegos Dl,Dz),(11'!Z
del
Juego repetido. Estos dos resultados perfectos en subjuegos del juego
repehdo simplemente enlazan los resultados de los equilibrios de Nash
de los juegos de etapa, pero el tercer equilibrio de Nash de la figura
2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura
todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es
nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones
mduso mas generales.
Juegos rq;elidos / 85
2.3.4 corresponde al resultado perfecto en subjuegos Cl,Cz),(D],D2)
del
juego repetido, puesto que el resultado previsto en la segunda etapa es
(Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'
anteriormente, se puede alcanzar la cooperacin en la primera etapa de
un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo
de un resultado ms general: si G = {Al,'"
,An; uI- ... ,un} es un juego
esttico con informacin completa que tiene mltiples equilibrios, pueden
existir resultados perfectos en subjuegos del juego repetido G(T) en los
que, para cualquier t < T, el resultado de la etapa t no es un equilibrio
de Nash de G. Volveremos sobre esta idea en el anlisis de un juego con
horizonte infinito en la prxima seccin.
Juegos repetidos / 87
que
el
repetidos
infinitamente
(
''-.(,
~
..
1'.
~,
COMPLETA (c. 2)
Jugador 2
D2
1,1 5,0
0,5 4,4
Figura 2.3.6
16 El teorema de tradicin oral original se referia a las ganancias en todos los equilibrios
de Nash de un,juego repetido infinitamente. A este resultado se le llam teorema de tradicin
oral por ser ampliamente conocido entre los tericos de juegos de os "aos cincuenia, aun
sin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgnancias
en ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y,
por tanto, refuerza el teorema de tradicin oral original al utilizar un criterio de solucin ms
fuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo,
el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)
se les llama a veces teoremas ele tradicin oral, aun cuando' no hayan sido ampliamente
conocidos entre los tericos de juegos antes de ser publicados.
de la sucesin
00
Jugador 1
.'
L 5 l7f
t
t.
t=I
c..
';-',
"'~'-
,,",
'.'
Juegos repetidos ! 91
Estaes~~~t~i?aesun, ei,:fi,lplod:l~/~t.rategiadel
disparador(trigger strategy);.
'llamadaas p'orque el jugad~i coopera hastaquealguieridefa de Cooperar,
lo qu~Aesencadena' la;dcisln'de. rtovivi '~'.'cooperair.Utlcaffis: Si
ambos jugadores adoptnla, estrat~gia derdlsparador, el resUltado d~l"
juegorepeti~o inffuitamertte ser (Dl,D~)enCdaetapa.' Yerembs pnmeio
que si o est' lo suficientemente Cerca de uno, el hecho de que los dos
jugadores adopten esta estr~tegia cortstituyeun equilibrio de Nash del
juegorepetid infinitamente. Veremos a contiriu~cin que este equilibrio
de Nash es'perfecto en subjuegos, en un sentido que se precisar ms
adelante.
Para demostrar que la adopcin de la estrategia del disparador por
parte de los dos jUi?adores es un equilibrio de Nash del juego repetido
infinitamente, supondremos que el jugador i ha adoptado la estrategia
del disparador ydemostraremos a'continuacin, siempre que o est lo
suficientemente cerca de uno, que adoptar esta estrategia es tambin la
mejor respuesta del jugador j. Dado que el jugador i jugar I para
siempreeuand el resultado de alguna ronda difiera de (Dl~D2), lafuejor
respuesta del jugador j es efectivamente jugar Ij para siempre ruando el
resultado de alguna etapa difiera de (Dl,D2)' Queda: por determinar la
mejor respuesta del jugador ien la primera etapa yen cualquier etapa tal
que los resultados anteriores hayan sido (Dl,D2). Jugar Ij proporcionara
una ganancia de 5 en esta etapa, pero desencadenara la riocooperacin
del jugador"i (y, por tanto, tambin del jugador j) enio sucesivo, de forma
que la ganancia en cada etapa futUra sera 1: Comd'1++2+:. /=1/(1-0),
el valor presente de esta:sucesin de ganancias es
5 + 0.1 +
.::
..,'
_.
o'
5 + 1 _ '
(2.3.1)
.0
.1 + ... = 5 + -"-.
1-0
17 Naturalmente se puede definir tambin un juego repetido basado en un juego de etapa
dihInico, En esta seccin limitamos nuestra atencin a juegos de etapa estticos para poder
presentar las ideas principales de. forma sencilla. Las aplicaciones en las secciones 2.3.0 y
2.3.E son juegos repetidos basados en juegos de etapa dinmicos.
V =5+ 1_
. _
'.
"'.~
~,.~-
;.0
<
,"
Juegos repetidos I 93
clor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores del
jllego de etapa son conocidos antes de que empiece la t-sima etapa. La ganancia
de cada jugador en G(co,o) es el valor presente de las ganancias que el jugador
outiene en la sucesin infinita de juegos de etapa.
En cualquier juego (repetido o no), la estrategia de un jugador es un
plan completo de accin, es decir, especifica una accin factible del jugador
en cada contingencia en la que le pudiera corresponder actuar. Dicho de
forma algo ms frvola, si un j~ga_dordejara una estrateg!a a su abogado
anles de que el juego empezase, el abogado podra sustituir al jugador
en el juego, sin necesitar en ningn caso de instrucciones adicionales
sobre cmo jugar. En un juego esttico con informacin completa, por
ejemplo, una estrategia es simplemente una accin. (Por esto describimos
lal juego como G = {S,,,,,Sn;'U,
... ,un} en el capitulo t pero aqu
pu:de describirse tambin como G = {A], ... ,An; U, '" ,un}: en un juego
estallco con informacin 120mpletael ~spacio de estrategias del jugador i,
Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juego
dinmico, una estrategia es ms complicada.
Consideremos el dilema de los presos en dos etapas analizado en la
seccin anterior. Cada jugador acruados veces, de forma que podra
pensarse que una estrategia es simplemente un par d irIstrucciones (b,c),
donde b es la decisin en la primera etapa y e es la decisin en la segunda
elapa. Pero existen cuatro resultados posibles de la pr11leraetapa, (1,1z),
U,Dz),(D1,1 y (D,D, que representan cuatro contingencias diferentes
en las que al jugador l~ podra corresponder actuar. Por tanto, la estrategia
de cada jugador consta de cinco instrucciones, que indicamos mediante
(VW,x,y,z), donde v es la decisin en la primera etapa y w,x,y y zson''!as
decisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (DJz) y
(D,Dz) respectivamente. Usando esta notacin, las instrucciones "jugar b
en la primera etapa y jugar e en la segunda pase lo que pase enla primera"
se describen como (b,c,c,c,c), pero esta notacin tambin puede expresar
estrategias en las que la decisin de la segunda etapa es contingente del
resultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b en
la pnmera etapa y jugar e en la segunda ronda a menos que el resultado
de la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, en
el juego. repetido en dos etapas basado en la figura 2.3.3, la estrategia
de cada Jugador consta de diez instrucciones, una decisin en la primera
etapa y nueve decisiones contingentes en la segunda etapa, una para cada
resultado posible de la primera etapa. Recordemos que al analizar el
liegos "e'e/idos
al juego original G(oo,o). Como en el caso con horizonte finito, existen tantos
subjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias del
juego hasta la etapa t.
Obsrvese que la t-sima etapa de un juego repetido no es por s misma
un subjuego del juego repetido (suponiendo que t < T en el caso finito).
Un subjuego es una parte del juego original que no slo empieza en un
momento en que la historia del juego hasta entonces es informacin del
domino pblico entre todos los jugadores, sino que tambin incluye todas
las decisiones posteriores a ese rnome~toen el juego original. Analizar la
t-sima etapa aisladamente sera equivaierit~a considerar la t-sima etapa
corno la etapa final del juego repetido .. Tal anlisis podra llevarse a cabo
pero no sera relevante para el juego repetido original.
Estamos ahora preparados para la definicin de equilibrio de Nash
perfecto en subjuegos, la cual depende a su vez de la definicin de equilibrio de Nash. Esta ltima no 11acambiado desde el captulo 1, pero ahora
apreciamos la complejidad potencial de la estrategia de un jugador en
un juego dinmico: en cualquier juego, un equilibrio de Nash es una coleccin de estrategias, una para cada jugador, tal que la estrategia de cada
jugador es la mejor respuesta a las estrategias de los dems jugadores.
Definicin. ,(Selten 1965): Un equilibrio de Nash es perfecto en subjuegos
si las estrategias de los jugadores constituyen un equilibrio de Nash en cada
subjuego.
'
,
,
qs
(Dl,Dz).
(0,5)
(5,0)
Ganancia al
jugador 1
Figura 2.3.7
'
Aplicamos seguidamente argumentos anlogos al juego repet.do infi'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman
(1971) para juegos repetidos infinitamente. Para enunciar' el teorema, necesitarnos dos ltimas definiciones. Primero, llamamos factIbles a las ga. (Xl,"" x n ) en ell'uego de etapa G si son una combinacin
convexa
nanCIas
.
(es decir, una media ponderada donde las ponderaciones son no-negativas
y suman uno) de las ganancias a las estrategias puras de. G. El conju.llto
de ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es la
regin sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras
(1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los
, ) para 1 < .,x < 4 que resultan de las medias ponderadas de (1,
pares (X,X
1) Y (4, 4), Y los pares (y,z) para y + z = 5 Y O < Y < 5, que resl1.ltan.de
las medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenor
de) la regin sombreada de la figura 2.3.7 son medIas ponderadas de las
Juegos repetidos / 97
media de la sucesin
00
O -
8)
8t-]7ft._
t=1
cada jugador ' y si (j est lo suficientemente cerca de uno, existe UI1 equilibrio de
Nash perfecto en subjuegos del juego repetido infinitamente G(oo,ti) que alcanza
(X], ... ,xn) como ganancia media.
'
Pago al jugador 2
(0,5)
(.
(5,0)
Ganancia-al
jugador 1
Figura 2.3.8
La demostracin de este teorema repite los argumentos ya dados para
el dilema de los presos repetido infinitamente, de forma que la relegamos
al apndice, Es conceptualmente inmediato pero algo complicado de notacin extender el teorema a los juegos de etapa de buen comportamiento
que'~~ ~~~ni,finitosni ~iticos (veremos algunos ejemplos ~n las apli7
caciones d las tres prximas secciones). En el contexto del dilema de
lo~p~sos de la fisuril 2.3.6.- el teorema de Friedman garantiza que puede
alcanzarse cualquier punto en la regin ms oscura de la figura 2.3.8como
ganancia media en Un equilibrio de Nash perfecto en subjuegos del juego
rep~tido, siempre y cuando el factor de descuento est lo suficientemente
cerca de uno.
, Concluimos esta seccin esbozando dos derivaciones adicionales de la
teora de juegos repetidos infinitamente, que se complican al aadrseles
la siguiente caracterstica especial del dilema de los presos. En el dilema
de los presos (de una etapa) de la figura 2.3.6, el jugador i puede estar
seguro de recibir,como mnimo la ganancia de 1 del equilibrio de Nash,
jugando 1;. En un juego de duopolio de Cournot de una etapa (como
el descrito en la seccin 1.2.A), por el contrario, una empresa no puede
estar segura de obtener los beneficios del equilibrio de Nash produciendo
,, .:.
<,'
, .~t~;
'b:
~t::
98 I
JUEGOS DlNMIICOS
CON INFORMACIN
,',
... ,-,'
. "
'
Juegos
COMPLETA (e. 2)
I'qJef
idos I 99
Esto es,
adi
es una solucin de
max lLi(o.xl, - -'
,o,x,i_l,ai,o..T:i+l,'"
,o.xn).
a,EA,
Sea
di
di = v,;(axl,'
, . ,o,,,,,i-l ,0.di,0'x,;+1
100/
COMPLETA (e. 2)
a XlI. a X'l+
. 1I
...
a)xn
>
e,
Ui
((le]"
...
,aen).
(dado que los dems jugadores han adoptado la estrategia del disparador)
es axi si y slo si { ?: (di - xi)/(di - ei).
Combinando esta observacin con el hecho de que la mejor respuesta
de 'i es jugar aei para siempre si el resultado de alguna etapa difiere de
(axIJ' .. ,axn), conc'uimos que jugar la estrategia del disparador por parte
de todos los jugadores es un equilibrio de Nash si y slo si
,
u
?: max
1
'
= d., + 1 _o oei.
'"
,~I:/~
o V,-,- x
,/0
,) S"1Jugar
u.
adi
Vi = Xi + oVi,
es. ptimo, entonces
Vi
= di
+ --e.
1-0'"
Xi
-->d+-1 - { - " 1 _
o e,,,.
o>
d; -
Xi
di -
ei'
d,; - Xi
-d--'
i - ei
Como di ?: Xi > ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i,
de foim que eI~valormximo de esta fraccin para cualquier jugador sea
tambin estrictamente menor que 1.
Queda por demostrar que este equilibrio de Nash es perfecto en subjuegos. Es deCir,'que las estrategias del disparador deben constituir un
equilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cada
subjuegode 0(00,0) idntico al propio G(oo,o). En el equilibrio de Nash
con estrategias del disparador estos subjuegos pueden agruparse en dos
clases: (i) subjuegos en los que los resultados de las etapas anteriores han
sido (axl, .. -: ;a~n), y (ji) subjuegos'en los
el resultado de al menoS.ri{
etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'del
disparador en el juego completo, (i) las estrategias'd los jugadores riun'
subjuego de la primera etapa son de nuevo las estrategias del disparador
que, tal como acabamos de demostrar, constituyen un equilibrio de Nash
del juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle .
la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiieg
de etapa (ael,' .. ,aen), lo que tambin es un equilibrio de Nash d~l jrieg;;~"
completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Parador
del juego repetido infinitamente es perfecto en subjuegOs.
es
qu
':,.,
....... '
':.."
--------
COMPLETA (c. 2)
"
",',
max
qj
(a -
q'
',':.'
:::
7rd
+ 1 _ 6 . 11"c,
Producir q*
producir q*
uno de los
producir la
_.
max (a, -
qj - q* - c)qj.
qj
_l,q
~ c)q,
2'
m
'(2.3.2)
1
1-8
--
'11"*
>
-
7rd
8
1-6
+ --'
7rc,
J !legos repetidos /
COMPLETA (c. 2)
105
= 7f(x) + --
. -7f
2
m.
siguiente:
--
1-5
V(x)
Sustituyendo
V(x)
(2.3.3)
. -7r
m_
(2.3.4)
?: 7r dp(X) + 5V(x).
en (2.3.3) obtenemos
5 G7rm
-7r(X)
?: 7rd -
~7fm.
Es decir, lo que se gana en este periodo por desviarse no debe ser mayor
que el valor descontado de la prdida en el periodo siguiente debida a
la penalizacin. (Siempre y cuando ninguna de las empresas .se desvi
de la fase de penalizacin, no hay ninguna prdida a parlii dl si~ente
periodo, ya que la fase de penalizacin termina y las empresas velven
al resultado de monopolio, como si no hubiera habido desviacin.) Dl
mismo modo, (2.3.4) puede reescribirse como
.
1-
-":
(a - qj - x - e)qj.
qj
5 G7fm
7r(x)
?: 7rdP
~ 7f(x?::
..
',
COMPLETA (c. 2)
Jllegos
mente.
Shapiro y Stiglitz (1984) desarrollan un mo.delo ~inmico en el q.ue
l empresas inducen a los trabajadores a trabajar mas pagando salanos
:r:os y amenazando con despedir a los que sean descubiertos trabajando
poco. Como consecuencia de estos salarios altos, las empresas reducen su
demanda de trabajo, de forma que a1g1.mostrabajadores tendrn empleo
n salarios altos mientras que otros estarn (involuntariamente) parados.
ca
d
,.
1
Cuanto mayor sea el nmero de trabajadores para os, mas tIempo e
llevar a un trabajador que haya sido despedido encontrar un nuevo
empleo, de forma que la amenaza de despido resulta ms. efectiva. En
el equilibrio competitivo, el salario 'w y la tasa de paro 1J, mduc.en a los
trabajadores a esforzarse, de tal forma que la demanda de trabajO de las
empresas al salario lJ) hace que la tasa de desempleo ~ea exactamente 'U,.
Vamos a estudiar los aspectos de este modelo que tienen que ver co~
los juegos repetidos (pero ignoraremos los relacionados co~ el equilibriq'
competitivo) analizando el caso de una empresa y un trabajador.
, Consideremos el siguiente juego de etapa. En primer lugar, la empresa
ofrece al trabajador unsalario,vJ. En segundo lugar, el trabajador a.ceptao
rechaza la oferta de la empresa. Si el trabajador rechaza w, se conVIerte en
un trabajador independiente con un salario Wo. Si el trabajador acepta UI,
escoge entre realizar un esfuerzo (lo que le produce una desutilidad e~o no
(lo que no le produce desutilidad). La decisin tornada por el traba~ador
sobre su esfuerzo no es observada por la empresa, pero lo que el traba)'Jdor
produce es observado tanto por la empresa como por el.!!abajador. La
produccin puede ser alta o baja; para simplificar, suponemos que el
nivel bajo de produccin es cero y escribimos, eLnivel~1to como y > O.
Supongamos que si el trabajador realiza un esfuerzo, la produccin es ~J,ta
con probabilidad 1, pero que si el trabajador no se esfuerza, la producClon
es alta con probabilidad p y baja con probabilidad 1 - p. Por tanto, en
este modelo, un nivel bajo de produccin es signo inequvoco de falta de
esfuerzo.
.tI
Si la empresa emplea al trabajador con un salario w, las gananciils a
lbs jugado~es si el trabajador realiza un esfuerzo ~ la pro~uccin e: alta
son y - w para la empresa y w -'- e para el trabajador. SI el trabaJildor
no se esfuerza, e es cero; si la produccin es baja, y es cero. Suponemos
que y - e > lIJO> py, de forma que al trabajador le resulta eficiente estilr
e)
+ 8y':,
{jp)O
O
-p\. wa_ }
{j'
'\."
w
.
',1'
1-
2: Wo + '(1
(j
p{j
)e
p .
Juegos repelidos /
COMPLETA (c. 2)
(1 -
+ 1 + ---
== Wo
(j
[jO - p)
(2.3.5)
(2.3.6)
>
_wo+
'(1 1- 6)
.+-/5-. e,
w::
y - w*
2: O.
(2.3.7)
Recordemos que supusimos que y - e > Wo (es decir, que para el trabajador
es eficiente estar empleado por la empresa y esforzarse). Necesitamos una
condicin ms fuerte si estas estrategias han de formar un equilibrio de
Nash perfecto en subjuegos: (2.3.5) y (2.3.7) implican
Y-e>
- 'tilo +
1-/5
---e
60 - p)
111
,'.
'112
COMPLETA (c. 2)
::-C'Tr2
_ (y _y*)2,
y =by*
+d(-r - 7[e)]2.
d~~~tp.J~
'
1l'*(-re)
= --:J?[(l c+ u-
b)y*
+ d-re].
(2.3.8)
.'
~:;,,
~
,
;:~;~~\:i!~W;.;,~,\
~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;,,:,;1;'r,,,,l..l.'~I'
..,,.:.,,;"" .:.:"'J.._~'
~-...:..!...~...:..-'~~L~,I
.........
_ .~I;.l...;.'--:'<'~.
---.---------
Juegos dil1micos
COll
/ 115
<...
".-,:
. ,~.;.
'.":.'
="..
_l_W(O
1-b
O)
'-
>
(".+(0),0)
+ _rS_vV("',""'s),
1-15
(2,39)
con infoIDlacin
completa
pero imperfecta
19
116/
COMPLETA (c. 2)
nos juegos una de las dos formas es ms apropiada que la otra. Vamos a
ver cmo los juegos estticos pueden representarse utilizando la forma extensiva y cmo los juegos dinmicos pueden ser representados utilizando
la forma normal.
Recordemos de la seccin l.1.A que la representacin en forma normal
de un juego requiere precisar: (1) los jugadores, (2) las estrategias posibles
de cada jugador y (3) las ganancias recibidas por cada jugador para cada
combinacin de estrategias posibles.
Definicin. La representacin en fanna extensiva de un juego exige preci~ar:
(1) los jugadores, (2a) cundo tiene que jugar cada jtigador,(2b) lo qt{e cada
jugador puede hacer cada vez que tiene la oportunidad de jugar, (2c) lo que cada
jugador sabe cada vez que tiene la oportunidad de jugar y (3) la ganancia recibida
por cada jugador para cada combinacin posible de jugadas.
ALmqueno lo dijimos en su momento, eillas secciones 2.1 a 2.3 hemos
analizado varios j~egos representados en forma extensiva. La contribucin de esta seccin consi~te elldescribir estos juegos en forma derbol
en vez de utiliZr' palabr~s, porqtie el uso derbo~es,.~ menudo'facilita
tanto la explicaci6n co~o el anlisis.
' .. , .> .,.
' ..
Como ejemplo de un juego en formaextensiva, consideremseI siglliente representante d la clase de juegos en dos etapas 'con informacin
completa y perfecta presentada en la seccin 2.1.A:
1. El jugador 1 escoge una accin al del conjunto factible Al = {J,D}.
2. El jugador 2 observa al y escoge entonces una accin a2 del conjunto
,42 = {J',D'}.
3. Las ganancias son Ul (al,az) y -uz(al,a2), como se indica en el rbol de
la figura 2.4.1.
<..
2,')
Ganancia al jugador 1:
Ganancia al jugador 2:
2
1
Figura 2.4.1
o
O
. Puede parecer innecesario exigir que la estrategia de un jugador es-p~tmque una accin factible, para cada contingencia en la que al jugadb~'I)l~diera<;orrespQnderle decidir~;Resulta claro, sin embargo, que no
. ,poarqlOs aplicar lanociri de equilibrio de Nash a los juegos dinmicos
118/
COMPLETA (c. 2)
Juegos dinmicos
con informacin completa si permitiramos que las estrategias de un jugador ~epran sin especificar sus acciones en algunas contingencias. Para
que el Jugador j calcule una mejor respuesta a la estrategia del jugador i,
puede que j necesite considerar cmo,actuara i en todas y cada una de las, '
contingencias, no slo en las contingencias que i o j creen que es posible'
~~~.
..
, o.'.
COI!
, .,
forma extensiva. Denominemos las filas de la forma normal
entaClonen
.
I
d
sd aCuerd oc on las estrategias factibles del Jugador 1 y las ca umnas e
e d o con las estrategias factibles del jugador.. 2, y calculemos las gana 11euer
a.
en cada combinacin posIble de estrategIas,
~aoo 1 J'ugadores
'
" como se
. dica en la figura 2.4.2.
111 Una vez mostrado que un juego dinmico puede rep~esentars: .en
seguidamente a demostrar cmo un Juego
formano,rmal pasemos
,
, estatIco
'
.
de
decisiones
simultneas)
puede
representarse
en
forma
(es d eClr, ,
'
.,
'.
, extensiva. Para ello, nos basamos len la observaoon hecha en la sec~IOn ] .l.A
(en conex'o'ncon el dilema de los presos) de que
, no es necesano que los
.
, 'dores acten simultneamente: es suficiente con que cada uno escoJa
ugaestrateoia sin conocer la decisin del otro, como sera el caso en el
una
o~
d ..
Id
dilema de los presos silos presos tomaran sus eCSlO~eSen cea: :eparadas. Por tanto, podemos representar un juego de (dgamos) deosJOnes
simultneas entre los jugadores 1 y 2 como sigue:
3,1
Jugador 1
3,1
(DI,DI)
1,2
"
1,2
',---.../
2,1
0,0
2,1
')
0,0
"",.;
Figura 2.4.2
",.,'
de
Defulicin Un conju~to
itlfonnacin
nodos de decisi~ que satisface:
11/1
a2
del
Preso 1
-1
.
La representacin en forma extensiva de este juego (ignoramos las ganancias para simplificar) aparece en la figura 2:4.4. En esta forma extensiva;
el jugador 3 tiene dos conjuntos de informacin: uno con un nico elemento que sigue a D por parte del jugador 1 y DI por parte del jugador
2 y otro con ms de un elemento que incluye los dems nodos en los que
le corresponde decidir al jugador 3.. Por tanto/todo lo que el jugador 3
observa es si (al,a2) = {D,D'} o no ..
1
4
4
5
O
':."'
Figura 2.4.3
En un juego el! forma extensiva, indicaremos que una coleccin de
nodos de decisineonstituye un-conjunto de informacin con una lnea
discontinua, como en la representacin en forma extensiva del dilema de
los presos de la figura 2.4.3. Indicaremos a veces a qu jugador- le corresponde mover en los nodos del conjunto de informacin por medio de una
leyenda, como en la figura 2.4.3; alternativamente, podemos simplemente
dar nombre a la lnea discontinua que une esos'nodos, como en la figura
2.4.4. La interpretacin del conjunto de informacin del preso 2 en la figura 2.4.3 es que cuando al preso 21e corresponde decidir, todo lo que sabe
es que se ha llegado al conjunto de informacin (es decir, que el preso 1
ha decidido), pero no a qu nodo se ha llegado (es decir, lo que ha hecho).
Veremos en el captulo 4 que el preso 2 puede tener una opinin de lo que
el preso 1 ha hecho, incluso sin haberlo observado, pero ignoraremos esta
cuestin hasta entonces.
Figura 2.4.4
Ahora que hemos definido la nocin de conjunto de informacin, podemos ofrecer una definicin alternativa de la distincin entre informacin
perfecta e imperfecta. Definimos previamente la informacin perfecta diciendo que en cada jugada, el jugador al que le corresponde jugar conoce
toda la historia del juego hasta ese momento. Una definicin equivalente
es que cada conjunto de informacin contiene un nico elemento: Por
el contrario, la informacin imperfecta significa que existe al menos un'
--~
122 / JUEGOS DINMICOS CON INFORMAcrN
Juegos dinlmicos
COMPLETA (c. 2)
cO~j~ntode informaci~n con m~ de un elemento,19Por tanto, la represent~ClQnen forma extensiva de un Juego de decisiones simultneas (como el
~lle~a de l~s presos) es un juego con informacin imperfecta. De forma
~lml1ar, l~: J~egos en dos etapas estudiados en la seccin 2.2.A poseen.
l~orm~clOn Imperfecta porque las decisiones. de los jugadores Iy 2 son
slmultaneas~ como tambin lo son las decisiones de los jug~dofes 3 y 4..
?e forma mas general, un juego dinmico con informacin co'mpleta pero
lm~erfecta~~ede repr,esentarse en forma extensiva utilizandbconjuntos
de mformaclOn con mas de un elemento para indicar lo que cada jugador
sabe (y no sabe) cuando le corresponde jugar, tal como hemos hecho en la
figura 2.4.4.
."
....
,_.
..",
.... ", "
"
.: '.
--
". -
~
.
'-..:.
19
.
'. ":.~:;C
,
Est~ ~aracterizacin de la informaan perfecta e imperfecta en trminos de 20njuntos de
informaaon con ~o o ms elementos est restringida a los juegos cn info~aci" complet;
>0
COI1infonl1nn
completa
pero imperfecto
/ 123
(a) empieza en un nodo de decisin n que sea un conjunto de informacin con 1111
nico elemento (pero que no sea el primer nodo de decisin del juego),
(b) incluye todos los nodos de decisin y terminales que siguen a n en el rbol
(pero no los nodos que no siguen a n) y
(e) no intersecta a ningn conjunto de informacin (es decir, si 1m nodo de
decisin n' sigue a n en el rbol, todos los otros nodos en el conjunto de
informacin que contiene a n' deben tambin seguir a -n y, por tanto, deben
incluirse en el subjuego).
Debido al comentario entre parntesis de la parte (a), no contamos el
juego completo como un subjuego, pero esto es slo una cuestin de
estil: eliirtinar ese comentario entre parntesis de la definicin no tendra
ningri efecto.
Podemos utilizar el juego de la figura 2.4.1 y el dilema de los presos
de la figura 2.4.3 para ilustrar las partes (a) y (b) de esta definicin. En la
figura 2:4.1 hay dos subjuegos, que empiezan en cada uno de los nodos de
decisin del jugador 2. En el dilema de los presos (o cualquier otro juego
de decisin simultnea) no hay subjuegos. Para ilustrar la parte (c) de la
definicin', consideremos el juego de la figura 2.4.4. Slo hay un subjuego,
el que empieza en el nodo de decisin del jugador 3 que sigue a D por
parte del jugador 1 y D' por parte del jugador 2. Debido a la parte (c), en
este juego ningn subjuego empieza en ninguno de los nodos de decisin
del jugador 2, aun cuando estos dos nodos son conjuntos de informacin
de un nico elemento..
.
"Vn trtanera de motivar la parte (c) consiste en fumar que queremos
poder ari~liiar ili1subju~gcipor s mismo y que qti~rem6s que el a'niisi's
searei~vait~pai~el juego completo. En la figura 2.4.4, si intentramos
definir un:'subjuego que empezara en el nodo de decisin del jugador 2
qu sigue a la decisin I del jugador 1, estaramos creando un subjuego en
el que el jugador 3 ignora la decisin del jugador 2 pero conoce la deeisln
del jugador.1. Tal subjuego no sera relevante para el juego completo
porque en ~ste lltim el jugador 3 no conoce la jugadade 1, sino que tan
slo observa si (0.1,0.2) = {D,D/} o no. Recordemos el argumento parecido
porelqlleE-fsimojuego de etapa de 1.111 juego repetido no es en s mismo
un stihjUegodeljuego repetido, suponiendo en el caso finito que t < T.
Otra m'anerade motivar la parte (c) es dndonos cuenta de que la
parte (a) slo garantiza que el jugador al que le corresponde jugar en el
nodo n conoce la historia completa del juego hasta ese momento, no que
los dems jugadores tambin conozcan la historia. La parte (c) garantiza
COMPLETA (c. 2)
que la historia completa del juego hasta ese momento sea informacin del
dominio pblico en el siguiente sentido: en cualquier nodo que sigue a
/1, digamos ni, el jugador al que le corresponde decidir,en ni sabe que el
juego lleg al nadan. Por tanto, incluso si ni pertenece a un conjunto de
informacin con ms de un elemento, todos los nodos en ese conjunto de
informacin siguen a n, de forma que el jugador al que le corresponde
decidir en ese conjunto de informacin sabe que el juego ha llegado a un
nodo que sigue a n. (Si las dos ltimas afirmaciones parecen difciles es en
parte porque la representacin en forma extensiva de un juego especifica
lo que el jugadori sabe en cada uno de sus nodos de, decisin, pero no
hace explcito lo que el jugador i sabe en los nodosfe decisin de j,)
Como se ha descrito anteriormente, la figura 2.4.4 ofrece un ejemplo de
cmo podra no cumplirse la parte (c). Podemos ahora reinterpretar este
ejemplo: si caracterizsemos (informalmente)1o que el jugador 3 sabe
en el nodo de decisin del jugador 2 que sigue a la decisin 1 por parte
del jugador 1, diramos que 3 no conoce la: historia del juego .hast~ ese
momento, ya que 3 tiene otros nodos de decisin en lasque 3no sabe sil
jug 1 o D.
~;.
Dada la definicin general de subjuego, podemos;ahora aplicar la
definicin de equilibrio de Nash perfecto en subjuegosde la seccin 2,3.B.
Definicin. (Selten 1965):Un equilibrio de Nash es perfecto en subjuegos si las
estrategias de los jugadores constituyen un equilibrio de Nash en cada subjuego.
Es inmediato demostrar que cualquier juego dinrrlic:finito con.informacin completa (es decir, cualquier juego dinmico en l q~~ iffi ~&nero
finito de jugadores tiene un conjunto de estrategias fac~:I:>.!eSftriit~ri:jn
un equilibrio de Nash perfecto en subjuegos"posiblemenh~ co~ e'stnltegias
mixtas. El argumento procede por: construccin, utilizando un procedimiento parecido a la induccin hacia atrs, y est basad~. en dos o~stTrvaciones. Primero, aunque presentamos el teorema de Nash en el contexto
de juegos estticos con informacin completa, ste se extiend~ a'todo
juego finito en forma normal con informacin complef~, y hemos visto
que estos juegos pueden ser estticos o dinmicos. En segundo lugar, un
juego dinmico finito con informacin completa tiene lll nnerq)lnito
de subjuegos, cada uno de los cuales cumple las hiptesisdelte~r~ria d
Nash.20
. -.
- '.
20 Para construir un equilibrio de Nash perfecto en ~ubjuego's,identifiquemos
primero
t"dos los subjuegos menores que contienen nodos terminales en el rbol del. juego original
"
.....
.C;.,
"
1',.,
i"
.'
~.'.
'
:~
'<.;'
pero imf,,:rfeela
/127
,/,'
'a4:(aT~0.2)).
"'-:,'
una
3
1
1
2
o
O
Figura 2.4.5
COMPLETA (e. 2)
::.:',,,
en
','.'
(: '
.;:'
,....
,,'"
-,
captulo 4).
Seccin 2.1: Sobre los salarios y el empleo en empresas con fuerte ~pl~~:
tacin sindical, vase ~ m~d~k, de negociacin repetida en.Espinosa y
Rhee (1989; ejercicio 2,lO}y un'modelo de tina nica negociacin en el que
las empresas pueden escoger negociar sobre salarios y empleo o slo sobre
salarios, en Staiger (199), Sobre la negociacin sucesiva, vase un modelo
al estilo de Rubinstein de negciacin entre una empresa y un sindicato en
Ejercicios
130 / JUEGOS DINMICOS CON INFORMACIN
",
.',.-.
/ 131
COMPLETA (c. 2)
2.2 Supongamos ahora que padre e hijo juegan un juego diferente, analizado originalmente por Buchanan (1975). Los ingresos IH e Ip estn
fijados exgenamente. Primero, el hijo decide qu parte del ingreso If{
ahorrar (S) para el futuro, consumiendo el resto UR - S) hoy. En segundo lugar, el padre observa la eleccin de S por parte del hijo y escoge una herencia, B. La ganancia del hijo es la suma de las utilidades
presente y futura: Ul UR - S) + U2(S + B). La ganancia del padre es
V(Ip - B) + k[U1 (IR - S) + U2(S + B)]. Supongamos que las funciones de
utilidad Ul, U2, y V son crecientes yestrictamente cncavas. Demustrese
que hay un "dilema del samaritano": en el resultado por induccin hacia
atrs, el hijo ahorra demasiado poco, para inducir al padre a dejarle una
herencia mayor (es decir, tanto las ganancias del padre corno las del hijo
podran aumentar si S fuera convenientemente ms alto y B convenientemente ms bajo).
2.3 Supongamos que los jugadores en el juego de la negociacin con horizonte infinito de Rubinsteintienen factores de descuento diferentes: 81
corresponde al jugador 1 y {j2 al jugador 2. Adptese el argumento dado
en el texto para demostrar que en el resultado por induccin hacia atrs,
el jugador 1 ofrece el acuerdo
2.6 Ejercicios
2.1 S.upongamos que un padre y un hijo participan en el siguiente juego,
anahzado originalmente por Becker (1974). Primero el hijo toma una
accin, A, que.resulta en un ingreso para l, IR (A), yen un ingreso para
el padre;Jp(A).
(Pensemos en I H(A) corno el ingreso dl hijo, neto de
cualquier coste de, la accin A.) En segundo lugar, el padre bserv los
132/
Ejercicios I 133
otro difcil (D), y que la preparacin es til en los dos empleos, pero ms
. en el difcil: YDO < YEO < YES < YDS, donde Yij es lo que el trabajador
produce en el trabajo 'i (= E o D) cuando el trabajador tiene un nivel de
preparacin de j (~ O o S). Supongamos que la empresa puede comprometerse a pagar salarios diferentes en los dos empleos, 'WE y 'WD; pero
ningl,J.n9de estos dos salarios puede ser menor que el salario alternativo
del trabajador, que normalizamos a cero.
El desarrollo temporal del juego es el siguiente: En el momento O la
empresa escoge 'WE y 'WD Yel trabajador observa estos salarios. En el ~~mento 1 el trabajador entra a formar parte de la empresa y puede adqumr
el nivel de preparacin S a un coste C. (Ignoramos laproduccin'y los
salarios en el primer periodo. Puesto que el trabajador no ha adqUirido
an la preparacin, lo eficiente es que se le asigne el trabajo E.) Supongamos que YDS - YEO > e, de forma que al trabajador leconyiene adquirir
la preparacin. En el momento 2 la empresa observa si el trabajador ha
adquirido o no la preparacin y decide entonces si concederle el ascenso
al trabajo D o no durante el segundo (y ltimo) periodo de empleo qel
trabajador..
"".':Los beneficios de la eID:presa en el segundo periodo son Yij- 'W;,
donde el trabajador realiza el trabajo 'i y tiene un nivel de preparacin j.
La ganancia del trabajador por realizar eltrabajo i en el segundo periodo
es 'Wi o 'Wi - e, dep.endiendo de si el trabajador se ha preparado o no en el
primer periodo. Hllese el resultado por induccin hacia atrs, Vase un
modelo ms complejo en Prendergast (1992).
!.:::' .
0'-
.~.
ti:! I
Eje,.cici()~ / 135
COMPLETA (e. 2)
.".,;.,'
2,2
x,O
-1,0
0,0
O,x
4,4
-1,0
0,0
0,0
0,0
0,2
0,0
0, -1
0, -1
-1, -1
2,0
Ejercicios I 137
produccin de monopolio, cul es el equilibrio de Nash perfecto en subjuegos simtrico ms rentable al que puede llegarse utilizando estrategias
del disparador?
j'.'
(;::-:-'
:~
"'",'
Refrrencias
COMPLETA (c. 2)
/\39
2.7 Referencias
ABREU,
JOlll'1wl
140/
-.
COMPLETA (e. 2)
Repeated
Referencias / 141
Ecollometrica 56:383-96.
ABJ~EU,D., D. PEARCE, y E. STACCHETTI. 1986. "Optimal
with Imperfect
o/ Economic
Cartel Equilipria
Monitoring."
Review
"JointProjects
without
Commitment."
5tudies 58:259-76.
in In#3529
o/ Economic
"A Non-cooperative
Equilibrium
for Supergames."
Studies 38:1-12.
AKE1~LOF,C., Y J. YELLEN, eds. 1986. Efficiency Wage Models 'o/ the Labor
Market. Cambridge, Inglaterra: Cambridge University Press.
BECKER, G. 1974.
FRIEDMAN, J. 1971.
Review
and Incomplete
in Repeated
Carnes
Econometrica 54:533c54.
Inforrnation."
Collusion
Wage Bargaining
Under Irnperfect
and Industry
Structure."
and In':
oumal of .
in a
KREPS, D. 1990. A Course in Microeconomie Theory. Princeton,
University Press.
NJ: Princeton
oumal of Political
of Social Interactions."
Economy 82:1063-93.
1982.
"Sequential
Equilibrium:."
Eeonometne~
. .' ~;
1985. "Finitely
-. 1989. "Renegotiation
in Finitely
School Working Paper #89-004.
Repeated
Econometrica
Carnes."
50:863-94..
LAZEAR,
Repeated
Carnes."
Harvard
.
Business
Debt:
Is to Forgive
to Forget?"
Deposit
Insurance,
and
as a Repeated
Carnes."
Carnes
as Optimum:
Annual
Wage
in Repeated
and Industrial
:L'.iC,;
.:/
man Capital
e 1992.
Acquisition."
in Inducing
aparicin
Specific Hu-
en Quarterly oumal o/
Eeonomies.
Two
ROSEN, 5.1986.
in Elimination
Tournaments.'~
Ame-
1;;
. ~,.
ROTEMBERG,
J., y G. SALONER.1986. "A Supergame-Theoretic Model of
Busmess Cycles and Price Wars during Booms." American Economic Review
76:390-407.
3. JUEGOS ESTTICOS
CON INFORMACIN INCOMPLETA
RUB~STEJ.'\I,
A. 1982. "Perfect Equilibrium in a Bargaining Model." Econometrzca 50:97-109.
..
, ,'
.~
,~:;
of Bargainin ."
g
STA~:I<ELBERG,
H. VON. 1934.. Marktform und Gle:hgewicht.
Spnnger.
Viena: Julius
STAIGER~
D. 1991. "Why Do Union Contracts Exclude Employment?" Stanford Uruversity, Mimeo.
TIROLE,J. 1988. The Theory o/ Industrial Organization.
Press.
.{,;',
ambridge: MIT
Con este captulo comienza nuestro estudio de los juegos con ill!0r1110Il
incompleta, tambin llamados juegos bayesianos .. Recordemos que en un
juego con infoIDlacin completa las funciones de ganancias de. los juga~
dores son informacin del dominio pblico. Por el contrario, en un juego
con informacin incompleta, al menos un jugador no est'seguro de la
funcin de ganancias de otro jugador. Un ejemplo comn de un juego
esttico con informacin incompleta es una subasta de sobre cerrado:
cada participante conoce su propia valoracin del bien subastado, pero no
conoce las valoraciones de los otros participantes, y las pujas se entregm
en sobres cerrados, por lo que las decisiones de los jugadores pueden considerarse simultneas. Sin embargo, la mayora de los juegos bayesianos
con inters econmico son dinmicos. Como veremos en el captuJo,4,
la existencia de informacin privada conduce de forma natural a que las
partes informadas intenten comunicar (o a confundirlos), y que las partes no informadas intenten conseguir informacin. Estas cuestiones son
intrnsecamente
dinmicas.
.
'
En la seccin 3.1, definimos la representacin en forma normal de
un juego bayesiano esttico y el equ.i1ib'nbayesiano de Nash en dicil~
juego. Puesto que estas definiciones son abstractas y algo complejas,
introduciremos las ideas principales con un ejemplo sencillo, el de l~
competencia a la Cournot bajo informacin asimtrica.
En la seccin 3.2 consideramos tres aplicaciones. En priiller lugar,
ofrecemos una discusin formal de la interpretacin de las estrategias
mixtas dada en el captulo 1: la estrategia mixta del jugador .i representa
la incertidumbre del jugador i con respecto a la estrategia pura que eligir
j, y la eleccin de j depende de una cierta informacin privada. En
segundo lugar, analizamos una suba sta "de sobre cerrado en la que las
valoraciones de los participantes son informacin privada, mientras que
la valoracin del vendedor es conocida. Finalmente, consideramos el
caso en el que un comprador y un vendedor tienen, cada UIlO de ellos,
informacin privada sobre sus valoraciones (como cuando una empresa
14.1/
INCOMPLETA (e. 3)
qi -
q2) - cBlq2'
q2
maxB
q
[(a -, ql - qi(cA)
'cJ ql
+ (l -
B) [(a -ql
q2
qi -
c] ql
q2(CA) -
a -
qi -
CA
a-
qi -
CB
-2
qi(c~)
.,"
L...
B [a - qi(cA)
ql =
c]
+ (l 2
'
Supongamos que estas condiciones de primeror.den caracteriz~i~isoluciones de los problemas de 'optimizacin anterires, '\Recotdem:~s.~el
ejercicio 1.6 que, en un duopolio de Coumot .C?-!1 ~oI1llacin.co.~gl~ta,
si los costes de las empressson lo'suficientemente diferentes entre s, la
empresa con el coste alto no produce nada en-equilibio. Corno ejeicoo,
hllese una condicin suficiente para excluir aqu problemas anlogos.)
Las soluciones a las tres condiciones de primer orden son
y
max[(a
- qi(CB) -
q2) - cAlq2-
qi =-
a -
2c +BCA + (l 3
B)cB
"
1 .:.::-
(
"-'.-
146/
(..,
.
s estlticos y eqllilib,'io bayesiallo de Nosl, ! 147
Teoria: Juegos bayesw,lO
INCOMPLETA (c. 3)
de
a;
""-
Ahora queremos representar en forma normal un juego d decisin simultnea con informacin incompleta, tambin llamado juego bayesiano
esttico, El primer paso consiste en representar la Idea de que cadajugadar conoce su funcin de ganancias, pero puede no conocer las de otros
y
1rZ(ql,qZ;
= [(a - ql - '1z) -
e)
ql
. que e 1 espaCIO
'de tipos
de" la empresa 2 es Tz = {CB,CA} y
Podemos deCIr
.
qu el espacio de tipos de la empresa 1 es 7] = {c}',
l'
d
'"
del.' tipo de un jugador, decrr
Da d a esta d e fimCIOn
'1 que e ' Juga~' or
,.
.-'
.-';, d"e gananCIas
'es
equivalente " a deCIr que e Jugalor /.
1 conoce su fuhcIOn
" '.
,
d ..decir que el Jugador '1, puede no estar
conoce su tIpo, Del rmsmo mo o,
, I t .
de otros J'ugadores es
seguro d e las fuh'CIonesed ganancI'as
.
. equwa ene
d
'
a decir que puede no estar
seguro. de los tipos de otros Jugadores,
, r, e-I
t ). Utilizamos T-i para mucar e
notados por t- = (t],., . ,/i_l,t,+l".
.. , 'n
148/
INCOMPLETA (c. 3)
... ,an;tl,
,tn).
La segunda cuestin tcnica se refiere a las conjeturas Pi(Ltlti). SupOl\emos que es del dominio pblico que en el paso (1) del desarrollo
temporal del juego esttico bayesiano, el azar escoge un vector de, ,tipos
t = (tI, ... ,tn) de acuerdo con la distribucin a priori de probabilidad p(t\
Cuando el azar revela ti al jugador i, ste puede calcular laconjel:tiiPi(Lilti) utilizando la regla de Bayes:2'
a, "
Pi(Li Iti) =
p(L;,ti)
P(ti)
p(L;,ti)
p(L;,ti) .
t_iET_i
Adems, los otros jugadores pueden calcular las distintas conjeturas que
podra, formarse el jugador -i, dependiendo del tipo de i, concretame,nte
2 La regla de Bayes es una frmula para calcular P(AiB), la probablIidad (condidomida)
de ql.\e un suceso A ocurra dado que un suceso B ha ocurrido ya. Sean peA), P(B) y P(A,El
las prob,abilidaqes (a priori, es decir, las probabilidades antes de que A o B hayan podido
ocurri~) de qu~ A ocurTa, de que B ocurra y de'que ambos A y B ocurran respectivamente. La
regla de Bay",s establece que'P(AIB) ; P(A,B)/ P(B). Es decir, la probabilidad condicional
d", que se d /1es igual a la probabilidad de que se den tanto A como B, dividida por. la
pr~babilida'd
pri9ri de que ocurra B.
150/
INCOMPLETA (c. 3)
.,
"
-.-"{'
..~:
Definidri:Enet'uegobayeslm.iJestticoG=={AI,:.A'TI
.".,'
nI
' .. "' T 'PI
P":; Ul~' .. ,U,;}, una'estrategia
del jugador i es una funcin Si(t;) donde, para
cada tipo ti en Ti, Si(ti)'determiha la accin del conjunto factible Ai que el tipo ti
elegira si el azar determinara que el jugador es de este tipo.
_
nI
1."/
'
152/
Aplicaciones / 153
INCOMPLETA (e 3)
Definicin. En el juego bayesiano esttico G = {Al,' .. ,:1n; TI, ... ,T,,; PI, .
estrategias
= (.~1',... ,"~) forman un equilibrio bayesiano
de Nash (con estrategias puras) si para cada jugador i y para cada uno" de sus
tipos ti en Ti, si (ti) es una solucin de
,,*
Pat
pera Boxeo
pera
2,1
0,0
Boxeo
0,0
1,2
Chris
Es decir, ningn jugador quiere cambiar su estrategia, incluso si el cambio supone
cambiar slo una accin para un tipo.
Es inmediato dem'ostrar que en un juego bayesiano esttico finito (es
decir, un juego en el cual TI es finito y (Al, ... ,A,,) Y (Tl, ... ,T,.) son todos
conjuntos finitos) existe un equilibrio bayesiano de Nash, tal vez con
estrategias mixtas. La demostracin es muy similar a la de la existencia
de un equilibrio de Nash con estrategias mixtas en juegos finitos con
informacin completa, por lo que la omitimos.
3.2 Aplicaciones
3.2.A Revisin de las estrategias mixtas
Como mencionamos en la seccin 1.3.A, Harsanyi (1973) interpret la
estrategia mixta del jugador j como la incertidumbre deTjugador i sobre
la estrategia pura elegida 'por el jugador j y que, a su vez; la eleccin de j
depende de cierta informacin privada. Ahora damos"i.m\~rlI1cido'ms
preciso de esta idea: un equilibrio de Nash con~str~tegi~~ 'mixtas en u~
juego con informacin completa puede (casi siempre) interpretarse como
un equilibrio bayesiano de Nash con estrategias puras en un juego muy
similar con algo de informacin incompleta. (No tendrem9sen cuenta los
casos raros en los cuales tal interpretacin no es posible.) De un modo ms
evocador, la caracterstica crucial de un equilibrio de Nashcori estrategias
mixtas no es que el jugador j elija una estrategia al azar, sirio'que el jugadr
i no sabe con certeza la eleccin del jugador j. Esta falta de certeza puede
provenir de algn suceso aleatorio o (ms probablemente) de tin poco de
informacin incompleta, como en el siguiente ejemplo.
-Recordemos que en la batalla de los sexos existen dos equilibrios de
Nash con estrategias puras, (pera, pera) y (boxeo, boxeo), y uno con
estrategias mixtas, en el que Chris elige la pera con probabilidad 2/3 y
Pat elige el boxeo con probabilidad 2/3.
Boxeo
pera
2 + te,l
0,0
Boxeo
0,0
1,2 + tp
Chris
""';
.','.
","
154/
,'.
\.~}
]VEGaS
Aplicaciones
INCOMPLETA (c. 3)
-.
E.(2+tc)+
j;
"
.,
[ 1--
C].
x
. O+ -(2 +
tp)
e.,
= -(2
de
.'
+ tp)
C]
ee
1-- .1+-.0=1--,
x
x
x
tp .;::: ..-
:-
3 = p.
2:1;
+4:;
"
que tiende a 2/3 cuando :; tiende a cero. Por lo tanto, cuando la informacin incompleta desaparece, el comportamiento de los jugadores en
este equilibrio bayesiano de Nash con eslrategias puras del juego con
informacin incompleta tiende a su comportamiento en el equilibrio de
Nash con estrategias mixtas en el juego original con informacin completa,
3.2.B Una subasta
v; ~.
x'
-3 +)9
1------
/ 155
si bi > bj,
si bi = bj,
(3.2,2)
Resolviendo (3.2.1) y (3.2.2) simultneamente obtenemos p = e y p2 + 3px= O.'Reiolvlendo la ecuaCin de segundo gradase demuestra que la
probabilidad:deque Chris elija la pera; concretamente (x ::..c)/x, y la de
que Patel1ja ei boxeo, concretamente (x- p)/x, son'ambas iguales a.
si bi
<
bj.
Para obtener un equilib~io bayesiano de Nash de este juego comenzarnos construyendo los espacios de estrategias de los jugadores. Recordemos que en un juego bayesiano esttico, una estrategia es una funcin
que va de tipos a acciones. Por lo tanto, para el jugador i una estrategia
156/
JUEGOS ESTTlCOSCON
INFORMACIN
INCOMPLETA Ce. 3)
Aplicaciones / 157
es una hmcin bJv) que determina la puja que elegira cada uno de los
tipos (es decir, valoraciones) de i . En un equilibrio bayesiano de Nash, la
estrategia bl (VI) del jugador 1 es una mejor respuesta a la estrategia b2(V2)
del jugador 2 y viceversa. Formalmente, el par de estrategias (b1 (VI ),b2 (V2
constituye un equilibrio bayesiano de Nash si, para cada V en [0,1], b;(vi)
es una solucin de
max(v.-
b)
Prob{b >
bj(vj)}
-(v. - bi)
Prob{bi
= bj(uj)}.
n,ax(Vi - b) Prob{bi
>
aj
+ CjVj},
P. ro b{b
.i
>
aj +Cjv]
} --
p.10 b { Vj
bi < ---
aj } = ---o
bi - aj
Cj
5(0 < aj < 1, existen varios valores de Vi tales que Vi < aj, en cuyo caso
bi (V) no es lineal, sino plana al principio y con pendiente positiva despus.
Como estamos buscando un equilibrio lineal, excluimos O < aj < 1,
centrndonos en aj 2: 1 Y aj ::; O. Pero el primero no puede darse en
equilibrio: puesto que es ptimo para un tipo ms alto pujar tanto al
menos corno la puja ptima del tipo ms bajo, tenemos que Cj 2: O, pero
entonces aj 2: 1 implicara que bj(Vj) 2: Vj, lo que no puede ser ptimo.
Por lo tanto, si b;(vi) tiene que ser lineal, debemos tener aj ::; O, en cuyo'
caso b;(v.) = (Vi + aj)/2, por lo que ai = aj/2 y Ci= 1/2.
R9\:h~f\19s.
reRe!ir el D.1Smo
anlisis para el jugador j suponiendo que el
jugac!9i'iadOpta Iastrate&'ab;(vi) ~Q-i +civi,'con lo qu~ obtenernos ai::; O,
aj = a;/2 y Cj = 1/2:' Combinando estos dos conjuntos de resultados
tenemos que ai = aj = O Y c.-= Cj = 1/2, es decir, bi(Vi) = v;/2, como.
dijimos antes.
Podramos preguntarnos si hay otros equilibrios bayesianos de Nash
en este juego, y tambin cmo las pujas en equilibrio cambian cuando
la distribucin de las valoraciones de los jugadores cambia. Ningunacie
estas cuestiones puede reslverse utilG:ando la tcnica que acabaiTIosdi
aplicar (proponer estrategias .lineales y despus derivar los coeficientes
que l~s cOnvierten enequllibrio).
No conduce a niI:guna part~ inte~~..
taradivinar todas las formas funcionales que podran tener otros egi1ilibrios de este j~ego, y no existe equilibrio lineal para ninguna otra distribucin de valoraciones. En el apndice, derivamos un equilibrio bayesiano simtrico}. nuevamente para el caso de valoraciones uniformemente
distribuida;, Suponiendo _qu~.lasestrategias de los jugadores son estric~
tamentecrecientes y diferenciables, demostrarnos que el nic,?equilibi;i,~
bay~sianode NashsjII1~tIjcQ.e_s el equilibrio lineal que ya1erros' deri~
vadO. La tcnica que utilizarnos puede extenderse fcilmente a una clase
ms amplia.de distribuciones de las valoraciones, y tambin al caso de n
participil;ntes.4
Cj
AplicacirJlles
/ 159
Apndice
Supongam.os queel jugador j adopta la estrategia bO y supongamos que
N.) es estnctamente creciente y diferenciable. Entonces', para un valor
dado de Vi la puja ptima del jugador ies una solucin de
>
b(vj)}.
bi
Sea b-1 (bj) la valoracin-que el participante j debe tener para pujar bj; esto
es, b-1(bj) = Vj sibj = b(vjtP.4esto que.vj est uniformemente clistribuida
en [O,ll,Prob{bi > b(1jt= Prob{b:2-I(b> v= b-1(bi). La condicin de
primer orden.para la opti~zacin del probletriadl jugador ies
.
-b-1(bi)
d'
+ (Vi ~ bi) db. b-(bi)
'1
= O.
.;
-b-l(b(~i
.'.
'.'
O.
t'i
) = O,
la cual~e expresa de un modo ms conveniente como b' (Vi)Vi +b( Vi) = Vi. La
parte izquierda de esta ecuacin diferencial es precisamente d{ b(Vi )Vi} /dVi.
Integrando ambas partes de la ecuacin obtenemos
1
b(v)v'
7.
t = -'Il
2 1_ + k ,
max Pb [v b -
Pb+E[P,(v,)IPb>,,(U,)J]
2
Prob{p
.
>p
1) -
(7) )}
S
(3.2.3)
Aplicaciones!
donde E[psCuJlpb
2':f'JuJJ es el precio esperado que pedir el vendedor,
condicionado a que lo que pida sea menor que el precio ]lb ofrecido por el
cumprador. Para cada Vs en [0,1], J!s(Vs)es una solucin de
(3.2.4)
donde E[Pb(Vb)lpb(Vb)
2':PsJ es el precio esperado que ofrecer el comprador condicionado a que lo que ofrezca sea mayor que el precio Ps que pide
el vendedor.
Vb
Intercamqio
x
161
del vendedor es una mejor respuesta a la del comprador, ya que para los
tipos del vendedor que hacen que el intercambio se prefiera a la ausencia
de intercambio ste ocurre, y viceversa. El argumento anlogo demuestra
que la estrategia del comprador es una mejor respuesta a la del vendedor,
por lo que estas estrategias forman un equilibrio bayesiano de Nash. En
este equilibrio el intercambio se da para los pares (VsUb) indicados en la
figura 3.2.1; el intercambio sera eficiente para todos los pares (V"Vb) tales
que Vb ~. Vs, pero no se da en las dos regiones sombreadas de la figura.
Ahora derivamos un equilibrio bayesiano de Nash lineal de la subasta
doble. Como en la seccin anterior, no restringimos los espacios de estrategiasdelos jugadores de nianera que se incluyan solamenre las estrategias
lin~ales, sino que pennitimos que los jugadores elijan estrategias arbitrarias pero nos preguntamos si existe un equilibrio que sea lineal. Existen
muchos otros equilibrios adems de los equilibrios de precio nico y el
equilibrio lineal, pero el equilibrio lineal tiene propiedades de eficiencia
interesantes que describiremos ms adelante.
Supongamos que la estrategia del vendedor es Ps(vs) = as + CsVs'
Entonces Ps est uniformemente distribuido en [as,as + cs], por lo que
(3.2.3) se convierte en
as + Pb}]
max [Vb - -1 {Pb + .--Pb
2
2
(3.2.5)
"-; .:r.,:,,,: .,;_._~_
V.
Figura 3.2.1
max [ -2 Ps +
. p,
Ps + ab + Cb }
....
Cs
Pb = 3"Vb + 3"as.
;';:
Pb - as
---,
,','
<:.
(3.2:6)"
Apl icnCollcs
162/
163
INCOMPLETA (c. 3)
(ab
Ch)
(3.2.7)
v,
v, = v, + 0/4)
V,=
v,
Intercambio
p,,(v.) =
3v., + "4
v,
3/4
Figura 3.2.3
3/4
1/4
".'
;..J'
V"
Vb
"
,
Figura
3.2.2
l~ figura 3.2.3. (De acuerdo con esto, la figura 3.2.2 revela que, para los
tIpos del vendedor por encima de 3/4, se realizan demandas por encima
de la oferta ms alta del comprador Pb(l) = 3/4, Yque para los tipos del
vendedor por debajo de 1/4 se realizan ofertas por debajo de la oferta ms
baja del vendedor, P. (O) = 1/4.)
lb4 / JUEGOS
ESTTICOS
CON
INFOI<iVIACIN
INCOMPLETA
(e. 3)
si /lb 2:
ti..).
forma continua en [:l:s,ys], donde Ys > Xb e Yb > x" no existe ningn juego
de negociacin al que quisieran jugar el comprador y el vendedor que
tenga un equilibrio bayesiano de Nash en el que el intercambio ocurra si
y slo si es eficiente. En la prxima seccin vamos a indicar cmo puede
utilizarse el principio de revelacin para demostrar este resultado general.
Concluimos esta seccin aplicando este resultado al modelo de empleo de
Hall y Lazear: si la empresa tiene informacin privada sobre el producto
marginal m del trabajador y el trabajador tiene informacin privada sobre
una oportunidad alternativa ti, no existe ningn je'gode negociacin que
la empresa y el trabajador quisieran jugar que 'produZca empleo si y slo
si es eficiente (es decir, si y slo si m2: v).
3.3 El principio
de revelacin
Los juegos de esta clase (es decir, los juegos estticos bayesianos en los
cuales la nica accin del jugador es hacer una declaracin sobre su tipo)
se llaman mecanismos directos.
La segunda manera en la que el vendedor puede utilizar el principio de revelacin es limitando su atencin a los mecanismos directos, en
los cuales decir la verdad constituye un equilibrio bayesiano de Nash
para cada participante, es decir, a ls funciones de oferta y de probabilidad {Xl (TI", . ,Tn),. ,. ,Xn(Tl,' .. , Tn); ql (TI,' .. ,Tn), ... ,qn(Tl,'",
taun)}
tales que la estrategia de equilibrio de cada jugador i sea declarar Ti (t;) =ti
para cada ti en n. Un mecanismo directo en el cual decir la verdad constituye un equilibrio bayesiano de Nash se llama de incentivos compatibles.
Fuera del contexto del diseo de una subasta, el principio de revelacin puede seguir siendo utilizado de estas dos maneras. Cu~lquier
equilibrio bayesiano de Nash de un juego bayesiano puede representarse
<;:onun nuevo equilibrio bayesiano de Nash en un nuevo juego bayesiano
adecuadamente escogido, en el cual por "representado" queremos decir
que para cada posible combinacin de tipos de los jugadores (tit ... ,tn),
las acciones y las ganancias de los jugadores en el nuevo equilibrio son
idnticos a los del equilibrio original. Itdependientemente de cul sea el
juego original, el nuevo juego bayesiano es siempre un mecanismo directo;
independientemente del equilibrio original, el nuevo equilibrio siempre
consiste en decir la verdad. De manera ms formal:
r,:
".'.
166/
INCOMPLETA (c. 3)
',':
,".
..
.. :
INCOMPLETA (e. 3)
Ejercicios I 169
donde t = (t, ... ,tn). Se podra pensar que estas ganancias se dan porque
un observador imparcial se acerca a los jugadores y pronuncia el siguiente
discurso:
".,/
\ ..
35 Ejercicios
3.1 Qu es un juego bayesiano esttico? Qu es una estrategia (pura)
en tal juego? Qu es un equilibrio bayesiano de Nash (con estrategias
puras) en dicho juego?
\
',.o',
Ejercicios
ID'-
j)
,o
A 1,1 0,0
A 0,0
B 0,0 0,0
B 0,0 2,2
Juega
Juega2
....
3.5 Recordemos de la Seccin 1.3 que el juegode las monedas (un jueg'.
esttico con informacin completa) no tiene equilibrios de Nash cori's~..
trategias puras; pero' tiene un 'equilibrIo de Nash con estrategias' 'Ilixhis;':';
cada jugador elige cara con probabilidad 1/2 ..
Jugador 2
cara cruz
cara 1,-1
-1,1
Jugador 1
cruz -1,1 1,-1
','
/171
.~;
..tl~'f;'.~"
;10;
..
. en
172/
INCOMPLETA (c. 3)
Referencias
3.6 Referencias
/ 173
of Operations Research
-. 1985. "Bayesian Equilibrium and Incentive Compatibility: An I.ntroduction." In Social Goals and Social Organization. L. Hurwicz, D. Schmeldler,
y H. Sonnenschein, eds. Cambridge: Cambridge University Press.
MYE~N, R., Y M. SATTERHWAlTE.
1983. "Efficient Mechanisms for Bilateral Trading." oumal of Economic Theory 28:265-81.
SAPPINGTON,D. 1983. "Limited Liability Contracts between Principal and
Agent." oumal o/ Economic Theory 21:1-21.
BA1<ON,
D., Y R. MYERSON.1982. "Regulating a Monopolist with Unknown
Costs." Econometrica 50:911-30.
BULOW,J., y P. KLEMPERER.1991. "Rational Frenzies and Crashes." Stanford University Craduate School of Business Research Paper #1150.
CHATTERjEE,K., Y W. SAMUELSON.1983. "Bargaining under Incomplete
Informabon." Operations Research 31:835-51.
DEmE, D. 1988. "Bilateral Trading as an Efficient Auction over Times."
[ol/rIlal of Political Economy 96:100-15.
.
HALL,R., Y E. LAZEAR.1984. "The Excess Sensitivity of Layoffs and Quits
lu Demand." [ournal of Labor Econ01nics 2:233-57.
HARSANYI,J. 1967. "Cames with Incomplete Information Played by Bayesian Players Parts 1 II and I1I." Management Science 14:159-82, 320-34~
486-502.
~3
4. JUEGOS DINMICOS
CON INFORMACIN INCOMPLETA
176
I J;ECOS
L\iCOMPLETA (e. 4)
__
eM@_!.O!' ~!i!!!E'!!!!!'!'!!'!'
:t,"""'~ ..""__..
._.
."_
Introduccin
I 177
En la seccin 4.3 describiremos otras aplicaciones del equilibrio bayesiano perfecto. Comenzaremos c0r:. el. an~~isis de juegos con parloteo
(cheap-talk games) (es decir, juegos de sena1JZacJOnen los cuales los mensajes no cuestan nada), entre cuyas aplicac.ion~sse incluyen 1.asamenazas d~
to
ve Presidencial a las decisiones del legIslativo norteamencano, los
. anun
.
cios de poltica por parte de la autoridad monetaria y las comurucaclOnes
(o "voz") en las organizaciones. En los juegos con parloteo, el ~cance de
la comunicacin se determina por los intereses comu~es de los Ju~adores
ms que por los costes de las seales de los diferentes tipos. EstudIaremo~
a continuacin el modelo de negociacin sucesiva de Sobel y Takahashi
(1983), en el cual una empresa debe tolerar una huelga para den:ostrar
que no puede permitirse pagar salarios ms .altos.(cfr. el.mo~elo ge negociacin con informacin completa de Rubmstem que mclwmos en la
secclOn
. en equilibrio). Finalmente,
..
.
" 2.1.D , en el cual las huelgas no se dan
exploraremos la explicacin clsica de Kreps, Milgrom, ~~bert~ y WIlson
(1982)del papel de la reputacin en el logro de la coopera~~~ raCJOnale~,el
dilema de los presos repetido finitamente (cfr. la proposlclon en ~asecCloIl
2.3.A concerniente al nico equilibrio de Nash perfecto en subJueg~s .de
un juego repetido finitamente basado en un juego de etapa con un m:1CO
equilibrio de Nash).
.:,
En la seccin 4.4 volveremos a la teora. Aunque es la seccin final
del libro, sirve para indicar lo que podra venir a continuaciIl.~~ql.!~
como culminacin de los temas analizados. All describireII10seustraremos dos refinamientos (sucesivos) del equilibrio bayesiano perfecto, el
segundo de los cuales es el criterio intuitivo de Cho y Kreps (1987).
. Introduccin
o'
O
2
O
1
Utiiza~d la rep!esent~ci6n'enfonnan9pnal
de este juego4ad~~
la figura 4.1.2, observ~mq~ que existen~().seqi1ibrios deNash con estra:;:
tegias puras, (1,1') y (D,D'),
(ieterminat SI estos equiiibri~;'d ],{f;h
son perfectos en subjuegos utiHz!Ull0slarepresentacin en {antia e~t~ri~
'.
'
"",'
,'"
,
, ", 'jl'!'
siva para definir los subjuegos del juego. Puesto que un' juego ,esdefr{j~9.,
de modo que comienza en, un nodo de decisin, que no es ~s que~~:
conjunto deinformacin cbn un nico elemento (aunque no es eipri~EJ-,
n~do de decisin del jueg()), el juego'delafigura .l no tiene subjug~~~"
SI un juego no tiene subjuegos, el r~q,uisitode perfeccin en subjuegos
(~o~cretamenteque las estrategias d' los jugadores c~mstituyan un equi~
hbno de Nash en cada subjuego) se cumple de forma trivia( Por tano:
encualquierjuego que no tenga subjuegos la definicin de equilibrio de.
Nash perfec~ en subjuegosles equivalent a la definicin de equilibriocl~
Nash, por lo que en la figura 4.1.1 tanto (1,!') como (D,D') son equilibrios
'de Nash perfectos en subjuegos. No obstante, (D,D') depende claramente
d,euna amen,aza que n resultacreble: si llega el tumo del jugador 2,jugar
1 domma a Jugar D', por 10 que el jugador 1 no debera verse inducido a
jugar D por la amenaza d;l jugador 2 de jugar Di si llega a mover.
r~r
Jug~dor 2
D'
.,:'1:';'
2,1
0,0
0,2
0,1
1,3
.:.:J:"
Jugadorl'
,;~~
Ii"
1,3
I liCJ
"t
1 En cada conj'unto de inFormacin el j'ugador que decide debe
RequISl o .
' J'
'
.
formarse una conjetura sobre el nodo del conjunta ~te injorm,acln al que se 1m
llegado en el juego. Para un conjunto de 111f~,:maclOncon mas de un ele1l1:/lfO,
una conjetura es una distribucin de probabl11dad sobre los nodos del conju/lto
de infonnacin; para un conjunto de informacin con un nico. el:mento, la
conjetura del jugador asigna probabilidad uno al nico nodo de declslO11.
"Figura 4.1.1
l'
perj)"
Una manera de reforzar el concepto de equilibrio para excluir el equi. d Nash perfecto en subJ'uegos (D D') de la figura 4.1.1 es imponer
libno e
' ,
los dos requisitos siguientes:
'o
2
1
..".
Requisito 2. Dadas sus conjeturas, las estrategias de los jugado~~s deben ~~,.
sucesivamente
racionales.
Es decir, en cada conjunto de mformaclOn, la aCClO1l
tomada por el jugador al que le toca tirar y su estrategia subsiguie~te debense.r
ptimas, dada la c01fjetura del jugador en ese conjunto d~ informaclOn y las :llbSl,~
guientes estrategias de los dems jugadores (donde una estra.tegla subslg,Ulente
es un plan de accin completo que cubre cada contmgencla que podna darse
despus de haberse alcanzado el conjunto de informacin).
180
! JUECOS
INCOMPLETA (c. 4)
Introduccin
o
1
o
2
o
1
Figura 4.1.3
"
equl~Ito 3.
al equilibrio
bayesiano
perfecto / 181
sino que ahora tambin incluye una conjetura para cada jugador en cada
conjunto de informacin en el que el jugador tenga que jugar.1 La ventaja
de hacer explcitas las conjeturas de los jugadores de esta manera es que,
igual que en captulos anteriores insistimos en que los jugadores eligen
estrategias crebles, ahora podemos insistir en que se forman conjeturas
razonables, tanto dentro de la trayectoria de equilibrio (en el requisito 3)
como fuera de sta (en el requisito 4 que sigue y en otros de la seccin 4.4).
En aplicaciones econmicas simples, que incluyen el juego de sealizacin de la seccin 4.2.A y el juego con parloteo de la seccin 4.3.A,
los tres requisitos no slo capturan el espritu del equilibrio bayesiano
perfecto, sino que tambin constituyen su definicin. Sin embargo, en
aplicaciones econmicas ms complejas, se necesita imponer msrequisitos con objeto de eliminar equilibrios inverosmiles. Distintos autores han
utilizado. diferentes definiciones del equilibrio bayesiano perfecto. Todas
las definiciones incluyen los tres requisitos; algunas tambin incluyen el
requisito 4 y algunas imponen requisitos adicionales.2 En este captulo
tomamos los requisitos 1 a 4 como definicin del equilibrio bayesiano
perfecto.3
jugador 1?
3 Fudenberg y TIrole (1991) dan una definicin formal del equilibrio bayesiano perfecto
para una amplia clase de juegos dinmicos con informacin incompleta. Su definicin trata
cuestiones como las que hemos planteado en la nota 2. Sin embargo, en los juegos simples
analizados en este captulo. estas cuestiones no se plantean, por lo que su definicin es equivalente a los requisitos 1 a 4; Fudenberg y TIrole ofrecen condiciones bajo las cuales su equilibrio
bayesiano perfecto es equivalente al equilibrio sucesivo de Kreps y Wilson.
,,
''-.'
'.'
'.
\~ ..'
CON INFOR,\IAClN
INCO~II'LET,\
Introduccin
re .)
Definicin U q ''b . b
duras que s'at n, e ul1 no .ayesiano perfecto
lS aeen os requIsItos 1 a 4.
ni equilibrio
bnycsinno
perfccto
/ 183
A
2
L'
O
O
A
Figura 4.1.5
-,,} .. _---
O
1
1
Figura 4.1.4
Este juego ti ne
b'
,
con un n'
un su Ju~go: comIenza en el conjunto de informacin
este sub' ICOe emento ~el Jugador 2. El nico equilibrio de Nash en
Juego entre los Jugadores 2 3
(1 D'
equilibrio de Nash e
. y es , ), por lo que el nico
Estas estrate 'as 1p rfe:to en subJuegos del juego completo es (A,!,D').
g Y a conJetura p = 1 del jugador 3 satisfacen los requisitos
184/
INCOMPLETA (e. 4)
que el equilibrio bayesiano perfecto hace que las conjeturas de los jugadores sean explcitas, este equilibrio no puede reconstruirse procediendo
hacia atrs en el rbol del juego, como hicimos para construir el equilibrio
de Nash perfecto en subjuegos. El requisito 2 determina la accin de un
jugador en un conjunto de informacin.dado basado en parte en la conjetura del jugador sobre dicho conjunto de informacin. Si el requisito 3
o el requisito 4 se aplican a este conjunto de informacin, determinan la
conjetura del jugador a partir de las acciones de los jugadores situados
ms arriba en el rbol. Pero el requisito 2 determina las acciones situadas
ms arriba en el rbol, basndose en parte en las estrategias subsiguientes
de los jugadores, incluyendo la decisin en el conjunto de informacin
original. Esta circularidad implica que una sola pasada ha~a atrs a lo
largo del rbol (normalmente) no es suficiente para calcular un equilibrio
bayesiano perfecto.
, '!li
.r'
mj
UE(ti,mj,ak)
UR(ti,mj,ak).
, 'Jt
_rJ
\
(
(
J'
;',
:- - .:.'
En el modelo deinversirtempresarial
y estruc~rade
capital de Myers y Majluf (1984),el emisor es una empresa
que necesita capital para financiar WI nuevo proyecto, el
receptor es un inversor potencial; el tipo es la rentabilidad
de los activos existentes de la empresa, el mensaje es la
oferta de una participacin en l beneficio de la empresa
a cambio de financiacin y llaccin es la decisin de si
invertir ano por parte del inversor.
expectativa de inflacin por parte de los empresarios precede al juego de seii.alizacin, y la eleccin de la autoridad
monetaria de inflacin en el segundo periodo la sigue,
En el resto de esta seccin analizarnos el juego de seii.alizacin abstracto dado en 1 a 4, ms que estas aplicaciones. La figura 4.2.1 ofrece
una representacin en forma extensiva (sin ganancias) de un caso simple:
T == {tlh}, NI == {ml,m2}, A. == {o.l,o.2}YProb{t] } == p. Ntese que el juego
no se desarrolla desde el nodo inicial en la parte superior del rbol hasta
los nodos terminales en la parte inferior, sino desde una jugada inicial
iterminada por el azar en mitad del rbol hasta los nodos terminales en
los extremos izquierdo y derecho.
Emisor
a,
a,
m,
:
a,
'
,
,
Receptor
Azar
,
,
,
1 - J
a,
m,
t,
ai
a,
Receptor
m,
t,
a,
m,
a,
Emisor
Figura 4.2.1
Recordemos que (en cualquier juego) la estrategia de un jugador es un
plan de accin completo; una estrategia detalla una accin factible para
cada contingencia en la cual el jugador pudiera tener que actuar. Por lo
tanto, en un juego de seii.alizacin, una estrategia pura del emisor es una
funcin m(ti) que especifica qu mensaje elegir para cada tipo que el
azar pueda detemIinar, y una estrategia pura del receptor es una funcin
o.(mj) que especifica qu accin elegir ante cada mensaje que .el emisor
pueda enviar. En el juego simple de la figura 4.2.1, tanto el emIsor como
el receptor cuentan con cuatro estrategias puras.
188/
INCOMPLETA (e. 4)
mI
m2
si el
m2
m2
si el
ai si el
a2
L .(tjmj)
1.
tiET
,'.
'.','
Juegos de se1alzalf
190 / JUEGOS DINMICOS CON INFORMACIN
:," >
/.'
'
P(ti)
E.p(ti) .
".
;':
'\.
"
/ IlJ 1
INCOMPLETA (c. 4)
t,ET,
Definicin, Un equilibrio
bayesiano
erfi t
.'.
.
juego de sealizacin consiste en ," dP ec o ,CO~l estrategIas puras en un
' t
unpar eestrategzasm*(t')ya*(m)
je ura At 1m )
. fi
'j
,yen una
con
(3).
' 'J que satls acen los requisitos de sealizacin (1), (2R), (2E) Y
'.\
(e. 4)
':.
,',,'-,
i
','
4 La presencia de dos empresas en el papel del receptor deja este juego ligeramente fuera
de la clase de juegos analizada en la seccin previa; pero vase la discusin que precede a la
ecuacin (4.2.1).
5 Formalmente, suponemos que trabajadores con alta capacidad sbn ms productivos (es
decir, y(A,e) > 'y(I3,e) para toda e), y que la educacin no reduce la productividad (es decir,
Ye(TI,e) ~ Opara cada 'TI y cada e, donde ye('r,e) es la productividad
marginal de la educacin
",
____________________
(:;:"
..J.
fuegos de sClia/izacin
194
:""r
/195
INCOMPLETA (c. 4)
co~ IAenlafigura).
.
IR
lA
::.
v
w,
~.
Figura 4.2.3
196/
INCOMPLETA (e. 4)
w(e)
= .L(Ale)
. y(A,e)
+ [1 -
.L(Ale)] . y(E,e),
Curvas de
indiferencia
para capacidad
(4.2.1)
y(n,e)
e*(iz)
(';,
;
Figura 4.2.4
Ahora volvemos (deforma permanente) al supuesto de que la capacidad del trabajador es informacin privada. Esto abre la posibilidad d~ que.
un trabajador con capacidad baja pueda tratar de pasar por un trabaJa~or
de capacidad alta. Pueden plantearse dos casos. La ~gura 4.2.5 des~nbe
el caso en el que le resulta demasiado caro a un trabajador con capacIdad
baja adquirir una educacin e*(A), incluso si esto permitier~ engaa~ a las
empresas y hacer que le pagaran el salario w*(A). Es deCIr,en la figura
4.2.5, w*(B)
- c[B,e*(B)]
>
w*(A)
- c[E,e*(A)].
'-:
lA
y(A,e)
w
w*(A)
,',
y(B,e)
w*(B)
e
w*(-,) = Y[',e*Cr)].
e*),
e*(B)
e'(A)
Figura 4.2.5
"
'".'
e')
},
':,:,
,,
Juegos de se>lalizacll
w*(B}
Para completar la descripcin de equilibrio bayesiano perfecto ele agrupacin nos falta (i) determinar la conjetura ele la~ empresas p,(A le) para
las elecciones de educacin e =1 ep fuera del eqUlltbno, que entonces determina el resto de la estrategia de las empresas ll)(e) por medio de (4.2.1),
y (ii) demostrar que la mejor respuesta d: ambos tipos de trabajador a
la estrategia w(e) de las empresas es elegIr e = ep' Est~s dos pasos 1 epresentan los requisitos 1 y 2E de sealizacin respechvame~te: CO~l~O
apuntamos anteriormente (4.2.1) sustituye al reqUlsJto2R de senaltzaclon
en este modelo con dos receptores.
Una posibilidad es que las empresas crean que cualquier niv.elde ed~lcacin distinto de ep indica que el trabajador tiene Wla capaCIdad baja:
p,(A!e) = O para todo e =1 ep' Aunque esta conjetura ,podra parecer extraa, nada en la definicin de equilibrio bayesiano perfecto la e~c1L1ye,
porque los requisitos del 1 al 3 no imponen restricci~~es a las conjeturas
situadas fuera de la trayectoria de equilibrio y el reqwsJto 4 es vacuo en un
juego de sealizacin. El refinamiento que aplicamos en la seccin 4.4 restringe la conjetura del receptor fuera de la trayecto~ia de equilibri~ en un
juego de sealizacin; en particular excluye la conJ::ura que anahzamos
aqu. En este anlisis de los equilibrios de agrupaclOn ~~s cent:3mos en
esta conjetura para simplificar la exposicin, pero tamblen conSIderamos
brevemente conjeturas distintas.
Si la conjetura de la empresa es
__
,_,__
.
e*(B}
/ '199
~L(Ale)
e*(A)
apara
e =1 ep
{ q para e = ep
(4.2.3)
-.':: .
Como describimos en la seccin anterior, en este modelo pueden existir tres casos de equilibrios bayesianos petf~i:tos: de' ~i;rupacin, de separacin e hbrido. Normalmente existen numerososdsos de cada clase de
equilibrio; aqu l~mitamos nuestra atertci6riiirios cant~s ejemplos. En
un equilibrio de agrupacin, los dos tipos del trabajador eligen un nivel de
educacin nico, digamos ep' Elrequisit03'de seilicin impli<;aque
la conjetura de las empresas despus de observar ep debe ser lac'onjetura
a priori p,(Alep) = q, que, a su vez, exige que el salario ofrecido despus de
observarep
sea
(4.2)
_ {Y(E ,e)
wp
7]
para e =1 ep
para e,. -- e-p'
(4.2.4)
max'w(e)
- c(7/,e).
(4.2.5)
INCOMPLETA (c. 4)
de indiferencia del trabajador con capacidad alta que pasa por el punto
(ep'll)p)
est por encima de la funcin de salario tu = y(B,e).
y (A,e)
O
q y(A,e)
+ ( 1 - q)
L(Ale) =
y(R,e)
e'
el'
"
1.:.;.
(R,e)
.
e*(B)
q
{ q
w(e)
{Y(B,e)
wq
Wq
el'
Figura 4.2.7
En resumen, dadas las curvas de indiferencia, las funciones de produccin y el valor de el' en la figura 4.2.7,la estrategia [efE) = ep,e(A) = el']
del trabajador, y la conjetura L(Ale) en (4.2.3)y la estrategia w(e) en (4.2.4)
de las empresas constituyen un equilibrio bayesiano perfecto de agrupacin.
Existen muchos otros equilibrios bayesianos perfectos de agrupacin
en el ejemplo definido por las curvas de indiferencia y las funciones de
produccin de la figura 4.2.7. Algunos de estos equilibrios incluyen una
eleccin de un nivel de educacin diferente por parte del trabajador (es
decir, un valor de el' distinto del de la figura); otros incluyen la misma
eleccin de un nivel de educacin pero difieren fuera de la trayectoria de
equilibrio. Como ejemplo de lo primero, sea e un nivel de educacin entre
ep y el, donde el en la figura 4.2.7 es el nivel de educacin en el eualla curva
de indiferencia del trabajador de baja capacidad que pasa por el punto
(e'(B)w'(B)
corta la funcin de salario w = q . y(A,e) + (l - q) . y(B,e).
C"
'.
01 sustItUImos el' en (4.2.3) y (4.2.4) por e, la conjetura y la estrategia
resultantes de las empresas, junto con la estrategia [e(B) = e,e(A) = e] del
(,',
"
0'
",<
,'.
'.',',','
1'.>.,
________
.:..--
1::'
Juegos de selaliznci"
INCOMPLETA (e. 4)
2m
y(A,e)
O
p,(Afe) = { 1
10
(4.2.6)
( _ { y(E,e)
we ) y(A,e)
Puesto que e'(A) es la mejor respuesta del trabajador con capacidad alta.
a la funcin de salariosw = y(A,e), tambin es la mejor respuesta aqu.
Con respecto al trabajador de baja capacidad, e7(B) es la mejor respuesta
de dicho trabajador cuando la funcin de salarios eSw == y(E,e), de manera que w'(E) -e[B,e'(E)]
es la mayor ganancia.que el trabajador puede
lograr de entre todas las elecciones de e < e'(A), Puesto que las cur~.
vas de indiferencia del trabajador de baja capacidad tienen mayor pen.:
diente que las del trabajador de alta capacidad; w~(A) - e[E,e'(A)] es
la mayor ganancia que puede conseguir; aqu un trabajador de baja capacidad de entre todas las elecciones de e 2: e'(A).
Por tanto, e'(E)
es la mejor respuesta de un trabajador de baja capacidad, puest? qu~
w'(E) - dE,e'(E)]
> w'(A) - dE,e'(A)] en el caso en que no hay envidia_
A partir de aqu ignoramos el caso en el que no hay envidia. Como
sugerimos anteriormente, la figura 4.2.6 (el caso con envidia) es ms inte"'
resante. Ahora el trabajador con capacidad alta no puede ganar el salario
alto roCe) = y(A,e) simplemente eligiendo la educacin e'(A) queelegia
bajo informacin completa. En su lugar, para sealizar su capacidad, el
trabajador con capacidad alta debe elegir e., > e'(A), .como muestra la
figura 4.2.8, puesto que el trabajador con capacidad baja imitar cualquier
valor de e entre e'(A) y es si hacerlo lleva a las empresas a creer que tiene
capacidad alta. Formalmente, el equilibrio natural bayesiano perfecto de'
separacin incluye ahora la estrategia [e(E) = e'(E),e(A) = es] del trabajador y las conjeturas de equilibrio p[Ale'(E)] = O Y{t[Ales] = 1 Ylos salarios
de equilibrio w[e'(E)] = w'(E) y w(es) = y(A,es) de las empresas. ste es
el nico comportamiento en equilibrio que sobrevive al refinamiento que
aplicaremos en la seccin 4.4.
y(A,e,J
w'(A)
y(B,e)
w'
(L)
e*(B)
e'(A)
es
Figura 4.2.8
.,
de e uilibrio, de las conjeturas de las emjJr~sas
Una expreslOn, fuera
.q
., .
Itrabajador tIene
que sustenta este comportamiento de e~Ulhbno es que ~o'
capacidad alta si e 2: e., y capacidad baja en caso contra .
O
para e
p,(Aje) = { 1 para e
< es
2: e.,.
para e < es
para e 2: es.
.
cidad baja tiene dos
Dada esta funcin de salarios, el trabaJado.r con capa.
ar' (A,e,).
". .. .
l . '(E)
ganar 1}! (B) y elegIr es y gan.l/
.
mejores respuestas: e eglr e
y
.
f
d p'(JJ)' al.
ue esta indiferencia se resuelve en avor e ~
,
Vamos a suponer q
.'
f dad arbitrariamente
. '"
d 'amos aumentar es en una can 1
.
temativamente po n
..
'd d b J'aprefiriera estnc- d
ue el trabajador con capaCl a a
pequena e manera q
,...
'd d alta las elecciones
tamente e'(E), En cuanto al trabajador con capan a
,
.'
d
.
.
> e'(A). :Puesto que
las LUlvas e
. de e > e son lnfenores a e" ya que e.,.
,
'j'
s
.
'dad baJ'a llenen mas pem lente que
indiferencia del trabaJador con capacI
.
1 '1 .
.d d lta la curva de indiferenCla de u t11110
las del trabajador con capacl a a ,
.,
1 .'
que pasa por el punto ( e"y. (A ,es est por encima de la funclOn de s.a allos
b"
.
1 que las. elecciones de e < es son tam len
w = y(B,e) para e < e" por o
- c[B,e*(E)]
= 'Wh - c(E,eh).
\:.'
"
;;'
'.'
,"
"
(4.2.9)
(4.2.8)
Recordemos de la nota 2 ele! captulo 3 que la regla de Rayes establece que P(AIB) =
p(A.m/
P(8). Para derivar (4.2.8), reformulemos la regla de Bayes como P(A,E) = P(BIA).
1-'(04), por lo que P(AIE) = P(BIA).
1-'(04)/ P(B).
6
q
Wh = ---~.
q + (l - q)7f
.
y(A,e.)
(1 - q)7f
q
(1
).
7f
y(E,eh).
(4.2.10}
....
INCOMPLETA (c. 4)
Para un valor determinado de eh, si (4.2.9) da que '/1)h < y(A,eh), entonces
(4.2.10) determina el valor nico de que constituye un equilibrio hbrido
en el cual el trabajador con capacidad baja escoge aleatoriamente entre
e*(E) y eh, mientras que si '/1)h > y(A,eh),
no existe ningn equilibrio
hbrido que incluya eh.
7["
O
/.L(A\e) = { r
y(A,e)
para e < eh
para e 2': e".
r y(A,e)
+ O - r)
y(E,e)
w(e) = { r . y(A,e)
.
y(B,e)
+ (l - r) . y(B,e)
para e <
para e 2':
eh
eh.
Slo queda por comprobar que la estrategia del trabajador (e(B) = e" con
probabilidad 7[",e(B)
e*(E) con probabilidad 1 - 7[";e(A) = eh) es una
mejor respuesta a la estrategia de las empresas. Para'el trabajador con
capacidad baja,la e < eh ptima es e*(B) y la e 2': eh ptima es el~' Para el
trabajador con capacidad alta, eh es superior a todas las alternatlvas.
w~
q y(A,e)
+,0-
q) y(B,)
,
,,
,
y(B,e)
'~
. 1:,
w*(B)
' ..
'
'.'
e*(B)
Figura 4.2.9
.....
7["
o.'
)' n
Juegos de sel1aliZJlcin
INCOMPLETA (c. 4)
y las
ganancias:
pB
(l - q)A + R]
2:
1(1 + r).
(4.2.11)
s<--1f+R
(4.2.12)
1(1 +1')
R
.
< --o
+ (1 - p)A + R - A + R
!209
(4.2.13)
1(1 + r)A
R
- B.
(4.2.14)
Jegos de sializnci')/1
JO + r), que el inversor; acepta. Sin embargo, si B fuera lo suficientemente negativo como para queR +B < JO + 7"), el tipo de beneficio
bajo no podra devolver su deuda, por lo que el inversor no aceptara el
contrato. Aplicaramos un argumehto'similar siH y A fueran benefiCiti;:'
esperados (y no beneficios seguros). Supongamos que el tipo 7f Sil;nifit~ .
que los beneficios actuales de !l empresa sern 1r+ J{ con probabilidad
1/2 y 1r- J{ con probabilidad 1/2. Ahora, si B - J{ + R < JO + r), hay
una probabilidad de 1/2 de qu el tipo de beneficio bajo no sea capaz
de devolver la deuda D = J(1 + r), por 10 que el inverSOftlo aceptar el
contrato.
.
D =
I 211
'"t
1r*(1re) = ~2[(l
c+d
- b)y* + d1re].
c+d
b)y' + d1r21
=. 1r:i.(1r2'c).
~ 12
! JUEGOS
INCOMPLETA (e. 4)
En un equilibrio de agrupacin, ambos tipos escogen la misma inflacin para el primer periodo, digamos 7r*,por lo que la expectativa de ,
los empresarios en el primer periodo es 7rj = 7r*. En la trayectoria de
equilibrio, los empresarios empiezan el segundo periodo creyendo que la
probabilidad de que e = D es Ji, por lo que se forman la expectativa 7r2(p).
La autoridad monetaria de tipo c escoge entonces su inflacin ptima para'
el segundo periodo dada esta expectativa, concretamente 7ri[7r2(P),c],finalizando con ello el juego. Para completar la descripcin de este equilibrio,
queda (como siempre) definir las conjeturas del receptor fu~~a del equi-.
Iibrio para calcular las correspondientes decisiones fuera del equilibrio
utilizando (4.2.15), y comprobar que estas decisiones no crean ningn
incentivo a desviarse del equilibrio para ningn tipo del emisor.
En un equilibrio de separacin, los dos tipos escogen niveles de inflacin diferentes en el primer periodo, digamos 7[D y 7rF, por lo que la
expectativa de los empresarios en el primer periodo es 7r = P7[D+(1-phF.
Despus de observar 7[D, los empresarios empiezan el segundo periodq'
creyendo que e = Dy se forman por ello la expectativa 7[2(1);delmi~IJ;l9
modo, observar 7[F cOJ;lducea7[2(0).En equilibrio, el tipo dbil e~coge ei1~
tonces 7[i[7[2(1),D] y el tipo fuerte 7[i[7r2(O),F], finalizandoel juego. Par~
completar la descripcin de este equilibrio,. no.'slo queda, corno antes~
detallar las conjeturas y acciones fuera del equilibrio del receptoricorii~
probar que ningn tipo del emisor tiene incentivos para desviarse, sino
tambin comprobar que ningn tipo tiene incentivos pala imitar el cmn-,
pOltamiento en equilibrio del otro. Aqu, por ejemplo, el tipo dbil podra
pensar en escoger 7[F en el primer periodo, induciend() co!,ell.o a qtle !
expectativa de los empresarios en el segurido periodo fuera 7[2(0),pero
escoger 7[i[7[2(0),D], finalizando el juego. EscL~jr, incluso si 7[F fuera
demasiado baja para el tipo dbil, la expectativa consiguiente 7[2(0)podra
ser tan baja que el tipo dbil recibiera una ganancia enorme debido a la
inflacin inesperada 7[i[7[2(O),D] - 7r2(O) en el segundo periodo. En un
equilibrio de separacin, la inflacin escogida en el primer periodo por el
tipo fuerte debe ser lo suficientemente baja corno para que el tipo d~bil
no sienta la tentacin de imitarle, a pesar del ben~ficio que obtendra por
la inflacin inesperada en el segundo periodo. Para muchos valores de
los parmetros, esta restriccin hace que 7[F sea menor que ei nivel d~
inflacin que el tipo fuerte elegira bajo informacin completa, delrrJsmo
modo que el trabajador con capacidad alta invierte ms de la cuenta en
educacin en un equilibrio de separacin del modelo de Spence.
del equilibrio
bayesiano
perfecto
del libro, la frase que originalmente aparece es "Hey, look out for that
como "Cuidado con ese autobs!" o como "Espera ese autobs!",
La fraseqe nosotros incluimos aqu es una de las muchas frases en
signifiadosc?mpl"tamente
diferentes dependiendo del contexto. '
quiere eXpresar. (N. de los T.).
(i.
,
~.'.
"
':
,r.
Otras aplicaciones
214 / JUEGOS DINMICOS CON INFORMACIN
emisor, TI, enva un mensaje mI, mientras que otro subconjunto de tipos;
T2, enva o.tro mensaje, m2. (Cada Ti podra contener slo un tipo, como
en un equilibrio de separacin, o muchos tipos, como en un equilibrio de
separacin parcial.) En equilibrio, el receptor interpretar que mi viene de
Ti y tomar por tanto la decisin ptima, a dada su conjetura. Come:,to"
dos los tipos del emisor tienen las mismas preferencias sobre las acciones
a tomar, si un tipo prefiere (digamos) al a 0.2, todos los tipos tienen esta
preferencia y enviarn el mensaje mI en lugar de m2, destruyendo con ello
el equilibrio putativo. Por ejemplo, en el m~dei~' deSpence; 'si elpaii~teo
resultara. en un mensaje indicativo <leun saJaria,alto, mientras que otro
tipo de parloteo indicaraunsalario b~jo,lo~ trai:>aJ?dores'de'"~~lqier nivel d~ capacidad enviaran.el primer ni.ensaje~porlo que npuede' existir
,un equilibrio en el que. el parloteo afecte los salari()s.
,
',.'
,,/
del equilibrio
bayesinno
prr!,'cfo
/ 215
INCOMPLETA (c. 4)
Por 10 tanto, para que el parloteo sea informativo, una condicin necesaria es que diferentes tipos del emisor tengan preferencias diferentes en
relacin con:las acciOliesdeLreceptor, Una segunda condicin necesaria,
por supuesto, es que el.receptor prefiera acciones,giferentesdependiendo
del ti'p:del emisor .. (Tanto la selizacincomQ;ja.comurucacinp~yia
son intiles si las preferencias del receptor sobre sus acciones' son inde~
pendientes del tipo del emisor.). Una terceracondiciitnecesaria para que
el parloteo sea 'informativo es que las preferencias del receptr sobre sus
acciones nlJ sean completamente opuests alasd~emisor. Para adelantar
un ltimo. ejemplo,supongamos que elr~~epto{prefiere.acciones bajas
cuando el tipo deLemisor es bajo y acciones altastuando es.alto; Siemisores de tipos bajos prefieren acciones baja~ y los de tipos altos acciones
altas, puede haber comunicacin, pero si efemisor tiene ias preferencias
opuestas no puede existir comunicacin, ya que al emisorle gustara cone
fundir al receptor. Crawford y Sobel (1982) lIlalizanunmodelc5 abstracto
que satisface estas tres condiciones necesarias y establecen d()s resultados
intuitivos: en trminos informales, puede existir ms comunicacin por
medio del parloteo cuando las preferencias. de las jugadores estn ms
ntimamente relacionadas, pero no puede existir comunicacin perfecta a
no ser que las preferencias de los jugadores estn perfectamente alineadas ..
Cada una de .las aplicaciones econmicas que acabamos de. describir
(parloteo por parte de la autoridad monetaria, amenazas de veto, debates
parlamentarios y presencia sindical) incluyen no slo un juego sencillo
con parloteo sino tambin una modelizacion ms completade un entorno
econmico. Analizar una de estas apii<:acionesexigira describir no s<$loel
juego sino tambin el modelo completo, lo que desviara nestr<i atencin
de las fuerzas bsicas que operan en los juegos con parloteo. En esta
seccin, por lo tanto, nos apartamos de nuestro estilo anterior y.analizamos
slo juegos abstractos con parloteo, dejando las aplicaciones como lectura
adicional.
El desarrollo temporal del juego con parloteo ms sencillo es idntico
al del juego de sealizacin ms sencillo; slo cambian las ganancias.
(J.k
de
La caracterstica clave de este juego es que el mensaje no tiene efecto directo rusobre la ganancia del emisor ni sobre la del receptor. La nica
manera en la que el mensaje puede importar es a travs de su contenido
informativo: cambiando la conjetura del receptor sobre el tipo del emisor,
un mensaje puede cambiar la decisin del receptor y, por tanto, afectar
indirectamente a las ganancias de los dos jugadores. Como la misma informacin puede ser comurucada en diferentes lenguajes, diferentes espacios
de mensajes pueden alcanzar los mismos resultados. El espritu del parloteo es que puede decirse cualquier cosa; en consecuencia, formalizar este
concepto exigira que M fuera un conjunto muy grande. Por el contrario,
suponemos que M es lo suficientemente rico para decir lo que haga falta
decir; es decir, M = T. Para los propsitos de esta seccin, este supuesto
es equivalente a permitir que se diga cualquier cosa; sin embargo, para
los propsitos de la seccin 4.4 (refinamientos del equilibrio bayesiano
perfecto), este supuesto debe ser reconsiderado.
Puesto que los juegos con parloteo y de sealizacin ms sencillos
tienen el mismo desarrollo temporal, las definiciones de equilibrio bayesiano perfecto en los dos juegos son tambin idnticas: un equilibrio
bayesian perfecto con estrategias puras en un juego con parlol<;:oes un
par de estrategias m'(ti) y a'(mj), y una conjetura .t(tdm) que satisfacen
los requisitos (1), (2R), (2E) Y (3) de sealizacin, aunque las funciones
de ganancias U R(tmj,o,k) Y U ECt111.j,G.k) en los requisitos (2F,)y (2E) de
216/
INCOMPLETA (e. 4)
sealizac.in son ahora equivalentes a URUi,aJ y Udt."rtk) respectivamente. Sm embargo, una diferencia entre los juegos de sealizacin y los
Juegos con parloteo es que en estos ltimos siempre existe un equilibrio
de agrupacin. Puesto que los mensajes no tienen un efecto directo sobre
las'
. dI'
.
> gana~l.C1ase emI~or, SIel receptor va a ignorar todos los mensajes, la
atrupaclOn es una. mejor respuesta del emisor. Puesto que los mensajes no
tIenen un efecto dIrecto sobre las ganancias del receptor, si el emisor est
jugando agrupacin, ignorar todos los mensajes es una mejor respuesta
del receptor. Formalmente, sea a* la accin ptima del.receptor en un
equIlIbno de agrupacin; es decir, a* es una solucin de
tB
tA
aB
1:,1
y,O
(LA
Z,O "W,1
Figura 4.3.1
',
.... '
a.
\',"
..
218
!JUEGOS
(c. 4)
los jugadores, cuando b est cerca de tero los intereses de los jugadores
estn ms alineados),
.t
:'
".;.'
,"
,,'
",:,"
Xl
+b =
1]
X] +
2:1 [X]2 + -2-
Otras aplicaciolles
o Xl = 0/2)
positivo, por
para &:?: 1/4
para permitir
del equilibrio
bayesiallo
pa/cfo
! 219
Punto medio
a=l
t+b
U,(t,a)
Figura 4.3.2
Para completar la discusin de este equilibrio de dos escalones, tratamos el tema de los mensajes que estn fuera de la trayectoria de equilibrio.
Crawford y Sobel establecen la estrategia (mixta) del emisor de (orn:a ~l~e
estos mensajes no existan: todos los tipos t < X] escogen un mensaje
aleatoriamente de acuerdo con una dish'ibucin uniforme en [O,X]); todos
los tipos t :?: X] escogen un mensaje ale'atoriamente de acuerdo con una
distribucin uniforme en [xI,l]. Como hemos supuesto que M = '1', no
hay ningn mensaje del que podamos estar seguros que no se enviar en
equilibrio, por lo que el requisito 3 de sealizacin detemna la conjetura
del receptor despus de cualquier mensaje posible: la conjetu.ra del receptor despus de observar cualquier mensaje de [O,X]) es que t se distribuye
uniformemente en [O,XI),y la conjetura del receptor despus de observar
cualquier mensaje de [xI,l] es que t se distribuye wUformemente en [:1;1,11.
(El uso de distribuciones uniformes en la estrategia mixta del emisor no
tiene nada que ver con el supuesto de una distribucin uniforme del tipo
del emisor; la estrategia mixta del emisor podra utilizar tambin cualquier
otra densidad de probabilidad estrictamente positiva sobre los intervalos
220/
INCOMPLETA (e. 4)
Xk+l
+ :1;k
2
-
(
Xk
b)
= 2: +
\~.
En un equilibrio de n escalones, si el primer escaln tiene una longitud ti,el segundo debe tener una longitud d + 4b, el tercero d + 8b Y as
sucesivamente. El n-simo escaln debe acabar exactamente en 1, por lo
que de~emosterer
~. d + (d + 4b) + ... + [d + (n - 1)4b] = 1.
+ n(n
- 1) = n(n - 1)/2,
- 1) . 2.b
= 1.
tenemos que
(4.3.1)
Dado c~aiquiern tal que n(n -1). 2b < 1,existe' un vaJor de d cue~luci0I1a
(4.3.1). Es decir, para cualquier n talque n(n-l).2b
<1, existeunequilibri
de agrupaci~parcial de n escalones, y la longitud del primer escaln es
el valor de d que soluciona (4.3.1). Corno la longitud del primer escaln
debe ser positiva, el nmero mximo de escalones en este equilibri?, n *(b);
es el valor msaIto den tal que n(n - 1) .2b < 1. Utilizando la frmula
de la ecu"acin "de segundo grado, se obtiene que n*(b) es el mayor enter?
por debajo de
~.[1 + JI
+ (2/b)}.
(,
};~
'11)1
(2 - 8)2
=
2(4 -38)
'Ir
A.
1rl
INCOMPLETA (c. 4)
2w
2- 8
= 2-8 = 4-"381rA
UJ2
1rj
2=
Si el beneficio de la empresa,
en
Caso
2 -
-2-(4---3--)
1r,
/'
KA
,ltJ],
es mayor que
1))2'
contrario, la rechaza.
224/
INCOMPLETA (c. 4)
Azar
lO,
,WE}
lC,1 -
wa
7tH
'- wB
ei,
O.
O
lO"
IT, - lO,
O
O
e~p're~~:
O
O
lO,
1t.~- IVg
,.
,,-
O
O
Figura 4.3.3
dos com.o en la figura 4.3.3). En cada conjunto de informacin, la conjetura
del sIndIcato es una distribucin de probabilidad sobre estos nodos. En el
O
O
'_.
-,>.
_.
o'"
-'
..
'
maxUJ'
w
lO}
.'
lO},
;.
donde Prob{la empresa acepta w} = (TI-'w) /Tl para los valores relevantes
.....
...
....
,','
,~,',
....}
;-
7fl= max{7f"(w,7f,j2),Wl}'
Para resolver esta ecuacin implcita, supongamos que Wl ~ 7f"('U],irtl2).
7f*(Wl,7fl/2). Por lo tanto,
7fl -- Wl, lo que contradice Wl >
Enances
t
Wl
Wl
W2(w1)=2_'
Hemos reducido el juego a un problema de optimizacin en un periodo para el sindicato: dada la oferta salarial del sindicato en el prime.r
periodo, 1JJl,hemos hallado la respuesta p~m~ ~e la empresa en e~pnmer periodo, la conjetura del sindicato al pnnc~plO del segundo p:n~do,
la oferta ptima del sindicato en el segundo penado y la respuesta 0.pt1ll1a
de la empresa en el segundo periodo. Por lo tanto,.l,a oferta salanal del
sindicato en el primer periodo debera ser una soluclOn de
+ W2(Wl)
Wl
W2}'
=7fA
(.
228/
INCOlvlPLETA (e. 4)
en que la ganancia en una etapa dependa slo de las jugadas de esa etapa,
y que la ganancia total del juego repetido sea la suma de las ganancias en
cada una de las etapas del juego. En particular, se podra suponer que
con probabilidadp la mejor respuesta del jugador fila a la cooperacin
es la cooperacin. Kreps, Milgrom, Roberts y Wilson (KMRW en lo sucesivo) demuestran que la existencia de informacin asimtrica unilateral
de este tipo no es suficiente para producir la cooperacin en el equilibrio;
al contrario, no cooperar (confesar) es lo que ocurre en cada etapa, al igual
que bajo informacin completa. Sin embargo, tambin demuestran que si
la asimetra informativa es bilateral (es decir, existe tambin una probabilidad q de qli.e'la mejor respu~sta del jugador columna a la cooperacin
sea la cooperacin) puede existir entonces un equilibrio en el que los dos
jugadores cooperen hasta que;uede muy poco para que el juego se acabe.
Para repetirlo otra vez, supondremos que con probabilidad p el jugador fila slo puede jugar la estrategia del Talin. El espritu del anlisis
de KMRW' es que' incluso si p es muy pequea (es decir, incluso si el
jugador' colrnna tiene slo una ligera sospecha de que el jugador fila
podra no ser racional) ,sta incertidumbre puede tener un gran 'efecto"e:n
el siguiente sentido. KMRW demuestran que existe una cofa superior,.al
nmero de etapas en las que algn jugador no coopera en equilibrio. Esta
coti;lsuperior depende de p y de las ganancias en el juego de etapa, pero
no del nmero de etapas en el juego repetido. Por lo tanto, en cualquier
equilibrio de un juego repetido lo suficientemente largo, la fraccin deetapas en las que ambos jugadores cooperan es grande. (KMRWestablecen
su resultado para el equilibrio sucesivo, pero sus argumentos tamb~~~~e
pueden aplicar al eq\lilibrio bayesiano perfecto.) Dos pasos claveel1 ~l
argumento de KMRW son: (Osi el jugador fila se desva de la estrategia
del Talin,.pasa a ser informacin del dominio pblico que el jugador es
racional, por lo que ningn jugador' cooperar en lo sucesivo, de manera
que el jugador fila racional tiene un incentivo para imitar la estrategia del
Talin, y (ii) dado un supuesto que i.I;npondreJI,t,os
ms, adelante sobre las
ganancias del juego de etapa, la mejor respuest del jugador columna a la
~stategia del Talin sera coope~ar hasta. la ltima etapa del juego.
.
Para entende:ulsson los elementos bsicos del modelo de KMWR,
con~iderarem~s eicompieII1ertt?riricie su ~liSis:.en lugar de suponer q~e
p es baja y analizar los juegos rep,etldc,>sdelarga duracin, supondremos
qlle p es lo suficientemente alta ~oIl1oyara que exista un equilibrio de
.un juego repetido corto en el qud9!i dos jugadores cooperen en todas las
etapas menos
en las dos
l9~Ill.~,Empezamos con el caso de dos periodos.
.
.
.
,(
Olras aplicaciones
riel equilibrio
bayesillllO perfecto
/ 231
"o
";
1=2
1=1
NC
NC
Jugador columna
NC
Figura 4.3.5
Para hacer de este juego de etapa un dilema de los presos, suponemos que
a > 1 yb < O.KMRWtambin suponen que a + b < 2,de forma que (como
indicamos anteriormente en (ii la mejor respuesta del jugador columna
a la estrategia del Talin es cooperar hasta la ltini'etpa del juego; en
lugar de ir alternando entre cooperar y no cooperar.
1=1
1=2
1=3
NC
NC
Jugador columna
NC
Columna
Figura 4.3.6
Cooperar,No coop~rar
-,
.,:
Cooperar
1,1
b,a
No cooperar
a,b
0,0
Fila
Figura 4.3.4
Al igual que en el ltimo periodo de un dilema de los presos rejJetido
finitamente coninformacin completa, no cooperar (NO) driliaestric
tamente a cooperar (O) en l~ltima etapa de este juegod~ dos'peii6dos
con informacin incompleta; tanto para el jugador fila r.;tcional
para
el jugador column. Dado que el jugador columna no coopetaren"la
ltima etapa, no existe ninguna razn para que el jug~dorfila r~ional10
hagaen larrimera etapa. Ahora bien, la estrategia delTalin empieza
el juego con cooperacin. Por lo tanto, la nica decisi6n que hace falta
determinar es la del jugador columna en el primer periodo, (X), 'que ser
c?mo
"
p .
que
p + (1 - p)b
O.
(4.32)
232/
INCOMPLETA (c. 4)
(4.3.3)
,'o,,'
',,-;.",
1 + p + (1 - p)b + pa ~, a + b + pa.
1= 1
1= 2
1= 3
NC
NC
NC
Jugador columna'
NC
NC
-.
1= 1
1= 2
NC
NC
1=3
NC
"---'
Jugador columna
NC
NC
NC
Figura 4.3.8
Figura 4.3.7
a+b:::;1.
'(4.3.4)
(,
INCOMPLETA (c. 4)
a=l
a=l/(l-p)
= -p/(l-p)
Figura 4.3.9
Apndice
"'c
",
un
+ b + [T
- (t
+ 2) - 1] + 11 + (1 -
p)b
+ pa,
(t
+ 2) - 11 + p + (1 -
p)b
+ pu.
(43.5)
Refinamientos
Hasta ahora hemos demostrado que el jugador columna no tiene incentivos para desviarse cooperando hasta el periodo t - 1 Y dejando de
cooperar en el periodo t, dado que se jugar el equilibrio cooperativo en
el juego de continuacin que empieza en el periodo t + 2. Ms en general,
el jugador columna podra cooperar hasta el periodo t - 1, no cooperar
en los periodos t a t + s y volver a cooperar en el periodo t + s + 1. Hay
tres casos que son triviales: (1) si t + s = T (es decir, si el jugador columna
nunca coopera despus de no haberlo hecho en el periodo t), la ganancia
es a en el periodo t y cero en lo sucesivo, que es menor que (4.3.5); (2) si
t + s -1- 1 = T, la ganancia del jugador colunma de t a T es a + b, peor que
en (l), y (3) si t + s + 1 = T - 1, la ganancia del jugador colunma de t a l'
es a + b + pa, que es menor que (4.3.5). Quedan por considerar los valores
de ~ para los que t + s + 1 < l' - 1. Al igual que en elcaso anterior con
s = O, existe un equilibrio cooperativo. en el juego de. continuacin que
empieza en el periodo t + s + 2; supongamos que se juega este equilibrio.
Entonces, la ganancia del jugador columna en los periodos ta T por jugar
esta desviacin es
a + b + [1' - (t + s + 2) - 1] + p + (1 -p)b+
---------------2
pg,
3
1
------7
Figura 4.4.1
Otras dos caractersticas de este ejemplo merecen una breve mencin.
En primer lugar, aunque C est estrictamente dominada, 1 no. Si Eestu~
viera estrictamente dominada (corno ocurrira si la ganancia de 3 por parte
del jugador 1 fuera, por ejemplo, 3/2) el mismo argumento implicara que
no es razonable que p sea positiva, lo que implica que p debe ser cero, pero
esto contradira el resultado anterior de que p debe ser uno.,.En tal caso,
este requisito no restringir! lqs conj~turas fuera del equilibrio d~i jugador
2. (Vase la definicin formal'que damos ms adelante)
,
.
1
.,_,'
En segundo lugar, el ejemplo no ilustra el requisito .~escrito inicialmente, porque C no slo est estrictamente dC;IDinadaa partir de algn
conjunto de info~acin, sino estrjctarr;f~t~~ominada en el sentido ms
,.
. ..
."
o.
~
.
s;.
",
[pI
b
2,0
Receptor
1,0
[}- pI
1,
1,1
Figura 4.4.2
Definicin. Consideremos un conjunto de informacin en el cual le toca decidir al jugador i:" La estrategia s; est estrictamente
dominada a partir de
este conjunto de. informacin
s(existe otra estrategia Si tal que, para cada
conjetura que pudiera fonnarse i 'e-n el conjunto de informacin' dado, y para
cada posible combinacin' de las esttaiegiils subsiguientes de .los otros jugadores
(donde una "estrategia subsiguiente" es un plan completo de accin que cubre
cada contingencia que pudiera presentarse una vez se ha alcanzado el conjunto
de inforrr;zaciridado) la ganancia esperada de i al tomar la accin indicada por Si
en el conjunto de informacin dado 'y al jugar la estrategia subsiguiente indicada
por Si s :estr,ictamente ;nayor que la ganancia esperada al tomar la accin y jugar
la estrategia subsiguiente especificadas por s;.
2-10/
akEA
j'
,CLk) >
max U E(tmj,ak)'
ukEA
Duelo
[pI
,
,
Quiche
t,
[ql
Cerveza
..
No
0,5
:
.,,
3,0
Receptor
0,1
Cobardica
Duelo
en T.)
....
0,-1
2,0
,,
,,
,
,,
,,
,,
"
"::'"
1,-1
0,5
Duelo: ,
,
,
[l No
2,0
Reeptor
Azar
pI
Quiche
1,
Duelo
Cerveza
Malas pulgas
[1 -
~:
...
qI
No
3,0
Figura 4.4.3
En el juego de sealizacin "cerveza y quiche", elemisor es uno de los
dos tipos: t ="cobardica" (con probabilidad 0,1) Y t2 = "malas pulgas"
(con probabilidad 0,9). El mensaje del emisor es su eleccin de cerveza
c.
..
'"
',
..:.;
Refinamientos
INCOMPLETA Ce. 4)
del equilibrio
bayesimlO perjec/o
/ 24:1
Si este discurso fuera credo, establecera que q = 0, lo que es incompatible con este equilibrio bayesiano perfecto de agrupacin.
Podemos ahora generalizar este argumento a la clase de juegos de
sealizacin definida en la seccin 4.2.A; con ello obtenemos el requisito
6 de sealizacin.
Definicin. Dado un equilibrio bayesiano perfecto en un juego de serlalizacil1,
el mensaje mj est dominado en equilibrio para el tipo ti de T si la gl7J1I1ncia
en equilibrio de t que denotamos mediante U'(t;), es ms alta que la mayor
ganancia posible para ti por utilizar 7)Ij:
.~,
/
,
~-'
(,,1
Refinamientos
INCOMPLETA (c. 4)
1,
(A,e)
y(A, e,)----.-.-----
~Y(Bre)
w*(B)
e*(B)
e.
Figura 4.4.4
+ [1 -
J.l(Ale)] . y(B,e).
Por lo tanto, la utilidad para el trabajador con capacidad baja al escoger e'(B) es corno mnimo yfB,e*(B)]
- c[B,e*(B),
que es mayor que su
utilidad al escoger cualquier e > e., independientemente de lo que la
empresa crea despus de observar e. Es decir, en trminos del requisito 5
de sealizacin, cualquier nivel de educacin e > es estdom:inado para
el tipo de capacidad baja_ Utilizando lID lenguaje informal, el requisito 5
de sealizacin implica que la conjehlra de la empresa debe ser .t(Ale) = 1
para e > e., lo que a su vez implica que un equilibrio de separacin en el
,','
1,'.
;;',
Re!ill11111ielllos
INCOMPLETA (e. 4)
qy
(A,e,)
parcelo / 247
bayesiallo
(A,e)
del equilibrio
(A,e)
(B,e)
y
w*(B)
(A,e)
e,
e*(B)
e '
qy
y (A ,e, )
(A,e)
Figura 4.4.5
y U3,e)
w*(B)
e,
e*(B)
Figura 4.4.6
24j /
J llEGOS
Ejercicios / 249
INCOMPLETA (c. 4)
(A,e)
qy
(A,e)
(B,e)
4.6 Ejercicios
4.1 En los siguientes juegos en forma extensiva, dervese el juego en forma
normal y hllense todos los equilibrios de Nash con estrategias puras, los
perfectos en subjuegos y los bayesianos perfectos.
e* (L)
ep
e'
e"
e,
e
,-.. .-;:"
a.
D
Figura 4.4.7
2
2
4.5 Lecturas
adicionales
4
1
O
1
3
O
b.
D
2
4
1
3
1
2
4
O
4
O
3
3
.-;,":
",:.,
Ejercicios / 251
".,'
1")
(1/3)
1,0
: b
Receptor
1,1
2,1
, a
a
1
1,
(1/3)
, "
,."','.
'~4':.'
0,0
,
,
Receptor
2
2
<0'
b
1,0
0,0
O
1
3
O
\$.
k'
;t
Receptor
Receptor
Azar
1,
(1/3)
a
1
0,5
1,
3,0
2,0
a.
2,2
1,1
a
1
Receptor
Azar
Receptor
1,
0,5
O,n
2,0
Receptor
Azar
Receptor
t,
1,0
0,5
1
3,1
2,1
0,0
0,1
1,2
0,0
0,0
2,2
0,0
1
0,1
0,5
t,
.1,0
1,1
252 /
b,
J UECOS I)IN,vllCOS
30)
0,0
a
O
IJ
0,5
1,1
4,1
3,3.
0,5
Receptor
Azar
Receptor
0,1
Ejercicios / 253
1,
1,2
\:,.'
\.
'.
'.
b
2,0
',',
El socio 1 posee una participacin s en la sociedad, el socio 2 posee 1 - s.' Los socios estn de
acuerdo en jugar el siguiente juego: el socio 1 anuncia un precio para la
sociedad, p, y el soci02 escoge entonces si comprar la participacin de 1
por ps o vender la suya por pO - s). Supongamos que es informacin del
dominio pblico que las valoraciones de los socios de ser propietarios d
toda la sociedad son independientes y se distribuyen uniformemente en.
[0,1], pero que la valoracin deeada socio es informacin privada. Cul
es el equilibrio bayesiano perfecto?
.'
I\'.~J
Ejercicius / 255
254/
INCOMPLETA (e. 4)
4.11 Un comprador y un vendedor tienen valoraciones 'Ve y Vv respectivamente, Es informa,cin del dominio pblico que el intercambio es
rentable (es decir, que Ve > vv), pero la magnitud de esta rentabilidad es
informacin privada de la siguiente manera: la valoracin del vendedor se
distribuye uniformemente en [0,1];la valoracin del comprador Ve = k '1)",
donde k > 1 es informacin del dominio pblico; el vendedor conoce Vv
(y por tanto ve) pero el comprador no conoce Ve (o vv)' Supongamos que
el comprador realiza una nica oferta p que el vendedor acepta o rechaza.
Cul es el equilibrio bayesiano perfecto cuando k < 2? Ycuando k> 2?
(Vase Samuelson 1984.)
..
,,)
4.12 Este problema considera la versin con horizonte infinito del juego
de la negociacin con dos periodos analizado en la seccin 4.3.B. Como
antes, la empresa tieneinformacin privada sobre sus beneficios' (1r),que
estn uniformemente distribuidos en [O,1ro],
y elsindicafo realiza todas las
ofertas salariales y tiene un s~Jariode. rese~.va JJr ":::O. ,l
En el juego candas periodos, la ~npre~Kacepta la, primera oferta del
sindicato (Wl) si 1r'> 71'1,donde el tipo con:beneficlos,.1rl es indiferente
entre (i) aceptar Wl y (ii) rechazar Wl pero aceptar la oferta del sindicato en
el segundo. periodo (W2), y W2 es la oferta ptima del sindicato dado que
los bem~ficiosde la empresa estn uniformemente distribuidos en [O,1rl]
y que slo queda un periodo de negociacin. En cambio, en el juego
con horizonte infinito, W2 ser la oferta ptima del sindicato 4ado que el
beneficio deja emprsaest uniformemente distribuido en [O,1rl]y que
queda un n~er6infi.nito,de periodos de negociacin (potencial). Aunque
el tipo con beneficlos 1rlserotra vezndiferente entre las opciones (i) y
(ii), el cambio en W2 harq~e cambie el vlor de 1rl.
El juego de continuacin que empieza en el segundo periodo del
juego de horizonte infinito es una versin a escala del juego completo:
existe un nmero infinito de periodos de negociacin (potencial), y los
beneficios de la empresa estn otra vez uniformemente distribuidos entre
Oy una cota superior; la nica diferencia es que la cota superior es ahora
1rl en lugar de1ro. Sobel y Takahashi (1983)demuestran que el juego
con horizonte infinito tiene un equilibrio bayesiano perfecto estacionario.
En este equilibrio, si los beneficios de la empresa estn uniformemente
distribuidos entre Oy 1r*,elsindicato realiza una oferta salarial w(7r*) = b1r*,
por lo que la:primera oferta es b1ro, la segunda b1rl' etc. Si el sindicato utiliza
esta estrategia estacionaria, la mejor respuesta de la empresa proporciona
1rl = C7ro,7r2= C7rl,etc., y el valor presente esperado de las ganancias
a la empresa, Wl'
2. La empresa o acepta o rechaza 1JJI' Si acepta, hay produccin en
los dos periodos, por lo que las ganancias son 2WIpara el sindicalo
y 2(1r- Wl) para la empresa. (No hay descuento.) Si la empresa no
acepta 1))1,no hay produccin en el primer periodo, y las ganancias del
primer periodo son cero tanto para la empresa como para el sindicato,
3. Al comienzo del segundo periodo (suponiendo que la empresa rechaz Wl) la empresa realiza una oferta salarial al sindicato, W2. (Al
contrario que en el modelo de Sobel y Takahashi, el sindica to no realiza
la oferta.)
4. El sindicato o acepta o rechaza W2. Si lo acepta hay produccin en
el segundo periodo, con lo que las ganancias del segun<:ioperiodo (y
totales) son W2 para el sindicato y 7r- W2 para la empresa. (Recordemos
que las ganancias del primer periodo fueron cero.) Si el sindicato
rechaza W2 no hay produccin, por lo que el sindicato gana un salario
alternativo Wr en el segundo periodo y la empresa cierra y gana cero.
4.14 Nalebuff (1987) analiza el siguiente modelo de la negociacin previo
a un posible pleito entre un demandante y un demandado. Si el caso
va a juicio, el demandado se ver obligado a pagar al demandante una
cantidad d por daos. Es informacin del dominio pblico que d est
uniformemente distribuida en [0,1] y que slo el demandado conoce el
verdadero valor de d. Ir a juicio le cuesta al demandante C < 1';2, pero
(por simplicidad) no le cuesta nada al demandado.
El desarrollo temporal es el siguiente: (1) El demandante propone
un acuerdo, s. (2) El demandado o acepta el acuerdo (en cuyo caso la
ganancia del demandante es s y la del demandado es -s) o lo rechaza. (3)
INCOMPLETA (e. 4)
Referencias
/ 257
l
"'
..
4.7 Referencias
AUSTEN-SMITH,
D. 1990. "Information Transrnission in Debate." American
oumal
o/ Political
Science 34:124-52.
AxELROO,R. 1981. "The Emergence of Cooperation Among Egoists." American Political Science Review 75:306-18.
BALL!L. 1990. "Tune~Consistent Poliey and Persistent" Changes in lllfl~tion." National Bureau of13conornic Researeh Working Paper #3529
(December).
.
BARRO,R. 1986. "Reputation in a Model ofM~metary Policy with Incomplete Information." oumal o/ Monetary Economics 17:3-20.
BHAITACHARYA;
S. 1979. "Imperfect Information, Dividend Plicy: anc
the 'Bird in the Hand' Fallacy'" Bell oumal of Economics 10:259-70:
.. ,.. ~
CHO, J.-K., y D. KREPS.1987. "Signaling Carnes and Stable Equilibria."
-.'
'.'
'-:.
~
.
CHO, l.-K., y J. SoBEL.1990. "Strategie Stabilit}r and Uniqueness in Signaling Carnes." oumal o/ Economic Theory 50:381-413.
CRAMTON,
E, y J. TRAcy. 1992. "Strikes and Holdouts in Wage Bargainirg:
Theory and Data." American Economic Review 82:100-21.
.':
:-',.
'"
'i,;.
CRAWFORO,
v., y J. SOBEL. 1982. "Strategie Infornation Transrnission."
Econometrica 50:1431-51.
DYBVIG,
E, Y J. ZENOER.1991. "Capital Structure and Dividend Irrelevance
with Asymmetric Information." Review o/ Financial Stlldies 4:201-19.
FARRELL,
L y R. CIBBONS.1991. "Union Voice."Mimeo, Comell University.
FuDENBERG,D., Y J. TIROLE. 1991. "Perfeet Bayesian Equilibrium and
Sequential Equilibrium." oumal o/ Economic Theory 53:236-60.
HARSANYI,
J. 1967. "Carnes with Incornplete Information Played by Bayesian Players, Parts 1, n, and III." Management Science 14:159-82,320-34,
486-502.
RefercI1cil15
I 259
INCOMPLETA (e. 4)
Model of Bargaining,"
87:355-74.
Econometrica
50:863-94.
8:296-332.
1<REPS,
D., P. MILGROM,J. ROBERTS,y R. WILSON. 1982. "Rational Cooperation in the Finitely Repeated Prisioners' Dilernma." Joumal of Economic
Theory 27:245-52.
.
..,
STEIN,J. 1989. "Cheap Talk and the Fed: A Theory of 1mprecise Policy
Announcements." American Ecol1omic Review 79:32-42.
VICKERS,J. 1986. "Signalling in a Model of Monetary Policy with Incol1lplete Information." Oxford Economic Papers 38:443-55.
'
.,
INDICE ANALTICO
.,'
'".'
"\
":'.
NDICE
262 /
NDICE
AN,\J.TICO
/263
ANALT1CO
colusin
en el duopolio de Coumot
dinmico, 101-106
en modelos dinmicos de duopolio,
105-10.
vase tambin repetido, juego
compatibilidad de incentivos, 164-65
competencia internacional, 70
conjeturas.
en conjuntos de informacin con uno
y ms de un elemento, 179
en equilibrio bayesiano
perfecto,181,185
en juegos bayesianos estticos, 148
en refinamientos del equilibrio
bayesiano perfecto, 236-47
vase tambin informacin imperfecta;
informacin incompleta
conjunto deinformacin
con ms de un elemento,l22, 129,
176,178,189
definido, con ejemplos, 222-23
en la definicin deinformacin
imperfectar.121
en la definicin de informacin
perfecta, 121
vase tambin conjeturas; nodo de
decisin; trayectoria de equilibrio;
informacin imperfecta; informacin
incompleta
continuacin, juego de, 176, 235
ejercicios 4.12, 4.14, 254, 256
cooperacin
en el dilema de los presos repetido
infinitainnte con informacin
asimtrica, 227-36
en el modelo de salarios de
eficiencia,l07-108
en juegos repetidos infinitamente,
89-90,101-102,228n6
en juegos repetidos finilamente con
informacin completa, 82-86
vase tambin repetido, juego
correlacionado, equilibrio, 35n 15
correspondencia de mejor respuest~
como funcin de mejor respuesl~,
42-43
definida, 36
de n jug~dores, 47
intersecciones de, 39, 41
representaciones grfic~s de, 35, 38,
42-44
Cournot, A., 2, 11
Coumot, juego de duopoli%ligopolio
de
con informacin asimtrica, 143,
144-146,147,151
con informacin complet~, 15-21,
59-62,75-76,145-146
ejercicio 3.2, 169
ejercicios 1.4-1.6, 48-49
ejercicio 2.15, 176
en juegos repetidos, 101-106
vase tambin juego de duopolio
Cournot, equilibrio de, 60n4
Cr~mton, P., 248
Crawford, V., 177, 214,253
credibilidad en los juegos dinmicos, 53
vase tambin amenazas y promesas
Criterio intuitivo, vase requisito 6 de
sealizacin
lJ~sgupta, P. 48
decisin, teora de In, uni- frenle ~
multi-personal, 61
Deere, D., 169
Diamond, D., 54, 73
dilema de los presos, el
cooperacin en, 89-91, 227-236
equilibrio de Nash en, 10
;,.
26-1 / NDICE
en forma extensiva
NDICE
ANALTICO
iterativa de estrategias
definicin de, 5
vase tambin eliminacin iterativa de
estrategias estrictamente dominadas
etapa, juego de
con mltiples equilibrios de Nash,
82-87
de decisiones sucesivas, 109, 111
en el teorema de Friedman, 92
en juegos repetidos infinitamente,
91-92
en juegos repetidos infinitamente
informacin completa, 82
86,
con
ANALTICO
265 .
ejercicio 4.1,249
relacin con juegos en forma
extensiva, 118-19
transcripcin del enunciado informal
de un problema a un, 15-16,21-22,
153, 155
vase tambin forma extensiva, juego
en
Friedrnan, L 15n1, 54, 96,101
Friedman, teorema de, 88
demostracin del, 97, 99-101
enunciado del, 96
frontera, de Pareto, 87 .
Fudenberg, D., 98, 181n3
funcin de mejor respuesta, 35-37,
como correspondencia de mejor
respuesta, 42-43
como estrategia, 125
en el juego de duopolio de Coumot,
17-21,39
en el juego delos aranceles,. 75
funciones de ganancias, en jue~s"
bayesianos estticos"146,1.49
en juegos estticos con informacin
completa, 4
93,
97
Farber, H., 2, 23
farol, en pquer, 30
Farrell, J., 86,120,213,248
Fenlndez,Fl,129
finito,juego: 34,45, 181n1. Vas~ tambin
repetido finita mente, juego
forma extensiva, juego en, 4, 115-117
ejercicios 2.21, 2.22, 138-39
relacin con la forma normal,119
vase tambin nodo de decisin;
conjunto de info,rmacin; forma
nomlal, juego en
forma normal, juego en:
definicin de, par,! ti!' juego con
informacin completa, 3, 4
definicin de, para un juego
esttico con informacin incompleta,
146-150
ejercicios 2.21,2.22, 138-39
ganancia factible, 95
ganancia medio, 96
ganancia de reserva,
97, 98,.
.
ganancias, informacin del dominio~"
pblico sob;e as, 117,143
".
."
,(;"
-266
NDICE ANALTICO
NDICE ANALTICO
en el madela de duapalia de
Caumat, 144-146
en el madela de negaciacin
sucesiva, :221-27
vase tambin infarmacin incampleta;
infarmacin privada
infarmacin campleta, 1, 143, vase
tambin informacin incampleta
informacin campleta y perfecta, juega
can, 55, vase tambin induccin hacia
atrs; repetida, juega; perfecta en ~
subjuegas, equilibrio. d Nash
infarmacin campleta.pero irriperfda,
juega can, 70, 120-121 .
en das etapas, 92, 117 .
vase tainbin infarmaan
impeTf~da; bayesiand prfeCta,
.equillbda; repetida, juega; perfecta
en subjuegas, eijilibria de Nash
infarmacin del daminio pblica, 7
en el juega de dopalia de Caumat
con informacin asimtrica, 144
en juegas can infrmati6n corhpleta
y perfcta; 11i, 143
sabre la racianalidad
de las
jugadares, 7, 56-59
sabre,las fvncianes de ganancias de
las juga49'res, 1
infarmacin il'iperfecta .
definida, 53
en el juega de las aranceles, 73-77
en el juego de las pnicas bancarias,
71-73
en el juega de tameo, 77-80
en juegas repetidas finitamente, 80'87
en juegas repetidas infinitamente,
87-105
juegas dinmicas con; 10
vase tambin infamacin completa
152-55
en las juegas de sealizacin,
185-213,236-47
en un juega esttica, 146-150
vase tambin infarmacin asimtrica;
;.
Jacklin, C. 130
jugadares racianales, 4-7
53nl
en juegas can parla tea, 213-21
en la reinterpretacin del equilibrio.
de Nash can estrategias mixtas, 40,
cama,
I 267
Kakutani, S., 45
228,241,243
KrisllOa, V., 130
2b:i
1 NDICE
NDICE
ANALTICO
en el, 35
equilibrio de Nash con estrategias
mixtas en el, 37-39
eSlra legias mixtas en el, 39
ganan.:ias esperadas en el, 33
siendo ms listo en el, 30
Mont;omery, J., 51
Myers, S., 177, 186,208
l'vIyerson, R., 163, 164, 166, 169
ANALTICO
1269
probabilidad
de que se acabe un juego repetido, 90
distribucin, 24nll
en estrategias mixtas, 31
funcin de densidad, 23n10
vase tambin regla de Bayes conjetura
problema de teora de juegos, 4
punto fijo, teorema del, 45-47
pura, estrategia:
definicin de, 93, 117
ejercicio 2.18, 138
ejercicios 3.1, 3.3,169-70
en juegos bayesianos estticos, 151-52
en juegos de sealzacin, 188
en juegos dinmicos con informacin
completa, 93
en juegos repetidos con informacin
completa, 93
vase tambin estrategia; mixta,
"\
estrategia
Pyle, D., 248
racionaldad.sucesiva,
179.
refinamiento
del equilibrio bayesianoperfecto,
177,194,199,202,236,248
del equilibrio de Nash, 84
ejercicio 4.16, 256
regla de Bayes, 149112,180,204n6
renegociacin, 86-86, 11 ...
repetido finitamente, juego:
con informacin completa, 80-87
definicin, 82
dilema de los presos con iriformacin
incompleta, 227-36
renegociacin en un, 86-87
repetido infinitamente, juego: 87-101
definido, 92
estrategia del disparador en, 90
estrategia en, 93
ganancias en 95
subjuego en, 94
vase tambin ganancia media
cooperacin; colusin; factor de
descuento; ganancia factible;
.....
't.a
te::.
NDICE
270 /
';,
.L/
NDICE
~.)
ANM.II(,()
/2'71
ANALTICO
infinitamente, 93
en el dilema de los presos rel,elicio
infinitamente, 94
en el duopolio de Cournot repetid"
infinitamente, 105
en el juego de poltica mone!"ria, n5
en el modelo de salarios de eficiencia,
111
J., 68
'-"#;"
;-~;:C"l
valor prente,
89
Zender,
Facultad
r., 208
U 1'1~,il S IVI
de Cielic;;s EClr1micils
DCANi\TO
I ,fBRO
l.
CO;\lPR,\DO
SE"'JESTRE
2006 1
(;~