Академический Документы
Профессиональный Документы
Культура Документы
(TEORÍA DE JUEGO)
I) INTRODUCCIÓN
a. Reseña histórica
b. Trasfondo teórico
c. Breve explicación de los temas a cubrir
II) ELEMENTOS BÁSICOS DE JUEGO NO COOPERATIVOS
III) JUEGOS EN FORMA EXTENSIVA
IV) ESTRATEGIAS Y LA FORMA NORMAL
1
I- INTRODUCCIÓN
A. Reseña Histórica:
1) La teoría de juego fue desarrollada por John Von Neuman y Oskar Morgenstern.
2
B. Trasfondo: el enfoque cuantitativo de las ciencias económicas.
1) Los agentes económicos son racionales, i.e., persiguen o buscan satisfacer sus
preferencias de manera óptima a través de un conjunto de acciones, dado un conjunto de
información y una condiciones iniciales. En el sistema económico, se asume, explicita o
implícitamente, que los agentes optimizan. (Comentario sobre racionalidad instrumental).
2) Equilibrio. Esta es una premisa tomada de los sistemas físicos. En éstos, los sistemas
tienden a converger a una situación estable entre ellos y su entorno. Dentro del ámbito de
la teoría de juego, en principio, el equilibrio se refiere a un resultado (payoff) óptimo, para
todos los jugadores, dadas las reglas de juego y la racionalidad de los agentes. Lo anterior
implica que la suma de resultados pudiese ser cero pero no necesariamente.
3
¿En qué se diferencia la teoría de juego del resto de la teoría económica?
1) La teoría de juego es una disciplina en sí misma, con múltiples aplicaciones a los
diferentes campos o disciplinas: ciencias políticas, ciencias naturales (la biología,
fundamentalmente), la ingeniería, etc.
2) Dentro del ámbito económico, la teoría de juego se diferencia del resto de la
teoría económica en que los agentes toman decisiones y actúan de manera interactiva.
¿Qué significa esto…?.
3) Una característica fundamental de la interacción multipersonal es el potencial de
estrategias de comportamiento independiente (juego no cooperativo): en situaciones
multipersonales con independencia de estrategias, cada agente reconoce el resultado,
payoff, que él recibiría (en términos de utilidad o beneficio) en función, no sólo de sus
propias acciones, sino respecto de las acciones de otros.
4) Así, las mejores acciones a tomar dependen de: las acciones que otros individuos
ya hayan tomado; las acciones que se esperan sean tomadas; o de las futuras acciones
a tomar o no tomar.
4
5) En contraste, en el resto de la teoría económica, en el estudio de las decisiones
económicas individuales, el tomador de decisiones encuentra situaciones en las cuales
su bienestar depende sólo de las decisiones por las cuales él opta.
6) Las teorías que usamos para analizar el conjunto de estrategias
interdependientes se denomina teoría de juegos no cooperativos.
7) Existe otra rama de la teoría de juego – la cual no estudiaremos – denominada
teoría de juegos cooperativos. A diferencia de la teoría de juegos no cooperativos, los
unidades de análisis no son los agentes (racionales) individuales, sino grupos o
subgrupos de individuos que asumen, como premisa, que son capaces de obtener un
resultado particular mediante arreglos cooperativos, dada su indeterminada
esperanza de vida.
8) La teoría de juego no cooperativos puede explicar acciones cooperativas pero
como consecuencia de acciones individuales racionales, en ausencia de reglas o
convenios cooperativos precedentes.
5
Dentro de las escuelas de pensamientos económicos,
¿dónde se sitúa la teoría de juego no cooperativos?
6
Competencia
Monopolio OLIGOPOLIO:
perfecta
• Pocos suplidores
P • Pocos demandantes
Mc P D S
Pm • Interdependientes Pm
D • Varios agentes D
MR S
qm q qm q
Teoría de juego
Nash equilibria
7
Breve explicación de los temas a cubrir
1) En el tema I, Elementos Básicos de los Juegos No Cooperativos, estudiaremos
informalmente el concepto de juego. Además, describiremos cómo un juego puede ser
descrito en su forma de representación extensiva. También introduciremos el concepto de
estrategia, su forma normal de representación y su forma aleatoria, denominada estrategia
mixta.
8
3) Para el tema III, Juegos Dinámicos, estudiaremos juegos cuyas situaciones involucran
escoger acciones en el tiempo. Aquí introduciremos el concepto de credibilidad y el de
equilibrio de Nash con juegos sub-perfectos. Además, cubriremos los procedimientos por
inducción posterior e inducción anterior (back ward and forward induction), los cuales
conforman los principios de la programación dinámica.
9
II ELEMENTOS BÁSICOS DE JUEGO NO COOPERATIVOS
1) ¿Qué es un juego?
Un juego es una representación formal de una situación en la cual un número de
individuos interactúan dentro de un conjunto de estrategias inter-dependientes. Por ello,
queremos significar que el bienestar de cada participante depende, no solo de sus propias
acciones, sino también de las acciones de otros individuos. Más aún, las acciones que son las
mejores para algún jugador pudiese depender de lo que él espera o lo que él cree otros
jugadores harían.
2) Interacción estratégica
Para describir una interacción estratégica, se necesitan cuatro cosas:
(i) Los jugadores: ¿quiénes están involucrados?
(ii) Las reglas del juego: ¿quién mueve y cuándo?
¿qué saben o qué información tienen cuando actúan?
¿qué pueden y qué se cree no harían?
(iii) Los resultados: para cada posible conjunto de acción, ¿cuál es el resultado del juego?
10
(iv) Las ganancias o beneficios: partiendo de las preferencias (i.e., función de utilidad) se
generan un conjunto de los posibles resultados.
11
Reglas: los jugadores ponen su marca, X o 0 en cada recuadro (no remarcado). El
jugador X mueve primero. Ambos jugadores ven la selección hecha previamente.
Resultados: el primer jugador que marque su símbolo X o 0, en forma contigua
(horizontal, vertical o diagonalmente recibe un dólar (21.000 Bs). Si nadie lo logra, el
juego se empata y nadie recibe pago.
En relación al aspecto (iv), decimos que las preferencias están dadas sobre los
posibles resultados. De manera general, las preferencias de los jugadores se definen a
través de una función de utilidad que asigna un nivel de satisfacción o beneficio para
cada resultado. Es común referirse a la función de utilidad de cada jugador como la
función de resultado (pay off function) y el nivel de utilidad o satisfacción como su
beneficio (payoff).
En los ejemplos anteriores se sobre-entendió que el payoff de cada jugador es
simplemente la cantidad de dinero ganado (o perdido). Nótese que la acción que
maximiza el payoff de cada jugador depende de lo que él espera haga su oponente.
12
Los ejemplos descritos son considerados de conflictos puros: lo que un jugador
gana, el otro lo pierde. Tales juegos se denominan juegos de suma constante. Pero la
interacción estratégica no están limitada a tales situaciones de conflicto puro o parcial.
Ejemplo 3: encontrarse en Nueva York. (Juegos de puntos focales)
Los item (i) al (iv) son como sigue:
Jugadores: dos jugadores, Sr. Thomas y Sra. Schelling.
Reglas: los jugadores están separados y no pueden comunicarse. Se supone deben
encontrarse en NY al mediodía pero olvidaron dónde. Cada uno debe decidir dónde ir
(sólo una opción es posible).
Resultados: si se encuentran, disfrutan la compañía de cada uno. De lo contrario,
comerían y pasarían el resto de la tarde-noche solos.
Payoffs: cada uno obtendría un valor monetario de 100 dólares (Bs 2.100.000) por
la compañía compartida: 100 dólares para cada uno si se encuentran o nada si no.
Observen que este es un juego de coordinación que depende de lo que cada quien
piense en cuánto a qué haría el otro. A esto se le denomina puntos focales.
13
Ejemplo 4: Publicitar o no publicitar
Jugadores: dos firmas, firma A y firma B
Reglas: cada firma, de forma simultánea, puede publicitar sus productos en los medios
de comunicación televisivos pero de manera no engañosa.
Resultados: los resultados de la estrategia publicitaria se definen en términos de
aumento (variación) de las ventas: Beneficio de B
Beneficio de A
Firma B
Publicitar No Publicitar
One–shot
Publicitar (10,5) (15,0) game.
Firma A
No Publicitar (6,5) (10,2)
14
Ejemplo 5: el dilema del prisionero
Prisionero B
Confesar No Confesar
Prisionero Confesar (-5,-5) (-1,-10)
A No Confesar (-10,-1) (-2,-2)
17
La forma extensiva se basa en un aparato conceptual conocido
como “juego en forma de árbol”.
18
II. Ejemplos de representación extensiva
Ejemplo: Matching Pennies con información perfecta
Jugador 1
Cara Sello
Jugador 2 Jugador 2
Nodos
terminales
Jugador 1 Payoff -1 +1 +1 -1
Jugador 2 Payoff +1 -1 -1 +1
19
En este juego, cada jugador puede ver cuál es el movimiento previo de
su contraparte. El tipo de juego donde la información u observabilidad de
movimiento de los jugadores está presente se le conoce como “juegos
de información perfecta”.
El concepto de “conjunto de información” (information set) nos dice que
no necesariamente los jugadores conocen todos los movimientos de su
contraparte. Formalmente, el conjunto de información es un sub-conjunto
de cada nodo particular de decisión de un jugador.
La interpretación de lo anterior consiste en entender que existe una
posibilidad de que al alcanzar un nodo de decisión como consecuencia
de una jugada, el conjunto de información en ese nodo no ofrece
información al jugador, porque él ignora qué ha pasado previamente en el
juego
20
A lo dicho previamente se le conoce como juego sin memoria perfecta
(game withouth perfect recall).
Jugador 1
Conjunto de
Cara Sello información
Jugador 2
-1 +1 +1 -1
+1 -1 -1 +1
21
En este juego, el jugador 1 cubre con su mano sobre la jugada, por lo cual el
jugador 2 no puede ver cuál ha sido la jugada del jugador 1 hasta que el
mismo jugador 2 haya jugado.
La elipse dibujada que encapsula los nodos de decisión del jugador 2 están
en un único conjunto de información. Éste no ofrece información que le
permita al jugador 2 distinguir los dos nodos; si fuese de otra manera, el
jugador sabría cual habría sido la jugada del jugador 1.
22
Juegos con memoria perfecta son aquellos en los cuales cada jugador
recuerda las jugadas previas de su adversario y las suyas.
23
Ejemplo de juegos sin memoria perfecta:
Jugador 1
(A)
l r
Jugador 2 Jugador 2
L R L R
Jugador 1
x y x y
Jugador 2
a
b a b
(B) Jugador 1
Jugador 2 l r Jugador 2
L R L R
Jugador 1
x y x y x y x y
24
Hasta ahora los juegos descritos han sido una función determinística de las
opciones de cada jugador. Sin embargo, puede haber un elemento de azar,
denominado ello como “movimientos de naturaleza aleatoria”.
Naturaleza
1/2 1/2
Jugador 1 Cara Sello Jugador 1
Cara Sello
Cara Sello
Jugador 2 Jugador 2
-1 +1 +1 -1 -1 +1 +1 -1
+1 -1 -1 +1 +1 -1 -1 +1
25
Kidnapping Game (Selten, Nash, Harsany)
Selten: Kidnapping game, perfect equilibrium: Bellman’s Principle of Optimality.
Nash: Nash Equilibrium, Bargaining Game
Harsany: Bayesian Game
Two Players: K (Kidnapper)
F (Family of kidnapped victim)
N (Nature)
28
iii. - Una función origina la acción que lidera cualquier nodo
inicial desde su inmediato predecesor y satisface la propiedad
que,
Si y
Entonces
29
v. - Una función 𝜾: 𝓗 → {𝟎, 𝟏, , , 𝑰} asigna cada conjunto de información en 𝓗
al jugador (o la naturaleza, jugador 0) quien mueve en el nodo de
decisión;
- Se denota a la colección del conjunto de información del jugador por
𝓗𝒊 = {𝑯 ∈ 𝓗: 𝒊 = 𝜾 𝑯 }
31
+2 -1
Stay out 0 Pay off potential entrant: E -2 +1
I
I No reaction 1 Entrant E
E N No reaction -1 incumbent
I
Enter
I
O
I finds funds: (O)
Starts a price
war
Retreats Fights back
E = Potential Entrant
I = Incumbent -1 -2
+1 +2
N: Nature (at this point the
incumbent firm looks for financial
resources).
Information set of E
32
IV. ESTRATEGIAS Y LA FORMA NORMAL
Estrategias:
1) Un concepto central en la teoría de juego es la noción de estrategia de un juego. Una
estrategia es un plan contingente, o regla de decisión, que especifica cómo el jugador
actuará en cada circunstancia posible y distinguible en la cual él deba jugar (actuar).
2) Recordar que cada jugador, el conjunto de circunstancias está representado por su
colección de conjuntos de información, con cada conjunto de información
especificando una circunstancia diferente y distinguible en la cual él necesite actuar.
33
Definición IV.1: sea ℋ𝑖 la colección de conjunto de información del jugador i, A el
conjunto de acciones posibles en el juego, y C(H) ⊂ A el conjunto de acciones posibles en
cada conjunto de información H. Una estrategia por el jugador i es una función.
Si: ℋ𝑖 A; tal que,
Si (H) ∈ C (H) ∀ H ∈ ℋ𝑖 .
En otras palabras, una estrategia es un plan contingente completo o regla de decisión
que dice qué hará el jugador en cada circunstancia (conjunto de información) si él está
llamado a jugar.
1) En la forma extendida, cada perfil de estrategia para los jugadores, S= (S1, …, SI)
induce un resultado para el juego: movimientos o decisiones tomadas y una distribución
probabilística sobre los nodos del juego.
35
2) Por consiguiente, para cada perfil de estrategias (S1, …, SI) se puede deducir el
beneficio que recibe cada jugador. Pudiéramos por consiguiente especificar el juego en
términos de estrategias y su correspondiente beneficio.
3) Esta forma de representación se conoce como la forma normal (o forma estratégica).
4) Es, en esencia, una versión condensada de la forma extensiva.
Jugador 2
S1 S2 S3 S4 Forma normal del juego o
H -1, +1 -1, +1 +1, -1 +1, -1 Matching Pennies con
Jugador 1 información perfecta.
T +1, -1 -1, +1 +1, -1 -1, +1
36
Obsérvese que la función de utilidad depende de la estrategia adoptada en el juego.
Ejemplo. La forma normal del juego matching pennies con información perfecta
La función de resultados del jugador 1 en la caja del juego descrito en la lámina 35, es
37
EVOLUTIONARY GAME: THE ROOT GAME PARADIGM (Riecher
and Hammerstein )
ASSUMPTIONS:
Plant B
L T U: Underground water
S S S: Surface water
L , (S,U) L: Lateral system
Plant A 2 2
T (U,S) (U,U) T: Tap root system
In evolutionary time, one will observe a fraction of plants choosing L, the other
fraction will choose T for U>S/2 (Mixed Strategy equilibria).
39
John Maynard Smith: Evolutionary Games.
Animal B
Hawk Dove
Hawk (-2, -2) (2,0) One Nash equilibrium
Animal A
Dove (0,2) (1,1)
(H) Hawk: look tough. Threaten the other animal, be ready to fight.
(D) Dove: look tough. Threaten the other animal. If it doesn’t work, run away.
40
Payoff: average number of offspring (genetic fitness)
10 Average
2
(-2)
0
H is best against D
(H,D): A Nash Equilibrium strategy
D is best against H
41
Preguntas
Especifique brevemente:
1)¿De qué depende una estrategia a adoptar en un juego?
2)¿De qué depende el beneficio, o payoff, obtenido por cada jugador?
42