Clase 1-Teoría de Juego No Cooperativo I

PROGRAMA DE LA MATERIA: INTERACCIÓN ESTRATÉGICA,
(TEORÍA DE JUEGO)
I) INTRODUCCIÓN
a. Reseña histórica
b. Trasfondo teórico
c. Breve explicación de los temas a cubrir
II) ELEMENTOS BÁSICOS DE JUEGO NO COOPERATIVOS
III) JUEGOS EN FORMA EXTENSIVA
IV) ESTRATEGIAS Y LA FORMA NORMAL
1
I- INTRODUCCIÓN
A. Reseña Histórica:
1) La teoría de juego fue desarrollada por John Von Neuman y Oskar Morgenstern.
2) John Von Neumann lo desarrolló: en 1928 pero su refinamiento y publicación

fue hecha junto con Morgenstern en 1943: Theory of Game and Economic Behavior,
Princeton University Press.
3) En dicho libro, se exponen los fundamentos de la teoría de juego como disciplina,
cuya aplicaciones van más allá de las ciencias económicas.
4) John Nash hizo una contribución decisiva en este campo a partir de la

publicación de su tesis doctoral: Non–Cooperative Games, Dep. of Mathematics,
Princeton, 1950.
5) Otros autores han contribuido significativamente al desarrollo de la teoría de

juego pero las fundaciones fueron establecidas por estos 3 autores.
2
B. Trasfondo: el enfoque cuantitativo de las ciencias económicas.
Premisas en la formulación de un problema económico
1) Los agentes económicos son racionales, i.e., persiguen o buscan satisfacer sus
preferencias de manera óptima a través de un conjunto de acciones, dado un conjunto de
información y una condiciones iniciales. En el sistema económico, se asume, explicita o
implícitamente, que los agentes optimizan. (Comentario sobre racionalidad instrumental).
2) Equilibrio. Esta es una premisa tomada de los sistemas físicos. En éstos, los sistemas
tienden a converger a una situación estable entre ellos y su entorno. Dentro del ámbito de
la teoría de juego, en principio, el equilibrio se refiere a un resultado (payoff) óptimo, para
todos los jugadores, dadas las reglas de juego y la racionalidad de los agentes. Lo anterior
implica que la suma de resultados pudiese ser cero pero no necesariamente.
3) Comportamiento estándard. Si las reglas de juego están dadas, i.e., la organización

social es aceptada por los participantes o grupos sociales, las imputaciones óptimas
resultante del juego “social” (pay off) se aceptan y son estables.
3
¿En qué se diferencia la teoría de juego del resto de la teoría económica?
1) La teoría de juego es una disciplina en sí misma, con múltiples aplicaciones a los
diferentes campos o disciplinas: ciencias políticas, ciencias naturales (la biología,
fundamentalmente), la ingeniería, etc.
2) Dentro del ámbito económico, la teoría de juego se diferencia del resto de la
teoría económica en que los agentes toman decisiones y actúan de manera interactiva.
¿Qué significa esto…?.
3) Una característica fundamental de la interacción multipersonal es el potencial de
estrategias de comportamiento independiente (juego no cooperativo): en situaciones
multipersonales con independencia de estrategias, cada agente reconoce el resultado,
payoff, que él recibiría (en términos de utilidad o beneficio) en función, no sólo de sus
propias acciones, sino respecto de las acciones de otros.
4) Así, las mejores acciones a tomar dependen de: las acciones que otros individuos
ya hayan tomado; las acciones que se esperan sean tomadas; o de las futuras acciones
a tomar o no tomar.
4
5) En contraste, en el resto de la teoría económica, en el estudio de las decisiones
económicas individuales, el tomador de decisiones encuentra situaciones en las cuales
su bienestar depende sólo de las decisiones por las cuales él opta.
6) Las teorías que usamos para analizar el conjunto de estrategias
interdependientes se denomina teoría de juegos no cooperativos.
7) Existe otra rama de la teoría de juego – la cual no estudiaremos – denominada
teoría de juegos cooperativos. A diferencia de la teoría de juegos no cooperativos, los
unidades de análisis no son los agentes (racionales) individuales, sino grupos o
subgrupos de individuos que asumen, como premisa, que son capaces de obtener un
resultado particular mediante arreglos cooperativos, dada su indeterminada
esperanza de vida.
8) La teoría de juego no cooperativos puede explicar acciones cooperativas pero
como consecuencia de acciones individuales racionales, en ausencia de reglas o
convenios cooperativos precedentes.
5
Dentro de las escuelas de pensamientos económicos,
¿dónde se sitúa la teoría de juego no cooperativos?
Dentro de la economía neoclásica, la cual:

1) Parte del individuo: consumidores, firmas, gobiernos.
analogía con la física: átomos, moléculas, etc.
2) Preferencias individuales utilidad, beneficios, costos.
3) Se escogen las mejores acciones posibles dadas unas restricciones (optimización con
restricciones):
El individuo racional actúa siguiendo el principio de optimización:
multiplicador de Lagrange y el teorema Kuhn Tucker,
(optimización estática).
programación dinámica, donde el tiempo es una variable,
(principio del máximo de Pontryagin.)
4) El concepto de equilibrio de la física tiene su contrapartida en el concepto de equilibrio de
Nash en la teoría de juego.
6
Competencia
Monopolio OLIGOPOLIO:
perfecta
• Pocos suplidores
P • Pocos demandantes
Mc P D S
Pm • Interdependientes Pm
D • Varios agentes D
MR S
qm q qm q
Teoría de juego
Nash equilibria
Tanto en el monopolio puro como en competencia perfecta, la naturaleza de la

interacción estratégica entre los agentes es mínima, por lo cual, el análisis no requiere
del uso formal de la teoría de juego. No así en la situación de oligopolio.
7
Breve explicación de los temas a cubrir
1) En el tema I, Elementos Básicos de los Juegos No Cooperativos, estudiaremos
informalmente el concepto de juego. Además, describiremos cómo un juego puede ser
descrito en su forma de representación extensiva. También introduciremos el concepto de
estrategia, su forma normal de representación y su forma aleatoria, denominada estrategia
mixta.
2) En los temas II y subsiguientes, Juegos con Movimientos Simultáneos. En estos juegos,

los jugadores toman acciones una sola vez al mismo tiempo.
En estas secciones cubriremos los conceptos de estrategias dominantes y dominadas,

estrategias racionalizables, el concepto equilibrio de Nash y el concepto de (equilibrio de
Nash Bayesiano).
8
3) Para el tema III, Juegos Dinámicos, estudiaremos juegos cuyas situaciones involucran
escoger acciones en el tiempo. Aquí introduciremos el concepto de credibilidad y el de
equilibrio de Nash con juegos sub-perfectos. Además, cubriremos los procedimientos por
inducción posterior e inducción anterior (back ward and forward induction), los cuales
conforman los principios de la programación dinámica.
4) En la última sección, sección V, La Racionalidad Acotada (Bounded Rationality) se

cuestiona la optimización (maximización) subjetiva de la utilidad esperada como guía definitiva
y única en la toma de decisiones y comportamiento de los agentes. La propuesta implicaría la
reformulación no sólo de la teoría de juegos sino de la entera teoría microeconómica porque
apunta a la poca capacidad explicativa de la teoría ante eventos de la vida cotidiana. Su
basamento es estrictamente empírico. De hecho, en el mundo real, en la toma de decisiones
intervienen aspectos inconscientes como rutinas pre-aprendidas, intuición o prejuicios.
Discusión relativa a la utilidad de los sistema o modelos ideales.
9
II ELEMENTOS BÁSICOS DE JUEGO NO COOPERATIVOS
1) ¿Qué es un juego?
Un juego es una representación formal de una situación en la cual un número de
individuos interactúan dentro de un conjunto de estrategias inter-dependientes. Por ello,
queremos significar que el bienestar de cada participante depende, no solo de sus propias
acciones, sino también de las acciones de otros individuos. Más aún, las acciones que son las
mejores para algún jugador pudiese depender de lo que él espera o lo que él cree otros
jugadores harían.
2) Interacción estratégica
Para describir una interacción estratégica, se necesitan cuatro cosas:
(i) Los jugadores: ¿quiénes están involucrados?
(ii) Las reglas del juego: ¿quién mueve y cuándo?
¿qué saben o qué información tienen cuando actúan?
¿qué pueden y qué se cree no harían?
(iii) Los resultados: para cada posible conjunto de acción, ¿cuál es el resultado del juego?
10
(iv) Las ganancias o beneficios: partiendo de las preferencias (i.e., función de utilidad) se
generan un conjunto de los posibles resultados.
Ejemplo1: Matching pennies.

Los items (ii) al (iii) son como sigue:
Jugadores: hay dos jugadores, denotados como 1 y 2
Reglas: cada jugador pone una puya (pennie) simultáneamente: cara o sello.
Resultados: si los pennies (puyas) coinciden (match), (esto es, bien los dos son cara o los dos
son sello), el jugador 1 paga un dólar (o 21.000 Bs) al jugador 2; de lo contrario el jugador 2
paga un dólar (21.000 Bs) al jugador 1.
Ejemplo 2: Tick – Tack - Toe (“La Vieja”)

Los items (i) al (iii) son como sigue:
Jugadores: hay dos jugadores, X y O
Reglas: tenemos una tabla con nueve recuadros dispuestos en tres filas y tres columnas
dispuestos uno sobre otro:
11
Reglas: los jugadores ponen su marca, X o 0 en cada recuadro (no remarcado). El
jugador X mueve primero. Ambos jugadores ven la selección hecha previamente.
Resultados: el primer jugador que marque su símbolo X o 0, en forma contigua
(horizontal, vertical o diagonalmente recibe un dólar (21.000 Bs). Si nadie lo logra, el
juego se empata y nadie recibe pago.
En relación al aspecto (iv), decimos que las preferencias están dadas sobre los
posibles resultados. De manera general, las preferencias de los jugadores se definen a
través de una función de utilidad que asigna un nivel de satisfacción o beneficio para
cada resultado. Es común referirse a la función de utilidad de cada jugador como la
función de resultado (pay off function) y el nivel de utilidad o satisfacción como su
beneficio (payoff).
En los ejemplos anteriores se sobre-entendió que el payoff de cada jugador es
simplemente la cantidad de dinero ganado (o perdido). Nótese que la acción que
maximiza el payoff de cada jugador depende de lo que él espera haga su oponente.
12
Los ejemplos descritos son considerados de conflictos puros: lo que un jugador
gana, el otro lo pierde. Tales juegos se denominan juegos de suma constante. Pero la
interacción estratégica no están limitada a tales situaciones de conflicto puro o parcial.
Ejemplo 3: encontrarse en Nueva York. (Juegos de puntos focales)
Los item (i) al (iv) son como sigue:
Jugadores: dos jugadores, Sr. Thomas y Sra. Schelling.
Reglas: los jugadores están separados y no pueden comunicarse. Se supone deben
encontrarse en NY al mediodía pero olvidaron dónde. Cada uno debe decidir dónde ir
(sólo una opción es posible).
Resultados: si se encuentran, disfrutan la compañía de cada uno. De lo contrario,
comerían y pasarían el resto de la tarde-noche solos.
Payoffs: cada uno obtendría un valor monetario de 100 dólares (Bs 2.100.000) por
la compañía compartida: 100 dólares para cada uno si se encuentran o nada si no.
Observen que este es un juego de coordinación que depende de lo que cada quien
piense en cuánto a qué haría el otro. A esto se le denomina puntos focales.
13
Ejemplo 4: Publicitar o no publicitar
Jugadores: dos firmas, firma A y firma B
Reglas: cada firma, de forma simultánea, puede publicitar sus productos en los medios
de comunicación televisivos pero de manera no engañosa.
Resultados: los resultados de la estrategia publicitaria se definen en términos de
aumento (variación) de las ventas: Beneficio de B
Beneficio de A
Firma B
Publicitar No Publicitar
One–shot
Publicitar (10,5) (15,0) game.
Firma A
No Publicitar (6,5) (10,2)
Payoffs: ¿Cuál es el beneficio más alto (variación de ventas) para la firma A y B?
14
Ejemplo 5: el dilema del prisionero
Prisionero B
Confesar No Confesar
Prisionero Confesar (-5,-5) (-1,-10)
A No Confesar (-10,-1) (-2,-2)
Jugadores: hay dos prisioneros, A y B.

Regla (situación): los prisioneros son interrogados separadamente por la policía.
Resultados: N° de año en prisión en función de si confiesan o no, su crimen.
Payoffs: mínimos No. de años en prisión si la estrategia es la adecuada.
Claramente, la estrategia de cada prisionero es la de Confesar o no Confesar en
función de lo que uno piensa hará el otro.
Juego desde la perspectiva del
prisionero A:
Confesar No Confesar ¿Cuál es la estrategia
Confesar -5 -1 dominante para A?
Confesar domina a
No Confesar -10 -2 No Confesar.
15
Juego desde la perspectiva de B:
¿Cuál es la estrategia
Confesar No Confesar dominante para B?
Confesar -5 -10 Confesar domina
No Confesar -1 -2 estrictamente a No
Confesar.
¿Cuál es la solución de este juego?

Ambos prisioneros confiesan y cada uno obtiene 5 años de cárcel: (-5.5) real outcome.
¿Cuál es la mejor solución posible?
¿Es la solución del juego paretianamente eficiente? ¿Por qué?
Para el alumno distraído…

1)¿En qué consiste un juego?
2)¿Qué pasaría si se rompen las reglas?
3)¿Qué diferencia la teoría de juegos en la organización económica del resto de la teoría
económica?
16
III. REPRESENTACIÓN EXTENSIVA
La forma de representación extensiva de un juego.
1) Conociendo los componentes de un juego, podemos hacer una

representación extensiva del mismo. En esta forma capturamos quién
mueve y cuándo, cuáles acciones cada jugador puede jugar, qué
saben los jugadores cuando mueven, qué resultado se obtiene en
función de las acciones tomadas, y el beneficio a obtener de
dichos resultados.
2) La forma extensiva se basa en un aparato conceptual conocido como

“juego en forma de árbol”. La forma extensiva es empleada para
representar y resolver juegos dinámicos porque éstos presentan una
secuencia de acciones en el tiempo.
17
La forma extensiva se basa en un aparato conceptual conocido
como “juego en forma de árbol”.
2) Estructura de la forma extensiva:

a) El juego comienza desde un nodo vacío. Este pequeño círculo abierto se le
conoce como “nodo inicial” e indica el primer movimiento a ser ejecutado por el
primer jugador.
b) Seguido o partiendo del nodo inicial, las acciones del jugador 1 se ramifican,
y terminan cada una en otro nodo, denominado nodo de decisión del jugador 2.
c) A su vez, las acciones del jugador 2 terminan en otro nodo de decisión, en
este caso de jugador1, 3 o n, dependiendo del número de jugadores involucrados
y de cuándo le toque jugar.
d) Las acciones y nodos sucesivos llevan al juego a un término según las reglas.
Dicho nodo terminal presenta los resultados del juego y los respectivos beneficios.
18
II. Ejemplos de representación extensiva
Ejemplo: Matching Pennies con información perfecta
Jugador 1
Cara Sello
Jugador 2 Jugador 2
Cara Sello Cara Sello
Nodos
terminales
Jugador 1 Payoff -1 +1 +1 -1
Jugador 2 Payoff +1 -1 -1 +1
19
 En este juego, cada jugador puede ver cuál es el movimiento previo de
su contraparte. El tipo de juego donde la información u observabilidad de
movimiento de los jugadores está presente se le conoce como “juegos
de información perfecta”.
 El concepto de “conjunto de información” (information set) nos dice que
no necesariamente los jugadores conocen todos los movimientos de su
contraparte. Formalmente, el conjunto de información es un sub-conjunto
de cada nodo particular de decisión de un jugador.
 La interpretación de lo anterior consiste en entender que existe una
posibilidad de que al alcanzar un nodo de decisión como consecuencia
de una jugada, el conjunto de información en ese nodo no ofrece
información al jugador, porque él ignora qué ha pasado previamente en el
juego
20
 A lo dicho previamente se le conoce como juego sin memoria perfecta
(game withouth perfect recall).
Ejemplo: Matching Pennies sin memoria perfecta
Jugador 1
Conjunto de
Cara Sello información
Jugador 2
Cara Sello Cara Sello
-1 +1 +1 -1
+1 -1 -1 +1
21
 En este juego, el jugador 1 cubre con su mano sobre la jugada, por lo cual el
jugador 2 no puede ver cuál ha sido la jugada del jugador 1 hasta que el
mismo jugador 2 haya jugado.
 La elipse dibujada que encapsula los nodos de decisión del jugador 2 están
en un único conjunto de información. Éste no ofrece información que le
permita al jugador 2 distinguir los dos nodos; si fuese de otra manera, el
jugador sabría cual habría sido la jugada del jugador 1.
 Una lista de todos los conjuntos de información de un jugador nos diría

todos los eventos o circunstancias en las cuales debería intervenir una
jugada. ¿Cuál es la lista de los dos ejemplos anteriores de Matching
Pennies?
22
 Juegos con memoria perfecta son aquellos en los cuales cada jugador
recuerda las jugadas previas de su adversario y las suyas.
 Un juego de información perfecta es aquel en cada conjunto de

información contiene un único nodo de decisión. De otra manera sería
un juego de información imperfecta.
23
Ejemplo de juegos sin memoria perfecta:
Jugador 1
(A)
l r
Jugador 2 Jugador 2
L R L R
Jugador 1
x y x y
Jugador 2
a
b a b
(B) Jugador 1
Jugador 2 l r Jugador 2
L R L R
Jugador 1
x y x y x y x y
24
 Hasta ahora los juegos descritos han sido una función determinística de las
opciones de cada jugador. Sin embargo, puede haber un elemento de azar,
denominado ello como “movimientos de naturaleza aleatoria”.
Ejemplo de Matching Pennies con naturaleza aleatoria.
Naturaleza
1/2 1/2
Jugador 1 Cara Sello Jugador 1
Cara Sello
Cara Sello
Jugador 2 Jugador 2
Cara Sello Cara Sello Cara Sello Cara Sello
-1 +1 +1 -1 -1 +1 +1 -1
+1 -1 -1 +1 +1 -1 -1 +1
Este juego describe un comienzo de las naturaleza (aleatorio) en el nodo

inicial con dos ramas, cada una con probabilidad de ½.
25
Kidnapping Game (Selten, Nash, Harsany)
Selten: Kidnapping game, perfect equilibrium: Bellman’s Principle of Optimality.
Nash: Nash Equilibrium, Bargaining Game
Harsany: Bayesian Game
Two Players: K (Kidnapper)
F (Family of kidnapped victim)
N (Nature)
Do not kidnap Kidnap the victim

K
K 0 K
0 D: Ransom demand
F
C: Ransom offered. 𝐂 = 𝑫 F C: Ransom offered. 𝐂 < 𝑫
Accept C, realease the victim
D, -D K Accept C
and K Reject C and kill the
Accept C, kill the victim release the victim
victim
D, -2D N
N K not captured K captured by police
K captured by police K not captured
0 -P
-P C
-D -D
0 -C 26
Es un postulado de la teoría de juegos que todos los jugadores conozcan la
estructura del juego, que sepan que sus rivales la conocen y viceversa. Así,
decimos que la estructura del juego es común conocida.
Formalmente, un juego en su forma extensiva consiste en los siguientes ítems:
i. - Un conjunto finito de nodos χ;

- Un conjunto finito de acciones posibles A;
- Un conjunto finito de jugadores
ii. - Una función que especifica un nodo inmediatamente

predecesor de cada nodo .
- no es vacío excepto el nodo inicial, ;
- Los nodos inmediatos sucesores de son ;
- El conjunto de todos los nodos predecesores y sucesores de pueden ser
hallados iterando y ;
- Para tener una estructura de árbol, requerimos que los conjuntos y
estén separados;
- El conjunto de los nodos terminales es ;
- Todos los demás nodos 𝑿 | 𝑻 son conocidos como nodos de decisión.
28
iii. - Una función origina la acción que lidera cualquier nodo
inicial desde su inmediato predecesor y satisface la propiedad
que,
Si y
Entonces
iv. - El conjunto completo de información 𝓗, y una función 𝑯: 𝑿 → 𝓗

asignan cada nodo de decisión 𝒙 a algún conjunto de información en
𝑯 𝒙 ∈ 𝓗, así el conjunto de información en 𝓗 forma una participación
en el conjunto de nodos 𝑿.
- Se requiere que todos los nodos de decisión asignados a un conjunto
de información particular tengan las mismas opciones disponibles:
- Las opciones disponibles en el conjunto de información se escriben

como ;
29
v. - Una función 𝜾: 𝓗 → {𝟎, 𝟏, , , 𝑰} asigna cada conjunto de información en 𝓗
al jugador (o la naturaleza, jugador 0) quien mueve en el nodo de
decisión;
- Se denota a la colección del conjunto de información del jugador por
𝓗𝒊 = {𝑯 ∈ 𝓗: 𝒊 = 𝜾 𝑯 }
vi. - Una función 𝜌: Η0 x 𝐴 → [0, 1] asigna probabilidades a las acciones en

un conjunto de información donde la naturaleza mueve (produce una
acción) y satisface
vii. - Una colección de funciones de beneficio (payoff functions)

asigna utilidades a cada jugador en cada nodo terminal,
- La función de utilidad de cada jugador como una cantidad segura de

dinero a disfrutar (función de utilidad de Bernoulli).
Así, formalmente un juego en su forma extensiva está especificado por el

conjunto
𝜞𝑬 = {𝑿, 𝑨, 𝑰, 𝒑 . , 𝒔 . , 𝓗, 𝑯 . , 𝑪 . , 𝜾 . , 𝝆 . , 𝑼 . }
30
Nota: se han considerado los juegos de carácter finito, (finite games). Las
consideraciones del (ii) al (vii) pueden ser también aplicados a los casos de:
a) Un número infinito de acciones, lo cual requeriría un infinito número de nodos.
b) Un juego sin término (jugadores con vida infinita, como países o
corporaciones).
c) Un juego con infinito número de jugadores (jugadores inter-generacionales,
e.g.)
31
+2 -1
Stay out 0 Pay off potential entrant: E -2 +1
0 Pay off incumbent: I

Fights back Retreats
Starts a price X
I doesn’t find funds: (X) war
I
I No reaction 1 Entrant E
E N No reaction -1 incumbent
I
Enter
I
O
I finds funds: (O)
Starts a price
war
Retreats Fights back
E = Potential Entrant
I = Incumbent -1 -2
+1 +2
N: Nature (at this point the
incumbent firm looks for financial
resources).
Information set of E
32
IV. ESTRATEGIAS Y LA FORMA NORMAL
Estrategias:
1) Un concepto central en la teoría de juego es la noción de estrategia de un juego. Una
estrategia es un plan contingente, o regla de decisión, que especifica cómo el jugador
actuará en cada circunstancia posible y distinguible en la cual él deba jugar (actuar).
2) Recordar que cada jugador, el conjunto de circunstancias está representado por su
colección de conjuntos de información, con cada conjunto de información
especificando una circunstancia diferente y distinguible en la cual él necesite actuar.
33
Definición IV.1: sea ℋ𝑖 la colección de conjunto de información del jugador i, A el
conjunto de acciones posibles en el juego, y C(H) ⊂ A el conjunto de acciones posibles en
cada conjunto de información H. Una estrategia por el jugador i es una función.
Si: ℋ𝑖 A; tal que,
Si (H) ∈ C (H) ∀ H ∈ ℋ𝑖 .
En otras palabras, una estrategia es un plan contingente completo o regla de decisión
que dice qué hará el jugador en cada circunstancia (conjunto de información) si él está
llamado a jugar.
Ejemplo: Matching Pennies con información completa.
En este juego, el jugador 2 tiene 4 estrategias posibles:

Estrategia 1 (S1): juega cara si el jugador 1 juega cara;
juega cara si el jugador 1 juega sello.
Estrategia 2 (S2): juega cara si el jugador 1 juega cara;
juega sello si el jugador 1 juega sello.
Estrategia 3 (S3): juega sello si el jugador 1 juega cara;
juega cara si el jugador 1 juega sello.
Estrategia 4 (S4): juega sello si el jugador 1 juega cara;
juega sello si el jugador 1 juega sello. 34
Pregunta: ¿Cuántas estrategias tiene el jugador cuando el juego
Matching Pennies es de información imperfecta, i.e.,
non-perfect recall?
3) Las opciones de estrategias para un juego con I jugadores se pudieran denotar
como un vector
S= (S1, …, SI)
donde 𝑺𝒊 es la estrategia escogida por el jugador i.
4) (Si, S-i) es el perfil de estrategias del jugador i, donde el conjunto de estrategia
para todos los jugadores distintos a i (I-1) es S-i.
La forma normal de representación de un juego
1) En la forma extendida, cada perfil de estrategia para los jugadores, S= (S1, …, SI)
induce un resultado para el juego: movimientos o decisiones tomadas y una distribución
probabilística sobre los nodos del juego.
35
2) Por consiguiente, para cada perfil de estrategias (S1, …, SI) se puede deducir el
beneficio que recibe cada jugador. Pudiéramos por consiguiente especificar el juego en
términos de estrategias y su correspondiente beneficio.
3) Esta forma de representación se conoce como la forma normal (o forma estratégica).
4) Es, en esencia, una versión condensada de la forma extensiva.
Jugador 2
S1 S2 S3 S4 Forma normal del juego o
H -1, +1 -1, +1 +1, -1 +1, -1 Matching Pennies con
Jugador 1 información perfecta.
T +1, -1 -1, +1 +1, -1 -1, +1
Definición: para un juego con I jugadores, la forma normal de representación, 𝜞𝑵 ,

especifica para cada jugador i, un conjunto de estrategias Si (con si ∈ 𝑺i)
y una función de resultados (payoff function) Ui (S1, …, SI); esto es, unos
niveles de utilidad asociados con resultados (posiblemente aleatorios)
como consecuencia de las estrategias (S1, …, SI). Formalmente,
N = I, SI , Ui (.)
36
Obsérvese que la función de utilidad depende de la estrategia adoptada en el juego.
5) Cuando se describe el juego en la forma normal, no hay necesidad de seguir cada

movimiento o acción asociado con cada estrategia. Basta con enumerar las posibles
estrategias de cada jugador, escribir el conjunto de estrategias como
Si = s1i , s2i , … ,
Y luego cada estrategia por su número.
Ejemplo. La forma normal del juego matching pennies con información perfecta
La función de resultados del jugador 1 en la caja del juego descrito en la lámina 35, es
+1 Si (S1, S2) = (H, estrategias 3 o 4), o

U1 (S1, S2) = (T, estrategias 1 o 3),
-1 Si (S1, S2) = (H, estrategias 1 o 2) o
(T, estrategias 2 o 4)
donde U2 (S1, S2) = -U1 (S1, S2).
6) La 𝜞𝑵 se puede pensar como una forma simultánea de juego.
37
EVOLUTIONARY GAME: THE ROOT GAME PARADIGM (Riecher
and Hammerstein )
ASSUMPTIONS:
1. Desert plants compete for water.

2. Three sources of water available: 0-0.2 m; 0.21-1.0 m and >1 m.
3. Plants with lateral root systems (L) absorb water near surface.
4. Plants with tap-root systems, tap, (T) absorb underground water.
5. The efficient use of one water source precludes another: specialization.
Therefore the strategies are lateral or tap.
6. Payoffs: q. of water per unit of timereproductive output (Darwinian system).
7. S is defined as surface water (0-1 m) of L in the absence of neighbors.
8. U is the underground water sources (>1 m).
9. For two individual game, neighbors share by half in L: S/2.
10.T faces no competitive effect of neighbors: once located the source, it can
sustain the needs of shrubs (plants).
11.Constraints: L faces little water;
T faces non-reliable water sources (risky).
Please develop pure strategies assuming: i) U<S/2, underground water is difficult

to locate, and ii) U>S/2, underground water is plenty.
38
Ejemplos de juegos con movimiento simultáneos:
Evolutionary Game
Ecology: Dessert-Plant Root System
How desert plants organize their root structure to acquire enough water to
ensure their survival and reproduction in an arid environment.
Riecher and Hammerstein
Ann. Rev. Ecol. System Strategy (14)
1983, 377-409.
Lateral system
(water near
TAP Root System (water table): Risky
surface)
Strategy.
Plant B
L T U: Underground water
S S S: Surface water
L , (S,U) L: Lateral system
Plant A 2 2
T (U,S) (U,U) T: Tap root system
In evolutionary time, one will observe a fraction of plants choosing L, the other
fraction will choose T for U>S/2 (Mixed Strategy equilibria).
39
John Maynard Smith: Evolutionary Games.
Animal B
Hawk Dove
Hawk (-2, -2) (2,0) One Nash equilibrium
Animal A
Dove (0,2) (1,1)
Another Nash equilibrium
(H) Hawk: look tough. Threaten the other animal, be ready to fight.
(D) Dove: look tough. Threaten the other animal. If it doesn’t work, run away.
40
Payoff: average number of offspring (genetic fitness)
10 Average
2
(-2)
0
Animal A (H,D) plays H . D is the best response (for animal B) to H

If animal B plays D, then H is the best response for A; thus
H is best against D
(H,D): A Nash Equilibrium strategy
D is best against H
Reasonable equilibrium: Nash equilibria in mixed

strategies.
41
Preguntas
Especifique brevemente:
1)¿De qué depende una estrategia a adoptar en un juego?
2)¿De qué depende el beneficio, o payoff, obtenido por cada jugador?
42

Clase 1-Teoría de Juego No Cooperativo I

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Clase 1-Teoría de Juego No Cooperativo I

Загружено:

Авторское право:

Доступные форматы

PROGRAMA DE LA MATERIA: INTERACCIÓN ESTRATÉGICA,

2) John Von Neumann lo desarrolló: en 1928 pero su refinamiento y publicación

4) John Nash hizo una contribución decisiva en este campo a partir de la

5) Otros autores han contribuido significativamente al desarrollo de la teoría de

Premisas en la formulación de un problema económico

3) Comportamiento estándard. Si las reglas de juego están dadas, i.e., la organización

Dentro de la economía neoclásica, la cual:

Tanto en el monopolio puro como en competencia perfecta, la naturaleza de la

2) En los temas II y subsiguientes, Juegos con Movimientos Simultáneos. En estos juegos,

En estas secciones cubriremos los conceptos de estrategias dominantes y dominadas,

4) En la última sección, sección V, La Racionalidad Acotada (Bounded Rationality) se

Discusión relativa a la utilidad de los sistema o modelos ideales.

Ejemplo1: Matching pennies.

Ejemplo 2: Tick – Tack - Toe (“La Vieja”)

Payoffs: ¿Cuál es el beneficio más alto (variación de ventas) para la firma A y B?

Jugadores: hay dos prisioneros, A y B.

¿Cuál es la solución de este juego?

Para el alumno distraído…

1) Conociendo los componentes de un juego, podemos hacer una

2) La forma extensiva se basa en un aparato conceptual conocido como

2) Estructura de la forma extensiva:

Cara Sello Cara Sello

Ejemplo: Matching Pennies sin memoria perfecta

Cara Sello Cara Sello

 Una lista de todos los conjuntos de información de un jugador nos diría

 Un juego de información perfecta es aquel en cada conjunto de

Ejemplo de Matching Pennies con naturaleza aleatoria.

Cara Sello Cara Sello Cara Sello Cara Sello

Este juego describe un comienzo de las naturaleza (aleatorio) en el nodo

Do not kidnap Kidnap the victim

Formalmente, un juego en su forma extensiva consiste en los siguientes ítems:

i. - Un conjunto finito de nodos χ;

ii. - Una función que especifica un nodo inmediatamente

iv. - El conjunto completo de información 𝓗, y una función 𝑯: 𝑿 → 𝓗

- Las opciones disponibles en el conjunto de información se escriben

vi. - Una función 𝜌: Η0 x 𝐴 → [0, 1] asigna probabilidades a las acciones en

vii. - Una colección de funciones de beneficio (payoff functions)

- La función de utilidad de cada jugador como una cantidad segura de

Así, formalmente un juego en su forma extensiva está especificado por el

0 Pay off incumbent: I

Ejemplo: Matching Pennies con información completa.

En este juego, el jugador 2 tiene 4 estrategias posibles:

La forma normal de representación de un juego

Definición: para un juego con I jugadores, la forma normal de representación, 𝜞𝑵 ,

5) Cuando se describe el juego en la forma normal, no hay necesidad de seguir cada

+1 Si (S1, S2) = (H, estrategias 3 o 4), o

donde U2 (S1, S2) = -U1 (S1, S2).

6) La 𝜞𝑵 se puede pensar como una forma simultánea de juego.

1. Desert plants compete for water.

Please develop pure strategies assuming: i) U<S/2, underground water is difficult

Another Nash equilibrium

Animal A (H,D) plays H . D is the best response (for animal B) to H

Reasonable equilibrium: Nash equilibria in mixed

Вам также может понравиться