118 Juegos de estrategia «
€) Usa los métodos de a seorién 72 para calcular
0 nay
1 n-2
yy obtener asf expresiones para ay y fy, y demostrar en iltima instancia que
Me (‘ yf 0)
donde U, es la matriz n x n cuyos elementos son en su totalidad unos e es la matriz,
identidad nn
1) Demostrar que, para n > 2, todos los vertices de estos grafos dirigidas pertenecen @
cliques.
T2. Considerar un tomeo de enfrentamientos reciprocos entre n competidores (identificados
OT dy da, ds, dg) donde ay Vence a az, VENICE A ds, ds VENEE A Aydt VENCE 8 By Y Oy
vence a ay. Caleular el “poder” de cada competidor y demostrar que todos ellos tienen el
mismo poder; después, determinar ese poder comin,
SugerenciaUsar una computadora para estudiar los casos n = 3, 4, 5, 6; después, hacer
luna conjetura y demostrar que la conjetura planteada es verdadera
Je. +O
11.8
JUEGOS DE
ESTRATEGIA
Teoria de juegos
uw
Rueda de los englones
‘del jugador R
Reda delas columns
del jugador C
+ Figura 11.8.4
a
En esta seccién se analiza un juego general en el que dos contendientes eligen estra-
togias separadas para aleanzar objetivos contrarios. La estrategia Sptima de cada ju-
gador se encuentra en clertos casos mediante el uso de técnicas matriciales.
ara introducir los conceptos bésicos de la teorfa de juegos, se considera el siguiente
juego de feria que dos personas estén de acuerdo en jugar. A los participantes en el jue-
{go se les lamaré el jugador Ry el jugador C. Cada jugador tiene una rueda estacio-
naria con una flecha mévil en ella, como en la figura 11.8.1, Por razones que se aclaran
censeguida, la rueda del jugador R se denomina la rueda de los renglones y la rueda
del jugador C se denomina la rueda de las columnas. La rueda de los renglones esté
idida en tres sectores numerados 1,2 y 3, la rueda de las columnas esté dividida en
cuatro sectores numerados 1,2,3 y 4. En la figura se indican las fracciones del area
‘ocupada por los diferentes sectores. Para jugar el juego, cada jugador hace girar Ia fle-
cha de su rueda y la deja llegar al reposo. El nimero del sector en el que se detiene
la flecha se denomina la tirada del jugador. Asf, el jugador R tiene tres tiradas posi-
bles y el jugador C tiene cuatro tiradas posibles. Dependiendo de la tirada que cada
jugador haga, el jugador C le hace un pago de dinero al jugador R de acuerdo con la
tabla 1 que esté en la p4gina siguiente.
Por ejemplo, sila flecha de la rueda de los renglones se detiene en el sector 1 (el
jugador R tira un 1) y la flecha de la rueda de las columnas se detiene en el sector 2
(el jugador C tira un 2), entonces el jugador C debe pagarle al jugador R la suma
de $5. Algunas de las cifras de esta tabla son negativas, indicando que el jugador C
le hace un pago negativo al jugador R. Por lo anterior se entiende que el jugador R le
hhace un pago positivo al jugador C. Por ejemplo, si en la rueda de los renglones
sale un 2 y en la rueda de las columnas sale un 4, entonces el jugador R le paga al
jugador C la suma de $4, debido a que la cifra correspondiente en la tabla es ~$4.De
este modo, los valores positivos de la tabla son las ganancias del jugador R y las pér-
didas del jugador C, y los valores negativos son las ganancias del jugador C y las
pérdidas del jugador R.Juegos de matriz
de suma cero entre
dos personas
+ Capitulo 11 / Aplicaciones del algebra lineal
Tabla 1 Pago al jugador R
En este juego los jugadores no tienen controt sobre sus titadas; cada tirada se en.
cuentra determinada por el azar. Sin embargo, si cada jugador puede decidir si quie-
xe jugar, entonces cada uno de ellos querria saber cudnto puede esperar ganar o
perder en el largo plazo si decide jugar. (Més adelante en la seccién se analiza esta
‘uesti6n y se considera asimismo una situacién mas complicada en la que los jugado-
res pueden ejercer cierto control sobre sus tiradas al hacer variar tos sectores de sus
ruedas)
El juego antes descrito es un ejemplo de un juego de matriz de suma cero entre das
‘personas. El término de suma cero significa que en cada juego la ganancia positiva de
tun jugador es igual a la ganancia negativa (pérdida) del otro jugador. Es decir, tx
stuma de las dos gantancias es cero. EI término juego de matriz se usa para describir un
juego entre dos personas en el que cada jugador tiene tan s6lo un ntimero finito de
tiradas, de modo que todos los resultados posibles de cada jugada, y las ganancias
cotrespondientes dé los jugadores, pueden mostrarse en forma tabular o matricial,
como en la tabla 1.
En un juego general de este tipo, sea que et jugador R tenga m tiradas posibles y
‘sea que el jugador C tenga n tiradas posibles. En un juego, cada jugador hace una de
sus titadas posibles y después se hace un pago del jugador C al jugador R, dependien-
do de las tiradas, Para j= 1,2,..,m yj = 1,2,.0M,8€ hace
aj = pago que hace el jugador C al jugador R sie jugador R
hace la tirada i y el jugador C hace la tirada j
Este pago no es necesariamente en dinero; puede ser cualquier bien al que se le
puede asignar un valor numérico. Como antes, si un elemento a, es negativo, quiere
decir que el jugador C recibe un pago de |ay| del jugador R. Estos mn pagos posibles
se arreglan en Ja forme de una miatriz.m xn
ay an Oy
an; A,
A 2
Gaetan
que se denomina la matriz de pago del juego.
Cada jugador debe hacer sus tiradas basado en consideraciones de probabilidad:
Por ejemplo, para el juego analizado en la introduccién, el cociente del area de Ut
sector y el area de Ja rueda seria la probabifidad de que el jugador haga la tirada
correspondiente a ese sector, Asi en la figura 11.8.1 se observa que el jugador R ha-
ria la tirada 2 con una probabilidad de 4, y que el jugador C hard una tirada 2 co”
‘una probabilidad de +. En el caso general se hacen las siguientes definiciones:
probabilidad de que el jugador R haga latiradai (¢
probabilidad de que el jugador C haga la tiradaj —(j
»m)
on)11.8 Juegos de estrategia «+ 631
Por estas definiciones se concluye que
Prt Prt +P,
gt dn
Con las probabilidades p; y q; se forman dos vectores:
n
D
p=[pr Po Pm) y a=
Qn
El vector renglén p se denomina la esérategia del jugador Ry el vector columna q se
denomina la estrategia del jugador C. Por ejemplo, por la figura 11.8.1 se tiene
hive
para el juego de feria antes descrit.
Por la teoria de probabilidad, si la probabilidad del jugador R de hacer la tirada
ies pj € independientemente de la probabilidad de que el jugador C haga la tirada j
sea q, entonces pg, €s la probabilidad de que para cualquiera de los contendientes,
cl jugador R haga la tirada i y el jugador C haga la tirada j. El pago para el jugador
R por este par de tiradas es a, Si cada tino de los pagos posibles se multiplica por sw.
probabilidad correspondiente y se suman todos los pagos posibles, se abtiene la ex-
presion
Pid + AraPrde + + UaePGn + AaaPa + °° + GrnP nn oO
La ecuacién (1) es un promedio ponderado de los pagos para el jugador R;cada pago
esté ponderado de acuerdo con la probabilidad de su ocurrencia. En la teor‘a de pro-
babilidad, este promedio ponderado se denomina el pago esperado para el jugador
R.Es posible demostrar que si el juego se juega muchas veces, el pago promedio por
juego para el jugador R en el largo plazo est4 dado por esta expresién. Este pago es
perado se denota por E(p, q) para enfatizar el hecho de que depende de las estrate-
gas de los dos jugadores. Por la definicién de la matriz de pago A y de las estrategias
Py 4,se puede comprobar que el pago esperado se puede expresar en notacién ma-
tricial como
ay aD = Min |) a
aan
B(p.a)= [pr po Pal] “2°? ee" lpg)
Qt Gy2 ~~ en Ldn
Como E(p, q) es el pago esperado para el jugador R, se concluye que ~E(p, 4) es el
pago esperado para el jugador C.
EJEMPLO 1 _ Pago esperado para el jugador R
Para el juego de feria antes descrito se tiene