Вы находитесь на странице: 1из 5

PRINCIPIO DE INDIFERENCIA

DEFINICIONES

1. El principio de indiferencia es en el cual se mantiene un estado de equilibrio sabiendo


todas las decisiones del entorno, tomando en cuenta las mejores. El principio de
indiferencia afirma que cuando hay varios eventos posibles y no hay razón para primar
ninguno frente a otro se asigna la misma probabilidad a todos ellos.
2. Una estrategia mixta de un determinado juego es una mejor respuesta a las estrategias
mixtas de los otros jugadores si cada estrategia pura en su apoyo es también una mejor
respuesta a las estrategias mixtas dadas de los otros jugadores.
3. El principio de indiferencia dice que si un equilibrio mixto requiere que un jugador use
dos estrategias puras distintas con probabilidad positiva, entonces el beneficio esperado
para ese jugador por usar una de esas estrategias puras equivale a la ganancia esperada
para él, por usar la otra estrategia pura, asumiendo que los otros jugadores están
jugando de acuerdo con el equilibrio.

DEMOSTRACIÓN

Teorema: sea 𝝈∗ un equilibrio de estrategia mixta de un juego de forma estratégica, a su vez


𝒔𝒊 y 𝒔̂𝒊 sean dos estrategias puras del jugador i. Si 𝝈∗ (𝒔𝒊 ) > 𝟎 y 𝝈∗ (𝒔̂𝒊 ) > 𝟎
entonces:

𝑈𝑖 (𝑠𝑖 , 𝜎∗ −𝑖 ) = 𝑈𝑖 (𝑠̂,𝑖 𝜎∗ −𝑖 ) (1)

La razón por la cual este teorema se mantiene es simple: si el pago esperado para el jugador 𝑖
cuando juega estrategia pura 𝑠𝑖 es más alto que cuando juega 𝑠̂𝑖 , entonces él puede mejorar su
pago esperado aumentando la probabilidad de jugar si y disminuir el probabilidad de jugar 𝑠̂.
𝑖

Comprobación: Supongamos por contradicción que la Ecuación (1) no se cumple. Sin pérdida
de generalidad, supongamos que:

𝑈𝑖 (𝑠𝑖 , 𝜎∗ −𝑖 ) > 𝑈𝑖 (𝑠̂,𝑖 𝜎∗ −𝑖 ) (2)

Sea 𝝈∗ la estrategia de i definida por:

Entonces:

𝑈𝑖 (𝜎∗ , 𝜎∗ −𝑖 ) = ∑ 𝜎(𝑡𝑖 )𝑈𝑖 (𝑡𝑖 , 𝜎∗ −𝑖 ) (3)


𝑡𝑖 ∈𝑆𝑖
𝑈𝑖 (𝜎∗ , 𝜎∗ −𝑖 ) = ∑ 𝜎∗ (𝑡𝑖 )𝑈𝑖 (𝑡𝑖 , 𝜎∗ −𝑖 ) + (𝜎∗ 𝑖 (𝑠𝑖 ) + 𝜎𝑖 (𝑠̂))
𝑖 𝑈𝑖 (𝑠̂,𝑖 𝜎∗ −𝑖 ) (4)
𝑡𝑖 ∉{𝑠𝑖 ,𝑠̂𝑖 }

> ∑ 𝜎∗ (𝑡𝑖 )𝑈𝑖 (𝑡𝑖 , 𝜎∗ −𝑖 ) + 𝜎𝑖 (𝑠𝑖 ) 𝑈𝑖 (𝑠𝑖 , 𝜎∗ −𝑖 ) + 𝜎∗ 𝑖 (𝑠̂) ̂,𝑖 𝜎∗ −𝑖 ) (5)


𝑖 𝑈𝑖 (𝑠
𝑡𝑖 ∉{𝑠𝑖 ,𝑠̂𝑖 }

𝑈𝑖 (𝜎∗ , 𝜎∗ −𝑖 ) = ∑ 𝜎∗ 𝑖 (𝑡𝑖 )𝑈𝑖 (𝑡𝑖 , 𝜎∗ −𝑖 ) (6)


𝑡𝑖 ∈𝑆𝑖

𝑈𝑖 (𝜎 ∗ , 𝜎 ∗ −𝑖 ) = 𝑈𝑖 (𝜎 ∗ ) (7)

Las igualdades en la ecuación (4) y la ecuación (6) se deducen de la definición de σ, y la


ecuación (2) se sigue de la ecuación (1). Pero esto contradice la suposición de que σ * es un
equilibrio, porque el jugador 𝑖 puede aumentar su recompensa al desviarse a la estrategia 𝜎 ´ 𝑖 .
Esta contradicción muestra que la suposición de que la ecuación (1) no es incorrecta, y el
teorema por lo tanto, se cumple.

Ejemplo:

Para el juego de estrategia mixta: 𝛤 = (𝑈𝑘,𝑘=1,…,𝑛 , 𝑝𝑘 , П𝑆𝑖 𝑘 )

86 Personas juegan pidra , papel o tijeras.

𝑞1 𝑞2 𝑞3

𝑝1 10 20 11
𝐴 = 𝑝2 ( 8 6 9)
𝑝3 1 11 10

𝑝1 = 𝑃𝑖𝑒𝑑𝑟𝑎
𝑝2 = 𝑃𝑎𝑝𝑒𝑙
𝑝3 = 𝑇𝑖𝑗𝑒𝑟𝑎𝑠

𝑞1 = 𝑃𝑖𝑒𝑑𝑟𝑎
𝑞2 = 𝑃𝑎𝑝𝑒𝑙
𝑞3 = 𝑇𝑖𝑗𝑒𝑟𝑎𝑠

S1= (𝑝𝑖𝑒𝑑𝑟𝑎, 𝑝𝑎𝑝𝑒𝑙, 𝑡𝑖𝑗𝑒𝑟𝑎)

S2= (𝑝𝑖𝑒𝑑𝑟𝑎, 𝑝𝑎𝑝𝑒𝑙, 𝑡𝑖𝑗𝑒𝑟𝑎)

S1= (𝑝𝑖𝑒𝑑𝑟𝑎, 𝑝𝑎𝑝𝑒𝑙, 𝑡𝑖𝑗𝑒𝑟𝑎)

S1𝑥 S2
= {(𝑝𝑖𝑒𝑑𝑟𝑎, 𝑝𝑖𝑒𝑑𝑟𝑎), (𝑝𝑖𝑒𝑑𝑟𝑎, 𝑝𝑎𝑝𝑒𝑙), (𝑝𝑖𝑒𝑑𝑟𝑎, 𝑡𝑖𝑗𝑒𝑟𝑎𝑠), … … … , (𝑡𝑖𝑗𝑒𝑟𝑎, 𝑡𝑖𝑗𝑒𝑟𝑎)}
41
𝑝1 = = 0,47
86
𝑝2 = 0,26
𝑝3 = 0,27

𝑞1 = 0,22
𝑞2 = 0,43
𝑞3 = 0,35

(𝟏) (𝟐)
∑ 𝒑𝒊 𝒒𝒋 = 𝟎, 𝟏𝟎 + 𝟎, 𝟐 + 𝟎, 𝟏𝟔 + 𝟎, 𝟎𝟔 + 𝟎, 𝟏𝟏 + 𝟎, 𝟎𝟗 + 𝟎, 𝟎𝟔 + 𝟎, 𝟏𝟏 + 𝟎, 𝟎𝟗

(𝟏) (𝟐)
∑ 𝒑𝒊 𝒒𝒋 ≈𝟏
Encontrar q1,q2,q3 aplicando el principio de indiferencia
𝑞1 𝑞2 𝑞3

𝑝1 𝑎 𝑏 𝑐
𝑝2 (𝑑 𝑒 𝑓)
𝑝3 𝑔 ℎ 𝑖

Al tener 𝑞1 , 𝑞2 , 𝑞3 ; existirá 𝑢1, 𝑢2 , 𝑢3

𝑢1 = 𝑎𝑞1 + 𝑏𝑞2 + 𝑐𝑞3

𝑢2 = 𝑑𝑞1 + 𝑒𝑞2 + 𝑓𝑞3

𝑢3 = 𝑔𝑞1 + ℎ𝑞2 + 𝑖𝑞3

Mediante las siguientes consideraciones y aplicando el principio de indiferencia se tiene


que :

𝒖𝟏 = 𝒖𝟐 = 𝒖𝟑

𝒒𝟑 = (𝟏 − 𝒒𝟏 − 𝒒𝟐 )

𝒒𝟑 = (𝟏 − 𝒒𝟏 − 𝒒𝟐 )

a) 𝒖𝟏 = 𝒖𝟐
𝑎𝑞1 + 𝑏𝑞2 + 𝑐𝑞3 = 𝑑𝑞1 + 𝑒𝑞2 + 𝑓𝑞3

𝑎𝑞1 + 𝑏𝑞2 + 𝑐(1 − 𝑞1 − 𝑞2 ) = 𝑑𝑞1 + 𝑒𝑞2 + 𝑓(1 − 𝑞1 − 𝑞2 )

𝑎𝑞1 + 𝑏𝑞2 + 𝑐 − 𝑐𝑞1 − 𝑐𝑞2 = 𝑑𝑞1 + 𝑒𝑞2 + 𝑓 − 𝑓𝑞1 − 𝑓𝑞2

𝑎𝑞1 − 𝑐𝑞1 − 𝑑𝑞1 + 𝑓𝑞1 = −𝑏𝑞2 + 𝑐𝑞2 + 𝑒𝑞2 + 𝑓 − 𝑓𝑞2 − 𝑐

𝑞1 (𝑎 − 𝑐 − 𝑑 + 𝑓) = 𝑞2 (−𝑏 + 𝑐 + 𝑒 − 𝑓) + 𝑓 − 𝑐

𝑞2 (−𝑏 + 𝑐 + 𝑒 − 𝑓) + 𝑓 − 𝑐
𝑞1 =
(𝑎 − 𝑐 − 𝑑 + 𝑓)

b) 𝒖𝟐 = 𝒖𝟑
𝑑𝑞1 + 𝑒𝑞2 + 𝑓𝑞3 = 𝑔𝑞1 + ℎ𝑞2 + 𝑖𝑞3

𝑑𝑞1 + 𝑒𝑞2 + 𝑓(1 − 𝑞1 − 𝑞2 ) = 𝑔𝑞1 + ℎ𝑞2 + 𝑖(1 − 𝑞1 − 𝑞2 )

𝑞1 (𝑑 − 𝑓 − 𝑔 + 𝑖) = 𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖

𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖
𝑞1 =
(𝑑 − 𝑓 − 𝑔 + 𝑖)

c) Igualando el valor de 𝑞1 = 𝑞1
𝑞2 (−𝑏 + 𝑐 + 𝑒 − 𝑓) + 𝑓 − 𝑐 𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖
=
(𝑎 − 𝑐 − 𝑑 + 𝑓) (𝑑 − 𝑓 − 𝑔 + 𝑖)

[𝑞2 (−𝑏 + 𝑐 + 𝑒 − 𝑓) + 𝑓 − 𝑐 ](𝑑 − 𝑓 − 𝑔 + 𝑖) = [𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖](𝑎 − 𝑐 − 𝑑 + 𝑓)

𝑞2 (−𝑏 + 𝑐 + 𝑒 − 𝑓)(𝑑 − 𝑓 − 𝑔 + 𝑖) + (𝑑 − 𝑓 − 𝑔 + 𝑖)(𝑓 − 𝑐)


= 𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖)(𝑎 − 𝑐 − 𝑑 + 𝑓) + (𝑎 − 𝑐 − 𝑑 + 𝑓)(𝑖 − 𝑓)

𝑞2 [(−𝑏 + 𝑐 + 𝑒 − 𝑓)(𝑑 − 𝑓 − 𝑔 + 𝑖) − (−𝑒 + 𝑓 + ℎ − 𝑖)(𝑎 − 𝑐 − 𝑑 + 𝑓)]


= (𝑎 − 𝑐 − 𝑑 + 𝑓)(𝑖 − 𝑓) − (𝑑 − 𝑓 − 𝑔 + 𝑖)(𝑓 − 𝑐)

(𝑎 − 𝑐 − 𝑑 + 𝑓)(𝑖 − 𝑓) − (𝑑 − 𝑓 − 𝑔 + 𝑖)(𝑓 − 𝑐)
𝑞2 =
[(−𝑏 + 𝑐 + 𝑒 − 𝑓)(𝑑 − 𝑓 − 𝑔 + 𝑖) − (−𝑒 + 𝑓 + ℎ − 𝑖)(𝑎 − 𝑐 − 𝑑 + 𝑓)]

d) Sustituyendo 𝑞2 𝑒𝑛 𝑞1

𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖
𝑞1 =
(𝑑 − 𝑓 − 𝑔 + 𝑖)

(𝑎 − 𝑐 − 𝑑 + 𝑓)(𝑖 − 𝑓) − (𝑑 − 𝑓 − 𝑔 + 𝑖)(𝑓 − 𝑐) (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖


𝑞1 = ∗
[(−𝑏 + 𝑐 + 𝑒 − 𝑓)(𝑑 − 𝑓 − 𝑔 + 𝑖) − (−𝑒 + 𝑓 + ℎ − 𝑖)(𝑎 − 𝑐 − 𝑑 + 𝑓)] (𝑑 − 𝑓 − 𝑔 + 𝑖)

e) Sabiendo que : 𝑞3 = (1 − 𝑞1 − 𝑞2 )
(𝑎 − 𝑐 − 𝑑 + 𝑓)(𝑖 − 𝑓) − (𝑑 − 𝑓 − 𝑔 + 𝑖)(𝑓 − 𝑐) (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖
𝑞3 = 1 − { ∗ }
[(−𝑏 + 𝑐 + 𝑒 − 𝑓)(𝑑 − 𝑓 − 𝑔 + 𝑖) − (−𝑒 + 𝑓 + ℎ − 𝑖)(𝑎 − 𝑐 − 𝑑 + 𝑓)] (𝑑 − 𝑓 − 𝑔 + 𝑖)
(𝑎 − 𝑐 − 𝑑 + 𝑓)(𝑖 − 𝑓) − (𝑑 − 𝑓 − 𝑔 + 𝑖)(𝑓 − 𝑐)
−{ }
[(−𝑏 + 𝑐 + 𝑒 − 𝑓)(𝑑 − 𝑓 − 𝑔 + 𝑖) − (−𝑒 + 𝑓 + ℎ − 𝑖)(𝑎 − 𝑐 − 𝑑 + 𝑓)]

𝑢1∗ (𝑞1∗ , 𝑞2∗ , 𝑞3∗ ; 𝑝1∗ , 𝑝2∗ , 𝑝3∗ ) ≥ 𝑢1 (𝑞1 , 𝑞2 , 𝑞3 ; 𝑝1∗ , 𝑝2∗ , 𝑝3∗ )
El beneficio será el máximo siempre y cuando tome las más optimas decisiones (*), y
mi oponente no tome las mejores decisiones.

Вам также может понравиться