Академический Документы
Профессиональный Документы
Культура Документы
DEFINICIONES
DEMOSTRACIÓN
La razón por la cual este teorema se mantiene es simple: si el pago esperado para el jugador 𝑖
cuando juega estrategia pura 𝑠𝑖 es más alto que cuando juega 𝑠̂𝑖 , entonces él puede mejorar su
pago esperado aumentando la probabilidad de jugar si y disminuir el probabilidad de jugar 𝑠̂.
𝑖
Comprobación: Supongamos por contradicción que la Ecuación (1) no se cumple. Sin pérdida
de generalidad, supongamos que:
Entonces:
𝑈𝑖 (𝜎 ∗ , 𝜎 ∗ −𝑖 ) = 𝑈𝑖 (𝜎 ∗ ) (7)
Ejemplo:
𝑞1 𝑞2 𝑞3
𝑝1 10 20 11
𝐴 = 𝑝2 ( 8 6 9)
𝑝3 1 11 10
𝑝1 = 𝑃𝑖𝑒𝑑𝑟𝑎
𝑝2 = 𝑃𝑎𝑝𝑒𝑙
𝑝3 = 𝑇𝑖𝑗𝑒𝑟𝑎𝑠
𝑞1 = 𝑃𝑖𝑒𝑑𝑟𝑎
𝑞2 = 𝑃𝑎𝑝𝑒𝑙
𝑞3 = 𝑇𝑖𝑗𝑒𝑟𝑎𝑠
S1𝑥 S2
= {(𝑝𝑖𝑒𝑑𝑟𝑎, 𝑝𝑖𝑒𝑑𝑟𝑎), (𝑝𝑖𝑒𝑑𝑟𝑎, 𝑝𝑎𝑝𝑒𝑙), (𝑝𝑖𝑒𝑑𝑟𝑎, 𝑡𝑖𝑗𝑒𝑟𝑎𝑠), … … … , (𝑡𝑖𝑗𝑒𝑟𝑎, 𝑡𝑖𝑗𝑒𝑟𝑎)}
41
𝑝1 = = 0,47
86
𝑝2 = 0,26
𝑝3 = 0,27
𝑞1 = 0,22
𝑞2 = 0,43
𝑞3 = 0,35
(𝟏) (𝟐)
∑ 𝒑𝒊 𝒒𝒋 = 𝟎, 𝟏𝟎 + 𝟎, 𝟐 + 𝟎, 𝟏𝟔 + 𝟎, 𝟎𝟔 + 𝟎, 𝟏𝟏 + 𝟎, 𝟎𝟗 + 𝟎, 𝟎𝟔 + 𝟎, 𝟏𝟏 + 𝟎, 𝟎𝟗
(𝟏) (𝟐)
∑ 𝒑𝒊 𝒒𝒋 ≈𝟏
Encontrar q1,q2,q3 aplicando el principio de indiferencia
𝑞1 𝑞2 𝑞3
𝑝1 𝑎 𝑏 𝑐
𝑝2 (𝑑 𝑒 𝑓)
𝑝3 𝑔 ℎ 𝑖
𝒖𝟏 = 𝒖𝟐 = 𝒖𝟑
𝒒𝟑 = (𝟏 − 𝒒𝟏 − 𝒒𝟐 )
𝒒𝟑 = (𝟏 − 𝒒𝟏 − 𝒒𝟐 )
a) 𝒖𝟏 = 𝒖𝟐
𝑎𝑞1 + 𝑏𝑞2 + 𝑐𝑞3 = 𝑑𝑞1 + 𝑒𝑞2 + 𝑓𝑞3
𝑞1 (𝑎 − 𝑐 − 𝑑 + 𝑓) = 𝑞2 (−𝑏 + 𝑐 + 𝑒 − 𝑓) + 𝑓 − 𝑐
𝑞2 (−𝑏 + 𝑐 + 𝑒 − 𝑓) + 𝑓 − 𝑐
𝑞1 =
(𝑎 − 𝑐 − 𝑑 + 𝑓)
b) 𝒖𝟐 = 𝒖𝟑
𝑑𝑞1 + 𝑒𝑞2 + 𝑓𝑞3 = 𝑔𝑞1 + ℎ𝑞2 + 𝑖𝑞3
𝑞1 (𝑑 − 𝑓 − 𝑔 + 𝑖) = 𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖
𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖
𝑞1 =
(𝑑 − 𝑓 − 𝑔 + 𝑖)
c) Igualando el valor de 𝑞1 = 𝑞1
𝑞2 (−𝑏 + 𝑐 + 𝑒 − 𝑓) + 𝑓 − 𝑐 𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖
=
(𝑎 − 𝑐 − 𝑑 + 𝑓) (𝑑 − 𝑓 − 𝑔 + 𝑖)
(𝑎 − 𝑐 − 𝑑 + 𝑓)(𝑖 − 𝑓) − (𝑑 − 𝑓 − 𝑔 + 𝑖)(𝑓 − 𝑐)
𝑞2 =
[(−𝑏 + 𝑐 + 𝑒 − 𝑓)(𝑑 − 𝑓 − 𝑔 + 𝑖) − (−𝑒 + 𝑓 + ℎ − 𝑖)(𝑎 − 𝑐 − 𝑑 + 𝑓)]
d) Sustituyendo 𝑞2 𝑒𝑛 𝑞1
𝑞2 (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖
𝑞1 =
(𝑑 − 𝑓 − 𝑔 + 𝑖)
e) Sabiendo que : 𝑞3 = (1 − 𝑞1 − 𝑞2 )
(𝑎 − 𝑐 − 𝑑 + 𝑓)(𝑖 − 𝑓) − (𝑑 − 𝑓 − 𝑔 + 𝑖)(𝑓 − 𝑐) (−𝑒 + 𝑓 + ℎ − 𝑖) − 𝑓 + 𝑖
𝑞3 = 1 − { ∗ }
[(−𝑏 + 𝑐 + 𝑒 − 𝑓)(𝑑 − 𝑓 − 𝑔 + 𝑖) − (−𝑒 + 𝑓 + ℎ − 𝑖)(𝑎 − 𝑐 − 𝑑 + 𝑓)] (𝑑 − 𝑓 − 𝑔 + 𝑖)
(𝑎 − 𝑐 − 𝑑 + 𝑓)(𝑖 − 𝑓) − (𝑑 − 𝑓 − 𝑔 + 𝑖)(𝑓 − 𝑐)
−{ }
[(−𝑏 + 𝑐 + 𝑒 − 𝑓)(𝑑 − 𝑓 − 𝑔 + 𝑖) − (−𝑒 + 𝑓 + ℎ − 𝑖)(𝑎 − 𝑐 − 𝑑 + 𝑓)]
𝑢1∗ (𝑞1∗ , 𝑞2∗ , 𝑞3∗ ; 𝑝1∗ , 𝑝2∗ , 𝑝3∗ ) ≥ 𝑢1 (𝑞1 , 𝑞2 , 𝑞3 ; 𝑝1∗ , 𝑝2∗ , 𝑝3∗ )
El beneficio será el máximo siempre y cuando tome las más optimas decisiones (*), y
mi oponente no tome las mejores decisiones.