06 Cap 02

TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE
Jogos e decises estratgicas tm sido relatados ao longo da histria, como na compilao anci das leis babilnicas do Talmud e do general chins do sculo IV A.C. Sun Tzu em o livro The art of war . A partir do sculo XVIII vrios pesquisadores lanaram as bases da teoria dos jogos, como James Waldegrave, em 1713 proveu a primeira soluo conhecida para o problema do minimax de estratgias mistas para o jogo de duas pessoas, Augustin Cournot, que em 1838
PUC-Rio - Certificao Digital N 0220895/CA
explicou intuitivamente o que mais tarde seria conhecido como Equilbrio de Nash, Francis Ysidro Edgeworth, que em 1881, trouxe a noo de equilbrios competitivos, Emile Borel, em 1927, proveu a primeira percepo em estratgias mistas, John von Neumann fundou, como conhecemos hoje, a Teoria dos Jogos e juntamente com Oskar Morgenstern publicou em 1947 o livro The Theory of Games and Economic Behavior, Jonh Nash que em 1950 provou a existncia do equilbrio no cooperativo e John Charles C. McKinsey que em 1952 escreveu o livro sobre a teoria dos jogos, Introduction to the Theory of Games. A teoria dos jogos uma abordagem distinta e interdisciplinar do estudo do comportamento humano, e nos prov os fundamentos necessrios para o entendimento da interao entre agentes econmicos. As disciplinas mais envolvidas na teoria dos jogos so a matemtica, economia e outras cincias sociais e do comportamento. Existem dois ramos principais na teoria dos jogos: cooperativo e no cooperativo, ou competitivo. Para os jogos competitivos, a teoria dos jogos, estuda como os agentes lidam uns com os outros, de modo a atingir seus objetivos pessoais. J nos jogos cooperativos os agentes objetivam ganhos mtuos. A partir de Nash em 1950, a teoria dos jogos tornou-se um campo popular de pesquisas. O pensamento na poca era que esta teoria tornaria possvel uma srie de solues de problemas at ento insolveis.
Cap 2 - TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE
25
Ainda que a teoria dos jogos tenha sido aplicada a uma grande variedade de problemas, o interesse nela foi diminuindo a partir dos anos sessenta at o incio dos anos setenta. Entre o fim dos anos setenta e incio dos anos oitenta aconteceu um novo boom na teoria dos jogos, especialmente depois que Ariel [Ref: 47] publicou em 1982 um artigo no qual provou que o modelo de barganha no cooperativo possui um nico equilbrio perfeito. Ao final dos anos 80, entretanto, existia um sentimento de desconforto no uso do equilbrio de Nash na predio de resultados. Na poca os jogadores foram assumidos como hiper racionais e estava sendo usado para cada problema um tipo diferente e muito especfico de equilbrio de Nash. O nmero de refinamentos para o equilbrio de Nash cresceu enormemente e no era claro de antemo em quais situaes um certo refinamento serviria melhor. O que estava claro que no mundo real as pessoas no agiam da forma como foi postulada nos modelos. Antes que um novo declnio no interesse pela teoria dos jogos tivesse lugar, os tericos aproveitaram a idia de evoluo
vinda da biologia. Um artigo de 1973, escrito pelos bilogos Maynard Smith2 e Price [Ref: 17] no qual eles definiram o conceito de estratgias evolutivas estveis, tornou-se a mais importante traduo do pensamento evolutivo da biologia na teoria dos jogos. O livro Evolution and the Theory of Games escrito por Maynard Smith introduziu explicitamente a seleo evolutiva no jogo. A noo da evoluo das estratgias em jogos repetidos assemelha-se a certos modelos nos quais, os jogadores aprendem atravs do comportamento passado, o que veio facilitar a aceitao destes modelos evolutivos. Na dcada de 90, os modelos evolutivos tornaram-se populares na teoria dos jogos e em outros campos da economia. Este estudo comear revisando a base tcnica da teoria dos jogos, principalmente do equilbrio de Nash. A esta teoria ser unida a noo de Estratgias Evolutivas Estveis(EEE). Mais adiante, o conjunto de equaes diferenciais que regem um processo evolutivo biolgico, como a dinmica do
2
John Maynard Smith (19202004) Um dos gigantes da biologia evolutiva do sculo
XX era tambm engenheiro, faleceu no dia 19 de abril de 2004, em sua casa, na Inglaterra, vtima de complicaes decorrentes de um cncer no pulmo. H um prmio em seu nome, o John Maynard Smith Prize, oferecido a cada dois anos, desde 1997, pela European Society for Evolutionary Biology.
Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE
26
replicador, tambm ser abordada. Ser discutido o significado econmico de uma EEE e da dinmica de replicador, mostrado que uma EEE nada mais do que outro refinamento do equilbrio de Nash e que, embora a dinmica do replicador parea descrever muito bem um certo processo evolutivo biolgico no racional, os equilbrios evolutivos estveis so um subconjunto dos equilbrios prprios de Nash considerados como hiper racionais. Por este motivo em certos cenrios econmicos que no levam em conta qualquer forma de comportamento racional esta dinmica poder em todo caso favorecer uma comparao entre um ambiente racional e um ambiente de racionalidade limitada. A teoria dos jogos tornou-se uma ferramenta padro na modelagem de situaes conflitantes entre agentes racionais. Tal modelo descreve um conjunto de estratgias de cada agente ou jogador e o seu payoff para cada perfil de estratgia, onde perfil de estratgias a lista de estratgias concorrentes
escolhidas pelos jogadores. O conceito do equilbrio de Nash a pedra fundamental na previso do resultado do jogo. No equilbrio de Nash cada estratgia dos jogadores maximiza sua utilidade diante das estratgias jogadas pelos outros jogadores. Em muitas situaes o equilbrio de Nash no nico, isto , existe mais de um perfil em equilbrio. Deste modo, muitos artigos em teoria dos jogos foram dedicados seleo do tipo de equilbrio. Refinando-se o conceito do equilbrio de Nash permite-se descartar certos tipos de equilbrios que no satisfazem a certos tipos de comportamentos racionais. Nesta seo ser revisto um pouco da teoria do equilbrio de Nash e seus refinamentos. Isto capacita-nos mostrar, como os conceitos bsicos da teoria dos jogos evolutivos se encaixam neste quadro. O modelo bsico da teoria dos jogos no cooperativos conhecido como um jogo de n agentes e em sua forma normal caracterizado por uma 2n-tupla, = (S 1 , S 2 , L S n ; 1 , 2 , L , n ) Onde jogador i e, S i = (1,2,L mi ) o conjunto de todas as mi estratgias puras do
i ( s ) o payoff do jogador i diante do perfil de estratgias puras

s = {s1 , s 2 ,L s n } .
27
Cada estratgia pura si jogada pelo jogador i pertence ao conjunto de estratgias puras Si deste jogador i. O produto cartesiano S = S i chamado de espao de estratgias puras, em que todo perfil s S . O payoff combinado ( s) definido como [ 1 , 2 ,L n ] . Em termos de estratgias puras, um jogo em sua forma normal pode ser escrito como: G = (I,S,), onde I o conjunto de jogadores. Para o caso de jogos com dois jogadores, os payoffs podem ser postos na forma matricial e denota-se A como a matriz de payoff do primeiro jogador, onde cada elemento de A = ahk = 1(h,k) o payoff que o jogador 1 obtm ao jogar sua estratgia pura h contra a estratgia pura k do jogador 2. Do mesmo modo, denotase B como a matriz de payoff do segundo jogador, onde cada elemento de B = bhk
= 2(h,k) o payoff que o jogador 2 obtm ao jogar sua estratgia pura k contra a estratgia pura h do jogador 1.
2.1
Estratgias mistas At agora vimos que as aes de um jogador so representadas atravs das
estratgias puras. Uma outra forma de representar tais aes so as estratgias mistas. Considere que cada estratgia pura jogada com uma certa probabilidade, ento uma distribuio de probabilidades sobre o conjunto de estratgias puras, chamado de estratgia mista. Estas estratgias so representadas pelo vetor x j j , onde cada elemento deste vetor xjh a probabilidade do jogador j jogar a estratgia pura h. O conjunto de todas as estratgias mistas do jogador j um simplex unitrio de dimenso mj 1 definido como:
mj m j = x j + j ; x jh = 1 h =1
m
Equao 2-1
O simplex j tem dimenso mj-1, pois podemos escrever qualquer probabilidade como 1 menos a soma das outras probabilidades, desde que o somatrio de todas estas probabilidades igual a um. Assim, sem nenhuma perda
28
de informao, pode-se estudar o simplex j com dimenso mj-1.
mj
por sua projeo no espao
Para o caso de mj igual a 2, isto , para o caso em que o jogador j possui apenas duas estratgias de jogo, o espao de estratgias mistas como definido na Equao 2-1 representado graficamente na Figura 2-1 e sua projeo num espao mj 1 pode ser vista na Figura 2-2.
Figura 2-1 Espao de estratgias mistas para o caso de duas estratgias
Figura 2-2 Projeo do espao de estratgias mistas R2 R
Para o caso de um jogador com trs estratgias, o espao de estratgias mistas pode ser visto na Figura 2-3 e sua projeo no espao bidimensional na Figura 2-4
Figura 2-3 Espao de estratgias mistas para o caso de trs estratgias
29
Figura 2-4 Projeo do espao de estratgias mistas R3 R2
Os vrtices do simplex unitrio j so vetores unitrios no espao mj

1 denotados por e1j = { 1,0 L ,0} , e 2 0,1, L ,0}, , e m 0,0, L ,1} j ={ j ={
Cada vrtice e h j representa uma estratgia mista para o jogador j que associa
a probabilidade um sua hsima estratgia pura e conseqentemente probabilidades nulas para as estratgias restantes. Assim o simplex de estratgias mistas j a casca convexa de todos os seus vrtices, isto , cada estratgia mista
x j j uma combinao convexa de estratgias puras. Deste modo podemos
escrever.
mj
x j = x jh e h j
h =1
A seguir sero introduzidas algumas definies necessrias ao entendimento da teoria dos jogos.
2.1.1 Suporte de uma estratgia mista

o conjunto de estratgias puras com probabilidade maior que zero e definida como:
C ( x j ) = {h sima estratgia S j : x jh 0}
Ou seja, para cada estratgia h do conjunto de estratgias puras Sj do jogador j existe uma probabilidade maior que zero xjh
30
suas estratgias mistas tero a forma x j = {x j1 , x j 2 }.
Como exemplo considere o jogador j com duas estratgias apenas, assim
Se xj for {0,5 0,5} o suporte C ( x j ) ser {1,2} Se xj for {1,0 0,0} 0 suporte C ( x j ) ser {1}
2.1.2 Face de um espao de estratgias mistas

Se um subconjunto X j j for a casca convexa de algum subconjunto de estratgias puras (vrtices de j ) ento X j chamado face de j . Em particular
Xj = j uma face.
2.1.3 Interior de um espao de estratgias mistas

Um subconjunto escrito como INT ( j ) chamado interior, se cada elemento x jh > 0 , portanto cada estratgia pura deste subconjunto jogada com probabilidade maior que zero. Estratgias mistas com esta caracterstica so chamadas de estratgias completamente mistas ou interiores e tm suporte completo, ou seja, C(xj) = Sj.
2.1.4 Fronteira do espao de estratgias mistas

O conjunto de estratgias no interiores de j chamado de fronteira (ou borda) e denotado por:
bd ( j ) = {x j j : x j INT ( j )}
No caso da fronteira, o suporte no completo. A fronteira bd ( j ) pode ser vista como a unio de todas as faces fronteiras de j e como vimos uma face a combinao convexa de um subconjunto de vrtices ou estratgias puras. Sendo assim, j a nica face que no face fronteira.
31
2.1.5 Perfil de estratgias mistas

Seja x = {x1,x2,,xn} um perfil de estratgias mistas onde xj a estratgia mista do jogador j. Um perfil de estratgias mistas um ponto do espao de perfis de estratgias mistas definido como o produto cartesiano de n simplexes j de dimenso mj-1. = jI j O espao possui dimenso m, onde m =
m
j =1
o total de estratgias
puras no jogo e sua projeo feita no espao de dimenso m-n = m1-1+m21+mn-1 o produto cartesiano das projees de j . Para um jogo de duas pessoas com n = 2 e cada jogador possuindo apenas duas estratgias m1=m2 = 2, o espao = {[x11,x21],[x11,x22],[x12,x21],[x12,x22]}
4 o produto cartesiano de 1 e 2 .
Neste caso o produto cartesiano das projees de 1 e 2 :
Figura 2-5 Espao de perfis de estratgias mistas como o produto cartesiano de espaos de estratgias mistas de uma dimenso
Para um caso de dois jogadores, n = 2, o jogador um possuindo trs estratgias e o jogador dois possuindo duas estratgias, o espao dos perfis de estratgias mistas ser o produto cartesiano de 1 e 2 igual a;
= {[x11,x21],[x11,x22],[x12,x21],[x12,x22], [x13,x21],[x13,x22] } 5
32
Figura 2-6 Espao de perfis de estratgias mistas como o produto cartesiano de espaos de estratgias mistas de duas dimenses
Um perfil de estratgias mistas x dito interior se cada uma de suas estratgias mistas xj for interior e definido por,
INT () = jI INT ( j )
O suporte de um perfil de estratgias mistas x C ( x) = jI C ( x j ) S e x
INT() se e somente se C(x) = S.

A fronteira de , bd() o conjunto de perfis no interiores de . Um subconjunto X chamado face de se X o produto cartesiano das faces dos simplexes dos jogadores. Em particular se X = chamado de face mxima de . Todas as outras faces de so chamadas de faces de fronteira. Assim cada perfil de estratgia pura, visto como um subconjunto singleton de , uma face de fronteira. A unio das faces de fronteiras de a prpria bd(). Seja (xj,y-j) o perfil de estratgias no qual o jogador j joga a estratgia xj j contra o perfil y jogado pelos outros jogadores. Mais precisamente o perfil de estratgias Z=(xj, y-j) definido por zj = xj e zi = yi para todo j i
2.2
Funo de payoff de uma estratgia mista
A probabilidade que um perfil de estratgias puras s = (s1,s2,,sn) S ser usado quando o perfil de estratgias mistas x jogado :
n
x( s) = x jS j
j =1
33
Onde x js j a probabilidade do jogador j jogar sua estratgia sj. No caso de dois jogadores cada um com duas estratgias, sendo que o jogador A possui as estratgias a1 e a2 e o jogador B possui as estratgias b1 e b2, um perfil de estratgias puras seria, por exemplo, s = (a1,b1) e uma possvel estratgia mista do jogador A seria xA = (xA1,xA2) onde xA1 a probabilidade do jogador A jogar a estratgia a1 e xA2 a probabilidade do jogador A jogar a estratgia a2. Um perfil de estratgias mistas seria x = (xA,xB) onde xB uma estratgia mista de B. Ento equivalente escrever,
x A1 x B1 x = (xA, xB) = x x A2 B 2
O valor esperado do payoff para o jogador j associado com o perfil de

estratgias mistas x :
j ( x) = x( s) j ( s )
sS
Onde x(s) a probabilidade do perfil de estratgias puras e j(s) o payoff que o jogador j obtm caso o perfil de estratgias puras s for jogado. Jogar a estratgia pura sj = k probabilisticamente equivalente a jogar a estratgia mista e jk j , assim podemos escrever u j (e k j , x j ) como o payoff esperado do jogador j quando o perfil (ekj , x j ) for jogado, ou seja, o payoff que o jogador j obtm quando ele joga sua k-sima estratgia pura. Assim para qualquer perfil x ,
mj
j ( x ) = j (e k j , x j ) x jk
k =1
Onde xjk a probabilidade do jogador j jogar sua k-sima estratgia pura. Em outras palavras o payoff j(x) pode ser computado como a soma ponderada dos payoffs do jogador j obtidos jogando-se cada uma de suas estratgias puras contra um determinado perfil de estratgias, dos outros
34
jogadores, onde os pesos so as probabilidades associadas pela estratgia mista jogada pelo jogador, a cada uma de suas estratgias puras. A funo combinada (x) = (1(x), 2(x),, n(x)) chamada de funo de
payoff combinada de estratgias mistas do jogo.
Uma alternativa para isto a representao de estratgias puras G=(I,S,) ou ainda, em algumas vezes mais conveniente uma extenso de G para as estratgias mistas (I,,). Para o caso de dois jogadores poderamos representar o jogo pela matriz de
payoff. Assim, para qualquer par de estratgias mistas x1 1 e x2 2 temos:
O valor esperado do payoff do jogador 1 associado com a estratgia mista

x.
m1 m2
1 ( x) = x1h a hk x 2 k = x1T Ax 2 , onde A a matriz de payoff do jogador 1.

h =1 k =1
O valor esperado do payoff do jogador 2 associado com a estratgia mista

x.
m1 m2
2 ( x) = x1h bhk x 2 k = x1T B T x 2 onde B a matriz de payoff do jogador B

h =1 k =1
Para o caso de dois jogadores temos a seguinte matriz de payoff para o jogador A,
b1 b2 a (a , b ) 1 (a1 , b2 ) A= 1 1 1 1 a 2 1 (a 2 , b1 ) 1 (a 2 , b2 ) Onde o j(ah, bk) o payoff do jogador j jogando sua estratgia pura h contra a estratgia pura k do outro jogador i j. O payoff esperado do jogador 2 ser:
1 ( s ) = x( s) 1 ( s) = Prob(a1,b1)*1(a1,b1) + Prob(a1,b2)*1(a1,b2) +
sS
Prob(a2,b1)*1(a2,b1) + Prob(a2,b2)* 1(a2,b2)
35
Onde a Prob(ah, bk) = Probabilidade(ah) x Probabilidade(bk). Note que para que esta igualdade seja vlida necessrio que a estratgia jogada pelo primeiro jogador seja independente da estratgia jogada pelo segundo jogador. A Probabilidade da estratgia pura ah ser jogada tirada do h-simo elemento da estratgia mista usada pelo jogador j, xjh. Fazendo 1(ah, bk) = ahk temos,
a11*x(a1,b1) + a12*x(a1,b2) + a21*x(a2,b1) + a22*x(a2,b2) = a11*x11*x21+

a12*x11*x22+ a21*x12*x21+ a22*x12*x22 =
a
h =1 k =1
hk
x1h x 2 k
Do mesmo modo,
2 2
2 ( x) = bhk x1h x 2 k = x1T B x 2 = x 2 T B T x1

h =1 k =1
A funo de payoff combinado de estratgias mistas (x)=( 1(x),
2(x)):IR4IR2, ou seja IRmIRn onde m = m1+m2 o total de estratgias puras,

neste caso igual a quatro, e n o nmero de jogadores, igual a 2. Para uma matriz de payoff do jogador A igual a, 4 0 A= 5 3
x 4 0 x 21 x12 ] = [4 x11 + 5 x12 , 3 x12 ] 21 = 5 3 x 22 x 22
1(x) = x1Ax2 = [x11
4x11x21 + 5x12x21 + 3x12x22 e,

x 4 5 x 21 x12 ] = [4 x11 ,5 x12 + 3 x12 ] 21 = 0 3 x 22 x 22
2(x) = x1Bx2 = [x11
4x11x21 + 5x12x22 + 3x12x22
36
2.3
Dominncia
Existem trs tipos de dominncia, a dominncia fraca, a dominncia estrita e a dominncia estrita iterativa. importante ter em mente que tais conceitos nos levam a indicar que estratgias podem ser removidas do jogo sem que a soluo final seja alterada. Tais estratgias so ditas estratgias dominadas.
2.3.1 Dominncia fraca

Uma estratgia domina fracamente outra quando o payoff do jogador obtido quando ele joga tal estratgia contra todos os perfis de estratgias do jogo sempre maior ou igual ao payoff quando ele joga qualquer outra de suas estratgias contra os mesmos perfis de estratgias e maior para pelo menos um dos perfis. Ou seja, yj j domina fracamente xj j se j(yj,z-j) j(xj,z-j) para todo z
e com estrita desigualdade para algum z . Uma estratgia dita no dominada quando nenhuma outra a domina de modo fraco. Como exemplo observemos o jogo com a seguinte matriz de payoff
3 0 A= 0 3 1 1
O primeiro jogador possui trs estratgias puras e o segundo jogador possui duas estratgias puras. A estratgia trs, por exemplo, no dominada por nenhuma das outras duas estratgias do jogador um. Outro exemplo o conhecido dilema dos dois prisioneiros onde as matrizes de payoff dos dois jogadores so respectivamente. 4 0 4 5 A= , B= 5 3 0 3 As duas estratgias so: 1 Coopera 2 Delata
37
Vemos que a segunda estratgia (2) do primeiro jogador,delatar, domina estritamente a estratgia um, desde que (2,1) > (1,1) e (2,2) > (2,1) Do mesmo modo a estratgia dois dos segundo jogador domina de modo estrito a primeira.
2.3.2 Dominncia estrita

Uma estratgia dita estritamente dominante se o payoff que o jogador obtm quando a joga sempre maior do que o payoff que ele obtm quando joga qualquer outra de suas estratgias, ou seja, yj j domina estritamente xj j se
j(yj,z-j) > j(xj,z-j) para todo z

Como exemplo, consideremos a matriz de payoff de um jogador com trs estratgias competindo com outro jogador que possui duas estratgias.
b b 1 2
a1 3 0 A = a2 0 3 a3 1 1 Observa-se pelos payoffs obtidos na terceira linha, que nenhuma estratgia do jogador A domina fracamente sua terceira estratgia pura, e 3 A , pois: 1 - O payoff de sua primeira estratgia contra a segunda estratgia do jogador B menor que o payoff da terceira estratgia contra a segunda estratgia do jogador B. 2 O payoff de sua segunda estratgia contra a primeira estratgia do jogador B menor que o payoff da terceira estratgia contra a primeira estratgia do jogador B. Em termos de estratgias puras, nenhuma estratgia do jogador A estritamente ou fracamente dominante. Entretanto se o jogador A usa uma
1 1 estratgia mista yA = , .0 , ou seja joga a sua primeira estratgia pura 50% 2 2 das vezes e joga a sua segunda estratgia pura nas outras 50% das vezes e no joga nenhuma vez a sua terceira estratgia pura, o payoff do jogador A, A(yA,zB)
38
maior do que qualquer outro payoff que ele possa obter jogando uma outra estratgia mista xA.
A(yA,zB)
Prob(a1,b1)*A(a1,b1) + Prob(a2,b2)*A(a2,b2)
+ +
Prob(a1,b2)*A(a1,b2) Prob(a3,b1)*A(a3,b1)
+ +
Prob(a2,b1)*A(a2,b1) Prob(a3,b2)*A(a3,b2)
Considerando a probabilidade de A jogar a1 = , a probabilidade de A jogar
a2 = , a probabilidade de A jogar a3 = 0 e finalmente considerando-se Prob(b2) =

1 - Prob(b1), temos, Prob(a1,b1) = Prob(b1) e Prob(a1,b2) = (1-Prob(b1)) assim,
A(yA,zB) =
=3 Pr ob(b1 ) Pr ob(b1 ) 1 Pr ob(b1 ) 1 Pr ob(b1 ) + 0 + 3 +0 + 1* 0 + 1* 0 2 2 2 2
Pr ob(b1 ) 3 Pr ob(b1 ) = 3 = 1,5 + 3 2 2 2
J se o jogador A jogar sua terceira estratgia pura e 3 A = (0,0,1), ou seja, s joga sua terceira estratgia, seu payoff ser:
A(xA,zB) = *1 + *1 = 1 < 1,5 A(yA,zB) ser maior do que qualquer outro payoff que A possa obter
jogando uma outra estratgia mista A contra todo zB B.
39
2.3.3 Dominncia estrita iterativa

natural pensar que qualquer sujeito racional despreze suas estratgias estritamente dominadas em jogos competitivos, pois elas podem ser retiradas do jogo sem alterar o resultado final. Porm, se isso for feito, algumas estratgias puras restantes podem tornar-se estritamente dominadas no jogo reduzido. Repetidas remoes de estratgias puras estritamente dominadas de um jogo
G nos leva seguinte definio. Uma estratgia pura no iterativamente

estritamente dominada se ela no for estritamente dominada no jogo original, nem em nenhum dos jogos reduzidos at que no hajam mais estratgias estritamente dominadas. Seja Gt um jogo reduzido na iterao t. Para t igual a zero temos o jogo original e para t = T o ltimo jogo reduzido onde no existem mais estratgias dominadas. G1 o primeiro jogo reduzido aps terem sido retiradas as estratgias
estritamente dominadas do jogo original G0. G2 o segundo jogo reduzido aps terem sido removidas as estratgias estritamente dominadas do jogo G1. Se uma estratgia no estritamente dominada em nenhum dos jogos Gt, ento ela no iterativamente estritamente dominada. Para qualquer jogo finito em sua forma normal G = (I,S,), deixe SD S (espao dos possveis perfis de estratgias puras do jogo) ser um subconjunto dos perfis de estratgias puras iterativamente estritamente no dominados. Se este subconjunto um singleton, ou seja s possui um elemento, ento o jogo chamado de domnio estritamente solvel. Como exemplo temos o jogo de dois jogadores com as respectivas matrizes de payoff.
a1 A= a2 a3
b1 3 0 1
b2 b3 b1 1 6 B = , b2 0 4 b3 2 5
a1 3 0 1
a 2 a3 1 6 0 4 2 5
Pode-se observar que a segunda estratgia pura do jogador A estritamente dominada, j que os payoffs da segunda linha da matriz A so menores que os payoffs das outras linhas.
40
Ento a2 estritamente dominada, pois, (a2,b1) < (a1,b1) e (a2,b1) < (a3,b1) e (a2,b2) < (a1,b2) e (a2,b2) < (a3,b2) e (a2,b3)< (a1,b3) e (a2,b3)< (a3,b3). Assim, tanto a estratgia a1 como a a3 do jogador A dominam estritamente a estratgia a2. O mesmo acontece com a segunda estratgia pura do jogador B, b2, ela estritamente dominada pelas estratgias b1 e b3. Como a2 e b2 so estritamente dominadas, elas podem ser retiradas do jogo e o jogo reduzido G1 ter as seguintes matrizes de payoff. b1 b3 3 6 , B = b1 1 5 b3 a1 a3 3 6 1 5
A = a1 a3
Agora a estratgia a1 domina estritamente a3 e b1 tambm domina estritamente b3. Deste modo somente o perfil de estratgias puras s = (a1,b1)
permanece em G2. Ento SD = {[a1,b1]}. Weibull comenta em seu livro Evolutionary Game Theory [Ref: 1]. O postulado de que nenhum jogador usa uma estratgia estritamente dominada
uma suposio de racionalidade relativamente fraca. Para isto s se requer que a funo de payoff de cada jogador represente as suas preferncias. Em particular, nenhum conhecimento por parte do jogador sobre as preferncias ou comportamento dos outros jogadores requerido. Em contraste, a aplicao da eliminao iterativa das estratgias estritamente dominadas requer, que os jogadores saibam sobre as funes de payoff dos outros jogadores, de forma a poderem eliminar cada estratgia estritamente dominada. Alm disso, este conhecimento das preferncias, tem que ser conhecido por todos os jogadores, de forma que eles possam eliminar as estratgias que so estritamente dominadas no jogo reduzido aps uma rodada de remoes de estratgias estritamente dominadas e assim por diante, at um nvel de conhecimento mtuo, onde iteraes adicionais no eliminam mais nenhuma estratgia.
2.4
Melhor rplica
Uma melhor rplica pura ou melhor resposta em estratgias puras para o jogador j no perfil de estratgias y uma estratgia pura si Sj tal que nenhuma outra estratgia pura disponvel do jogador resulta num payoff melhor. Isto define a i-sima estratgia de melhor resposta do jogador j. importante
41
ressaltar que o termo rplica, utilizado no conceito de melhor rplica, est associado idia de contra resposta, contestao. Mais adiante quando for introduzido o conceito de dinmica do replicador, o termo replicador ser sinnimo de duplicador, aquele que clona, que copia.
2.4.1 Correspondncia de Melhor Rplica

A correspondncia de melhor rplica de estratgia pura de um jogador,
j : S j , mapeia cada perfil de estratgia mista y em um conjunto de

melhores rplicas puras do jogador j diante do perfil y. Este conjunto, finito e no vazio definido por:
k j ( y ) = {h S j : j (e h j , y j ) j (e j , y j ) ( k h) S j }
Em resumo, j ( y ) o conjunto de estratgias puras que obtm os melhores payoffs diante de um perfil concorrente y. Se a estratgia for uma melhor rplica, pode haver outras estratgias to boas quanto ela, mas no melhores. Desde que cada estratgia mista xj j uma combinao convexa de estratgias puras e j(xj,y-j) linear em relao a xj, nenhuma estratgia mista xj j pode dar ao jogador j um payoff maior contra o perfil y do que qualquer uma de suas melhores rplicas puras diante do mesmo y. Seja e j1 = (1,0) e e j 2 = (0,1) as duas estratgias puras de um jogador j. Considerando que j (e1j , y j ) > j (e 2 j , y j ) , ento qualquer estratgia mista xj que seja uma combinao convexa dessas duas estratgias puras ter um payoff j (e1j , y j ) > j ( x j , y j ) > j (e 2 j , y j )
Formalmente podemos escrever que para qualquer y , xj j e h j(y) o payoff

h j ( x j , y j ) = j (e , y j ) x jk j (e h j , y j ) x jk = j (e j , y j ) k =1 k j k =1 mj mj
observando-se que,
k =1
mj
(e , y j ) x jk = j (e , y j ) x jk = j (e h j , y j ) 1
k j h j k =1
mj
42
Resta-nos ver que j ( x j , y j ) = j (e k j , y j ) x jk desde que a estratgia

k =1
mj
mista xj pode ser escrita como combinao convexa dos vrtices de j, x j = ek j x jk

k =1 mj
Assim,
j ( y ) = {h S j : j (e h j , y j ) j ( x j , y j ) x j j }
Ou seja, o payoff de uma melhor rplica pura maior do que o payoff de qualquer estratgia mista. Uma melhor rplica mista para o jogador j diante do perfil de estratgias y
uma estratgia xj j, tal que nenhuma outra estratgia mista consegue um
payoff maior contra o perfil y. Cada melhor rplica pura pode ser vista como uma estratgia mista e jh com 100% de probabilidade para a estratgia pura sh. Portanto cada melhor rplica pura tambm uma melhor rplica mista. Alm do mais, pela linearidade do payoff
j(xj,y-j) em relao a xj, qualquer combinao convexa de melhores rplicas

puras, tambm uma melhor rplica mista. Conseqentemente a correspondncia ~ da melhor rplica mista do jogador j : j mapeia cada perfil de estratgias mistas para a face de j que gerada pelas melhores rplicas puras diante de y. Por exemplo,
Figura 2-7 Conjunto de melhores rplicas mistas, situadas na face do poliedro, combinao convexa de duas melhores rplicas alternativas.
43
Se e1j e e 2 j so as melhores rplicas puras e Xj uma face de j gerada pelas combinaes convexas das duas melhores rplicas puras diante de um perfil de estratgias y , ento temos as melhores rplicas mistas Xj. ~ O mapeamento j : j definido por: ~
j ( y ) = {x j j : u j ( x j , y j ) u j ( z j , y j ) z j j } =
a correspondncia de melhor rplica mista do jogador j. Qualquer ~ estratgia mista x j ( y ) uma melhor rplica para o jogador j contra o perfil de estratgias y . Sendo uma melhor rplica mista uma combinao convexa de melhores rplicas puras, ento a probabilidade xjh que no est associada a uma melhor
rplica pura h ser nula para qualquer estratgia pura j(y),
{x
j : x jh = 0 h j ( y )}
Ou ainda, para o caso de xj ser uma melhor rplica mista;
{x
j : C ( x j ) j ( y )},
pois o suporte C(xj) de xj o conjunto de estratgias puras associadas as probabilidades xjh>0. A correspondncia de melhor rplica pura combinada, :S, do jogo definida como o produto cartesiano de todas as correspondncias de melhores rplicas puras.
( y ) = jI j ( y ) S
A correspondncia combinada
: definida pelo produto
cartesiano das melhores rplicas mistas de cada jogador.
( y ) = jI j ( y )
44
2.5
Dominncia x Melhor Rplica
Uma estratgia pura e h j que uma melhor rplica diante de um perfil y de estratgias mistas no pode ser estritamente dominada, pois para isso seria necessrio que
k j (e h que vai j , y j ) < j (e j , y j ) para a lg um ( k h) S j o
contra a definio de melhor rplica pura. Para um jogo de dois jogadores as afirmaes seguintes so verdadeiras. 1. Uma estratgia estritamente dominada no pode ser uma melhor rplica. 2. Uma estratgia que no estritamente dominada necessariamente uma melhor rplica. 3. Uma estratgia que uma melhor rplica diante de um perfil de estratgias completamente misto no dominada. 4. Uma estratgia pura no dominada a melhor rplica para algum perfil
de estratgias completamente mistas.
2.6
Equilbrio de Nash
Um perfil y = (xj,y-j) um equilbrio de Nash se cada uma de suas estratgias mistas xj uma melhor rplica contra o perfil restante y-j, ou seja quando y uma melhor rplica para si mesmo como conseqncia de que toda estratgia mista xj y uma melhor rplica mista. ~ Ento y um equilbrio de Nash se y ( y ) . ~ Segue da definio de ( y ) que se y um equilbrio de Nash, ento toda estratgia pura no suporte de cada componente mista de y uma melhor rplica para y. Se uma estratgia mista xj pertencente ao perfil y for uma melhor rplica ento {x j j : C ( x j ) j ( y )}.
3 A estratgia mista xj = {x j1e1j , x j 2 e 2 j , x j 3 e j } , onde xjh a probabilidade da
estratgia pura e h j ser jogada, s ser uma melhor rplica mista se for combinao convexa de melhores rplicas puras e digamos que somente e1j e e 2 j sejam melhores rplicas puras, ento para que xj seja uma melhor rplica mista necessrio que a probabilidade xj3 seja zero. Deste modo podemos facilmente
45
concluir que as melhores rplicas puras j(y) possuem uma probabilidade maior que zero e, portanto pertencem ao suporte da estratgia mista xj. Portanto se sh C(xj) sh j(y). A estratgia pura sh do jogador j com probabilidade xjh > 0, e xj componente do perfil em equilbrio de Nash uma melhor rplica pura. Como exemplo considere o seguinte jogo de dois jogadores sem equilbrio em estratgias puras. Cada jogador possui duas estratgias apenas e as matrizes de payoff so:
1 1 1 1 T A= e B = 1 1 1 1
Seja j(s) o payoff mostrado nas matrizes A e B para um determinado

perfil s de estratgias puras. O payoff do jogador j para o perfil de estratgias mistas x ,

1 1 x 21 = 1 1 x 22
A(x) = [x11 , x12 ]
= x11x21-x12x21+x12x22-x11x22 = x21[x11-x12]+x22[x12-x11]
Sabemos que x21=1 - x22 e x11=1 - x12 Ento,
A(x) = 1 + x12(4x22-2)-2x22
Para que uma estratgia mista seja uma melhor rplica preciso que as
2 1 estratgias puras e1 A e e A sejam melhores rplicas puras, ento ( e A ,y-j) = 2 ( e A ,y-j) portanto expandindo esta expresso temos,
1 + 0(4 x 22 2) 2 x 22 = 1 + 1(4 x 22 2) 2 x 22 2 = 4 x 22 x 22 =
, x 21 =
46
1 Diante do perfil x-A = ( e1 B ), e A uma melhor rplica pura para o jogador A 2 2 ), e A uma melhor rplica pura. J diante do perfil x-B e diante do perfil y-A = ( e B 2 1 1 = ( e1 A ), e B a melhor rplica pura do jogador B, portanto o perfil x = ( e A , e B )
( x) e no um equilbrio de Nash. Se continuarmos com este raciocnio para os

demais perfis de estratgias do jogo, veremos que nenhum perfil de estratgias ~ puras x ( x) e, portanto, no h equilbrio de Nash em estratgias puras neste jogo. Uma questo interessante surge neste exemplo. Como vimos, apesar da
1 1 1 estratgia pura e1 A ser a nica melhor rplica pura contra e B o perfil ( e A , e B ) no 1 est em equilbrio desde que e1 B no melhor rplica pura contra e A , e
estendendo este raciocnio para as outras estratgias puras vemos que no existe nenhum equilbrio em estratgias puras neste jogo. Existe ainda a possibilidade de
haver estratgias mistas em equilbrio de Nash e pela prpria definio do equilbrio elas devem ser melhores rplicas mistas. Porm, sabemos que uma melhor rplica mista combinao convexa de duas melhores rplicas puras. Acontece que neste exemplo existe uma estratgia mista que d o mesmo payoff contra qualquer estratgia existente no perfil de estratgias. Sendo assim qualquer estratgia uma melhor rplica mista contra ela. Veja a seguir. Se um jogador opta por jogar uma estratgia mista com ambas as probabilidades iguais, isto , x11 = 1 - x12 = , qualquer estratgia xB do jogador B uma melhor rplica mista diante de xA = (,), pois como se pode verificar o payoff de qualquer estratgia contra (,) ser igual a zero. Assim todas
h , so melhores rplicas. estratgias puras e B
Como a estratgia xA = (,) uma melhor rplica diante do perfil x-A = xB = (,) e a estratgia xB = (,) uma melhor rplica diante do perfil x-B = xA ~ = (,) ento x = (xA,xB) ( x) e assim um equilbrio de Nash. Observe que xA = (,), apesar de ser uma melhor rplica mista combinao convexa do
1 0 2 perfil de rplicas puras e1 A e e B , ou seja , , que s so melhores 0 1
rplicas puras contra a estratgia mista (,). Veja os payoffs de trs estratgias de A contra a estratgia [1,0]T de B.
47
A1 =
[1,0] 1 1 1 1 1 0 = 1
melhor rplica pura contra [1,0]T
A2
1 1 [ , ] 1 1 1 = 2 2 = 0 1 1 0
combinao convexa de [1,0]T e [0,1]T
A3 =
[1,0] 1 1 1 1 1 0 = 1
no melhor rplica pura contra [1 0]T
A1 > A2 > A3, portanto contra qualquer outra estratgia no existe mais
de uma melhor rplica pura e portanto no existiriam melhores rplicas mistas. Assim no caso de s existir uma nica melhor rplica pura contra determinado perfil, a concluso no existe rplica mista que seja melhor que a melhor rplica pura. Alm do mais se o perfil est no equilbrio no significa que ele possui o maior payoff, assim como se o perfil possuir o maior payoff no quer dizer que ele est no equilbrio. Um equilbrio de Nash x chamado de equilbrio estrito se cada ~ componente xj do perfil x a nica melhor rplica para x. Cada j ( x) um ~ singleton xj e, portanto, jI j ( y ) o prprio perfil x. Enquanto o critrio do equilbrio de Nash requer que nenhum desvio fora do equilbrio seja mais lucrativo o critrio do equilbrio estrito de Nash requer que qualquer desvio fora do equilbrio seja custoso. Um equilbrio estrito no pode envolver uma probabilidade menor que um relacionado com uma determinada estratgia pura, pois assim haveria algum jogador para o qual existiriam pelo menos duas melhores rplicas puras, desde que as estratgias mistas so combinaes convexas de pelo menos duas estratgias puras e o payoff combinao linear das estratgias mistas e para haver equilbrio estrito deve haver somente uma melhor rplica. Assim cada equilbrio estrito de Nash um perfil de estratgias puras, vrtice dos espaos de perfis .
48
Um perfil em equilbrio de Nash no pode ser estritamente dominado. Entretanto no existe nada na definio que o previna se ser fracamente dominado. Pode existir outra melhor rplica para o perfil em equilbrio que no pior que a estratgia em equilbrio em questo e que melhor contra qualquer outro perfil. Um equilbrio de Nash x dito no dominado se cada estratgia xj do perfil no dominada. ~ Observe que ( x) no depende s de x j . Claramente x um ~ equilbrio de Nash se e somente se x j ( x) j I n . A elegncia do conceito do equilbrio de Nash e o comportamento racional dos agentes inspiraram muitos economistas na formulao de problemas econmicos como os jogos de n pessoas no cooperativos. Desde os anos 70 o conceito de Nash tem sido aplicado a uma grande classe de problemas. Entretanto, na aplicao do conceito alguns tericos se deram conta de uma sria
desvantagem do equilbrio de Nash, ou seja, constataram que um jogo no cooperativo de n pessoas pode ter muitos equilbrios de Nash. Assim um equilbrio escolhido arbitrariamente pode no fazer muito sentido como predio do resultado do problema. Alm do mais em muitos casos nem todos os resultados so consistentes com a noo intuitiva de qual deveria ser o resultado do jogo. Ento, nos anos setenta vrios tericos abordaram o problema da seleo de equilbrio pondo mais requisitos nos comportamentos racionais dos jogadores. Assumindo-se jogadores altamente racionais pode-se eliminar os resultados menos intuitivos. Neste estudo s sero considerados os conceitos dos equilbrios perfeito e prprio de Nash em suas formas normais. A noo de equilbrio perfeito de Nash, de um jogo de forma normal, foi introduzido por Reinhard Selten e um dos resultados mais fundamentais na teoria dos refinamentos do equilbrio de Nash. Para algum nmero real 0 > > 1 ( ih (0,1) ), um perfil de estratgias completamente mistas x , isto ,
x jk > 0 j I n e k S j ,
um
equilbrio
de
Nash
perfeito
se
~ k x jk , quando e k j ( x ) . A probabilidade da estratgia pura e j ser jogada deve ser menor que uma certa probabilidade se ela no estiver no espao de melhores rplicas mistas. Assim para um equilbrio de Nash perfeito cada estratgia pura jogada com uma probabilidade positiva (maior que zero), mas
49
somente as estratgias puras contidas no conjunto de melhores rplicas podem ter uma probabilidade mais alta que . Deste modo permitido aos jogadores cometerem erros, mas a probabilidade com que uma estratgia no tima ser jogada limitada por . Um equilbrio perfeito agora definido como o limite de uma seqncia de equilbrios perfeitos quando tende a zero. Todo equilbrio interior um equilbrio perfeito, pois se x (), sendo que () INT() e x
NE (subconjunto de perfis em equilbrio de Nash) ento x NE ( ) . Alm
disso, todo x PE (subconjunto de perfis em equilbrio perfeito de Nash) no dominado.
2.7
Equilbrio Perfeito de Nash
Um perfil de estratgia x * um equilbrio perfeito de Nash para um

jogo G = ( I n , , u ) se, para alguma seqncia r > 0, r IN convergindo para zero, existe uma seqncia de equilbrios perfeitos de Nash convergindo para x*. Da definio, segue-se imediatamente que qualquer equilbrio de Nash com estratgias completamente mistas um equilbrio perfeito de Nash para algum suficiente pequeno. Alm disso, Selten provou que qualquer jogo G = ( I n , , u ) tem um equilbrio perfeito de Nash, mesmo se o jogo no possui equilbrio nas estratgias completamente mistas.
2.8
Teorema de Selten
Qualquer jogo G = ( I n , , u ) tem pelo menos um equilbrio perfeito de Nash e o conjunto dos equilbrios perfeitos de Nash um subconjunto do conjunto dos equilbrios de Nash. Embora a noo de equilbrio perfeito elimine os equilbrios de Nash que no so robustos com respeito s pequenas probabilidades de engano por erro dos jogadores, a probabilidade com o qual um jogador racional joga uma estratgia por engano depender do efeito prejudicial da estratgia no tima. Enganos mais custosos iro ser menos provveis que os enganos menos custosos. Para um refinamento adicional do conjunto de equilbrio de Nash, Myerson (1978) introduziu o conceito de equilbrio prprio. Para algum nmero real 1 > > 0 um perfil de estratgias completamente mistas x um equilbrio
50
prprio
de
Nash
se
para
qualquer
jogador
j h j I n , x jk x jh se u j (e k k , h I m j . Novamente, para um j , x j ) < u (e j , x j )
equilbrio prprio de Nash cada estratgia pura jogada com uma probabilidade positiva. Alm do mais, se alguma estratgia pura k uma pior rplica contra as estratgias dos outros jogadores que uma certa estratgia h, ento a probabilidade com que a estratgia k jogada no mximo vezes a probabilidade com que estratgia h jogada. Ainda existe uma proposio que diz que se x NE no dominado, ento num jogo de dois jogadores x PE.
2.9
Equilbrio Prprio de Nash
Um perfil de estratgias x * um equilbrio prprio de Nash para o jogo

G = ( I n , , u ) , se para alguma seqncia r > 0, r IN, convergindo para zero,
existe uma seqncia de equilbrios r prprios de Nash convergindo para x*. Novamente, segue imediatamente que qualquer equilbrio interior de Nash (completamente misto) um equilbrio prprio de Nash. Alm do mais cada equilbrio prprio de Nash satisfaz as condies de um equilbrio perfeito, porque a noo de propriedade restringe o conjunto de enganos permissveis. Myerson provou que qualquer jogo G = ( I n , , u ) tem pelo menos um equilbrio prprio de Nash.
2.10
Teorema de Myerson
Qualquer jogo G = ( I n , , u ) possui pelo menos um equilbrio prprio de Nash. Alm disso, o conjunto de equilbrios prprios de Nash um subconjunto do conjunto de equilbrios perfeitos de Nash. Os conceitos de equilbrio prprio e perfeito de Nash so bem ilustrados pelo seguinte exemplo. Seja o jogo bimatricial, de duas pessoas, dado por.
9 1 0 A = BT = 0 0 7 9 7 7
51
Este jogo possui trs equilbrios de Nash em estratgias puras apontados pelas setas, ou seja, cada perfil de estratgia no qual os dois jogadores jogam a mesma estratgia pura. Entretanto, o equilbrio de Nash no qual ambos jogadores jogam a terceira estratgia muito improvvel por ser irracional. Este equilbrio rejeitado pela noo de perfeio, a qual s admite os dois equilbrios nos quais ou ambos os jogadores jogam sua primeira estratgia ou ambos os jogadores jogam sua segunda estratgia. Podemos ver que uma melhor rplica para a terceira
3 , e3 estratgia do jogador B e B A e a uma melhor rplica para a terceira estratgia 3 3 3 do jogador A e 3 A e B , portanto ( e A , e B ) um equilbrio de Nash. Porm, como 3 2 3 nem ( e1 A , e B ) nem ( e A , e B ), so equilbrios de Nash, ento toda estratgia mista
candidata a melhor rplica deve ter suas componentes xA1 e xA2 iguais a zero. Assim no seria robusto a perturbaes e, portanto, no um equilbrio perfeito. Seguindo com este mesmo raciocnio para os outros equilbrios temos que
2 2 e1 A e e A so melhores rplicas para e B , portanto qualquer estratgia mista 2 2 combinao convexa de e1 A e e A uma melhor rplica mista contra e B e o perfil 2 2 { eA , eB } um equilbrio de Nash. Para xA = (xA1, xA2, 0), onde xA combinao 2 2 1 convexa de ( e1 A , e A ), e B uma melhor rplica? Calculemos os payoffs ( e B ,xA), 2 3 ( e B ,xA) e ( e B ,xA).
0 9 x A1 1 x A1 0 7 x A2 = [1,0,9] ( e ,xA) = [1,0,0] 0 x A2 = x A1 0 9 7 7 0 0

1 B
0 9 x A1 1 x A1 ( e ,xA) = [0,1,0] 0 0 7 x A2 = [0,0,7] x A2 = 0 9 7 7 0 0

2 B
0 9 x A1 1 x A1 ( e ,xA). = [0,0,1] 0 0 7 x A2 = [9,7,7] x A 2 = 9 x A1 7 x A2 0 9 7 7 0 0

3 B
52
2 2 s uma melhor rplica para xA se xA1 = 0, caso contrrio e B Portanto e B 2 ) no um equilbrio de Nash. no uma melhor rplica para xA e (xA, e B
Um modo mais claro de vermos se x um equilbrio perfeito de Nash seria considerarmos a seguinte definio: Um equilbrio - perfeito em um jogo de forma normal um perfil x NE(), tal que para cada jogador j, xj maximiza o
payoff (xj,x-j) sujeito a xjh jh para toda h Sj, onde 0< jh <
3 Deste modo se considerarmos a equilbrio ( e 3 A , e B ), temos que:
3 e3 A = [0,0,1] e e A = [A1,A2,1-A1-A2] 3 3 eB =[0,0,1] e e B = [B1,B2,1-B1-B2]
Ento,
B1 0 9 1 = 2 7 ( e , e ) = [0,0,1] 0 0 7 B2 B1 9 7 7 1 B1 B 2
3 A 3 B
0 9 B1 1 = 7 + 7 7 ( e , e ) = [0,1,0] 0 0 7 B2 B1 B2 9 7 7 1 B1 B 2
2 A 3 B
0 9 B1 1 = 10 + 9 9 ( e , e ) = [1,0,0] 0 0 7 B2 B1 B2 9 7 7 1 B1 B 2
1 A 3 B
Se variarmos de 1 a 0, isto , simulando
**
0, variamos os payoffs
3 3 3 ( e * A , e B ) e observaremos que no existe 0< < 1 tal que ( e A , e B ) seja um 3 equilbrio de Nash, portanto ( e 3 A , e B ) no um equilbrio perfeito de Nash
53
Figura 2-8 O perfil ( e A , e B ) no um equilbrio perfeito de Nash, pois no robusto menor perturbao. J o perfil ( e A , e B ) robusto qualquer perturbao < 0.4
2 3
2 2 , eB ), assim, Consideremos agora, um outro equilbrio de Nash deste jogo ( e A
repetindo o mesmo procedimento anterior, temos que:

2 2 eA = [0,1,0] e e A = [A1,1-A1-A3,A3] 2 2 eB =[0,1,0] e e B = [B1,1-B1-B3,B3]
Ento,
0 9 B1 1 ) = [1,0,0] 0 0 7 1 B1 B 3 = B1 9 B 3 9 7 7 B3 0 9 B1 1 ) = [0,1,0] 0 0 7 1 B1 B 3 = 7 B 3 B3 9 7 7 0 9 B1 1 ) = [0,0,1] 0 0 7 1 B1 B 3 = 2 B1 7 B3 9 7 7
( e , e
1 A
2 B
( e , e
2 A
2 B
( e , e
3 A
2 B
54
Se variarmos de 1 em direo a 0, isto , simulando 0, variamos os

**
2 2 2 payoffs ( e * A , e B ) e observaremos que para todo 0< < 1, ( e A , e B ) um 2 2 2 3 2 2 , eB ) > ( e1 equilbrio de Nash, desde que ( e A A , e B ) > ( e A , e B ). Portanto ( e A , 2 eB ) um equilbrio perfeito de Nash.
Figura 2-9 O perfil ( e A , e B ) uma equilbrio perfeito de Nash para todo 0< < 1
1 Finalmente, considerando o equilbrio de Nash restante deste jogo ( e1 A , eB ) e
repetindo os procedimentos anteriores, temos que:

1 e1 A = [1,0,0] e e A = [1-A2-A3, A2,A3] 1 e1 B =[1,0,0] e e B = [1-B2-B3, B2,B3]
Ento,
0 9 1 B1 B 3 1 = 1 10 ( e , e ) = [1,0,0] 0 0 7 B2 B2 B3 B3 9 7 7
1 A 1 B
0 9 1 B1 B 3 1 = 7 0 7 ( e , e ) = [0,1,0] 0 B2 B3 B3 9 7 7
2 A 1 B
55
0 9 1 B1 B 3 1 = 2 + 2 9 1 ( e 3 0 7 B2 A , e B ) = [0,0,1] 0 B2 B3 9 7 7 B3
Se variarmos de 1 em direo a 0, isto , simulando 0, variamos os

**
1 1 1 payoffs ( e * A , e B ) e assim poderemos observar que para todo 0< < , ( e A , e B ) 1 2 1 um equilbrio de Nash, desde que para este intervalo ( e1 A , e B ) > ( e A , e B ) > 1 1 1 ( e 3 A , e B ). Portanto ( e A , e B ) um equilbrio perfeito de Nash.
Figura 2-10 O perfil ( e A , e B ) uma equilbrio perfeito de Nash para todo 0< < 1/4
O segundo equilbrio rejeitado pela noo de equilbrio prprio. Observe

2 2 2 3 2 que pela definio de equilbrio prprio, ( e1 A , e B ) = ( e A , e B ) = 0 > ( e A , e B ) = 1 1 2 1 3 -7, portanto xA3 xA2 e xA3 xA1 e ( e1 A , e B ) > ( e A , e B ) > ( e A , e B ), portanto 2 2 xB1>xB2 e xB1 > xB3, assim o equilbrio ( e A , eB ) seria menos provvel do que o 1 equilbrio ( e1 A , e B ).
Ento, pela definio de equilbrio prprio seleciona-se o equilbrio na qual ambos os jogadores jogam a primeira estratgia. Este equilbrio d a ambos os jogadores um payoff igual a um.

06 Cap 02

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

06 Cap 02

Загружено:

Авторское право:

Доступные форматы

TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

Cap 2 - TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

John Maynard Smith (19202004) Um dos gigantes da biologia evolutiva do sculo

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

i ( s ) o payoff do jogador i diante do perfil de estratgias puras

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

de informao, pode-se estudar o simplex j com dimenso mj-1.

por sua projeo no espao

PUC-Rio - Certificao Digital N 0220895/CA

Figura 2-1 Espao de estratgias mistas para o caso de duas estratgias

Figura 2-2 Projeo do espao de estratgias mistas R2 R

Figura 2-3 Espao de estratgias mistas para o caso de trs estratgias

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

Figura 2-4 Projeo do espao de estratgias mistas R3 R2

Os vrtices do simplex unitrio j so vetores unitrios no espao mj

2.1.1 Suporte de uma estratgia mista

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

suas estratgias mistas tero a forma x j = {x j1 , x j 2 }.

Como exemplo considere o jogador j com duas estratgias apenas, assim

2.1.2 Face de um espao de estratgias mistas

PUC-Rio - Certificao Digital N 0220895/CA

2.1.3 Interior de um espao de estratgias mistas

2.1.4 Fronteira do espao de estratgias mistas

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

2.1.5 Perfil de estratgias mistas

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

O suporte de um perfil de estratgias mistas x C ( x) = jI C ( x j ) S e x

INT() se e somente se C(x) = S.

Funo de payoff de uma estratgia mista

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

O valor esperado do payoff para o jogador j associado com o perfil de

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

O valor esperado do payoff do jogador 1 associado com a estratgia mista

1 ( x) = x1h a hk x 2 k = x1T Ax 2 , onde A a matriz de payoff do jogador 1.

PUC-Rio - Certificao Digital N 0220895/CA

O valor esperado do payoff do jogador 2 associado com a estratgia mista

2 ( x) = x1h bhk x 2 k = x1T B T x 2 onde B a matriz de payoff do jogador B

Prob(a2,b1)*1(a2,b1) + Prob(a2,b2)* 1(a2,b2)

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

a11*x(a1,b1) + a12*x(a1,b2) + a21*x(a2,b1) + a22*x(a2,b2) = a11*x11*x21+

PUC-Rio - Certificao Digital N 0220895/CA

2 ( x) = bhk x1h x 2 k = x1T B x 2 = x 2 T B T x1

A funo de payoff combinado de estratgias mistas (x)=( 1(x),

2(x)):IR4IR2, ou seja IRmIRn onde m = m1+m2 o total de estratgias puras,

1(x) = x1Ax2 = [x11

4x11x21 + 5x12x21 + 3x12x22 e,

2(x) = x1Bx2 = [x11

4x11x21 + 5x12x22 + 3x12x22

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

2.3.1 Dominncia fraca

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

2.3.2 Dominncia estrita

j(yj,z-j) > j(xj,z-j) para todo z

PUC-Rio - Certificao Digital N 0220895/CA

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

Considerando a probabilidade de A jogar a1 = , a probabilidade de A jogar

a2 = , a probabilidade de A jogar a3 = 0 e finalmente considerando-se Prob(b2) =

Pr ob(b1 ) 3 Pr ob(b1 ) = 3 = 1,5 + 3 2 2 2

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

2.3.3 Dominncia estrita iterativa

G nos leva seguinte definio. Uma estratgia pura no iterativamente

Cap. 2-TEORIA DOS JOGOS CONCEITUAO E CONTEXTUALIDADE

Prob(a2,b1)1(a2,b1) + Prob(a2,b2) 1(a2,b2)

a11x(a1,b1) + a12x(a1,b2) + a21x(a2,b1) + a22x(a2,b2) = a11x11x21+