Академический Документы
Профессиональный Документы
Культура Документы
Eleutério F. S. Prado1
1. Introdução
1
Professor da USP; e-mail: eleuter@usp.br
2
O presente artigo originou-se de várias modificações e extensões feitas em um modelo básico
encontrado em Vega-Redondo (1996, p. 72-79).
2
2. Emergência da Civilização
C D
C 3;3 0;4
D 4;0 1;1
Como bem se sabe, o dilema do prisioneiro de apenas uma fase tem uma solução
bem determinada. Tendo por certo que para cada um dos jogadores a defecção é a
estratégia dominante, o equilíbrio do jogo se dá na combinação de estratégias (D; D).
Esta combinação, como também é bem sabido, é ineficiente, já que um movimento
simultâneo para (C; C) traz um ganho para ambos. Ora, vem a ser justamente este
resultado paradoxal que suscita a busca de extensões do modelo de fase única.
Se o número de repetições é infinito, a indução para trás não pode ser aplicada e,
assim, inúmeras possibilidades de solução emergem, entre as quais se encontra a
permanente defecção. Estas nascem do fato de que agora cada jogador pode penalizar o
outro no presente, se este for o caso, para obter dele um comportamento mais cooperativo
no futuro, mesmo se esta ação tem custos para ele próprio. Para descobrir todo o
conjunto das soluções possíveis, é mais adequado considerar a situação mais geral, em
que o número de repetições pode ser finito, mas indeterminado num certo grau. A esta
3
Sob essa mesma perspectiva, o dilema do prisioneiro tem sido estudado de muitas formas. Uma
resenha que apresenta os esforços de economistas para compreender tal emergência foi feita por Routledge
(1998).
4
Esta teoria tem recebido considerável atenção recentemente na esfera da Economia, tendo sido
exposta em livros como os de Samuelson (1997) e Weibull (1997). Uma avaliação interessante sobre o seu
potencial para o desenvolvimento da teoria econômica foi feita por Mailath (1998).
3
última aplica-se o teorema popular (folk theorem) que tem aplicação mais geral do que a
examinada no presente contexto:
Este resultado é suficiente para mostrar que a cooperação é possível entre agentes
definidos como homo economicus. Entretanto, não é capaz de dizer nada de muito
específico sobre as condições nas quais a cooperação entre estes egoístas racionais,
altamente abstratos, vem a ocorrer em efetivo. Para examiná-las, Axelrod desenvolveu
um método de investigação baseado na simulação de processos de evolução por meio de
torneios em computador. Nestes torneios, competiam pelo sucesso e, assim, pela própria
sobrevivência, autômatos que representavam certas estratégias, os quais foram criados
por cientistas de vários campos do conhecimento. Desse modo, ele pretendia descobrir
como a competição engendra a cooperação. Com o seu método Axelrod pretendeu
chegar, assim, a conclusões muito mais bem definidas sobre a emergência da cooperação
e, assim, da própria sociedade.
5
Ver Hofstader (1986).
6
Esta abordagem vai do indivíduo à sociedade, mas não implica na adoção nem do individualismo
sociológico nem do individualismo metodológico; ela não implica em assumir qualquer reducionismo, ou
seja, a idéia de que todo fenômeno social pode ser reduzido às crenças, atitudes, ações e decisões dos
indivíduos (Prado, 1993).
5
Os resultados dos torneios efetuados por Axelrod mostraram que havia uma
estratégia que se sobressaia sempre como vencedora e que fora chamada pelo seu
inventor, Anatol Rapopport, de "tit-for-tat" . Esta estratégia, que impressionava pela
simplicidade, consistia em cooperar no primeiro movimento para, depois, replicar com o
mesmo comportamento da estratégia adversária na rodada anterior: se este era de
cooperação, ela manda cooperar; se não o era, ela manda optar pela defecção. Axelrod
concluiu, então, que a cooperação podia emergir num mundo formado por egoístas e sem
autoridade central e que, para tanto, era necessário que houvesse a possibilidade da
interação repetida o que, de fato, como se viu, eram já inferências que se poderiam
tirar do teorema popular.
a) Ela pode ter início mesmo num mundo de defecção incondicional. Isto vem a
ocorrer desde que surja nesse mundo um conjunto suficientemente grande de agentes
intrinsecamente colaboradores e que agem com base na reciprocidade;
Ora, as duas primeiras conclusões precisam ser qualificadas e a terceira delas está
errada o que, aliás, foi mostrado por Binmore (1995, p. 187-203). Nos modelos
apresentados abaixo, em que se mantém o contexto evolucionário, mas se opta por um
caminho analítico, serão mostrados os problemas das conclusões de Axelrod de um modo
especialmente claro e transparente.
3. Civilização ou barbárie
Com base nesse pequeno conjunto de estratégias (infinitas outras poderiam ter
sido pensadas), vários jogos podem ser considerados. O primeiro a ser examinado contém
agentes que adotaram e só podem adotar as estratégias poliana, anti-social e retaliadora.
Como a estratégia de defecção tende a desaparecer neste primeiro jogo, em seqüência,
será considerado o jogo que contém as estratégias poliana, retaliadora e oportunista. Por
sua vez, como agora é a estratégia poliana que tende a desaparecer, será então analisado o
jogo que contém as estratégias retaliadora, oportunista e retaliadora disfarçada. Os outros
jogos possíveis serão desprezados.
Como cada jogo tem horizonte infinito, vai-se assumir sempre que em cada
encontro os payoffs considerados são obtidos descontando-se todo fluxo de rendimentos
futuros com uma determinada taxa. De acordo com Binmore (1992, p. 360-369), dada a
matriz de payoffs anteriormente apresentada, pode-se apresentar a estrutura de payoffs de
todos os jogos possíveis com estas cinco estratégias por meio da seguinte matriz de
dimensão 5 por 5
7
C D R O Rd
C 3; 3 0; 4 3; 3 0; 4 0; 4
D 4; 0 1; 1 1; 1 1; 1 1; 1
R 3; 3 1; 1 3; 3 3; 3 0; 4
O 4; 0 1; 1 3; 3 3; 3 0; 4
Rd 4; 0 1; 1 4; 0 4; 0 1; 1
Para dar uma forma concreta à dinâmica evolucionária, sob o suposto de que o
processo de seleção é cego, será utilizado aqui o replicador dinâmico em sua versão de
tempo contínuo8, a qual é menos transparente do a versão em tempo discreto mas permite
obter mais facilmente resultados por simulação.
l q
ν 'i (t ) = ν i (t ) U i [i; ν (t )] − U m [v (t )] ; i = c, d , r , o, rd
U [c; ν (t )] = 3 − 3vd (t )
U [d ; ν (t )] = 4 − 3ν d (t ) − 3ν r (t )
U [r ; ν (t )] = 3 − 2ν d (t )
com ν c (t ) = 1 − ν d (t ) − ν r (t )
U m [ν (t )] = 3 − 2ν d (t ) − 2ν d (t )ν r (t )
ν 'd (t ) = ν d (t )[1 − ν d (t ) − 3ν r (t ) + 2ν d (t )ν r (t )]
ν 'r (t ) = ν r (t )[2ν d (t )ν r (t )]
ν d [1 − ν d − 3ν r + 2ν d ν r ] = 0
ν r [2ν d ν r ] = 0
É imediato que (0; 0), ponto em que existe apenas a estratégia C, é um deles. Se
νd ≠ 0 e νr = 0, então 1 - νd = 0; logo (1; 0), em que só a estratégia D está presente, vem a
ser um outro ponto estacionário. Se νd = 0 e νr ≠ 0, então νd νr = 0, o que é verdadeiro
para qualquer ponto (0; ν*r ) ∈ H = {(0; νr) | 0< νr ≤ 1}, logo, os pontos deste conjunto
são também estacionários. Em (0; 1) apenas a estratégia R está presente e em H
coexistem as estratégias C e R.
∆2 = {(ν d ; ν r )|ν d + ν r ≤ 1, ν d ≥ 0, ν r ≥ 0}
Para prosseguir é preciso ver que H pode ser particionado em dois subconjuntos
H1 = {(0; νr) | 0< νr < 1/3}e H2 = {(0; νr) | 1/3 ≤ νr ≤ 1}. Eis que há um conjunto de
pontos em ∆2 em que νd ≠ 0 mas ν'd = 0. Para encontrá-los é preciso igualar a zero a
expressão [1 - νd - 3 νr + 3 νd νr] , obtendo os seguintes resultados:
1− ν d 1
νr = ;com lim ν r = e com lim ν r = 0
3 − 2ν d ν d → 0 3 ν d →1
Dito em palavras, isto implica que não há convergência em (0; ν*r) ∈ H2.
É com certa facilidade que se pode fazer por meio de simulações uma análise da
dinâmica global deste sistema de equações diferenciais. Os resultados aparecem no
gráfico abaixo:
10
νr
(0;1)
H2
(0;1/3)
H1
νd
(0;0) (1;0)
numa norma de apreciável valor moral, pode-se denominar o estado social resultante
pelo termo "civilização".
O segundo jogo a ser examinado vem a ser aquele em que a população contém
jogadores que adotam as estratégias poliana, retaliadora e oportunista (CRO). Em relação
ao jogo anterior saí a estratégia D, que lá havia desaparecido, e entra a estratégia O cuja
origem pode ser explicada por mutação do próprio D. Procedendo de acordo com os
passos do jogo anterior, encontra-se com facilidade os payoffs esperados das três
estratégias, assim como o payoff médio entre elas:
U [c; ν (t )] = 3 − 3ν o
U [r ; ν (t )] = 3
U [o; ν (t )] = 4 − ν r − ν o
U m [ν (t )] = 3 − 2ν o + 2ν oν r + 2ν o2
Com base nessas expressões, pode-se chegar aqui, tal como antes, ao sistema
autônomo de equações diferenciais:
vr′ = ν r (2ν o − 2ν oν r − 2ν o2 )
ν ′o = ν o (1 − ν r + ν o − 2ν rν o − 2ν o2 )
νo
(0; 1)
H4
νr
(0 ;0)
H3 (1; 0)
oportunista é mais forte do que a retaliadora, já que tende a crescer mais rápido e a
predominar como opção na população. A cooperação emerge, mas não porque está
fundada no princípio de reciprocidade antes referido e que se encontra implícito no
comportamento dos indivíduos que empregam a estratégia "tit-for-tat". A mutualidade
que existe aqui é perversa: há cooperação porque os agentes com maior capacidade de
sobrevivência são oportunistas, agentes do mal, que respeitam apenas os retaliadores que
punem e os outros oportunistas. Se for possível dizer que estes últimos agem por
princípio, aquele que seguem é o da falta de princípios. Há cooperação, mas o estado da
social prevalecente pode ser denominado de "barbárie".
Por exemplo, o mesmo raciocínio poderia ser empregado para considerar uma
nova mutação da estratégia que implica em jogar sempre a defecção. Por meio dela passa
a existir a possibilidade de um comportamento anti-social mais cínico que aparenta ser
retaliador para induzir aqueles que optam pelo verdadeira retaliadora ou pela oportunista
que agora se afigura algo ingênua , a se comportarem de modo cooperativo. À
medida que eles fazem isto, o optante da estratégia disfarçadora consegue derrotá-los,
porque ele mesmo jogará sempre a defecção.
νrd
(0,1)
νo
(0,0)
H5 (1,0)
4. Conclusões
Referências bibliográficas
BINMORE, K., Fun and games a text on game theory. Lexington, MA: Ann Arbor,
1992.
BINMORE, K., Game theory and the social contract playing fair. Cambridge, MA:
The MIT Press, 1995.
______________, A USP e a tragédia dos comunas. In: Jornal da USP, ano XIV, n 460,
8/2/1999, p. 2 e Informações FIPE, n 121, fevereiro de 1999, p. 23-25.
9
O autor do artigo ficaria com a renovação do argumento kantiano no interior da filosofia da
linguagem para compreender a moralidade numa perspectiva universalista, ou seja, com Habermas. Esta
opção tem profundas conseqüências para a compreesão da Economia como ciência, da teoria dos jogos e da
oposição sustentada em seu interior entre jogos cooperativos e não cooperativos. A elaboração disto requer
um esforço bem mais extenso do que o necessário para expor uma refutação dos argumentos de Axelrod.
16
SAMUELSON, L., Evolutionary game and equilibrium selection. Cambridge, MA: The
MIT Press, 1997.
WEIBULL, J. W., Evolutionary game theory. Cambridge, MA: The MIT Press, 1997.