Вы находитесь на странице: 1из 23

Universit Mohammed Premier

Facult des Sciences Juridiques Economiques et Sociales


Oujda

Expos sous le thme :

La thorie des jeux

Anne universitaire : 2013/2014

Plan

Introduction..2
I prsentation de la thorie des jeux.3-5
1. Historique
2. Dfinition
3. Hypothses
4. Elments des jeux
II typologie des jeux.5-11
1. Jeux coopratifs et non coopratifs
2. Jeux somme nulle et jeux somme positive
3. Jeux simultans et jeux squentiels
4. Jeux finis
5. Jeux rpts
6. Jeux information complte et incomplte
IIIForme des jeux de stratgie..11-13
1. Forme extensive
2. Forme normale
IV le dilemme du prisonnier14-15
V lquilibre de Nash16-19
1. Equilibre de Nash en stratgie pure
2. Equilibre de Nash avec stratgie mixte

Conclusion20
Bibliographie
Introduction

La thorie des jeux est une approche distincte et interdisciplinaire du


comportement humain, elle a t fonde par les grands mathmaticiens
John Von Neumanet Oskar Morgenstern dans leur livre publi en 1944,
intitul Theory of Games and EconomicBehavior (la thorie des jeux et
comportement conomique).
Lorsque des personnes interagissent entre elles, on peut dire quil y a
un jeu. Lorsquun commerant dtermine le prix dun bien, il joue un
jeu avec ses clients et ses concurrents. La ngociation des salaires est
un jeu entre le patron, les employs et les syndicats. Napolon et
Wellington jouaient un jeu lors de la bataille de Waterlou tout comme
Kroutchev et Kennedy lors de la crise de Cuba.
Donc la thorie des jeux est prsente souvent en conomie, en
management, en politique, en sociologie, en situation de guerrel o des
dcisions complexes doivent tre prises.
Lobjet de cette thorie est dtudier les principes et rgles
mathmatiques et les mettre profit dans des situations de conflits lors
dune interaction stratgique entre plusieurs preneurs de dcisions (appels
agents en conomie et joueurs en thorie des jeux). Ces preneurs de
dcisions interagissent dans le sens o le sort de chacun dpend non
seulement des dcisions quil prend mais galement des dcisions prises
par dautres preneurs de dcisions, donc le choix optimal dpend
gnralement de ce que font les autres.
Dans cette recherche, on va essayer en premier lieu de donner un
cadre thorique cette conception, puis parler des diffrents types et
formes de jeux, tudier le dilemme du prisonnier et enfin voquer la notion
dquilibre de Nash.

I prsentation de la thorie des jeux

1. Historique

En 1938, mile Borel dveloppe, dans son ouvrage Applications


aux Jeux de Hasard ,un thorme du minimax pour les jeux
somme nulle deux joueurs, c'est--dire les jeux dans lesquels ce que
gagne l'un est perdu par l'autre.
En 1944, La thorie des jeux devient un champ de recherche part
entire avec lades publication de la Thorie jeux et du comportement
conomique (Theory of Games and EconomicBehavior) par John
von Neumann et Oskar Morgenstern
En 1950, John Nash dveloppe la notion d'quilibre de Nash qui
gnralise les travaux de Cournot.
En 1994, John Nash, Reinhard Selten et John Harsanyi reoivent le
prix Nobel d'conomie (prix de la Banque royale de Sude en
sciences conomiques en mmoire d'Alfred Nobel) pour leurs
travaux sur la thorie des jeux. Ce choix tmoigne de l'importance
prise par la thorie des jeux dans l'analyse conomique.

2. Dfinition

La thorie des jeux peut tre dnie comme ltude mathmatique des
Interactions Stratgiques entre plusieurs agents Rationnels.
Interaction : il y a plusieurs agents (appels aussi joueurs, "dcision
makers", etc...), et ils interagissent : le contentement (appel aussi
paiement, gain, utilit, bien-tre) de chacun ne dpend pas que de lui, mais
aussi en partie des autres.
Stratgique : Les joueurs ont le choix entre plusieurs options.
Rationnel : un joueur ne joue pas nimporte comment, il cherche
optimiser son paiement.

3. Hypothses
Rationalit
Cest une hypothse fondamentale. En effet, chaque joueur cherche
maximiser ses gains. Le gain de chacun dpend autant des dcisions des
autres que de sa propre dcision. Il est donc ncessaire quil y ait
anticipation de ce que vont faire les autres et cela repose sur des
croyances.
Information Complte
Chaque joueur connat tous les dtails du modle et peut se mettre la
place du modlisateur. Il sait que les autres savent quil sait, quils
savent quil sait quils savent, etc.

4. Elments des jeux

Lorsque lon dsire modliser des comportements conomiques


faisant apparaitre des interactions stratgiques sous la forme dun jeu, il est
ncessaire de dfinir prcisment ces lments :
Les joueurs
Les rgles
Les choix possibles: les stratgies
Rsultat: les gains ou pertes

II typologie des jeux


1. Jeux coopratifs et non coopratifs
Les jeux coopratifs
Les joueurs peuvent communiquer librement et passer entre eux des
accords qui les lient de faon contraignante.
Ils cherchent lintrt gnral suivi dun partage des gains entre tous les
joueurs ( intelligence collective).
Jeux solidaires :les joueurs gagnent ou perdent tous ensemble ( ils ne
jouent pas lun contre lautre).
Exemple:Le ct de conduite
Conduire du mme ct que les autres permet de se dplacer en
relative scurit (gain de 100).
Conduire dans le sens oppos rend un accident trs probable (gain 0).

On obtient la matrice suivante:

Conduire gauche

Conduire droite

Conduire gauche

100

Conduire droite

100

Jeux non coopratifs


Les individus adoptent un comportement goste et opportuniste
chaque instant:
Absence de la communication entre les joueurs.
Les joueurs agissent selon le principe de rationalit conomique:
chacun cherche son intrt individuel.
Exemple :
Soit une entreprise 1 et une entreprise 2 ayant leur disposition les
actions: produire et ne pas produire :
E2
E1

Produit

Ne produit pas

Produit

(-3;-2)

(10;0)

Ne produit pas

(0;8)

(0;0)

2. Jeux somme nulle et jeux somme positive


Jeux somme nulle (ou interdpendance comptitive)
6

Un jeu est somme nulle si la somme des gains est constante : somme
gale zro.
Dans ce type de jeu ce que gagne lun des joueurs lautre le perd.
Par exemple, les checs; le poker; la pierre, papier, ciseau sont des jeux
somme nulle.
Exemple:Jeu de matching Pennies :
Deux joueurs annoncent simultanment Pile ou face:
- Si les annonces sont identiques:
*Le joueur 1 reoit 20 que lui paie le joueur 2.
- Si les annonces ne concordent pas:
*Le joueur 1 verse 20 2.
La matrice des gains est donc la suivante :
J2

Pile

Face

Pile

(20;-20)

(-20;20)

Face

(-20;20)

(20;-20)

J1

Jeux somme non nulle (indpendance coopratifs)


Dit aussi jeux somme positive. Ils reprsentent les situations o les
joueurs peuvent potentiellement gagner sils parviennent cooprer ou
coordonner leurs stratgies.
7

Alors le rsultat dun tel jeu peut tre:


*(positif; positif): tous les joueurs sont gagnants.
*(ngatif; ngatif):tous les joueurs sont perdants.
Exemple:
Soit deux entreprises ont le choix dans leur politique de
communication entre lancer une compagne de publicit ou ne rien
faire .
E2

Lancer la
compagne pub

Ne rien faire

Lancer la
compagne pub

(40;90)

(60;50)

Ne rien faire

(25;140)

(25;50)

E1

3. Jeux simultans et jeux squentiels


Jeux squentiels
Il existe des jeux o les joueurs jouent lun aprs lautre: jeux
squentiels.
Celui qui joue en premier est le leader , celui qui joue en deuxime est
le follower .
8

Le joueur dans ce cas peut savoir ce que lautre a jou avant de prendre sa
dcision.
Exemple :
Un monopoleur peut observer le comportement de la demande des
consommateurs avant de produire.
Un duopoleur peut observer linvestissement en capital de son
concurrent avant de prendre sa propre dcision.
Remarque:
Le duopole: une structure du march oligopolistique dans laquelle deux
entreprises offreuses font face une infinit de demandeurs.
Jeux simultans
Chaque joueur choisit son plan daction complet au dbut du jeu et
une fois pour toutes.
Le joueur ne connat pas les choix effectu par les autres joueurs
donc il doit prvoir les choix des autres.
Exemple:Le dilemme du prisonnier.

4. Jeux finis
On dit qu'un jeu est fini lorsque l'ensemble des stratgies de chacun
des joueurs est fini.
Le dilemme du prisonnier est un jeu fini car chacun des joueurs n'a que
deux stratgies possibles.

5. Jeux rpts
La rptition dun jeu, avec connaissance des rsultats intermdiaires,
change souvent fondamentalement son droulement (les meilleurs coups et
la conclusion).
Par exemple, il peut tre utile de prendre ponctuellement le risque de
perdre pour voir , tester les autres joueurs, et mettre en place des
stratgies de communication par les coups jous ( dfaut dautre moyen
de communication).

6. Jeux information complte et incomplte


Jeux information complte
On dit qu'un jeu est information complte si chaque joueur connat
lors de la prise de dcision :

ses possibilits d'action


les possibilits d'action des autres joueurs
Rsultats de la dcision qui sera prise
les motivations des joueurs

Jeux information incomplte


On dit quun jeu est information incomplte sil manque de
linformation (lorsquil ny a pas de connaissance des gains, ou de
certaines rgles ).
On parle de jeu information parfaite dans le cas de jeu sous forme
extensive, o chaque joueur a une connaissance parfaite de toute l'histoire
du jeu.
Un jeu information incomplte est aussi information imparfaite.
Les jeux information complte peuvent tre information imparfaite soit
10

du fait de la simultanit des choix des joueurs, soit lorsque des


vnements alatoires sont cachs certains joueurs.

IIIForme des jeux de stratgie


1. Forme extensive
Lorsquil y a information complte, chaque joueur connait toutes les
donnes du problme, pour lui et pour les autres.
Trois types de situations peuvent alors tre envisags :
Soit les joueurs font leurs choix de faon squentielle, dans un ordre
prcis fix lavance.
Soit ils prennent leur dcision simultanment
Soit ils font face des situations mixtes, avec des coups successifs et
des coups simultans.
Lorsque les rgles du jeu stipulent que les joueurs interviennent les
uns aprs les autres, dans un ordre prcis et que le nombre dactions parmi
lesquelles leur choix sexerce est fini, la reprsentation qui semble la plus
approprie consiste tracer un arbre (appel arbre de Kuhn).
Une telle reprsentation, dite sous forme extensive, peut tre illustre par
lexemple suivant prsent par Bernard Guerrien.

Exemple d'un arbre de Kuhn

11

La construction et ltude des jeux sous forme extensive offrent un


moyen commode de reprsenter des interactions stratgiques squentielles
dans des jeux information parfaite.
Dans le cas des jeux information imparfaite, le recours un arbre de
Kuhn est toujours possible. Dans ce cas lexistence de coups simultans se
traduit par lapparition densembles dinformations regroupant des nuds
de larbre relatifs ces coups.
Forme extensive reprsentant un jeu information imparfaite

2. Forme normale
La forme normale est une faon pratique de prsenter les gains (ou
utilits) et les stratgies de chaque joueur : elle est constitue dun tableau
(2 dimensions) lorsquil y a 2 joueurs. Lorsquil y a N joueurs, on est
oblig de construire plusieurs tableaux pour reproduire la dimension N.
On associe par exemple le gain au nombre 1, le match nul 0, la dfaite
1.Si le gain est alatoire (ex du jeu de carte ou du lancer de d), son gain
ou son utilit est alors son esprance mathmatique.
12

Exemple :
Le caillou casse les ciseaux (Caillou> Ciseaux).
La feuille enveloppe le caillou (Feuille > Caillou).
Les ciseaux coupent la feuille (Ciseaux > Feuille).

IV le dilemme du prisonnier
Quelque part, un crime est commis et la police arrte deux suspects.
La police est certaine que ces deux hommes sont impliqus dans le crime,
mais n'ont aucune preuve. L'un des policiers a eu alors une ide. Il dcide
de mettre les prisonniers dans des cellules spares et leur fait la
proposition suivante:Ils ont le choix entre dnoncer leur complice et passer
moins de temps en prison ou ils peuvent tous deux garder le silence.

13

Si aucun des prisonniers ne parle, la police n'aura aucune preuve et les


deux prisonniers iront en prison 1 an pour possession d'arme. Si l'un d'eux
parle et l'autre garde le silence, le mouchard sera libre et l'autre ira en
prison pour 10 ans. Si les deux prisonniers se dnoncent mutuellement,
alors ils iront en prison pour 8 ans (et non 10 ans, car ils auront aid la
justice tous les deux).
Nous pouvons prsenter ces informations sous forme de tableau :
P1 Silence

P1 Dnonce

P2 Silence

1,1

0,10

P2 Dnonce

10,0

8,8

Ce tableau s'appelle une matrice o nous voyons tous les


rsultats

possibles

pour

les

deux

"joueurs"

(les

prisonniers)

impliqus dans ce jeu. Le premier nombre est toujours le rsultat


pour le premier prisonnier (P1) et le nombre aprs la virgule est
le rsultat pour le second prisonnier (P2).
En analysant la situation dinterdpendance de chacun des
prisonniers, il est vident que pour eux, la meilleure solution est
davouer le crime en esprant que lautre niera. Il y a donc une
interdpendance comptitive ou il y aura un gagnant et un
perdant, sauf que si les deux prisonniers adoptent le mme
14

schma de rflexion alors ils se retrouvent dans une relation de


perdant- perdant.
Tout cela est un problme de confiance, que se portent les deux
prisonniers.
Mais sils identifient tout les deux quil y a une solution gagnantgagnant, il y aura donc une interdpendance cooprative.
Imaginons que nous soyons P1. Nous sommes assis dans
notre cellule, rflchissant ce qu'il faut faire. Nous ignorons ce
que fera P2 et nous n'avons aucun moyen de communiquer. Si
P2 nous dnonce, alors il est prfrable pour nous de le dnoncer
galement. Si P2, ne nous dnonce pas, alors notre meilleur choix
est aussi de le dnoncer. Dans les deux cas, peu importe ce que
choisit P2, le dnoncer vous permet de rduire le temps que
vous passerez en prison.
Pour P2, la situation est exactement la mme et il aura intrt
nous dnoncer pour les mmes raisons. Certes, P1 peut
penser : "Peut-tre que je ne devrais rien dire, si P2 fait de
mme, nous serons libres dans 1 an". Mais si P2 dcide de parler,
vous irez en prison pour 10 ans ! Avez-vous envie de prendre ce
risque ? En gnral, non.
Aussi, la fin du "jeu", les deux prisonniers coperont de 8
ans de prisons. Cette situation s'appelle l'quilibre de Nash,
15

d'aprs le nom du clbre mathmaticien John Forbes Nash.


Lorsque cet quilibre est atteint, aucun joueur ne peut ajuster sa
stratgie unilatralement pour en tirer profit. C'est exactement ce
qui se passe pour nos deux prisonniers. Imaginons que nous
soyons sur le point d'quilibre de Nash, les deux prisonniers se
dnoncent et vont en prison pour 8 ans. P1 peut changer sa
stratgie et garder le silence, mais il ira en prison pour 10 ans et
n'aura rien gagn. La situation est la mme pour P2. Aucun
changement

unilatral

de stratgie

ne

peut

profiter

ces

"joueurs".

V lquilibre de Nash
1. Equilibre de Nash en stratgie pure
Soit un jeu 2 joueurs avec un nombre fini de stratgies. Considrons
que chaque joueur :
optimise et poursuit son intrt individuel: la rationalit ;
choisit une stratgie une fois pour toutes, cest--dire que chaque
agent effectuait un seul choix et sy tenait: la stabilit.
La matrice des paiements suivante reprsente les paiements dont
bnficient les joueurs A et B pour chaque combinaison de stratgies
choisies.

16

Joueur A

Joueur B
gauche
haut
2, 1
bas
0, 0

droite
0, 0
1, 2

Quand B choisit gauche, les gains pour A sont 2 ou 0. Quand B choisit


droite, les gains pour A sont 0 ou 1. Cela signifie que quand B choisit
gauche, A prfre haut et quand B choisit droite, A prfre bas. Le choix
optimal de A dpend donc de ce quil croit que B fera.
La stratgie (haut, gauche) est un quilibre de Nash. En effet, si A choisit
haut, la meilleure chose que B puisse faire, cest choisir gauche puisque
son gain est 1 sil choisit gauche et 0 sil choisit droite.
Nous dirons quune paire de stratgies est un quilibre de Nash1 si le
choix de A (ou de B) est optimal compte tenu du choix de B(ou de A).
Une autre faon de dfinir un quilibre de Nash est une situation dont
personne na intrt dvier individuellement, sachant la stratgie de
lautre. Ne pas dvier individuellement veut dire que les individus font un
choix optimal qui maximise leur utilit compte tenu de la stratgie de
lautre. Lautre fait le mme raisonnement compte tenu de la stratgie du
premier joueur.
Exemple 1
Le concept dquilibre de Nash montre clairement quil sagit
simplement dune gnralisation de lquilibre de Cournot. Dans le cas de
lquilibre de Cournot, la variable de dcision est la quantit doutput
produite qui est une variable continue et chaque firme choisit loutput qui
maximise son profit compte tenu du choix de lautre firme.
1John F. Nash junior, n en 1928, a reu le prix Nobel en 1994 avec ReinhartSelten et
John Harsanyi pour la thorie des jeux non coopratifs.
17

En effet, lorsque le concurrent augmente sa production, la moins


mauvaise solution consiste, pour la firme, diminuer la sienne : ceci
limite la baisse du prix due la hausse de la production du concurrent,
sans ncessairement viter la diminution de la recette totale, et permet de
diminuer le cot de production.

Exemple 2
Lquilibre de Bertrand, galement est un quilibre de Nash avec des
stratgies en prix. Chaque firme choisit le prix qui maximise son profit,
compte tenu du choix quelle pense que lautre firme fera.

Limites de lquilibre de Nash en stratgie pure


Tout dabord, un jeu peut avoir plus quun quilibre de Nash. En fait,
les choix (bas, droite) correspondent galement un quilibre de
Nash.
Le second est que pour certains jeux, de tels quilibres nexistent pas.

2. Equilibre de Nash avec stratgie mixte

La notion dquilibre de Nash en stratgies pures suppose que chaque


joueur connat les stratgies des autres joueurs. Or, il existe des jeux o
chaque joueur a intrt cacher sa stratgie.
Par consquent, on admet que les agents peuvent choisir des
stratgies alatoires, cest--dire attribuer une probabilit chaque
choix et jouer ces choix sur la base de ces probabilits il sagit de
stratgies mixtes.

18

Exemple : Pierre Papier et ciseaux


Dans ce jeu, les deux joueurs annoncent leur choix parmi trois
possibilits : le poing (la pierre), la paume de la main(le papier) ou les
deux premiers doigts(les ciseaux).
Les rgles sont que la pierre brise les ciseaux, les ciseaux coupent le
papier et le papier enveloppe la pierre.
Le joueur J1 pourrait choisir de jouer pierre avec une probabilit de
1/3, papier avec 1/3 et ciseaux avec 1/3. De mme, le joueur J2: pourrait
choisir de jouer pierre avec une probabilit de 1/3, papier avec 1/3 et
ciseauxavec 1/3.

19

Conclusion

La thorie des jeux fournit un cadre d'analyse permettant


d'tudier les situations conflictuelles dans lesquelles les individus ou
les firmes sont en interaction. Lorsque peu de firmes dominent un
march ou bien lorsque des pays concluent un accord sur les
politiques commerciales, les agents concerns (individus, firmes,
tats) doivent prendre en compte les ractions des autres et
anticiper leurs propres dcisions. Il sagit alors d'analyser la
manire dont les agents coordonnent ou peuvent coordonner
leurs dcisions dans diffrentes configurations.

20

Bibliographie

Yildizoglu, Introduction la thorie des jeux, Dunod 2004.


Umbhaver,Thorie des jeux, Vuilbert 2004.
Rasmusen, Jeux et info, De Boeck 2004.
EMMANUELLE BENICOURT, BERNARD GUERRIEN: La
thorie
conomique
noclassique
:
microconomie,
macroconomie et thorie des jeux , dition la dcouverte,2008.
VARIAN, Hal R.(1996). Intermediate Microeconomics, 4 med.,
W. W. Norton and Company, New york/London.
21

http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux
http://www.cril.univartois.fr/~konieczny/enseignement/TheorieD
esJeux.pdf

22