7.IntroductionalaTheoriedesjeux versionknowledge

Année académique 2015 - 2016

Thomas Lanzi
SKEMA Business School

Introduction
Nos intérêts individuels sont-ils compatibles avec ceux
de la collectivité ?
La poursuite de nos motivations individuelles et de nos
désirs égoïstes engendrent-elles nécessairement des
situations collectivement optimales ?
Adam Smith avait-il tort ? Ou bien avait-il raison dans un
cadre bien défini ?

La réponse à ces questions implique de comprendre
précisément la distinction entre un équilibre et un
optimum collectif.
Imaginons deux firmes se faisant concurrence par les
prix. S’il existe une issue dans laquelle aucune des deux
firmes n’a intérêt à modifier son prix compte tenu du prix
pratiquer par son concurrent alors cette situation

constituera un équilibre, i.e une issue stable.
En revanche, il est possible que cette issue stable ne
soit pas celle préférée collectivement par les 2 firmes.

Comment comparer des « états économiques », des
issues ou des solutions possibles dans une interaction
stratégique ?
Le critère de Pareto
Considérons 2 agents A et B dont les gains sont
représentés par la fonction gi .
Une issue h est une issue strictement Pareto-dominé s’il
existe au moins une issue z telle que le gain de tout
agent i obtenu avec l’issue h est strictement inférieure à
celui procuré par l’issue z :
gi(h) < gi(z) pour tout i.

EXEMPLE

Issue
1

2
3
4

gA
10
20
8
7

gB
10
26
22
30

L’issue 1 est Pareto-dominée par l’issue 2 puisque gA(1) < gA(2) et gB(1) < gB(2).
L’issue 3 est Pareto-dominée par l’issue 2 puisque gA(3) < gA(2) et gB(3) < gB(2).
Les issues 1 et 3 ne peuvent pas être des optima de Pareto.


L’optimum de Pareto
Une issue est un optimum de Pareto:
-

si elle n’est pas Pareto-dominée et,

-

s’il n’existe aucune autre issue qui fait l’unanimité
auprès des agents, i.e si l’augmentation du gain d’un
agent se réalise au détriment du gain d’au moins un
autre agent.

Techniquement, deux issues h et z sont des optima de
Pareto si:
gi(h) > gi(z) et gj(h) < gj(z) avec i j

Comment sélectionner les optima de Pareto entre
eux ?
Construction des préférences collectives W :

-

Critère Utilitariste : le planificateur maximise la somme
des gains ou utilités individuelles. Ex: On sélectionne
l’issue 2 car W2 = 46 et W4 = 37.

-

Critère Egalitariste : le planificateur minimise l’écart entre
les gains ou utilités individuelles. Ex: On sélectionne
l’issue 2 car W2 = g2 = - 6 et W4 = g4 = - 23.

-

Critère Rawlsien : le planificateur maximise le gain ou
l’utilité de l’agent le plus défavorisé.
Ex: l’agent A est le plus défavorisé car gA(2) < gB(2) et
gA(4) < gB(4). On retient l’issue 2 car gA(2) = 20 et gA(4)
= 7.


Les conséquences du raisonnement stratégique au
travers de quelques exemples:
« Le dilemme du prisonnier »
Considérons l’histoire suivante:
« 2 individus A et B sont interrogés séparément après
avoir réalisés conjointement une attaque de banque.
Chacun dispose de deux actions possibles. La première
consiste à coopérer avec son camarade et nier alors que
la seconde consiste à avouer l’attaque et lâcher son
camarade. »

Représentation du jeu sous forme normale
Jeu simultané
B

A

Nier

Avouer


Nier

(-1 ; -1)

(-10 ; 0)

Avouer

(0 ; -10)

(-8 ; -8)

Quelle est l’issue de cette interaction ?

B

A

Nier


Avouer

Nier

(-1 ; -1)

(-10 ; 0)

Avouer

(0 ; -10)

(-8 ; -8)

Avouer est une stratégie strictement dominante pour
chacun des joueurs, ils ont donc tous les 2 intérêts à
jouer cette dernière.
Solution : (Avouer ; Avouer)
Cette solution est unique mais ne constitue pas l’issue la

plus favorable aux deux individus.

Une des principales moralités du dilemme du prisonnier
est que les interactions stratégiques entre des agents
économiques rationnels peuvent rendre le résultat
collectif inefficace.
Comment s’engager sur une solution efficace ?
Dans cette exemple, coopérer n’est pas crédible.
Nécessité de contrats pour réguler les défaillances de
marché liées aux comportements stratégiques.

Exemple en science politique: « le vote stratégique »
Une commission de 3 personnes (A, B et
C) doit choisir un projet de texte de loi
parmi 3 versions possibles: a, b et c.

A

B


C

Règle de vote: 1er tour - Majorité sans
abstention entre b et c. 2nd tour - Majorité
sans abstention entre le 1er vainqueur et
a.

a

b

c

b

a

b

Si le vote est naïf, alors b l’emporte au 1er

et 2nd tour.
Si A est stratégique, il votera pour c au
1er tour pour éliminer le projet b et faire
gagner le projet a au 2nd tour.

c

c

a

Eléments de bases des jeux non coopératifs
Description d’un jeu


Représentation formelle d’une situation dans
laquelle un certain nombre d’individus « rationnels »
doivent prendre des décisions qui les affectent
mutuellement.




Les décisions sont stratégiques et dépendent des
anticipations sur les actions des autres.



Différence entre la théorie des jeux et la théorie de
la décision (ex. de l’addition au restaurant).

Eléments d’un jeu
a) les joueurs
b) le rôle du hasard (ou « nature »)
c) les règles du jeu:
- qui joue quand ?
- quelle information ont les joueurs lorsqu’ils jouent ?
- que peuvent faire les joueurs lorsque c’est leur tour de
jouer ( « stratégies »)
d) les résultats (pour chaque ensemble possible
d’actions des joueurs et de la nature, quel est le résultat
du jeu ?
e) les utilités (préférences des joueurs sur les résultats
possibles)

Nature des interactions
Jeux à somme nulle



Les intérêts des joueurs sont diamétralement opposés.
Situation de pur conflit car ce qui est perdu par l’un est
gagné par l’autre.

Jeux de coordination




Les intérêts des joueurs sont alignés.
Problèmes de multiplicité d’équilibres.
Introduction de concept de raffinement d’équilibres.

Types de jeux
Les jeux simultanés




Les actions sont retenues simultanément et par
définition on n’observe jamais le choix des autres
joueurs.
Anticipation des stratégies des autres joueurs.
Les jeux séquentiels
Les choix sont séquentiels et selon l’hypothèse faite sur
l’information les actions sont observées ou non par les
autres joueurs.

Deux types de représentations
Forme normale








Forme condensée d’un jeu où apparaît directement les
stratégies de chaque joueurs et les résultats
conditionnels.
Représentation des jeux simultanés et séquentiels.
Forme extensive
Représentation sous la forme d’un arbre où les choix
sont séquentiels. Les arbres se caractérisent par des
branches et des nœuds.
Représentation des jeux séquentiels.

Exemple : Un jeu d’entente
Deux firmes A et B en concurrence.


Règles du jeu : chaque firme choisit soit une stratégie de
«concurrence» ou d’«entente».



Logique du Dilemme du prisonnier



Selon les règles du jeu, les résultats peuvent être
différents.

Version 1
• les choix sont simultanés
• Représentation sous forme normal
Firme B

Firme A

Concurrence

Entente

Concurrence

(2;2)

(15;0)

Entente

(0;15)

(10;10)

Version 2



Les choix sont séquentiels en information parfaite
Forme extensive des jeux
A
Concurrence

Entente

B
Concurrence

(2 ; 2)

B
Entente Concurrence

(15 ; 0) (0 ; 15)

Jeu avec 3 nœuds de décision et 6 branches

Entente

(10 ; 10)

Le concept de stratégie d’un joueur
Une stratégie n’est pas une action mais une règle de
décision qui spécifie le choix du joueur dans toutes les
circonstances dans lesquelles il pourrait avoir à choisir
une action.
Elle constitue une planification du choix de ses actions à
chacun de ses ensembles d’information.
L’ensemble des stratégies est donc défini avant que le
jeu commence et peut s’apparenter à un livre
d’instructions permettant de déléguer ses choix.

L’écriture des stratégies constitue l’étape la plus
importante dans la résolution du jeu.
La résolution d’un jeu consiste à déterminer les
stratégies optimales de chaque joueur compte tenu des
anticipations faites sur les choix de tous les joueurs.
Un équilibre en théorie des jeux s’apparente donc à un
ensemble de profil de stratégies mutuellement
compatible avec un critère donné.
Un jeu peut comporter un, plusieurs ou aucun équilibre.

La recherche d’équilibres
Stratégies dominantes et dominées
Une stratégie Si est strictement (resp. faiblement)
dominante pour le joueur i si, quoi que fassent les autres
joueurs, Si lui procure un gain supérieur (resp. supérieur
ou égal) à toute autre stratégie.
Une stratégie Si est strictement (resp. faiblement)
dominée pour le joueur i s’il existe une stratégie S’i qui,
quoi que fassent les autres joueurs, lui procure un gain
supérieur (resp. supérieur ou égal) à celle de Si.

Exemples:
Peugeot

Renault

Prix bas

Prix élevé

Prix bas

(300 ; 300)

(700 ; 100)

Prix élevé

(100 ; 700)

(500 ; 500)

« Prix bas » est une stratégie dominante pour les deux
firmes.

Joueur 2
G

D

H

(1 ; -1)

(-1 ; 1)

M

(-1 ; 1)

(1 ; -1)

B

(-2 ; 5)

(-3 ; 2)

Joueur 1

Pas de stratégies dominantes mais, pour le joueur 1, la stratégie B est
strictement dominée par H et M

Joueur 2
G

D

H

(5 ; 1)

(4 ; 0)

M

(6 ; 0)

(3 ; 1)

B

(6 ; 4)

(4 ; 4)

Joueur 1

Pour le joueur 1, les stratégies H et M sont faiblement dominées par la
stratégie B, qui est donc faiblement dominante.

Equilibre de Nash
Couple de stratégies qui constitue un ensemble de
meilleurs réponses (pas de déviations mutuellement
avantageuses).
Deux joueurs: 1 et 2 ayant tous deux les mêmes
stratégies soit haut "H" ou bas "B".

Joueur 2

Joueur 1

H

B

H

(a ; b)

(c ; d)

B

(e ; f)

(g ; h)

On dira que par exemple (H,H) est un équilibre de Nash si :
MR1(H) = H, i.e la MR de J1 quand J2 joue H est H (a > e)
MR2(H) = H, i.e la MR de J2 quand J1 joue H est H (b > d)
Equilibre de Nash en stratégies pures car les stratégies H et B sont
déterministes.

Exemples:
Joueur 2

Joueur 1

G

M

D

H

(5 ; 3)

(0 ; 4)

(3 ; 5)

M

(4 ; 0)

(5 ; 5)

(4 ; 0)

B

(3 ; 5)

(0 ; 4)

(5 ; 3)

(M ; M) est un équilibre de Nash en stratégies pures

Choix technologiques : JVC vs Sony
Conquête du marché mondial des magnétoscopes.
Problématique liée à un programme d’investissement dans des nouvelles
technologies incompatibles entre elles (VHS pour JVC et BETAMAX pour
SONY).
SONY

JVC

VHS

BETAMAX

VHS

(3 ; 4)

(1 ; 2)

BETAMAX

(0 ; 0)

(2 ; 5)

2 équilibres de Nash (VHS ; VHS) et (BETAMAX ; BETAMAX)

Pendant presque 10 ans, les deux entreprises se sont neutralisées.
Cependant JVC préparait la victoire VHS en partageant la
production de cette technologie avec d’autres entreprises
d’électroniques - RCA aux Etats-Unis, Thorn-EMI en GB, Thomson
en France, AEG en Allemagne.... et obtenant ainsi une diminution
significative des coûts de production. La matrice des gains s’est
transformée 10 ans plus tard de la manière suivante:
SONY

JVC et alliés

VHS

BETAMAX

VHS

(12 ; 3)

(10 ; 1)

BETAMAX

(0 ; 0)

(3 ; 3)

VHS est ainsi devenue une stratégie dominante pour JVC et ses
alliés et SONY ne pouvait que s’aligner, ce qui a été le cas en 1988.

Dynamique séquentielle et notion de menace
Comme les joueurs jouent les uns après les autres, ils
peuvent introduire dans leurs stratégies la notion de
menace.
On dira que les menaces peuvent être crédible ou non
crédible.
Une menace consiste à retenir une décision
contraignante pour un joueur (une punition) si ce dernier
retient une décision donnée.
Applications : dynamique de l’innovation, politique
monétaire des banques centrales …

Joueur 1

Joueur 2
(4 ; 1)

h

H

N2
b

N1

(-5 ; 0)
h

B

(2 ; 2)

N3

b

(0 ; 0)

Joueur 1

Joueur 2
h

(4 ; 1)

b

(-5 ; 0)

N2

H
N1
B

h

(2 ; 2)

b

(0 ; 0)

N3

Joueur 2

Joueur 1

(h ; h)

(h ; b)

(b ; b)

(b ; h)

H

(4 ; 1)

(4 ; 1)

(-5 ; 0)

(-5 ; 0)

B

(2 ; 2)

(0 ; 0)

(0 ; 0)

(2 ; 2)

Joueur 2

Joueur 1

(h ; h)

(h ; b)

(b ; b)

(b ; h)

H

(4 ; 1)

(4 ; 1)

(-5 ; 0)

(-5 ; 0)

B

(2 ; 2)

(0 ; 0)

(0 ; 0)

(2 ; 2)

Equilibres de Nash :
E1 = ( H ; (h ; h))
E2 = ( H ; (h ; b))
E3 = ( B ; (b ; h))

Joueur 1

Joueur 2

H

E1 = ( H ; (h ; h))
E2 = ( H ; (h ; b))
E3 = ( B ; (b ; h))

(4 ; 1)

b

(-5 ; 0)

N2

N1
B

h

h

(2 ; 2)

b

(0 ; 0)

N3

Menace crédible
Menace non crédible

Une stratégie repose sur une menace non crédible s’il
existe au moins une action qui la compose qui ne
constitue pas une meilleure réponse en un nœud de
l’arbre de décision.
On peut donc proposer un raffinement de l’équilibre de
Nash qui consiste à éliminer les équilibres reposant sur
des menaces non crédibles.
Equilibre Parfait : Equilibre de Nash qui impose une
logique de meilleure réponse pour tous les nœuds de
l’arbre de décision (ou pour tous les sous jeux).

Induction vers l’amont
Joueur 1

Joueur 2
(4 ; 1)

h

H

N2
b

N1

(-5 ; 0)
h

B

(2 ; 2)

N3

b
Equilibre Parfait : E1 = ( H ; (h ; h))

(0 ; 0)

Application au problème de l’innovation
Firme 1 : Entreprise innovante et a le choix entre
développer deux types de technologies, la technologie 1
(T1) qui est plus innovante et plus coûteuse que la
technologie 2 (T2).
Firme 2 : Entreprise non innovante mais avec la capacité
de copier (C) ou non (NC) les technologies de la firme 1.
On suppose que la technologie 1 est très coûteuse à
imiter. Dans ce cas, le seul intérêt pour la firme 2 à
proposer une copie de la technologie 1 est d’éliminer la
firme 1 du marché.

Le jeu se déroule de la manière suivante :
La firme 1 choisit la technologie 1 ou 2 et la firme 2
décide de la copier ou non.
On suppose que si la firme 1 choisit la technologie 1 et
quelle est copiée par la firme 2, alors la firme 1 est
éliminée du marché.
Si c’est la technologie 2 qui est retenue et quelle est
copiée par la firme 2 alors les deux firmes se partagent
le marché.

Firme 1

Firme 2
C

T1

N2
NC

N1

C
T2

(-1 ; 1)

(10 ; 2)
(3 ; 3)

N3

NC

(5 ; 2)

Firme 1

Firme 2
C

(-1 ; 1)

NC

(10 ; 2)

N2

T1
N1
T2

C

(3 ; 3)

NC

(5 ; 2)

N3

Firme 2

Firme 1

(C ; C)

(C ; NC)

(NC ; NC)

(NC ; C)

T1

(-1 ; 1)

(-1 ; 1)

(10 ; 2)

(10 ; 2)

T2

(3 ; 3)

(5 ; 2)

(5 ; 2)

(3 ; 3)

Firme 2

Firme 1

(C ; C)

(C ; NC)

(NC ; NC)

(NC ; C)

T1

(-1 ; 1)

(-1 ; 1)

(10 ; 2)

(10 ; 2)

T2

(3 ; 3)

(5 ; 2)

(5 ; 2)

(3 ; 3)

Equilibres de Nash
E1 = (T1 ; (NC ; NC))
E2 = (T1 ; (NC ; C))
E3 = (T2 ; (C ; C))

Firme 1

Firme 2

T1

(-1 ; 1)

NC

(10 ; 2)

N2

N1
T2

C

C

(3 ; 3)

NC

(5 ; 2)

N3

Equilibres de Nash
E1 = (T1 ; (NC ; NC))

Menace non crédible

E2 = (T1 ; (NC ; C))

Menaces crédibles

E3 = (T2 ; (C ; C))

Menace non crédible

Induction vers l’amont
Firme 1

Firme 2
C

T1

N2
NC

N1

C
T2

(-1 ; 1)

(10 ; 2)
(3 ; 3)

N3

NC
Equilibre parfait : E2 = (T1 ; (NC ; C))

(5 ; 2)

Application à une chaîne de montage

Déterminer l’équilibre parfait.