LES GRANDS CONCEPTS

La théorie des jeux

Où l'on se demande comment faire le bon choix si les autres en font de mauvais.

Commencer

8 questions

Vous êtes malhonnête.

...

Allons, ce n’est qu'une hypothèse !

Vous venez d’être arrêté(e) avec un(e) complice. Heureusement pour vous, la police n’a pas un dossier très solide. Elle a donc besoin de vos témoignages respectifs pour vous inculper.

L’inspecteur vous place, vous et votre complice, dans deux cellules séparées. Et il propose à chacun un marché :

  • Si vous dénoncez votre complice et qu’il ne vous dénonce pas, vous serez libéré, lui prendra 10 ans ;
  • Si vous vous dénoncez mutuellement, vous prendrez 5 ans chacun.

Si vous vous taisez tous les deux, vous savez par ailleurs que l'inspecteur ne pourra vous mettre sur le dos que de menus larcins et vous ne serez condamnés qu’à un an de prison chacun.

PRÉCEDENT

SUIVANT

QUESTION 1/8

Que faites-vous ?

PRÉCÉDENT

dilemme du prisonnier

Voici comment les participants ont répondu.

Ce choix est-il rationnel ?

PRÉCEDENT

SUIVANT

Analysons la situation :

  • Soit votre complice décide de vous dénoncer. Vous risquez alors 10 ans si vous vous taisez, seulement 5 ans si vous choisissez de le dénoncer également ;
  • Soit votre complice décide de se taire. Vous risquez alors 1 an si vous vous taisez également, mais repartez libre si vous le dénoncez.

Ainsi, quelque soit le comportement adopté par votre complice, vous vous en sortez mieux en le dénonçant.

PRÉCEDENT

SUIVANT

PRÉCEDENT

SUIVANT

Bien entendu il n'y a pas de bonne ou de mauvaise réponse à ce problème. Vous ne pouvez pas savoir à l'avance ce que votre complice décidera de faire (et pourriez vouloir faire entrer d'autres critères, comme la moralité par exemple !).

Notons que le Dilemme du prisonnier est un "jeu à un coup". Si vous trahissez votre complice, celui-ci n'aura pas l'occasion de se venger. Mais dans d'autres situations, la personne qui trahit pourrait avoir à rendre des comptes !

C'est ce que nous verrons dans la suite de ce questionnaire.

PRÉCEDENT

SUIVANT

QUESTION 2/8

Qu’étudie la théorie des Jeux ?

PRÉCÉDENT

Bonne réponse !

Qu’étudie la théorie des Jeux ?

La prise de décision dans un contexte d’interdépendance

PRÉCEDENT

SUIVANT

Oups !

Qu’étudie la théorie des Jeux ?

La prise de décision dans un contexte d’interdépendance

PRÉCEDENT

SUIVANT

THÉORIE DES JEUX

La théorie des jeux porte sur la prise de décision stratégique dans un environnement incertain. En d'autres termes elle adresse la question :

Quel comportement adopter lorsque le résultat de nos actions dépend aussi des décisions d'autres parties ?

Elle s'applique à de nombreux domaines, tels que l'économie, la politique, la sociologie, la biologie, l'informatique, etc.

PRÉCEDENT

SUIVANT

Un concept clé dans la théorie des jeux, est le moment où aucun des joueurs n'a intérêt à modifier sa stratégie.

PRÉCEDENT

SUIVANT

QUESTION 3/8

Comment s’appelle ce point d’équilibre ?

PRÉCÉDENT

Bonne réponse !

Comment s’appelle ce point d’équilibre ?

L’équilibre de Nash

PRÉCEDENT

SUIVANT

Oups !

Comment s’appelle ce point d’équilibre ?

L’équilibre de Nash

PRÉCEDENT

SUIVANT

ÉQUILIBRE DE NASH

Nash est le célèbre mathématicien qui a théorisé ce concept dans les années 1950.

L'équilibre de Nash représente la situation où aucun joueur n'a intérêt à modifier sa stratégie unilatéralement.

Dans le dilemme du prisonnier, l'équilibre de Nash est atteint lorsque les deux prisonniers se rendent individuellement compte qu'ils ont intérêt à dénoncer leur complice.

PRÉCEDENT

SUIVANT

L'équilibre de Nash permet ainsi de prédire le comportement de joueurs rationnels devant un choix stratégique.

Il s'applique en particulier aux situations de jeu répété, c'est à dire lorsque des comportements passés peuvent influencer une décision présente.

Les interactions sociales sont un exemple d'équilibre de Nash : si tout le monde respecte un code de courtoisie, en théorie personne n'a intérêt à le briser.

De manière plus élaborée, on retrouve l'équilibre de Nash dans les situations d'entente commerciale : même si elle souhaite augmenter ses résultats, aucune des entreprises n'a intérêt à baisser ses prix (en espérant gagner des parts de marché), car elle risquerait de lancer une guerre des prix qui lui serait finalement préjudiciable (ainsi qu'autres autres entreprises).

PRÉCEDENT

SUIVANT

Russel Crow-oit avoir trouvé la solution 
(Un homme d'exception, 2001, raconte la vie de John Nash)

PRÉCEDENT

SUIVANT

Il est temps d'introduire la fascinante l'expérience réalisée par le professeur de sciences politiques Robert Axelrod dans les années 1980.

Le principe est le suivant :

  • Deux joueurs s'affrontent dans une partie comprenant 200 manches ;
  • À chaque manche, les deux joueurs doivent décider, chacun de leur côté, de placer ou non une pièce dans une machine ;
  • Les manches sont successives, ainsi chaque joueur connait le comportement de l'autre joueur lors de la manche précédente.
  • Le gagnant de la partie est celui qui a récolté le plus de points à l'issue de la 200e manche.

PRÉCEDENT

SUIVANT

Voici comment sont comptés les points :

  • si les deux joueurs placent une pièce dans la machine, ils recoivent chacun 3 pièces ;
  • si aucun joueur ne place de pièce dans la machine, ils recoivent une pièce chacun ;
  • si un joueur place une pièce dans la machine mais pas l'autre, le premier joueur ne reçoit rien, l'autre reçoit 5 pièces.

PRÉCEDENT

SUIVANT

PRÉCEDENT

SUIVANT

Axelrod crée une compétition entre des programmes informatiques ayant chacun leur propre stratégie de jeu.

Chaque programme joue contre chacun des autres programmes. La compétition sera remportée par le programme qui totalisera le maximum de point cumulés sur l'ensemble des matches.

PRÉCEDENT

SUIVANT

15 programmes participèrent à cette expérience.

Par simplification, nous n'en retiendrons que 5 :

  1. Gentil : il collabore à chaque tour, mettant donc systématiquement une pièce dans la machine ;
  2. Méchant : il "triche" à chaque tour, ne mettant jamais de pièce ;
  3. Rancunier : il commence par collaborer, mais dès lors que l'adversaire triche une fois, il arrêtera de collaborer jusqu'à la fin de la partie ;
  4. Donnant-donnant : il commence par collaborer, puis aux tours suivants il adopte le comportement pris par son adversaire au tour précédent ;
  5. Random : il adopte un comportement aléatoire à chaque tour.

PRÉCEDENT

SUIVANT

QUESTION 4/8

Quelle est la performance prévisible de Méchant ?

PRÉCÉDENT

Bonne réponse !

Quelle est la performance prévisible de Méchant ?

Il ne va perdre aucune partie

PRÉCEDENT

SUIVANT

Oups !

Quelle est la performance prévisible de Méchant ?

Il ne va perdre aucune partie

PRÉCEDENT

SUIVANT

expérience d'axelrod

Méchant ne peut pas perdre la moindre manche !

Puisqu'il est programmé pour ne jamais collaborer :

  • soit son adversaire collabore, et Méchant remporte 5 pièces de plus que son adversaire ;
  • soit son adversaire ne collabore pas et lui et Méchant font nul (1 pièce chacun).

PRÉCEDENT

SUIVANT

QUESTION 5/8

Quel joueur a finalement remporté la compétition ?

PRÉCÉDENT

Bonne réponse !

Quel joueur a finalement remporté la compétition ?

Donnant-donnant

PRÉCEDENT

SUIVANT

Oups !

Quel joueur a finalement remporté la compétition ?

Donnant-donnant

PRÉCEDENT

SUIVANT

EXPÉRIENCE D'AXELROD

Ce résultat peut sembler surprenant. En effet, Donnant-donnant n'a pas remporté le moindre match !

Au premier tour, Donnant-donnant coopère. Il fait donc nul au mieux (et il perd si son adversaire ne collabore pas).

Sur les tours suivants, puisque Donnant donnant a toujours une stratégie de rééquilibrage par rapport au comportement précédent de son adversaire.

Sur une série de 2 manches, il ne pourra ainsi faire mieux que maintenir un équilibre de gain avec son adversaire.

Ce qui permet à Donnant donnant de remporter le tournoi, c'est qu'il maximise son score à chaque partie. Pour le classement final, il est souvent plus intéressant de perdre 199 à 200, que de gagner 100 à 90 !

PRÉCEDENT

SUIVANT

Par la suite, Axelrod réalisa de nouvelles expériences en ajoutant de nombreux programmes développant chacun une stratégie spécifique. ‍

Aucune stratégie ne parvint à gagner dans toutes les configurations.

Axelrod en tira néanmoins 4 principes généraux.

PRÉCEDENT

SUIVANT

QUESTION 6/8

Parmi les propositions suivantes, laquelle n'est pas caractéristique des stratégies les plus efficaces ?

PRÉCÉDENT

Bonne réponse !

Parmi les propositions suivantes, laquelle n'est pas caractéristique des stratégies les plus efficaces ?

Elles sont agressives

PRÉCEDENT

SUIVANT

Oups !

Parmi les propositions suivantes, laquelle n'est pas caractéristique des stratégies les plus efficaces ?

Elles sont agressives

PRÉCEDENT

SUIVANT

STRATÉGIES GAGNANTES

Les stratégies gagnantes font le choix initial de la coopération.

Dans la première expérience, 8 stratégies ne trahissaient pas avant d'être trahies, 7 étaient capables de trahir en premier. Les 8 stratégies collaboratives finirent aux 8 premières places. Cela se confirma de manière nette lors des expériences ultérieures.

Elles intègrent également un principe de réciprocité - si elles sont trahies, elles réagissent (soit immédiatement, comme Donnant donnant, soit quelques coups plus tard dans certaines stratégies).

Elles prévoient néanmoins une forme de « pardon », c'est à dire qu'elles ne s'enferment pas dans un schéma délétère de trahison continue.

Enfin, elles sont lisibles. Les stratégies trop complexes ne permettent pas l'instauration d'une forme de confiance.

PRÉCEDENT

SUIVANT

QUESTION 7/8

Parmi les propositions suivantes, laquelle n'est pas une application pratique de la théorie des jeux ?

PRÉCÉDENT

Bonne réponse !

Parmi les propositions suivantes, laquelle n'est pas une application pratique de la théorie des jeux ?

Coordination des feux de circulation

PRÉCEDENT

SUIVANT

Oups !

Parmi les propositions suivantes, laquelle n'est pas une application pratique de la théorie des jeux ?

Coordination des feux de circulation

PRÉCEDENT

SUIVANT

APPLICATIONS PRATIQUES

La dissuasion nucléaire est une stratégie militaire qui consiste à menacer de riposter à une attaque nucléaire par une attaque nucléaire encore plus puissante. Cette stratégie repose sur l'équilibre de la terreur, c'est-à-dire sur la peur mutuelle que les deux parties ont de subir une attaque nucléaire.

La dissuasion nucléaire est un équilibre de Nash non coopératif, où aucune des deux parties n'a intérêt à attaquer l'autre.

PRÉCEDENT

SUIVANT

Dans une négociation, chacun peut-être tenté de maximiser son gain, mais ne doit pas risquer de rompre la discussion.

On la résume parfois au jeu de l'ultimatum :

  • Une personne se voit attribuer une somme d'argent ;
  • Elle doit décider quelle part elle garde pour elle, et quelle part elle attribue à une seconde personne ;
  • La seconde personne doit décider si elle accepte ou refuse l'offre. Si elle refuse, aucun des deux individus ne reçoit d'argent.

PRÉCEDENT

SUIVANT

Dans les systèmes d’enchères, que l’on retrouve par exemple dans l’attribution des licences de téléphonie mobile, chaque entreprise doit formuler une offre qui sera suffisamment compétitive pour remporter le contrat, tout en lui permettant de maximiser ses profits.

C’est le principe du minimax : minimiser le risque de perte (du marché), maximiser le potentiel de gain.

PRÉCEDENT

SUIVANT

QUESTION 8/8

Parmi les propositions suivantes, laquelle ne constitue pas une limite à l'application de la théorie des jeux ?

PRÉCÉDENT

Bonne réponse !

Parmi les propositions suivantes, laquelle ne constitue pas une limite à l'application pratique de la théorie des jeux ?

Les mauvais perdants

PRÉCEDENT

SUIVANT

Oups !

Parmi les propositions suivantes, laquelle ne constitue pas une limite à l'application pratique de la théorie des jeux ?

Les mauvais perdants

PRÉCEDENT

SUIVANT

LIMITES

La principale objection porte sur la rationalité supposée des acteurs du jeu. En théorie, chacun choisit ainsi la meilleure stratégie possible compte tenu des informations à sa disposition. Mais en pratique, la rationalité est altérée par l’émotion, l’ambiguïté, l’incertitude, etc. Les joueurs adoptent souvent des comportements irrationnels.

Les hypothèses simplificatrices sont également l’une des limites admises.

En pratique, les règles du jeu ne sont jamais aussi claires que dans le dilemme du prisonnier par exemple. Les interactions sont multiples, le nombre d’acteurs souvent indéfini, les conséquences moins binaires, etc.

Le bruit désigne tous les éléments susceptibles de brouiller la lecture du jeu et des stratégies des autres joueurs.

Par exemple, si un joueur souhaite coopérer mais commet une maladresse, laissant croire à l'autre qu'il a essayé de le trahir. Ce dernier va probablement adapter son comportement en fonction de cet élément fortuit. Le jeu prend une tournure très différente.

PRÉCEDENT

SUIVANT

Saisissez votre email si vous souhaitez enregistrer votre activité. 

Polaris vous proposera bientôt une interface personnalisée qui vous permettra de suivre vos progrès et analyser votre profil de connaissances.

PRÉCÉDENT

Votre score est de

@[score]

%

Moyenne des participants : -

Félicitations ! Vous êtes maintenant familier avec les notions suivantes :

Dilemme du prisonnier

Objet de la théorie des jeux

Équilibre de Nash

Expérience d'Axelrod

Stratégies gagnantes en théorie des jeux

Applications pratiques

Limites d'application pratique

Vous devez impérativement essayer le jeu The Evolution of trust, qui permet de simuler l'expérience de coopération à grande échelle. Très amusant. 

Merci pour votre participation !
Oups ! Quelque chose s'est mal passé ...