Le dilemme du prisonnier, l’une des plus célèbres théories du jeu, a été conceptualisé par Merrill Flood et Melvin Dresher à la Rand Corporation en 1950. Il a ensuite été formalisé et nommé par le mathématicien de Princeton, Albert William Tucker.
Le dilemme du prisonnier fournit essentiellement un cadre permettant de comprendre comment trouver un équilibre entre coopération et compétition et constitue un outil utile pour la prise de décision stratégique.
Par conséquent, il trouve une application dans divers domaines allant des affaires, de la finance, de l’économie et des sciences politiques à la philosophie, la psychologie, la biologie et la sociologie.
Points clés à retenir
- Le dilemme du prisonnier décrit une situation où, selon la théorie des jeux, deux joueurs agissant stratégiquement vont finalement aboutir à un choix sous-optimal pour les deux.
- En affaires, comprendre la structure de certaines décisions en tant que dilemme du prisonnier peut aboutir à des résultats plus favorables.
- Cette configuration permet d’équilibrer à la fois la concurrence et la coopération pour un bénéfice mutuel.
Les bases du dilemme du prisonnier
Le scénario du dilemme du prisonnier fonctionne comme suit : Deux suspects ont été appréhendés pour un crime et se trouvent maintenant dans des pièces séparées dans un commissariat de police, sans aucun moyen de communiquer entre eux. Le procureur leur a dit séparément ce qui suit :
- Si vous avouez et acceptez de témoigner contre l’autre suspect, qui n’avoue pas, les charges retenues contre vous seront abandonnées et vous serez libéré.
- Si vous n’avouez pas mais que l’autre suspect le fait, vous serez condamné et le ministère public demandera la peine maximale de trois ans.
- Si vous avouez tous les deux, vous serez tous deux condamnés à deux ans de prison.
- Si aucun de vous n’avoue, vous serez tous deux accusés de délits et condamnés à un an de prison.
Que doivent faire les suspects ? C’est l’essence même du dilemme du prisonnier.
Évaluer la meilleure ligne de conduite
Commençons par construire une matrice des gains comme indiqué dans le tableau ci-dessous. Le « gain » est indiqué ici en termes de durée de la peine d’emprisonnement (symbolisée par le signe négatif ; plus le chiffre est élevé, mieux c’est). Les termes « coopérer » et « défaut » font référence aux suspects qui coopèrent entre eux (par exemple, si aucun d’entre eux n’avoue) ou qui font défaut (c’est-à-dire qui ne coopèrent pas avec l’autre joueur, ce qui est le cas lorsqu’un suspect avoue, mais que l’autre ne le fait pas). Le premier chiffre des cellules (a) à (d) indique le gain pour le suspect A, tandis que le deuxième chiffre l’indique pour le suspect B.
Le dilemme du prisonnier – Matrice des gains |
Suspect B | ||
Coopérer | Défaut | ||
Suspect A | Coopérer | (a) -1, -1 | (c) -3, 0 |
Défaut | (b) 0, -3 | (d) -2, -2 |
La stratégie dominante pour un joueur est celle qui produit le meilleur rendement pour ce joueur, indépendamment des stratégies employées par les autres joueurs. La stratégie dominante ici est que chaque joueur fasse défection (c’est-à-dire avoue), car avouer minimiserait la durée moyenne du séjour en prison. Voici les résultats possibles :
- Si A et B coopèrent et restent maman, tous deux sont condamnés à un an de prison – comme indiqué dans la cellule (a).
- Si A avoue mais que B ne le fait pas, A est libéré et B est condamné à trois ans de prison – comme indiqué dans la cellule (b).
- Si A n’avoue pas mais que B avoue, A est condamné à trois ans de prison et B est libéré – voir la cellule (c).
- Si A et B avouent tous deux, ils sont condamnés à deux ans de prison, comme le montre la cellule (d).
Donc si A avoue, soit il est libéré, soit il est condamné à deux ans de prison. Mais s’il n’avoue pas, il est condamné à un an ou trois ans de prison. B est confronté exactement au même dilemme. Il est clair que la meilleure stratégie est d’avouer, indépendamment de ce que fait l’autre suspect.
Implications du dilemme du prisonnier
Le dilemme du prisonnier montre avec élégance que lorsque chacun poursuit son propre intérêt, le résultat est pire que s’ils avaient tous deux coopéré. Dans l’exemple ci-dessus, la coopération – dans laquelle A et B gardent tous deux le silence et n’avouent pas – permettrait aux deux suspects de se voir infliger une peine de prison totale de deux ans. Tous les autres résultats donneraient lieu à une peine combinée de trois ou quatre ans.
En réalité, une personne rationnelle qui n’est intéressée que par l’obtention d’un maximum d’avantages pour elle-même préférerait généralement faire défection plutôt que de coopérer. Si tous deux choisissent de faire défection en supposant que l’autre ne le fera pas, au lieu de se retrouver dans la cellule (b) ou (c) – comme chacun d’entre eux l’espérait – ils se retrouveraient dans la cellule (d) et gagneraient chacun deux ans de prison.
Dans l’exemple du prisonnier, coopérer avec l’autre suspect entraîne inévitablement une peine d’un an, alors qu’avouer entraînerait dans le meilleur des cas la libération, ou au pire une peine de deux ans. Toutefois, ne pas avouer comporte le risque de se voir infliger la peine maximale de trois ans, si la confiance de A, par exemple, dans le fait que B restera également maman s’avère déplacée et que B avoue effectivement (et vice versa).
Ce dilemme, où l’incitation à la défection (et non à la coopération) est si forte même si la coopération peut donner les meilleurs résultats, se joue de nombreuses manières dans les affaires et l’économie, comme nous le verrons plus loin.
Demandes aux entreprises
Un exemple classique du dilemme du prisonnier dans le monde réel est rencontré lorsque deux concurrents s’affrontent sur le marché. Souvent, de nombreux secteurs de l’économie ont deux principaux rivaux. Aux États-Unis, par exemple, il existe une rivalité féroce entre Coca-Cola (KO) et PepsiCo (PEP) pour les boissons non alcoolisées et Home Depot (HD) contre Lowe’s (LOW) pour les matériaux de construction. Cette concurrence a donné lieu à de nombreuses études de cas dans les écoles de commerce. Parmi les autres rivalités féroces, citons Starbucks (SBUX) contre Tim Horton’s (THI) au Canada et Apple (AAPL) contre Samsung dans le secteur mondial de la téléphonie mobile.
Prenons le cas de Coca-Cola contre PepsiCo, et supposons que le premier envisage de réduire le prix de son soda emblématique. Si elle le fait, Pepsi n’aura peut-être pas d’autre choix que de suivre le mouvement pour que son cola conserve sa part de marché. Cela pourrait entraîner une baisse significative des bénéfices pour les deux entreprises.
Une baisse de prix de la part de l’une ou l’autre des entreprises peut donc être interprétée comme une défection puisqu’elle rompt un accord implicite visant à maintenir des prix élevés et à maximiser les bénéfices. Ainsi, si Coca-Cola baisse son prix mais que Pepsi continue à maintenir des prix élevés, la première fait défection, tandis que la seconde coopère (en s’en tenant à l’esprit de l’accord implicite). Dans ce scénario, Coca-Cola peut gagner des parts de marché et réaliser des bénéfices supplémentaires en vendant plus de colas.
Matrice des gains
Supposons que les bénéfices supplémentaires qui reviennent à Coca-Cola et Pepsi sont les suivants :
- Si les deux maintiennent des prix élevés, les bénéfices de chaque entreprise augmentent de 500 millions de dollars (en raison de la croissance normale de la demande).
- Si l’une baisse les prix (c’est-à-dire qu’elle est défectueuse) mais que l’autre ne le fait pas (coopère), les bénéfices augmentent de 750 millions de dollars pour la première en raison d’une plus grande part de marché et restent inchangés pour la seconde.
- Si les deux entreprises réduisent les prix, l’augmentation de la consommation de boissons non alcoolisées compense la baisse des prix, et les bénéfices de chaque entreprise augmentent de 250 millions de dollars.
La matrice des gains ressemble à ceci (les chiffres représentent les bénéfices supplémentaires en dollars en centaines de millions) :
Coca-Cola contre PepsiCo – Matrice des gains |
PepsiCo | ||
Coopérer | Défaut | ||
Coca-Cola | Coopérer | 500, 500 | 0, 750 |
Défaut | 750, 0 | 250, 250 |
D’autres exemples souvent cités de dilemme du prisonnier se trouvent dans des domaines tels que le développement de nouveaux produits ou technologies ou les dépenses de publicité et de marketing des entreprises.
Par exemple, si deux entreprises ont un accord implicite pour laisser les budgets publicitaires inchangés au cours d’une année donnée, leur revenu net peut rester à des niveaux relativement élevés. Mais si l’une d’elles fait défaut et augmente son budget publicitaire, elle peut réaliser des bénéfices plus importants aux dépens de l’autre entreprise, car l’augmentation des ventes compense l’augmentation des dépenses publicitaires. En revanche, si les deux sociétés augmentent leurs budgets publicitaires, les efforts publicitaires accrus peuvent se compenser et se révéler inefficaces, ce qui se traduit par des bénéfices plus faibles – en raison des dépenses publicitaires plus élevées – que si les budgets publicitaires étaient restés inchangés.
Applications à l’économie
L’impasse de la dette américaine entre les démocrates et les républicains qui surgit de temps en temps est un exemple classique du dilemme du prisonnier.
Disons que l’utilité ou l’avantage de résoudre la question de la dette américaine serait un gain électoral pour les partis lors de la prochaine élection. Dans ce cas, la coopération fait référence à la volonté des deux parties de travailler pour maintenir le statu quo en ce qui concerne la spirale du déficit budgétaire américain. Faire défection implique de s’écarter de cet accord implicite et de prendre les mesures nécessaires pour maîtriser le déficit.
Si les deux parties coopèrent et maintiennent le bon fonctionnement de l’économie, certains gains électoraux sont assurés. Mais si le parti A tente de résoudre le problème de la dette de manière proactive, alors que le parti B ne coopère pas, cette récalcitrance peut coûter des voix à B lors des prochaines élections, qui pourraient aller à A.
Toutefois, si les deux partis renoncent à coopérer et jouent la carte de la fermeté pour tenter de résoudre le problème de la dette, les turbulences économiques qui en résultent (marchés en déclin, baisse possible de la cote de crédit et fermeture du gouvernement) peuvent entraîner une baisse des gains électoraux pour les deux partis.
Comment pouvez-vous l’utiliser ?
Le dilemme du prisonnier peut être utilisé pour faciliter la prise de décision dans un certain nombre de domaines de la vie personnelle, comme l’achat d’une voiture, les négociations salariales, etc.
Par exemple, supposons que vous soyez à la recherche d’une nouvelle voiture et que vous entriez chez un concessionnaire automobile. L’utilité ou le gain, dans ce cas, est un attribut non numérique (c’est-à-dire la satisfaction de la transaction). Vous voulez obtenir la meilleure affaire possible en termes de prix, de caractéristiques de la voiture, etc., tandis que le vendeur de voiture veut obtenir le prix le plus élevé possible pour maximiser sa commission.
Dans ce contexte, la coopération signifie qu’il n’y a pas de marchandage ; vous entrez, vous payez le prix autocollant (au grand plaisir du vendeur) et vous repartez avec une nouvelle voiture. En revanche, la défection signifie qu’il faut négocier. Vous voulez un prix plus bas, alors que le vendeur veut un prix plus élevé. En attribuant des valeurs numériques aux niveaux de satisfaction, où 10 signifie pleinement satisfait de la transaction et 0 n’implique aucune satisfaction, la matrice des gains est la suivante :
Acheteur de voiture contre vendeur – Matrice des gains |
Vendeur |
||
Coopérer | Défaut | ||
Acheteur | Coopérer | (a) 7, 7 | (c) 0,10 |
Défaut | (b) 10, 0 | (d) 3, 3 |
Que nous dit cette matrice ? Si vous faites une bonne affaire et obtenez une réduction substantielle du prix de la voiture, vous serez probablement pleinement satisfait de l’affaire, mais le vendeur sera probablement insatisfait en raison de la perte de la commission (comme on peut le voir dans la cellule b).
À l’inverse, si le vendeur s’en tient à sa position et ne bouge pas sur le prix, vous serez probablement insatisfait de l’affaire alors que le vendeur sera pleinement satisfait (cellule c).
Votre niveau de satisfaction peut être moindre si vous vous contentez d’entrer et de payer le prix total (cellule a). Le vendeur dans cette situation risque également de ne pas être pleinement satisfait, car votre volonté de payer le prix total peut l’amener à se demander s’il aurait pu vous « orienter » vers un modèle plus cher ou ajouter des clochettes et des sifflets pour obtenir une plus grande commission.
La cellule (d) montre un degré de satisfaction beaucoup plus faible, tant pour l’acheteur que pour le vendeur, car un marchandage prolongé peut avoir fini par aboutir à un compromis réticent sur le prix payé pour la voiture.
De même, lors de négociations salariales, vous pouvez être mal avisé d’accepter la première offre qu’un employeur potentiel vous fait (en supposant que vous savez que vous valez plus).
Coopérer en acceptant la première offre peut sembler une solution facile dans un marché du travail difficile, mais cela peut vous amener à laisser de l’argent sur la table. Le fait de faire défection (c’est-à-dire de négocier) pour obtenir un salaire plus élevé peut en effet vous permettre d’obtenir une rémunération plus importante. À l’inverse, si l’employeur n’est pas disposé à vous payer davantage, vous risquez d’être mécontent de l’offre finale.
Il faut espérer que les négociations salariales ne deviennent pas acrimonieuses, car cela pourrait entraîner un niveau de satisfaction moindre pour vous et pour l’employeur. La matrice de rémunération acheteur-vendeur présentée plus haut peut facilement être étendue pour montrer le niveau de satisfaction du demandeur d’emploi par rapport à l’employeur.
Le dilemme du prisonnier nous montre que la simple coopération n’est pas toujours dans le meilleur intérêt de chacun. En fait, lorsque l’on achète un article coûteux comme une voiture, la négociation est la solution privilégiée du point de vue des consommateurs. Sinon, le concessionnaire automobile peut adopter une politique de rigidité dans les négociations de prix, maximisant ses profits mais entraînant un surpaiement des consommateurs pour leurs véhicules.
Comprendre les avantages relatifs de la coopération par rapport aux défauts peut vous inciter à vous engager dans des négociations de prix importantes avant d’effectuer un achat important.