Quel est le dilemme du prisonnier ?
Le dilemme du prisonnier est un paradoxe dans l’analyse des décisions où deux individus agissant dans leur propre intérêt ne produisent pas le résultat optimal. Le dilemme typique du prisonnier est mis en place de telle manière que les deux parties choisissent de se protéger aux dépens de l’autre participant. En conséquence, les deux participants se retrouvent dans un état pire que s’ils avaient coopéré l’un avec l’autre dans le processus de décision. Le dilemme du prisonnier est l’un des concepts les plus connus de la théorie moderne des jeux.
Points clés à retenir
- Le dilemme du prisonnier est une situation dans laquelle les décideurs individuels sont toujours incités à choisir d’une manière qui ne donne pas un résultat optimal pour les individus en tant que groupe.
- Les dilemmes du prisonnier se présentent dans de nombreux aspects de l’économie.
- Les gens ont développé de nombreuses méthodes pour surmonter les dilemmes des prisonniers afin de choisir de meilleurs résultats collectifs malgré des incitations individuelles apparemment défavorables.
1:46
Comprendre le dilemme du prisonnier
Le dilemme du prisonnier présente une situation où deux parties, séparées et incapables de communiquer, doivent chacune choisir entre coopérer avec l’autre ou non. La récompense la plus élevée pour chaque partie se produit lorsque les deux parties choisissent de coopérer.
Le dilemme classique du prisonnier se présente ainsi : deux membres d’une bande de braqueurs de banques, Dave et Henry, ont été arrêtés et sont interrogés dans des pièces séparées. Les autorités n’ont pas d’autres témoins et ne peuvent prouver les faits qui leur sont reprochés que si elles peuvent convaincre au moins un des braqueurs de trahir son complice et de témoigner du crime. Chaque voleur de banque est confronté au choix de coopérer avec son complice et de garder le silence ou de quitter le gang et de témoigner pour l’accusation. S’ils coopèrent tous deux et gardent le silence, les autorités ne pourront les condamner qu’à une peine moins sévère pour vagabondage, soit un an de prison chacun (1 an pour Dave + 1 an pour Henry = 2 ans de prison au total). Si l’un témoigne et que l’autre ne le fait pas, alors celui qui témoigne sera libéré et l’autre recevra trois ans (0 an pour celui qui fait défaut + 3 pour celui qui est condamné = 3 ans au total). Toutefois, si les deux personnes témoignent l’une contre l’autre, chacune d’entre elles sera condamnée à deux ans de prison pour avoir été partiellement responsable du vol (2 ans pour Dave + 2 ans pour Henry = 4 ans de prison au total).
Dans ce cas, chaque voleur a toujours une incitation à faire défection, quel que soit le choix de l’autre. Du point de vue de Dave, si Henry reste silencieux, alors Dave peut soit coopérer avec Henry et faire un an de prison, soit faire défection et être libéré. Dans ce cas, il serait évidemment préférable qu’il trahisse Henry et le reste de la bande. D’un autre côté, si Henry fait défaut et témoigne contre Dave, alors le choix de Dave devient soit de garder le silence et de faire trois ans de prison, soit de parler et de faire deux ans de prison. Là encore, il préfère évidemment faire les deux ans plutôt que les trois.
Dans les deux cas, qu’Henry coopère avec Dave ou qu’il fasse défaut à l’accusation, Dave sera mieux si lui-même fait défaut et témoigne. Maintenant, puisque Henry est confronté aux mêmes choix, il sera toujours préférable qu’il fasse également une défection. Le paradoxe du dilemme du prisonnier est le suivant : les deux voleurs ne peuvent minimiser la durée totale de leur peine d’emprisonnement que s’ils coopèrent tous les deux (2 ans au total), mais les incitations auxquelles ils sont confrontés séparément les pousseront toujours à faire défection et à finir par purger la durée totale maximale de leur peine d’emprisonnement (4 ans au total).
Exemples de dilemme du prisonnier
L’économie regorge d’exemples de dilemmes de prisonniers dont les résultats peuvent être bénéfiques ou néfastes pour l’économie et la société dans son ensemble. Le fil rouge est constitué par les situations où les incitations auxquelles est confronté chaque décideur individuel qui a le droit de choisir l’une ou l’autre de ces options l’amènerait à se comporter d’une manière qui les rendrait tous collectivement plus mal lotis, tout en évitant individuellement les choix qui les rendraient tous collectivement plus aisés si tous pouvaient, d’une manière ou d’une autre, choisir en coopération.
La tragédie des biens communs en est un exemple. Il peut être dans l’intérêt de tous de conserver et de réinvestir dans la propagation d’une ressource naturelle commune afin de pouvoir continuer à la consommer, mais chaque individu est toujours incité à en consommer le plus possible et le plus rapidement possible, ce qui épuise alors la ressource. Trouver un moyen de coopérer rendrait clairement la situation de chacun meilleure.
D’autre part, le comportement des cartels peut également être considéré comme un dilemme de prisonnier. Tous les membres d’un cartel peuvent s’enrichir collectivement en limitant la production pour maintenir le prix que chacun reçoit à un niveau suffisamment élevé pour capter les rentes économiques des consommateurs, mais chaque membre du cartel a individuellement intérêt à tromper le cartel et à augmenter la production pour capter également les rentes des autres membres du cartel. En termes de bien-être de la société dans laquelle le cartel opère, c’est un exemple de la façon dont le dilemme du prisonnier qui brise le cartel peut parfois rendre la société plus prospère dans son ensemble.
Échapper au dilemme du prisonnier
Au fil du temps, les gens ont élaboré diverses solutions aux dilemmes des prisonniers afin de surmonter les incitations individuelles en faveur du bien commun.
Premièrement, dans le monde réel, la plupart des interactions économiques et autres interactions humaines se répètent plus d’une fois. Un véritable dilemme du prisonnier n’est généralement joué qu’une seule fois ou bien il est classé comme un dilemme du prisonnier itéré. Dans un dilemme du prisonnier itéré, les joueurs peuvent choisir des stratégies qui récompensent la coopération ou punissent la défection au fil du temps. En interagissant de manière répétée avec les mêmes personnes, on peut même passer délibérément d’un dilemme du prisonnier unique à un dilemme du prisonnier répété.
Deuxièmement, les gens ont développé des stratégies institutionnelles formelles pour modifier les incitations auxquelles sont confrontés les décideurs individuels. L’action collective visant à imposer un comportement coopératif par le biais de la réputation, des règles, des lois, de la prise de décision collective démocratique ou autre, et de la punition sociale explicite pour les défections transforme de nombreux dilemmes des prisonniers vers des résultats coopératifs plus bénéfiques pour la collectivité.
Enfin, certaines personnes et certains groupes de personnes ont développé des préjugés psychologiques et comportementaux au fil du temps, tels qu’une plus grande confiance mutuelle, une orientation future à long terme dans les interactions répétées, et des inclinations vers une réciprocité positive de comportement coopératif ou une réciprocité négative de comportements déficients. Ces tendances peuvent évoluer par une sorte de sélection naturelle au sein d’une société au fil du temps, ou par une sélection de groupe entre différentes sociétés concurrentes. En effet, elles amènent des groupes d’individus à choisir « irrationnellement » les résultats qui sont en fait les plus bénéfiques pour tous ensemble.
Mis ensemble, ces trois facteurs (les dilemmes répétés des prisonniers, les institutions officielles qui permettent de résoudre les dilemmes des prisonniers, et les préjugés comportementaux qui sapent le choix individuel « rationnel » dans les dilemmes des prisonniers) aident à résoudre les nombreux dilemmes des prisonniers auxquels nous serions tous confrontés autrement.