La théorie des jeux et l’organisation

 

 La théorie des jeux et l’organisation

 

Un placement à – 70 % sur trente secondes

L’orateur se présente devant le groupe. Il pose sur la table deux billets de cent euros et trois pièces de dix euros. Puis il propose au public le pari suivant : « Je parie trente euros qu’à celui qui me donne cent euros, je donne deux cents euros. Cette proposition est valable pour trente secondes. » Immédiatement, une personne se précipite et donne à l’orateur un billet de cent euros. L’orateur prend le billet et déclare à la personne : « Je vous remercie. J’ai perdu mon pari. Voilà vos trente euros. » Il donne à la personne les trois pièces de dix euros et garde le billet de cent euros[1].

jeu-2La théorie des jeux, initiée par le mathématicien John Von Neuman, s’efforce de formaliser les décisions en utilisant la logique et les mathématiques, ceci dans des situations dont les règles sont claires. Son intérêt principal est d’envisager de façon froide et objective les divergences d’intérêts. Dans un jeu, on cherche en général à gagner au détriment de l’autre. La théorie des jeux éclaire de façon intéressante les divergences d’intérêts. Dans son livre Stratégie du conflit[2], Thomas Schelling en tire quelques leçons qui renversent les idées communes sur les situations de décision et la négociation.

Un bon négociateur ne dispose pas forcément de marge de manœuvre

Un bon moyen de l’emporter dans une négociation consiste à se mettre en situation de ne pas pouvoir céder. Quelques exemples illustrent ce procédé.

Lors d’un conflit du travail, supposons que le syndicat ait évalué à deux cents euros l’augmentation réclamée, alors que les employeurs, de leur côté, estiment ne pouvoir en accorder plus de cent. Les représentants du syndicat peuvent juger opportun de persuader le personnel que la direction est en mesure de fournir l’effort qui lui est demandé et qu’eux, les représentants du syndicat, ne seraient pas à la hauteur s’ils n’obtenaient pas satisfaction. L’objectif de cette manœuvre est de démontrer aux employeurs qu’en n’obtenant pas les 200 euros demandés, les représentants perdent leur crédibilité. Ce faisant, les syndicalistes réduisent délibérément leur marge de manœuvre et placent la direction face à un risque de grève qu’ils ne seraient plus en mesure d’écarter mais qui ne résulte pourtant que de leur propre attitude.

Autre exemple : au Japon, les cheminots grévistes s’asseyent sur les voies dans la gare pour imposer le blocage des trains. La contre-mesure appropriée est la suivante : le conducteur de la motrice la met en marche avant lente, quitte le train, traverse la gare à pieds et remonte à bord quand elle repasse à sa hauteur. Ainsi, le gréviste sait dès le départ que la locomotive ne s’arrêtera pas pour éviter de l’écraser. Tant que le conducteur reste aux commandes, la faiblesse de sa position réside dans le fait qu’il est en mesure de s’arrêter plus vite que les manifestants ne peuvent quitter la voie et que ceux-ci le savent. En quittant la locomotive, le conducteur supprime sa marge de manœuvre ; il ne peut plus céder. Les grévistes sont obligés de se retirer de la voie. Il leur est cependant possible d’adopter une contre-contre-mesure : s’enchaîner à la voie et jeter les clés du cadenas, à la condition toutefois d’en aviser le conducteur à temps, c’est-à-dire avant qu’il ait lui-même quitté sa machine. Le conducteur aura évidemment intérêt à ne pas s’en aviser.

Chacun sait que ce sont les riches plutôt que les pauvres qui sont soumis à des chantages et à des enlèvements. Ceci parce qu’ils disposent d’une marge de manœuvre – la possibilité de payer – qui les met en position de faiblesse.

Pour négocier, il n’est pas indispensable d’être bête. Mais ça peut aider

Si votre adversaire dans la négociation pense que vous n’êtes pas accessible à certains arguments, il renoncera à faire valoir ces arguments, même s’il les juge valables. Au contraire, si vous êtes perçu comme un individu rationnel, on pourra plus facilement prévoir vos réactions et vos attitudes, ce qui constitue un désavantage. Telle était la théorie de Henry Kissinger qui pensait que pour obtenir davantage des Soviétiques, il fallait se montrer capable de comportements irrationnels, imprévisibles voire même irresponsables. Se montrer inapte à comprendre les arguments revient à réduire sa marge de manœuvre.

Un homme se présente à votre porte et menace de se tuer si vous ne lui donnez pas quelque argent. Ses chances d’obtenir gain de cause sont bien meilleures si ses yeux sont injectés de sang que s’il paraît raisonnable et maître de soi. D’un autre côté, il est inutile de proférer une menace de destruction mutuelle à l’encontre d’un interlocuteur incapable d’en saisir la portée ou d’en faire valoir les conséquences auprès de ceux qu’il représente. Dans cet esprit, les personnes jugées irresponsables par le corps médical échappent aux sanctions de justice.

Le négociateur doit manier la casuistique

Lorsque l’un des négociateurs parvient à un point où certaines concessions doivent être envisagées, il lui faut prendre en compte que toute concession de sa part rapproche sa position de celle de l’adversaire et donne l’impression qu’il est de moins en moins résolu à se défendre. Une concession peut être interprétée comme un début de capitulation et peut faire croire à l’adversaire que la position précédente avait pour but de le tromper, augmentant ainsi son scepticisme face aux propositions à venir. Il est donc indispensable de trouver une « bonne raison » pour justifier chaque concession, éventuellement à l’aide d’une réinterprétation rationnelle, et suffisamment convaincante aux yeux de l’adversaire, de l’engagement précédent.

Il n’est pas inutile d’avoir recours dans ce but aux ressources de la casuistique, par exemple pour relever l’adversaire d’un engagement antérieur. Ce sera le cas si l’on parvient à démontrer à l’adversaire qu’il n’est pas réellement lié par cet engagement ou qu’il a été induit en erreur par une appréciation erronée de la situation. Un engagement peut, au demeurant, être rendu suffisamment imprécis pour que les contractants et les observateurs extérieurs éventuels ne puissent établir avec certitude si les clauses on été respectées ou pas. (Ce résultat peut être obtenu en démontrant l’ambiguïté et le manque de clarté des notions utilisées comme condition, par exemple la « productivité » prônée par la direction d’une société, en sorte que l’engagement initial se trouve sensiblement atténué, voire dénoué de facto).

Dans le cas que nous venons d’évoquer, il n’est pas nécessairement avantageux pour l’adversaire d’être relevé de ses engagements antérieurs. Cependant, lorsque l’adversaire semble sur le point de consentir une concession modérée, il devient possible de l’aider à prendre sa décision en faisant valoir à ses yeux que cette concession n’est pas en contradiction avec sa position initiale et ne remet pas en question les principes qu’il a pu évoquer précédemment. En d’autres termes, la situation doit lui être présentée rationnellement sous une forme qui minimise le bénéfice que l’on retirera soi-même de sa concession, sous peine de le voir y renoncer.

Des promesses, toujours des promesses

Contrairement aux apparences, une promesse peut renforcer la position de celui qui promet et donc affaiblir celle de celui qui reçoit la promesse. Ce qui implique qu’il peut être astucieux de ne pas recevoir de promesse.

Le principe de la promesse ayant un objet détourné est à la base de l’article 26 du traité de paix des Etats-Unis avec le Japon. Cet article stipule que le Japon devrait concéder certains territoires aux Etats-Unis si une situation le conduisait à faire des concessions à un autre pays. Alors qu’en 1956 le Japon faisait l’objet de pressions soviétiques, John Foster Dulles, alors Secrétaire d’Etat américain, mentionna au cours d’une conférence de presse qu’il avait dû « rappeler récemment aux Japonais l’existence de cette clause. » Le but évident de la démarche du Secrétaire d’Etat était de renforcer la position des Japonais. En « rappelant » ainsi l’existence de cet article, Dulles leur permettait de déclarer à leur tour aux Soviétiques : « Si nous le faisons pour vous, il nous faudra le faire pour les autres. »

La poule mouillée ou l’art de se suicider jeune pour profiter de la mort

Petit jeu absurde qui illustre l’inversion des réflexes stratégiques en situation de conflit. Dans ce jeu le conflit est poussé à l’extrême.

Sur une route isolée en rase campagne, deux automobilistes foncent l’un sur l’autre. Le premier qui change de trajectoire a perdu. Si les deux changent de trajectoire en même temps, ils sont l’un et l’autre des « poules mouillées » et perdent l’un et l’autre. Si aucun ne cède, c’est l’accident et la mort, qui est une perte plus importante que la perte du jeu.

Le jeu est symétrique, c’est-à-dire que tout raisonnement valable pour l’un des joueurs l’est aussi pour l’autre. Gagnera celui qui fera croire à l’autre qu’il ne changera plus sa décision. Par ailleurs, cette situation ne comporte pas de compromis stable que chacun des joueurs puisse considérer comme satisfaisant. Chaque joueur veut gagner aux dépens de l’autre.

Dans une telle situation, le fait de pouvoir formuler une menace comptera beaucoup. De même, le passé peut constituer une menace implicite. Les deux conducteurs se connaissent-ils ? Que pensent-ils l’un de l’autre ? Que pensent-ils que l’autre pense d’eux ? Etc. La tactique gagnante consiste à prouver à l’autre qu’on ne pourra pas changer de route, par exemple en se bandant les yeux. Le premier qui trouve le moyen d’annuler sa marge de manœuvre et de le faire savoir à l’autre gagne car il parvient ainsi à jouer en premier et à casser la symétrie du jeu.

La stratégie gagnante consiste donc à se bander les yeux pour envoyer à l’autre conducteur le message suivant :  » De toute façon, je ne pourrais plus changer de trajectoire. »

L’erreur de Nikita Khrouchtchev[3], afin que nul n’en ignore

Le 14 octobre 1962, la CIA décèle la présence à Cuba de fusées nucléaires et de leurs rampes de lancement. Ces fusées sont de portée suffisante pour atteindre en quelques minutes le territoire des États-Unis, ce qui constitue, du point de vue américain, une menace inacceptable. Le temps presse car selon la CIA, les missiles seront opérationnels le 24 octobre.

L’objectif des États-Unis est de contraindre les Soviétiques à retirer leurs missiles. Deux solutions retiennent l’attention du comité de crise :

  • Un blocus naval destiné à empêcher l’arrivée de nouvelles fusées et à gêner Cuba. Le blocus sera éventuellement suivi d’une action plus violente ;
  • Un bombardement immédiat de tous les sites de missiles, accompagné éventuellement d’un débarquement sur l’île.

Mais cette façon de voir est incomplète car le risque de guerre nucléaire est réel et on peut penser que des deux côtés, on est prêt à davantage de subtilité pour éviter la montée aux extrêmes. Après examen plus approfondi de la situation, le comité de crise envisage quatre scénarios qu’il tente d’évaluer :

  • Un blocus américain suivi du retrait des missiles par les Soviétiques. Cette solution représente un succès incontestable pour les Américains (4 points) et un compromis honorable pour les Soviétiques (3 points) ;
  • Un blocus américain suivi du maintien des missiles par les Soviétiques et de l’acceptation de cet état de fait par les États-Unis. Il s’agit naturellement de la meilleure solution pour l’URSS (4 points) et de la pire pour les États-Unis (1 point) ;
  • Un bombardement américain au moment où les Soviétiques retirent leurs missiles. Dans ce cas, l’URSS enregistre un échec, mais les Américains aussi car l’opinion internationale juge sévèrement leur action : les bombes étaient inutiles puisque les Soviétiques étaient en train de démanteler leurs missiles. Finalement, l’URSS parvient à se faire passer pour une victime, ce qui tempère son échec. Deux points pour chacun des protagonistes ;
  • Un bombardement américain faisant suite au maintien des missiles par les Soviétiques. Cette fois les État-Unis n’encourent plus les foudres de l’opinion internationale. Au contraire, ils ont agi en état de légitime défense. Il s’agit donc de la meilleure solution pour les États-Unis (4 points) et de la pire pour l’URSS (1 point).

Cette nouvelle façon de raisonner, mieux adaptée que la précédente, présente néanmoins encore un défaut : elle fige les choix et ne montre pas que s’offre à tout moment à chacun des protagonistes la possibilité de choisir une autre solution, pour peu que celle-ci lui paraisse plus favorable. Le jeu n’est pas statique mais séquentiel. Si les Soviétiques maintiennent leurs missiles, les Américains peuvent renverser la situation par un bombardement. Les Soviétiques peuvent alors retirer leurs missiles…

Les Américains, pour faire le premier choix, blocus ou bombardement, doivent prévoir la réaction des Soviétiques donc examiner la position au niveau du deuxième choix. Pour faire ce deuxième choix, les Soviétiques tenteront de connaître la réaction américaine et pour cela examineront ce qui se passe au niveau du troisième choix. Parce que chacun essaie de tenir compte des réactions de l’adversaire, l’arbre se lit du bas vers le haut.

Au troisième choix, c’est-à-dire après un blocus prolongé et un maintien des missiles par les Soviétiques, les Américains devraient se décider entre le blocus prolongé (USA 1 – URSS 4) et le bombardement (USA 3 – URSS 1). Il est clair que dans une telle situation, les Américains choisiraient le bombardement, ce que les deux protagonistes savent. Au deuxième choix et compte tenu de ce qui précède, les Soviétiques devraient choisir, après un blocus américain, entre le maintien des missiles suivi d’un bombardement (USA 3 – URSS 1) et le retrait des missiles (USA 4 – URSS 3). Il est clair que dans une telle situation ils choisiraient la deuxième solution. C’est effectivement ce qu’ils ont fait. Compte tenu de ce qui précède, au premier choix les Américains doivent opter entre le blocus (USA 4 – URSS 3) ou le bombardement immédiat (USA 2 – URSS 2). Ils ont logiquement choisi la première solution.

Le 22 octobre 1962, les États-Unis ont décrété l’embargo sur les armes destinées à Cuba et opéré un blocus de l’île. Le 28, les Soviétiques annonçaient qu’ils retiraient leurs missiles.

L’examen en termes de théorie des jeux montre que les deux camps ont bien « joué ». Si les Soviétiques ont subi un demi-échec, c’est qu’ils s’étaient lancés dans une partie mal engagée. John Kennedy quant à lui s’est montré habile négociateur. Il a évité de coincer les Soviétiques avec un bombardement, leur laissant une porte de sortie honorable (le retrait soviétique ne devait pas être présenté comme humiliant, ceci grâce à la casuistique). C’est parce que Kennedy a évité à Khrouchtchev de perdre la face qu’il a pu atteindre son objectif. Quand les Soviétiques ont compris qu’on leur avait fait gober ce qui restait un échec, ils ont reconnu l’importance de cet échec en renvoyant Nikita Khrouchtchev à son cher jardinage. Ceci afin que les futurs dirigeants soviétiques et surtout les Occidentaux sachent ce qu’il en coûte à un communiste de reculer.

Le dilemme du prisonnier et la coopération

Le dilemme du prisonnier formalise les situations où l’intérêt collectif nécessite la coopération alors que l’intérêt individuel conduit plutôt à la non-coopération.

Un hold-up a été commis et la police a arrêté deux suspects qu’elle détient dans deux cellules différentes. L’inspecteur de police, féru de théorie des jeux, tient à chacun des deux suspects ce langage : « Vous pouvez avouer ou pas le hold-up. Votre collègue aussi. Si vous avouez tous les deux, vous aurez cinq ans de prison chacun. Si vous n’avouez pas, je vous fais condamner pour port d’arme illégal, vous aurez dix-huit mois chacun. Par contre, si vous n’avouez pas et que votre collègue avoue, vous apparaîtrez comme le responsable de l’affaire et vous prendrez vingt ans de prison. Votre complice, simple comparse, n’aura que six mois de prison. À l’inverse, si vous avouez et que votre complice n’avoue pas, vous aurez six mois et lui vingt ans. Voilà, j’ai tenu le même langage à votre complice. Maintenant réfléchissez à votre décision. »

Si le prisonnier regarde son intérêt personnel, il constate qu’il doit avouer. En effet, si l’autre n’avoue pas, il baisse sa peine de dix-huit mois à six mois, et si l’autre avoue, il baisse sa peine de vingt ans à cinq ans. Néanmoins, c’est le fait d’avouer tous les deux qui ferait remonter la peine de dix-huit mois à cinq ans. La peine totale minimum – dix-huit mois chacun – se situe dans le cas où aucun des deux n’avoue. L’intérêt collectif des deux prisonniers est que personne n’avoue, le raisonnement individuel conduit à avouer. On ne peut passer de l’intérêt individuel à l’intérêt collectif que si s’instaure une coopération (dans le cas des prisonniers une coopération implicite) entre les individus.

Le dilemme du prisonnier fascine parce que le développement économique de nos sociétés est massivement fondé sur la coopération et qu’il montre que cette coopération ne va pas de soi. Si l’on s’en tenait à la rationalité de l’acteur face à sa décision, on observerait davantage de vols, de rapines, d’escroqueries, de mensonges que de coopération, de respect des engagements, etc. Pourquoi et comment la coopération, indispensable à une économie développée, a-t-elle pu se développer ?

Robert Axelrod traite de ce sujet à partir du dilemme du prisonnier dans : Donnant donnant, Traité du comportement coopératif[4]. Pour ce faire, Robert Axelrod a organisé des tournois informatiques (selon la même structure que les championnats sportifs, tout le monde joue contre tout le monde) entre des programmes simulant une stratégie au dilemme du prisonnier itératif. Le terme « itératif » est ici important. Tout le monde joue contre tout le monde des centaines de fois et peut tenir compte de la stratégie passée de son adversaire. Nous sommes dans un monde où on se rencontre souvent.

C’est à chaque fois le programme « donnant donnant » qui l’a emporté dans les tournois organisés par Robert Axelrod. Ce programme est fort simple : il coopère au premier coup puis répète à chaque coup le coup précédent de l’adversaire. Tant que l’autre coopère, il ne rompt pas la coopération. Dans un monde où il y a assez de gens coopératifs, la coopération est payante à long terme.

Deuxième leçon des simulations d’Axelrod : si la coopération permet de générer davantage de ressources que la non-coopération, alors la coopération devient majoritaire même si au départ elle était le fait d’une minorité. L’esprit coopératif tend à s’étendre s’il permet l’émergence de ressources plus importantes. Voilà sans doute pourquoi les sociétés sont fondées sur la coopération bien que cela contrevienne souvent à l’intérêt du décideur rationnel et uniquement soucieux de son intérêt personnel.

Le problème des bureaucraties est-il l’intelligence de ceux qui les composent ?

Michel Crozier et Erhard Friedberg nous ont appris[5] que l’acteur n’est ni coopératif ni conflictuel par nature. Il est prêt à monnayer sa coopération s’il en tire une contrepartie suffisante et il est souvent prêt à aller jusqu’au conflit s’il juge que tel est son intérêt. Une autre façon de formuler ceci est d’affirmer que l’individu s’inscrit toujours dans des perspectives de coopérations si elles vont dans le sens de son intérêt tel qu’il le perçoit. L’individu est toujours coopératif, la question est de savoir dans quel sens il coopère, vers quel objectif.

Une entreprise est bureaucratique s’il elle agit davantage dans l’intérêt de son personnel que dans celui de ses clients ; c’est du moins ainsi que la ressentent ses clients. Or le confort du salarié fait rarement partie de la demande des clients. Donc, si les entreprises sont bureaucratiques, ce n’est pas parce que les gens qui les composent manquent d’intelligence, c’est justement parce que les acteurs sont intelligents. Nous ne parlons pas ici de l’intelligence au sens de la capacité à manipuler des idées mais au sens de la capacité à percevoir et défendre son intérêt.

Quand le client a le choix – ce qui se trouve être de plus en plus le cas – il quitte ses fournisseurs bureaucratiques et s’adresse à des fournisseurs non bureaucratiques, c’est-à-dire centrés clients. Voilà exactement comment les bureaucraties finissent, mortes sous le poids de leur intelligence. Voilà aussi pourquoi les entreprises mises en concurrence se préoccupent de « faire entrer le client dans l’entreprise ».

Pour sortir de ce dilemme, il faut penser et expliciter la divergence d’intérêts entre le client et le fournisseur. Il faut ensuite dépasser cette divergence par une logique contractuelle entre les entreprises d’une part, entre le salarié et l’entreprise d’autre part. Alors commence la coopération fondée sur des divergences explicitées et des échanges négociés.

La théorie des jeux, qui n’est pas qu’un jeu, montre comment aborder ces subtiles logiques où conflits et coopérations s’entrecroisent pour tisser une singulière étoffe.


[1] C’est mon éminent confrère Alain Simon que j’ai vu exécuter ce captieux et instructif exercice.

[2] Thomas C. Schelling : Stratégie du conflit, PUF, 1986.

[3] Ce développement est inspiré de Superpover Games (Yale University Press) de Stevan J. Brams.

[4] Robert Axelrod : Donnant donnant, Théorie du comportement coopératif, Odile Jacob, 1992.

[5] Michel Crozier et Erhard Friedberg : L’acteur et le système, Seuil, 1977.

Share Button