Théorie de l'équilibre de Nash et sa signification pratique. équilibre de Nash

  • 01.04.2019

À l’issue de la maîtrise de ce chapitre, l’étudiant doit :

savoir

  • détermination de l'équilibre de Nash (dans les stratégies pures et mixtes) ;
  • propriétés fondamentales de l'équilibre de Nash ;
  • des théorèmes qui formulent les conditions d'existence de l'équilibre de Nash dans les jeux stratégiques ;
  • définition de la notion de « équilibre d'une main tremblante » ;

être capable de

Résoudre le problème de la recherche de l'équilibre de Nash dans les jeux bimatrices (y compris la méthode graphique pour les jeux) ;

propre

  • les méthodes les plus simples pour analyser les propriétés des jeux bimatrices 2 x 2 en utilisant les résultats de leur solution graphique ;
  • un système d'idées sur les opportunités et les problèmes objectifs application pratique concepts d'équilibre de Nash ;
  • un appareil terminologique qui permet de maîtriser de manière autonome la littérature scientifique et professionnelle en utilisant le concept d'équilibre de Nash et ses propriétés.

Dans ce chapitre, nous considérerons le principal objet d’étude de la théorie des jeux non coopératifs, appelé équilibre de Nash. Ce concept a été proposée par l'éminent mathématicien américain John Forbes Nash, d'abord dans sa thèse, puis dans une série d'articles publiés entre 1950 et 1953. .

^ La situation merde* dans le jeu Г = (I, () i О I, ((s)) i О I) nous appellerons l'équilibre de Nash (en stratégies pures), si pour n'importe quel joueur je О je

En d'autres termes, une situation d'équilibre de Nash est une situation dans un jeu dont il n'est rentable pour aucun des joueurs de s'écarter individuellement (à condition que les autres participants au jeu adhèrent à leurs stratégies, formant un équilibre de Nash).

Considérons des cartographies qui, pour chaque joueur i О I pour chaque substitution possible О, associent une certaine stratégie qui est sa meilleure réponse pour une substitution donnée :

Les mappages qui renvoient les meilleures réponses aux sous-situations sont également appelés mappages de réponses des joueurs. De l'inégalité (3.1), il s'ensuit que la situation d'équilibre de Nash est formée de stratégies qui sont renvoyées par les cartes de réponse de tous les acteurs, c'est-à-dire Une situation d’équilibre de Nash est une situation formée des meilleures réponses de chaque joueur aux meilleures réponses des autres :

À leur tour, les propriétés suivantes découlent de la condition (3.3).

  • 1. Les stratégies strictement dominées et les stratégies OVNI ne peuvent pas entrer dans l’équilibre de Nash.
  • 2. Les stratégies qui forment un équilibre de Nash ne peuvent pas être éliminées dans le processus de suppression des stratégies strictement dominées et de rationalisation du jeu.

Dans le même temps, il convient de souligner que les stratégies faiblement dominées ne possèdent pas les propriétés énumérées. Il n’est pas difficile de construire un exemple d’équilibre de Nash dans lequel une ou plusieurs stratégies faiblement dominées seront présentes.

Pour considérer les propriétés de l'équilibre de Nash, revenons au jeu du dilemme du prisonnier (voir tableau 2.1).

Comme il est facile de le remarquer, ce jeu a un état d’équilibre de Nash unique. Il s'agit d'une situation (C, C) dans laquelle les deux joueurs avouent et écopent de cinq ans de prison. La qualité fondamentale de la situation (C, C) est précisément qu’il n’est vraiment avantageux pour personne de s’en écarter individuellement. Si l’un des prisonniers essaie de changer la stratégie de « avouer » à « garder le silence », alors

ce faisant, il ne fera qu'aggraver sa situation - au lieu de cinq ans de punition, il en recevra dix - et améliorera la situation de l'autre joueur qui sera libéré.

Il faut admettre que la situation d'équilibre dans dans cet exemple est un résultat inefficace pour les détenus. En effet, dans la situation (M, M) - tous deux sont muets - leur utilité est plus élevée (la peine est d'un an contre cinq). Cependant, la situation (M, M) présente l'inconvénient d'être instable. Dans ce document, il est avantageux pour chaque joueur de changer la stratégie « silencieuse » en « avouer », à condition que l'autre joueur continue d'adhérer à la stratégie « silencieuse ». Dans ce cas, la peine pour le traître devient nulle, même si elle augmente fortement pour le dévot : d'un an à dix.

Ainsi, le dilemme du prisonnier reflète très clairement le fait que

Un équilibre de Nash n’est pas forcément la situation « la plus rentable » pour les acteurs, c’est une situation stable.

En outre, en utilisant l'exemple du dilemme du prisonnier, la relation entre l'équilibre de Nash et un concept économique aussi fondamental que l'optimalité de Pareto peut être clairement démontrée. Rappelons que

une distribution est dite optimale mais Pareto (Pareto-optimale) lorsque l'utilité (le bien-être) d'aucun des participants à cette distribution ne peut être augmentée sans réduire l'utilité d'aucun autre participant.

Il est facile de voir que dans le dilemme du prisonnier, la situation d'équilibre de Nash est la seule Pareto-non optimale : l'utilité des participants « sans douleur pour chacun d'eux » peut être améliorée en passant de situation (C, C) à situation (M, M), mais ce dernier n'est pas un équilibre selon Nash du fait de son instabilité. De ce point de vue, le dilemme du prisonnier est un exemple classique démontrant les différences entre les concepts d'« équilibre de Nash » et d'« optimalité de Pareto ».

Démontrons les possibilités d'utilisation pratique du concept d'équilibre de Nash à l'aide de l'exemple des intrigues de l'annexe littéraire.

  • Pour sa contribution à la théorie des jeux non coopératifs, J. Nash a reçu le prix Nobel d'économie en 1994.
  • Présenté par l'économiste et sociologue italien Vilfredo Pareto (1848-1923)

Et Oscar Morgenstern est devenu le fondateur d’une nouvelle branche intéressante des mathématiques, appelée « théorie des jeux ». Dans les années 1950, le jeune mathématicien John Nash s’intéresse à ce domaine. La théorie de l'équilibre est devenue le sujet de sa thèse, qu'il a rédigée à l'âge de 21 ans. C'est comme ça que je suis né nouvelle stratégie jeu appelé « Nash Equilibrium », qui a valu le prix Nobel plusieurs années plus tard, en 1994.

Le long écart entre la rédaction de la thèse et reconnaissance universelle est devenu un test pour le mathématicien. Un génie non reconnu a entraîné de graves troubles mentaux, mais John Nash a pu résoudre ce problème grâce à son excellent esprit logique. Sa théorie de « l’équilibre de Nash » a remporté un prix Nobel et sa vie a été filmée dans le film « Beautiful Mind ».

En bref sur la théorie des jeux

Puisque la théorie de l’équilibre de Nash explique le comportement humain dans des contextes interactionnels, il convient donc de revoir les concepts de base de la théorie des jeux.

La théorie des jeux étudie le comportement des participants (agents) dans des conditions d'interaction les uns avec les autres comme dans un jeu, lorsque le résultat dépend des décisions et du comportement de plusieurs personnes. Le participant prend des décisions basées sur ses prédictions concernant le comportement des autres, ce qu'on appelle la stratégie de jeu.

Il existe également une stratégie dominante dans laquelle un participant obtient le résultat optimal pour tout comportement des autres participants. C'est la meilleure stratégie gagnant-gagnant du joueur.

Le dilemme du prisonnier et la percée scientifique

Le dilemme du prisonnier est un cas de jeu dans lequel les participants sont obligés de prendre des décisions rationnelles, but commun dans des conditions de conflit d’alternatives. La question est de savoir laquelle de ces options il choisira, compte tenu de son intérêt personnel et général, ainsi que de l’impossibilité d’obtenir les deux. Les joueurs semblent enfermés dans des conditions de jeu strictes, ce qui les oblige parfois à réfléchir de manière très productive.

Ce dilemme a été étudié par un mathématicien américain. L'équilibre qu'il a obtenu était révolutionnaire en son genre. Celui-ci est particulièrement brillant nouvelle pensée a influencé l'opinion des économistes sur la manière dont les acteurs du marché font des choix, en tenant compte des intérêts des autres, avec une interaction étroite et une intersection d'intérêts.

Il est préférable d’étudier la théorie des jeux à l’aide d’exemples précis, car cette discipline mathématique elle-même n’est pas sèchement théorique.

Exemple du dilemme du prisonnier

Par exemple, deux personnes ont commis un vol, sont tombées entre les mains de la police et sont interrogées dans des cellules séparées. Parallèlement, les policiers offrent à chaque participant des conditions favorables dans lesquelles il sera libéré s'il témoigne contre sa compagne. Chaque criminel dispose de l’ensemble de stratégies suivant qu’il envisagera :

  1. Tous deux témoignent en même temps et sont condamnés à 2,5 ans de prison.
  2. Tous deux gardent le silence en même temps et reçoivent chacun 1 an, car dans ce cas, la base de preuves de leur culpabilité sera faible.
  3. L'un témoigne et obtient la liberté, tandis que l'autre reste silencieux et écope de 5 ans de prison.

Évidemment, l'issue de l'affaire dépend de la décision des deux participants, mais ils ne peuvent parvenir à un accord car ils sont assis dans des cellules différentes. Le conflit de leurs intérêts personnels dans la lutte pour des intérêts communs est également clairement visible. Chaque prisonnier a deux options d'action et 4 résultats possibles.

Chaîne de conclusions logiques

Ainsi, le criminel A considère les options suivantes :

  1. Je me tais et mon partenaire se tait - nous serons tous les deux condamnés à 1 an de prison.
  2. Je livre mon partenaire et il me livre. Nous écopons tous les deux de 2,5 ans de prison.
  3. Je reste silencieux et mon partenaire me dénonce - je suis condamné à 5 ans de prison et il obtient la liberté.
  4. Je livre mon partenaire, mais il reste silencieux. J'obtiens la liberté et il écope de 5 ans de prison.

Présentons une matrice de solutions et de résultats possibles pour plus de clarté.

Tableau des issues probables du dilemme du prisonnier.

La question est : que choisira chaque participant ?

« Vous ne pouvez pas vous taire, vous ne pouvez pas parler » ou « Vous ne pouvez pas vous taire, vous ne pouvez pas parler »

Pour comprendre le choix du participant, il faut suivre l’enchaînement de ses pensées. Suivant le raisonnement du criminel A : si je garde le silence et que mon partenaire garde le silence, nous aurons une peine minimale (1 an), mais je ne peux pas savoir comment il va se comporter. S'il témoigne contre moi, alors je ferais mieux de témoigner aussi, sinon je pourrais aller en prison pendant 5 ans. Il vaut mieux pour moi servir 2,5 ans que 5 ans. S'il reste silencieux, j'ai d'autant plus besoin de témoigner, car ainsi j'obtiendrai la liberté. Le participant B argumente exactement de la même manière.

Il n’est pas difficile de comprendre que la stratégie dominante de chacun des criminels est de témoigner. Le point optimal de ce jeu survient lorsque les deux criminels témoignent et reçoivent leur « prix » : 2,5 ans de prison. La théorie des jeux de Nash appelle cela un équilibre.

Solution optimale de Nash sous-optimale

La nature révolutionnaire du point de vue de Nash n'est pas optimale si l'on considère le participant individuel et ses intérêts personnels. Après tout, la meilleure option est de garder le silence et de se libérer.

L'équilibre de Nash est un point de convergence d'intérêts, où chaque participant choisit une option qui lui est optimale uniquement si les autres participants choisissent une certaine stratégie.

Considérant l’option où les deux criminels gardent le silence et ne reçoivent qu’un an de prison, nous pouvons appeler cela une option Pareto-optimale. Cependant, cela n’est possible que si les criminels parviennent à un accord à l’avance. Mais même cela ne garantirait pas ce résultat, car la tentation de se retirer de l’accord et d’éviter la punition est grande. Le manque de confiance totale les uns envers les autres et le risque d'être condamné à 5 ans de prison nous obligent à choisir l'option des aveux. Il est tout simplement irrationnel de penser que les participants s’en tiendront à l’option silencieuse tout en agissant de concert. Cette conclusion peut être tirée en étudiant l’équilibre de Nash. Les exemples ne font que le prouver.

Égoïste ou rationnel

La théorie de l’équilibre de Nash a produit des résultats étonnants qui réfutaient les principes existants. Par exemple, Adam Smith considérait le comportement de chaque participant comme absolument égoïste, ce qui équilibrait le système. Cette théorie était appelée « la main invisible du marché ».

John Nash a compris que si tous les participants agissaient dans la poursuite de leurs propres intérêts, cela ne conduirait jamais à un résultat de groupe optimal. Étant donné que la pensée rationnelle est inhérente à chaque participant, le choix proposé par la stratégie d’équilibre de Nash est plus probable.

Une expérience purement masculine

Un bon exemple est le jeu Blonde Paradox, qui, bien qu’apparemment inapproprié, illustre clairement le fonctionnement de la théorie des jeux de Nash.

Dans ce jeu, vous devez imaginer qu'un groupe de gars libres vient dans un bar. Il y a un groupe de filles à proximité, dont l'une est préférable aux autres, dit une blonde. Comment les hommes devraient-ils se comporter pour avoir la meilleure petite amie pour eux-mêmes ?

Donc, le raisonnement des gars : si tout le monde commence à faire connaissance avec la blonde, alors très probablement personne ne l'aura, alors ses amis ne voudront pas non plus la rencontrer. Personne ne veut être le deuxième choix. Mais si les gars choisissent d'éviter la blonde, alors il y a une probabilité pour chacun des gars de se retrouver parmi les filles bon ami haut.

La situation d'équilibre de Nash n'est pas optimale pour les hommes, puisque, poursuivant uniquement leurs propres intérêts égoïstes, chacun choisirait la blonde. On peut voir que la poursuite d’intérêts égoïstes équivaudrait à l’effondrement des intérêts du groupe. Un équilibre de Nash signifierait que chaque homme agit dans son propre intérêt, ce qui correspond aux intérêts du groupe dans son ensemble. Ce n'est pas l'option optimale pour tout le monde personnellement, mais elle est optimale pour tout le monde en fonction de la stratégie globale de réussite.

Toute notre vie est un jeu

Prendre des décisions dans le monde réel est très similaire à un jeu dans lequel vous attendez un certain comportement rationnel de la part des autres participants. En affaires, au travail, en équipe, en entreprise et même dans les relations avec le sexe opposé. Des grosses transactions aux situations de la vie ordinaire, tout est soumis à une loi ou à une autre.

Bien entendu, les situations de jeu envisagées avec des criminels et un bar ne sont que d'excellentes illustrations démontrant l'équilibre de Nash. Des exemples de tels dilemmes surviennent très souvent sur le marché réel, et cela est particulièrement vrai dans les cas où deux monopoleurs contrôlent le marché.

Stratégies mixtes

Souvent, nous ne participons pas à un, mais à plusieurs jeux à la fois. Choisir l'une des options dans un jeu, guidé par une stratégie rationnelle, mais aboutit dans un autre jeu. Après avoir pris plusieurs décisions rationnelles, vous constaterez peut-être que vous n’êtes pas satisfait du résultat. Ce qu'il faut faire?

Considérons deux types de stratégie :

  • Une stratégie pure est le comportement d’un participant qui résulte d’une réflexion sur le comportement possible des autres participants.
  • Une stratégie mixte ou stratégie aléatoire est l'alternance de stratégies pures au hasard ou la sélection d'une stratégie pure avec une certaine probabilité. Cette stratégie est également appelée randomisée.

En considérant ce comportement, nous acquérons une nouvelle perspective sur l’équilibre de Nash. Si plus tôt on disait que le joueur choisit une stratégie une fois, alors un autre comportement peut être imaginé. Il est possible de supposer que les joueurs choisissent une stratégie au hasard avec une certaine probabilité. Les jeux dans lesquels les équilibres de Nash ne peuvent pas être trouvés dans des stratégies pures les ont toujours dans des stratégies mixtes.

L’équilibre de Nash dans les stratégies mixtes est appelé équilibre mixte. Il s'agit d'un équilibre où chaque participant choisit la fréquence optimale de choix de ses stratégies, à condition que les autres participants choisissent leurs stratégies avec une fréquence donnée.

Pénalités et stratégie mixte

Un exemple de stratégie mixte peut être donné dans le football. La meilleure illustration d’une stratégie mixte est peut-être la séance de tirs au but. Nous avons donc un gardien qui ne peut sauter que dans un corner, et un joueur qui tirera le penalty.

Donc, si la première fois le joueur choisit la stratégie consistant à tirer dans le coin gauche et que le gardien de but tombe également dans ce coin et attrape le ballon, alors comment les événements peuvent-ils se développer la deuxième fois ? Si un joueur frappe le coin opposé, c'est probablement trop évident, mais frapper le même coin n'est pas moins évident. Par conséquent, le gardien de but et le botteur n’ont d’autre choix que de s’appuyer sur un choix aléatoire.

Ainsi, en alternant sélection aléatoire et stratégie pure spécifique, le joueur et le gardien tentent d'obtenir le maximum de résultat.

Les situations où il existe un équilibre dans les stratégies dominantes du jeu sont assez rares. Et tous les jeux ne peuvent pas trouver une solution en abandonnant les stratégies strictement dominées. Un exemple correspondant de jeu est présenté dans le tableau 16.8.

Le deuxième joueur choisira la stratégie A s'il suppose que le premier choisira la stratégie Z ; en même temps, la stratégie B lui est préférable si le premier choisit Y.

Tableau 16.8.

Il est naturel de supposer qu'en l'absence de stratégies dominantes pour tous les acteurs, le choix de chaque joueur dépend des attentes quant aux choix des autres. Nous examinerons ensuite un concept de solution basé sur cette idée.

16.2.4 équilibre de Nash

Outre les situations évoquées dans la section précédente, il existe des situations14 qu’il est naturel de modéliser à partir des hypothèses suivantes :

Lorsqu'ils prennent des décisions, les joueurs sont guidés par les actions attendues de leurs partenaires ;

les attentes sont l'équilibre (coïncident avec les actions réellement choisies par les partenaires).

Si nous supposons que tous les acteurs sont rationnels, de sorte que chacun choisit la stratégie qui lui rapporte le plus compte tenu de ses attentes, alors ces hypothèses conduisent à un concept de décision appelé équilibre de Nash. A l’équilibre, chaque joueur n’a aucune raison de réviser ses attentes.

Formellement, l’équilibre de Nash est défini comme suit.

Définition 90 :

Un ensemble de stratégies x X est un équilibre de Nash15 si

1) la stratégie x i de chaque joueur est sa meilleure réponse aux stratégies attendues des autres joueurs xe −i :

ui (xi , xe −i ) = max ui (xi , xe −i ) i = 1, . . . , n;

x iX je

14 On peut imaginer une population de joueurs de type A (par exemple, un chat) et de joueurs de type B (par exemple, une souris). Un joueur de type A, lorsqu'il rencontre un joueur de type B, a des attentes concernant le comportement d'un partenaire de type B, justifiées par sa propre expérience ou celle de quelqu'un d'autre, et est guidé par elles à l'avance (et vice versa). Cependant, ce n’est pas le seul type de situation dans lequel l’approche envisagée est adéquate.

Le mathématicien américain John Nash a reçu le prix Nobel d’économie en 1994, aux côtés de J. Harsanyi et R. Selten, « pour leur analyse pionnière des équilibres dans la théorie des jeux non coopératifs ». Le concept d'équilibre a été proposé dans les articles suivants : J. F. Nash : Equilibrium Points in N-Person Games,

Actes de l'Académie nationale des sciences L'unionÉtats d'Amérique 36 (1950) : 48-49 ; J. F. Nash : Non-Cooperative Games, Annals of Mathematics 54 (1951) : 286-295 (traduction russe. J. Nash : Non-Cooperative Games, dans le livre Matrix Games, N. N. Vorobyov (éd.), M. : Fizmatgiz, 1961 : 205-221).

Il convient de noter que Nash lui-même n’a pas introduit d’attentes dans la définition. La définition originale de Nash coïncide avec la propriété discutée ci-dessous.

xe −i = x−i je = 1, . . . , n

Notez que lors de l'utilisation de l'équilibre de Nash pour modéliser des situations de jeu, les questions de savoir si les joueurs connaissent les objectifs de leurs partenaires, s'ils connaissent la rationalité de leurs partenaires, s'ils savent les calculer, etc., passent au second plan. La manière dont les attentes se forment est exclue du champ de l’analyse ; Tout ce qui compte ici, c’est que les attentes soient équilibrées.

Mais si, lors de l'analyse d'un équilibre de Nash, il importe peu qu'un joueur connaisse les objectifs des autres joueurs, alors on peut douter de la validité de considérer le concept de Nash dans le contexte de jeux avec information complète. Le fait est que le terme « information complète » dans la théorie des jeux a un sens plutôt étroit. Cela implique en réalité uniquement une information complète sur les types de partenaires (le terme « type de joueur » est expliqué dans le paragraphe sur les jeux bayésiens).

Comme il est facile de le constater, la définition ci-dessus de l’équilibre de Nash est équivalente à la propriété suivante, qui est généralement utilisée comme définition :

Un ensemble de stratégies x X est un équilibre de Nash si la stratégie xi de chaque joueur est sa meilleure réponse aux stratégies des autres joueurs x−i :

ui (xi , x−i ) = max ui (xi , x−i ) i = 1, . . . , n

x iX je

Cette propriété peut également être écrite en termes de fonctions dites de réponse (maps).

Définition 91 :

Afficher la réponse du i-ème joueur,

Ri : X−i 7→Xi

attribue à chaque ensemble de stratégies des autres joueurs, x−i X−i , l'ensemble des stratégies du i-ème joueur, dont chacune est la meilleure réponse à x−i . Autrement dit,

ui (yi , x−i ) = max ui (xi , x−i ) x−i X−i , yi Ri (x−i )x i X i

L'introduction de mappages de réponses permet d'écrire la définition d'un équilibre de Nash de manière plus compacte : un ensemble de stratégies x X est un équilibre de Nash si

xi Ri (x−i ) i = 1, . . . , n

Si la réponse de chaque joueur est sans ambiguïté (est une fonction), alors l'ensemble des équilibres de Nash coïncide avec l'ensemble des solutions du système d'équations :

xi = Ri (x−i ) i = 1, . . . , n.

Dans le tableau 16.8, les affichages des réponses des joueurs sont représentés en mettant en évidence les gains correspondant aux actions optimales. L'équilibre de Nash dans ce jeu est la cellule (B, Y), puisque les gains des deux joueurs sont soulignés.

Illustrons l'utilisation des fonctions de réponse en utilisant l'exemple d'un jeu dans lequel les joueurs disposent d'un continuum de stratégies.

Jeu 5. « Commerce international »

Deux pays choisissent simultanément le niveau des droits de douane, τi. Le volume des échanges commerciaux entre les pays16, x, dépend des droits établis ainsi que

x = 1 − τ1 − τ2

L'objectif de chaque pays est de maximiser le revenu ui = τi x.

Nous maximisons les gains du 1er pays,

τ1 (1 − τ1 − τ2 )

selon τ1, en considérant le niveau de droit fixé par le 2ème pays à fixer. La condition du premier ordre a la forme

1 − 2τ1 − τ2 = 0

La fonction maximisée étant strictement concave, la condition du premier ordre correspond à un maximum global.

La condition de premier ordre pour le problème de maximisation du gain du 2ème pays se trouve de la même manière :

1 − τ1 − 2τ2 = 0

Après avoir résolu un système de deux équations linéaires, on retrouve l'équilibre de Nash :

τ1 = τ2 = 1/3

La réponse optimale du 1er pays au niveau des droits de douane établi par le 2ème pays est décrite par la fonction

τ1 (τ2 ) =1 − τ 2

De même, la fonction de réponse du 2ème pays est

τ2 (τ1 ) =1 − τ 1 2

Pour trouver l'équilibre de Nash, vous devez résoudre le système d'équations

τ1 (τ2) = τ1,

τ2 (τ) = τ .

La recherche de l’équilibre de Nash est représentée graphiquement sur la figure. 16.3. Les points situés sur les courbes de réponse optimales τ1 (τ2) et τ2 (τ1) sont caractérisés par le fait que les tangentes aux courbes d'indifférence des joueurs sont parallèles à l'axe de coordonnées correspondant. Rappelons que la courbe d'indifférence est l'ensemble des points auxquels l'utilité de l'individu en question est la même (ui (x) = const). L'équilibre est trouvé comme point d'intersection des courbes de réponse.

L’avantage d’utiliser le concept d’équilibre de Nash est qu’il est possible de trouver une solution dans les jeux dans lesquels l’abandon des stratégies dominées ne le permet pas. Cependant, le concept lui-même peut être plus controversé car il repose sur des hypothèses fortes concernant le comportement des joueurs.

La relation entre les concepts de solution introduits est décrite par les déclarations suivantes :

16 Dans ce jeu, par souci de simplicité, nous ne faisons pas de distinction entre exportations et importations.

(τ2)

équilibre

τ2 (τ1 )

Riz. 16.3. L’équilibre de Nash dans le jeu du commerce international

Théorème 151 :

Si x = (x1, . . . , xm) est un équilibre de Nash dans un certain jeu, alors aucune de ses stratégies constitutives ne peut être écartée suite à l'application de la procédure d'élimination séquentielle des stratégies strictement dominées.

Le théorème inverse est vrai dans le cas de l’unicité.

Théorème 152 :

Si, suite au rejet séquentiel de stratégies strictement dominées, chaque joueur se retrouve avec une seule stratégie, xi, alors x = (x1, . . . , xm) est l'équilibre de Nash dans ce jeu.

Les preuves de ces deux affirmations sont fournies à l'annexe B (p. 641). Il est important pour nous ici que le concept de Nash ne contredise pas les idées de rationalité inhérentes à la procédure d'abandon des stratégies strictement dominées.

Apparemment, il est naturel de supposer qu’un équilibre raisonnablement défini ne peut être écarté en écartant successivement des stratégies strictement dominées. Le premier des théorèmes peut être considéré comme une confirmation du caractère tout à fait raisonnable du concept de Nash. Noter que ce résultat fait uniquement référence à une domination stricte. On peut donner un exemple d'équilibre de Nash avec une ou plusieurs stratégies faiblement dominées (voir par exemple le tableau 16.11 à la p. 652).

16.2.5 Équilibre de Nash dans les stratégies mixtes

Il n’est pas difficile de construire des exemples de jeux dans lesquels il n’y a pas d’équilibre de Nash. Le jeu suivant fournit un exemple d’une telle situation.

Jeu 6. « Inspection »

Dans ce jeu, le premier joueur (la personne testée) est confronté à un choix : payer ou ne pas payer l'impôt sur le revenu. Le second, l'inspecteur des impôts, décide de contrôler ou non ce contribuable en particulier. Si un inspecteur « attrape » un contribuable sans scrupules, il lui inflige une amende et obtient une promotion qui compense largement ses frais ; dans le cas d'un contrôle sur un contribuable en bonne santé, l'inspecteur, bien que ne bénéficiant pas d'incitations, supporte néanmoins les frais liés au contrôle. La matrice des gains est présentée dans le tableau 16.9.

Tableau 16.9.

Inspecteur

vérifier

ne vérifie pas

violer

Vérifiable

ne pas violer

Si l’inspecteur est convaincu que le contribuable choisira de ne pas payer l’impôt, il aura alors intérêt à le vérifier. D’un autre côté, si le contribuable est sûr qu’il sera contrôlé, il a alors intérêt à payer l’impôt. De même, si l'inspecteur est sûr que le contribuable paiera la taxe, il n'est alors pas avantageux pour l'inspecteur de le contrôler, et si le contribuable est sûr que l'inspecteur ne le contrôlera pas, il préférera alors ne pas payer la taxe. . Les réponses optimales sont présentées dans le tableau en mettant en évidence les gains correspondants. Évidemment, aucune des cellules ne peut constituer un équilibre de Nash, puisqu’aucune cellule ne met l’accent sur les deux gains en même temps.

Dans un tel jeu, chaque joueur souhaite s'assurer que son partenaire ne puisse pas deviner quelle stratégie il a choisie. Cela peut être réalisé en introduisant un élément d’incertitude dans le choix de la stratégie.

Les stratégies que nous avons examinées plus tôt sont généralement appelées stratégies pures. Les stratégies pures dans les jeux statiques coïncident essentiellement avec les actions des joueurs. Mais dans certains jeux, il est également naturel d’introduire des stratégies mixtes. Sous stratégie mixte comprendre les distributions de probabilité sur les stratégies pures. Dans le cas particulier où l’ensemble des stratégies pures de chaque joueur est fini,

Xi = (x1 je , . . . , xn je je )

(le jeu correspondant est dit fini), la stratégie mixte est représentée par un vecteur de probabilités des stratégies pures correspondantes :

µi = (µ1 je , . . . , µn je je )

Notons l'ensemble des stratégies mixtes du i-ème joueur par Mi :

Mi = µi µk i > 0, k = 1, . . . , ni; µ1 je + · · · + µn je je = 1

Comme nous l'avons déjà noté, l'hypothèse standard de la théorie des jeux (comme théorie économique) est que si le gain est une variable aléatoire, alors les joueurs préfèrent les actions qui leur rapportent le plus grand gain attendu. Le gain attendu du i-ème joueur, correspondant à l'ensemble des stratégies mixtes de tous les joueurs, (µ1, . . . , µm), est calculé par la formule

L'espérance est calculée en supposant que les joueurs choisissent leurs stratégies de manière indépendante (au sens statistique).

Les stratégies mixtes peuvent être représentées comme le résultat de la randomisation de ses actions par un joueur, c’est-à-dire comme le résultat de leurs actions. sélection aléatoire. Par exemple, pour choisir chacune des deux stratégies possibles avec une probabilité égale, un joueur peut lancer une pièce de monnaie.

Cette interprétation implique que le choix de la stratégie dépend d'un signal que le joueur lui-même peut observer, mais que ses partenaires ne peuvent pas17. Par exemple, un joueur peut choisir une stratégie en fonction de son humeur, s'il connaît la distribution de probabilité de ses humeurs, ou encore sur quel pied il s'est levé ce jour-là18.

Définition 92 :

L’ensemble des stratégies mixtes µ = (µ1 , . . . , µm ) est Équilibre de Nash dans les stratégies mixtes, Si

1) la stratégie µ i de chaque joueur est sa meilleure réponse aux stratégies attendues des autres joueurs µe −i :

U(µi , µe −i ) = max U(µi , µe −i ) i = 1, . . . , n;

µ jeM je

2) les attentes coïncident avec les stratégies réellement choisies :

µe −i = µ−i i = 1, . . . , n.

Notez que l’équilibre de Nash dans les stratégies mixtes est l’équilibre de Nash ordinaire dans ce qu’on appelle l’extension mixte du jeu, c’est-à-dire un jeu dont les stratégies pures sont les stratégies mixtes du jeu original.

Trouvons l'équilibre de Nash dans les stratégies mixtes dans le jeu 16.2.5.

Notons µ la probabilité que le contribuable ne paie pas d'impôt sur le revenu,

UN via ν - la probabilité que l'inspecteur des impôts contrôle le contribuable.

DANS Dans ces notations, le gain attendu du contribuable est égal à

U1 (µ, ν) = µ[ν · (−1) + (1 − ν) · 1] + (1 − µ)[ν · 0 + (1 − ν) · 0] =

= µ(1 − 2ν),

UN la récompense attendue par l'inspecteur est

U2 (µ, ν) = ν[µ 1 + (1 − µ) (−1)] + (1 − µ)[µ 0 + (1 − µ) 0] = = ν(2µ − 1 )

Si la probabilité de vérification est faible (ν< 1/2), то налогоплательщику выгодно не платить налог, т. е. выбрать µ = 1. Если вероятность проверки велика, то налогоплательщику выгодно заплатить налог, т. е. выбрать µ = 0. Если же ν = 1/2, то налогоплательщику все равно, платить налог или нет, он может выбрать любую вероятность µ из интервала . Таким образом, отображение отклика налогоплательщика имеет вид:

En argumentant de manière similaire, on retrouve la réponse de l’inspecteur des impôts :

0 si µ< 1/2

ν(µ) = , si µ = 1/2

1 si µ > 1/2.

17 Si les signaux observés par les joueurs sont statistiquement dépendants, cela peut alors aider les joueurs à coordonner leurs actions. Cela conduit au concept d’équilibre corrélé.

18 Nous examinerons ensuite comment l'effet de randomisation peut être obtenu dans le cadre de l'équilibre bayésien.

Les graphiques de réponses des deux joueurs sont présentés dans la Fig. 16.4. Les axes de ce diagramme représentent les probabilités (ν et µ, respectivement). Ils ont un seul point commun (1/2, 1/2). Ce point correspond à l'équilibre de Nash dans les stratégies mixtes. Dans cet équilibre, comme c'est toujours le cas dans les équilibres à stratégies mixtes non dégénérées (c'est-à-dire dans les équilibres dans lesquels aucune stratégie n'est choisie avec une probabilité 1), chaque joueur randomise les stratégies qui lui procurent la même utilité attendue. Les probabilités d'utiliser les stratégies pures correspondantes choisies par le joueur sont déterminées non pas par la structure de gains de ce joueur, mais par la structure de gains de son partenaire, ce qui peut entraîner certaines difficultés dans l'interprétation de cette décision.

Riz. 16.4. Affichage des commentaires dans le jeu "Inspection"

Contrairement à l’équilibre dans les stratégies pures, l’équilibre dans les stratégies mixtes dans les jeux finis existe toujours19, ce qui est une conséquence de l’énoncé général suivant.

Théorème 153 :

Supposons que dans le jeu G = hI, (Xi )i I , (ui )i I i pour tout joueur, l'ensemble des stratégies Xi est non vide, compact et convexe, et la fonction de gain ui (·) est concave en xi et continue. Alors le jeu G a un équilibre de Nash (en stratégies pures).

L’existence d’un équilibre de Nash à stratégie mixte dans les jeux avec un nombre fini de stratégies pures est une conséquence du fait qu’un équilibre de stratégie mixte est un équilibre de stratégie pure dans une extension mixte du jeu.

Théorème 154 (Corollaire (Théorème de Nash)) :

Un équilibre de Nash dans les stratégies mixtes existe dans tout jeu fini.

Notons que l'existence d'un équilibre dans un jeu en stratégies pures n'exclut pas l'existence d'un équilibre dans les stratégies mixtes non dégénérées.

Considérons dans le jeu 16.2.1 « Choisir un ordinateur » un cas où les avantages de la compatibilité sont importants, c'est-à-dire un< c и b < c. В этом варианте игры два равновесия в чистых стратегиях: (IBM, IBM) и (Mac, Mac). Обозначим µ и ν вероятности выбора компьютера IBM PC первым и вторым игроком соответственно. Ожидаемый выигрыш 1-го игрока равен

U1 (µ, ν) = µ[ν · (a + c) + (1 − ν) · a] + (1 − µ)[ν · 0 + (1 − ν) · c] = = µ[ν · 2c − (c − a)] + (1 − ν)c

et sa réponse ressemble à

µ(ν) = ,

Le gain attendu du 2ème joueur est

si ν< (c − a)/2c

si ν = (c − a)/2c

si ν > (c − a)/2c.

U2 (µ, ν) = ν[µ c + (1 − µ) 0] + (1 − ν)[µ b + (1 − µ) (b + c)] =

= ν[µ 2c − (b + c)] + b + (1 − µ)c

et sa réponse ressemble à

ν(µ) = ,

si µ< (b + c)/2c

si µ = (b + c)/2c

si µ > (b + c)/2c.

Les graphiques d'affichage des réponses et les points correspondant aux trois équilibres sont présentés sur la figure. 16.5. Comme on peut le voir, dans le jeu considéré, en plus de deux équilibres en stratégies pures, il existe un équilibre en stratégies mixtes non dégénérées. Les probabilités correspondantes sont égales

µ = b + c et ν = c − a

Riz. 16.5. Le cas où dans le jeu « Computer Choice » il y a trois équilibres, dont l'un est un équilibre en stratégies mixtes non dégénérées

Annexe A

Le théorème est répété, le numéro est mis à jour, il n'y a aucun lien vers cette application. A et B peuvent être échangés

Théorème 155 :

Supposons que dans le jeu G = hI, (Xi )i I , (ui0 )i I i pour tout joueur, l'ensemble des stratégies Xi est non vide, compact et convexe, et la fonction de paiement ui (·) est concave en xi et continue. Il existe alors un équilibre de Nash.

Preuve : Montrons que l'application de réponse, Ri (·), de chaque joueur est semi-continue supérieure et que sa valeur pour chaque x−i X−i est non vide et convexe. Le non-vide découle du théorème de Weierstrass ( fonction continue atteint un maximum sur le compact).

16.2. Jeux statiques avec informations complètes

Montrons la convexité. Soit z0 , z00 Ri (x−i ). Évidemment, u(z0 , x−i ) = u(z00 , x−i de concavité en xi de la fonction ui (·) il s'ensuit que pour α

u(αz0 + (1 − α)z00 , x−i ) > αu(z0 , x−i ) + (1 − α)u(z00 , x−i ) =

U(z0 , x−i ) = u(z00 , x−i )

Puisque la fonction ui (·) atteint un maximum aux points z0 et z00, alors l'inégalité stricte

impossible. Ainsi,

αz0 + (1 − α)z00 Ri (x−i )

Montrons maintenant la semicontinuité supérieure de l'application Ri (·). Considérons une séquence xn i convergeant vers x¯i et une séquence xn −i convergeant vers x¯−i , et xn i Ri (xn −i ). Notons qu'en raison de la compacité des ensembles Xj x¯i Xi et x¯−i X−i . Nous devons prouver que x¯i Ri (x¯−i ). Par définition de la cartographie des réponses

u(xn je , xn −i ) > u(xi , xn −i ) xi Xi , n

De la continuité de la fonction ui (·) il résulte que

u(¯xi , x¯−i ) > u(xi , x¯−i ) xi Xi

Ainsi, selon la définition de la cartographie de réponse introduite ci-dessus, x¯i Ri (x¯−i ). Basé sur les propriétés récemment prouvées de l’application Ri (·) et du théorème de Kakutani,

prouvons l'existence d'un équilibre de Nash, c'est-à-dire un tel ensemble de stratégies x X pour

qui est terminé

xi Ri (x−i ) i = 1, . . . , n

Nous définissons l'application R(·) de X vers X comme suit :

R(x) = R1 (x−1 ) × · · · × Rn (x−n )

Notons que cette application satisfait les mêmes propriétés que chacune des applications Ri (·), puisqu'elle est leur produit cartésien.

L'application R(·) et l'ensemble X satisfont aux propriétés nécessaires au maintien du théorème de Kakutani. Il existe donc un point fixe de cartographie

Évidemment, le point x est un équilibre de Nash.

Appendice B

Dans cette annexe, nous prouvons formellement les affirmations sur le lien entre l’équilibre de Nash et la procédure d’élimination séquentielle des stratégies strictement dominées.

Premièrement, nous définissons formellement une procédure pour éliminer séquentiellement les stratégies strictement dominées. Supposons que le jeu original soit donné comme

G = hI, (Xi )I , (ui )I i.

Définissons une séquence de jeux (G[t] )t=0,1,2,... , dont chacun est obtenu à partir du jeu suivant en écartant les stratégies strictement dominées. Les jeux diffèrent les uns des autres par les ensembles de stratégies acceptables :

G[t] = hI, (Xi [t] )I , (ui )I i

La procédure commence par G= G.

L'ensemble des stratégies admissibles du i-ème joueur à l'étape t + 1 de la procédure considérée est pris égal à l'ensemble des stratégies non strictement dominées du i-ème joueur dans le jeu de la t-ème étape. Nous désignerons par NDi des ensembles de stratégies non strictement dominées (voir la définition des stratégies strictement dominées (Définition89, p. 631)). Officiellement

NDi = xi Xi yi Xi : ui (yi , x−i ) > ui (xi , x−i ) x−i X−i

Ainsi, on peut écrire l’étape de la procédure en question comme suit :

X je = ND je [t]

où NDi [t] est l'ensemble des stratégies strictement non dominées dans le jeu G[t] .

Présentons maintenant les preuves des théorèmes 151 et 152 (p. 636). Le théorème 151 énonce ce qui suit :

: Si x = (x1, . . . , xm) est un équilibre de Nash dans un jeu, alors aucune des stratégies ne peut être rejetée suite à l'application de la procédure d'élimination séquentielle des stratégies strictement dominées.

En utilisant la notation qui vient d'être introduite, le théorème 151 déclare que si x est un équilibre de Nash dans le jeu original G, alors à tout pas t

xi Xi [t] , je je, t = 1, 2, . . .

x X[t] , t = 1, 2, . . .

Preuve (Démonstration du Théorème 151) : Soit une étape τ telle que la stratégie xi d'un joueur i I doit y être écartée. On suppose qu’aucune stratégie n’a été abandonnée lors des étapes précédentes :

x X[t] , t = 1, . . . , τ.

Par la définition de la domination stricte, il existe une autre stratégie pour le joueur i, x0 i Xi [τ], qui donne à ce joueur dans le jeu G[τ] un gain plus élevé pour tout autre choix.

ui (x0 i , x−i ) > ui (xi , x−i ) x−i X− [τ i ]

En particulier, cette relation doit être vraie pour x−i, puisque nous avons supposé que les stratégies x−i n'avaient pas été écartées dans les étapes précédentes de la procédure (x−i X− [τ i ]). Moyens,

: Si, suite à l'élimination séquentielle des stratégies strictement dominées, chaque joueur se retrouve avec une seule stratégie, xi, alors x = (x1, . . . , xm) est l'équilibre de Nash dans ce jeu.

Ce théorème s'applique au cas où, en train d'écarter les éléments strictement dominés

stratégies partant d’une certaine étape ¯ il ne reste qu’un seul ensemble de stratégies, c’est-à-dire t x

Le théorème stipule que x est l’unique équilibre de Nash du jeu original.

Preuve (Démonstration du théorème 152) : Puisque, selon le théorème qui vient d'être prouvé, aucun des équilibres de Nash ne peut être écarté, il suffit de prouver que l'ensemble spécifié de stratégies x est un équilibre de Nash. Supposons que ce ne soit pas le cas. Cela signifie qu'il existe une stratégie x˜i d'un joueur i telle que

ui (xi , x−i )< ui (˜xi , x−i )

Par hypothèse, la stratégie x˜i a été écartée à une étape τ car elle ne coïncide pas avec xi. Il existe donc une stratégie strictement dominante x0 i Xi [τ] , donc

ui (x0 i , x−i ) > ui (˜xi , x−i ) x−i X− [τ i ]

En particulier, cette inégalité est vraie pour x−i = x−i :

ui (x0 je , x−i ) > ui (˜xi , x−i )

La stratégie x0 je ne peut pas coïncider avec la stratégie xi, puisque dans ce cas les inégalités ci-dessus se contredisent. À son tour, il s'ensuit qu'il doit y avoir une stratégie x00 i qui domine la stratégie x0 i à un certain pas τ0 > τ, c'est-à-dire

(x00

[τ0 ]

−je

Y compris

ui (x00 je , x−i ) > ui (x0 je , x−i )

On peut encore affirmer que la stratégie x00 i ne peut pas coïncider avec la stratégie xi, sinon les inégalités ci-dessus se contrediraient.

En poursuivant ces arguments, nous obtenons une séquence d'étapes τ< τ0 < τ00 < . . .

et les stratégies admissibles correspondantes x0 i , x00 i , x000 i , . . ., ne coïncidant pas avec xi . C'est contre-

/ 667. Deux joueurs placent un objet sur l'avion, c'est-à-dire choisissent ses coordonnées (x, y). Le joueur 1 est au point (x 1, y1), et le joueur 2 est au point (x2, y2). Le joueur 1 choisit la coordonnée x et le joueur 2 choisit la coordonnée y. Chacun s'efforce d'avoir l'objet le plus près possible de lui. Montrer que dans ce jeu chaque joueur a une stratégie strictement dominante.

/ 668. Montrer que si dans un jeu chaque joueur a une stratégie strictement dominante, alors ces stratégies constituent le seul équilibre de Nash.

/ 669. Expliquez pourquoi l'équilibre de stratégie dominante doit aussi être un équilibre de Nash. Donnez un exemple de jeu dans lequel il existe un équilibre de stratégie dominante et, en plus, il existe des équilibres de Nash qui ne coïncident pas avec l'équilibre de stratégie dominante.

Trouvez tous les équilibres de Nash dans les jeux suivants.

/ 670. Jeu 16.2.1 (p.625), dont les gains sont présentés dans le Tableau ??////??

/ 671. « Noix »

Deux joueurs partagent 4 noix. Chacun fait son offre pour les noix : xi = 1, 2 ou 3. Si x1 + x2 6 4, alors chacun obtient ce qu'il a demandé, sinon les deux n'obtiennent rien.

/ 672. Deux professeurs de la Faculté des sciences économiques rédigent un manuel. La qualité du manuel (q) dépend de leurs efforts (respectivement e1 et e2) selon la fonction

q = 2(e1 + e2 ).

La fonction objectif de chacun a la forme

ui = q − ei ,

c'est-à-dire la qualité moins l'effort. Vous pouvez sélectionner le niveau d'effort 1, 2 ou 3.

/ 673. « La troisième roue » Chacun des trois joueurs choisit une des faces de la pièce : « face » ou « face ». Si

Si les choix des joueurs coïncident, chaque joueur reçoit 1 rouble. Si le choix de l'un des joueurs diffère du choix des deux autres, alors il leur paie 1 rouble.

/ 674. Trois joueurs choisissent l'une des trois alternatives : A, B ou C. L'alternative est choisie à la majorité. Chaque joueur vote pour une et une seule alternative. Si aucune des alternatives n'obtient la majorité, c'est alors l'alternative A qui sera choisie. Les gains des joueurs, en fonction de l'alternative choisie, sont les suivants :

u1 (A) = 2, u2 (A) = 0, u3 (A) = 1,

u1 (B) = 1, u2 (B) = 2, u3 (B) = 0,

u1 (C) = 0, u2 (C) = 1, u3 (C) = 2.

/ 675. Deux blocs électoraux sont en train de se former qui se disputeront des sièges Assemblée législative villes N-sk. Chaque bloc peut choisir l'une des trois orientations : « gauche » (L), « droite » (R) et « écologique » (E). Chaque orientation peut attirer respectivement 50, 30 et 20 % des votants. On sait que si l'orientation qui les intéresse n'est pas représentée aux élections, alors les électeurs du groupe correspondant ne voteront pas. Si les blocs choisissent des orientations différentes, chacun recevra une part correspondante des voix. Si les blocs choisissent la même orientation, alors les voix du groupe d’électeurs correspondant seront réparties également entre eux. Le but de chaque bloc est d'obtenir le plus grand nombre votes.

/ 676. Deux joueurs placent un point sur l'avion. Un joueur choisit l'abscisse, l'autre -

ordonnée. Leurs gains sont donnés par les fonctions :

une) ux (x, y) = −x2 + x(y + a) + y2 , uy (x, y) = −y2 + y(x + b) + x2 ,

b) ux (x, y) = −x2 − 2ax(y + 1) + y2 , uy (x, y) = −y2 + 2by(x + 1) + x2 , c) ux (x, y) = − x − y/x + 1/2y2 , uy (x, y) = −y − x/y + 1/2x2 ,

(a, b - coefficients).

/ 677. "Les glaciers sur la plage"

Deux glaciers vendent des glaces sur la plage par une chaude journée. La plage peut être considérée comme un seul segment. Les glaciers choisissent où ils doivent se trouver sur la plage, c'est-à-dire qu'ils choisissent la coordonnée xi. Les clients sont répartis uniformément le long de la plage et achètent des glaces au vendeur le plus proche d'eux. Si x1< x2 , то первый обслуживают (x1 + x2 )/2 долю пляжа, а второй - 1 − (x1 + x2 )/2. Если мороженщики расположатся в одной и той же точке (x1 = x2 ), покупатели поровну распределятся между ними. Каждый мороженщик стремиться обслуживать как можно большую долю пляжа.

/ 678. « Enchères » Considérons une enchère comme celle décrite dans le jeu 16.2.2, à condition que le gagnant

aux enchères, le joueur paie le prix qu'il a indiqué.

/ 679. Analysez le jeu 16.2.1 « Sélection d'un ordinateur » (p. 624) et trouvez les réponses aux questions suivantes :

a) Dans quelles conditions sur les paramètres a, b et c y aura-t-il un équilibre dans les stratégies dominantes ? À quoi ressemblera cet équilibre ?

b) Dans quelles conditions les paramètres aboutissent-ils lorsque les deux choisissent IBM, un équilibre de Nash ? Quand cet équilibre est-il le seul ? Serait-ce aussi un équilibre dans les stratégies dominantes ?

/ 680. Chacun des deux voisins de l'entrée choisit s'il balayera ou non l'entrée une fois par semaine. Que chacun évalue pour lui-même le bénéfice d'une double propreté à a > 0 unités monétaires, le bénéfice d'une simple propreté à b > 0 unités, d'une entrée non nettoyée à 0 et les coûts de sa participation personnelle au nettoyage à c > 0. À quoi relations entre a, b et c dans le jeu il y aura des équilibres de la forme : (0) personne n'enlève, (1) on enlève, (2) les deux enlèvent ?

/ 681. Supposons que dans un certain jeu de deux joueurs, chacun ayant 2 stratégies, il existe un équilibre de Nash unique. Montrer que dans ce jeu au moins un des joueurs a une stratégie dominante.

/ 682. Chacun des deux joueurs (i = 1, 2) a 3 stratégies : a, b, c et x, y, z, respectivement. Prenant son nom comme une séquence infinie de caractères comme iwaniwaniwan. . . , définissez les gains du premier joueur comme suit : u1 (a, x) = "et", u1 (a, y) = "in", u1 (a, z) = "a", u1 (b, x) = « n » , u1 (b, y) = « et », u1 (b, z) = « dans », u1 (c, x) = « a », u1 (c, y) = « n », u1 (c, z ) = "et". Au lieu de chaque lettre du nom, remplacez son numéro dans l'alphabet, pour lequel utilisez le tableau 16.10. En utilisant le nom de famille de la même manière, définissez les gains du deuxième joueur, u2 (·).

1) Y a-t-il des stratégies dominantes et strictement dominantes dans votre jeu ? Si oui, constituent-ils un équilibre dans les stratégies dominantes ?

2) Quel sera le résultat du rejet systématique des stratégies strictement dominées ?

3) Trouvez les équilibres de Nash de ce jeu.

Tableau 16.10.

/ 683. Composez un jeu matriciel de trois joueurs utilisant leur prénom, leur nom et leur patronyme, chacun disposant de 2 stratégies. Répondez aux questions de la tâche précédente.

/ 684. Remplissez les gains manquants dans le tableau suivant pour que dans le jeu résultant. . .

(0) il n'y avait pas d'équilibre de Nash,

il y avait un équilibre de Nash,

il y avait deux équilibres de Nash,

il y avait trois équilibres de Nash,

(4) il y avait quatre équilibres de Nash.

/ 685. 1) Expliquez pourquoi, dans tout équilibre de Nash, le gain Le ième joueur ne peut pas être inférieur à

min max ui (xi , x−i ).

x −iX −ix iX je

2) Expliquez pourquoi dans tout équilibre de Nash, le gain du i-ème joueur ne peut pas être

moins que

x iX ix −iX −i

L'équilibre de Nash fait partie de la théorie des jeux, son auteur était le mathématicien américain John Nash. Cette théorie démontre le jeu optimal « dans le vide » : quand faire tapis ou suivre le push d'un adversaire. Il est important de comprendre que le push/call selon Nash dans les réalités du poker moderne n'est plus le seul correct. Elle n'est optimale que si vos adversaires connaissent cette stratégie et y adhèrent sans déviation.

La stratégie push/fold de Nash ne peut être utilisée de manière optimale que contre des joueurs forts et compréhensifs. Avec un écart minime, l’efficacité de cette stratégie diminue considérablement. L'utilisation la plus avantageuse de l'équilibre de Nash est de s'adapter à vos adversaires et d'ajuster votre propre jeu en fonction des ranges de vos adversaires.

Où utiliser l’équilibre de Nash ?

Les ranges d’équilibre de Nash conviennent pour jouer en Sit&Go et en tournois. Cette stratégie doit être utilisée lorsque votre stack est tombé à 15 big blinds ou moins et que votre jeu se résume à des décisions de push/fold. Pour perfectionner vos compétences de jeu, vous devez utiliser un logiciel spécial qui simule de telles situations : et ICMIZER.

Disons que votre adversaire est all-in et qu'il vous reste 14 big blinds. Selon l'équilibre de Nash, vous pouvez suivre avec un large éventail de mains avec 20 BB, y compris une paire de trois, QJ, QT et même K2.

Mais il s'agit d'une fourchette « en vase clos », qui ne prend pas en compte le type de tournoi, l'étape et la différence de paiements. Cette stratégie est correcte, mais seulement si le jeu ne comporte que deux décisions préflop : pousser ou se coucher. Dans les réalités modernes, les joueurs forts sont capables de jouer une main post-flop profonde avec un stack de 15 big blinds.

En plus d'utiliser l'équilibre de Nash, vous pouvez toujours simplement attendre une bonne main et suivre votre adversaire. Mais si vous ne savez pas exactement ce qu'est une bonne main par rapport à la taille de votre tapis, consultez les tables de Nash comme guide.

Plage de poussée Nash

Plage d'appel Nash

Couleur verte– stack effectif de 15 à 20 big blinds.

Couleur jaune et jaune foncé– stack efficace de 6 à 14 big blinds.

couleur rouge– stack efficace de 1 à 5 big blinds.

L'utilisation de Nash Equilibrium dans votre jeu profitera aux joueurs car elle leur fournira une première compréhension des ranges de poussée ou de suivi dans les situations de tournoi standard et les aidera à démarrer assez rapidement dans le poker.

DANS vrai vie des questions se posent souvent quant aux raisons pour lesquelles les entreprises coopèrent sur certains marchés et se livrent une concurrence agressive sur d'autres ; à quels moyens l'entreprise doit-elle recourir pour empêcher l'invasion de concurrents potentiels ; comment les décisions de tarification sont prises ; lorsque la demande ou les conditions de coûts changent. Pour étudier ces problèmes, les scientifiques utilisent la théorie des jeux.
Les premiers chercheurs dans le domaine de la théorie des jeux furent le mathématicien américain J.-F. Neumann et l'économiste austro-américain O. Morgenstern (« Game Theory and Economic Behaviour », 1944). Ils ont étendu les catégories mathématiques à la vie économique de la société, en introduisant les concepts de stratégies optimales, de maximisation de l'utilité attendue, de domination dans le jeu (marché) et d'accords de coalition. Ces scientifiques ont eu une influence stimulante sur le développement Sciences sociales en général, statistiques mathématiques, pensée économique, en particulier dans le domaine de l'utilisation pratique de la théorie des probabilités et de la théorie des jeux en économie.
Les scientifiques ont cherché à formuler des critères fondamentaux pour le comportement rationnel d'un acteur du marché. Ils distinguent deux types de jeux. Le premier - «à somme nulle» - prévoit un tel gain formé à partir des coûts des autres acteurs, c'est-à-dire que le montant total des avantages et des coûts est toujours égal à zéro. Un autre type est le « jeu à somme positive », dans lequel des joueurs individuels se disputent des gains en fonction de leurs paris. Parfois, ce gain est créé par la présence d'une « issue » (terme du jeu de cartes de bridge ; c'est le nom d'un des joueurs qui, en plaçant des paris, ne participe pas au jeu), complètement passive. et souvent celui qui sert d'objet d'exploitation. Dans les deux cas, le jeu est inévitablement associé au risque, puisque chacun de ses participants, comme le croyait J.-F.. Neumann et O. Morgenstern, « cherche à maximiser une fonction dont les variables ne sont pas contrôlées ». Si tous les joueurs ont les mêmes compétences, le hasard devient le facteur décisif. Cependant, cela arrive rarement. Presque toujours, le rôle le plus important dans le jeu est joué par la ruse, à l’aide de laquelle on tente de révéler le plan de l’ennemi et de voiler ses intentions, puis de prendre des positions avantageuses et de forcer l’ennemi à agir à perte. La « contre-astuce » joue également un rôle important.
Pendant le jeu, beaucoup dépend du comportement rationnel du joueur, c'est-à-dire d'un choix réfléchi et d'une stratégie optimale. L'élaboration d'une description formalisée (sous forme de modèles) des situations conflictuelles, notamment la « formule d'équilibre », c'est-à-dire la stabilité des décisions des adversaires dans le jeu, a été réalisée par J.-F. Nash
Nash John-Forbes (né en 1928) - économiste américain, lauréat prix Nobel(1994). Né à Bluefield (Virginie occidentale, USA). Il a étudié à l'Université Carnegie Mellon en tant qu'ingénieur chimiste, mais s'est intéressé aux mathématiques et a été transféré au département de mathématiques. A obtenu un baccalauréat en mathématiques et en même temps une maîtrise en mathématiques.
Il entre à l'école supérieure de spécialisation en mathématiques à l'Université de Princeton, où il soutient sa thèse de doctorat sur le thème « Jeux non coopératifs » (1950). L'année suivante, il a été publié dans un article distinct dans la revue Annals of Mathematics. Quand j'étais en terminale à l'université, j'ai participé à travail de recherche RAND Corp., qui a financé plusieurs de ses projets de recherche dans le domaine de la théorie des jeux, économie mathématique et la théorie générale du comportement rationnel dans les situations de jeu.
En 1951-1959 J.-F. Nash est membre du corps professoral du Massachusetts Institute of Technology. Parallèlement, il mène des activités de recherche. Il a réussi à résoudre le problème classique associé à la géométrie différentielle.
En raison d'une grave maladie, il n'a pas pu travailler pendant 20 ans.
Dans les années 70, la maladie s’est atténuée. Mais il n’a pas réussi à obtenir des résultats scientifiques productifs du plus haut niveau.
J.-F. Nash poursuit ses recherches en mathématiques. Au total, il a publié 21 articles scientifiques, dont 16 avant 1959.
Il est membre de la National Academy of Sciences des États-Unis, de l'Econometric Society et de l'American Academy of Arts and Sciences.
Dans la théorie des jeux classique, les jeux coopératifs et non coopératifs sont traités différemment. J.-F. Nash a été le premier à souligner la différence entre eux et a défini les jeux coopératifs comme des jeux qui permettent le libre échange d'informations et des conditions forcées entre les joueurs, et les jeux non coopératifs comme ceux qui ne permettent pas le libre échange d'informations et des conditions forcées. Un jeu est non coopératif lorsque la coopération entre les joueurs n’est pas du tout autorisée. Dans les articles « Points d'équilibre dans les jeux N-Numbered » et « The Bargaining Problem » (1951), il a dérivé mathématiquement avec précision les règles des actions des participants (joueurs) qui gagnent conformément à la stratégie choisie. Chaque acteur tente de réduire le degré de risque en utilisant la stratégie la plus rentable, c'est-à-dire en s'adaptant constamment au comportement de ceux qui souhaitent également obtenir les meilleurs résultats.
Après avoir étudié en profondeur différents jeux, en créant une série de nouveaux jeux de mathématiques et observant les actions des participants dans différentes situations de jeu, J.-F. Nash a cherché à comprendre comment fonctionnent les marchés, comment les entreprises prennent des décisions en matière de risques et pourquoi les acheteurs agissent comme ils le font. En effet, en économie, comme dans un jeu, les dirigeants d'entreprise doivent prendre en compte non seulement les dernières, mais aussi les étapes précédentes des concurrents, ainsi que la situation dans l'ensemble du domaine économique (le jeu, par exemple les échecs) et d'autres facteurs. .
On sait que les sujets la vie économique- ses acteurs actifs qui, sur un marché concurrentiel, prennent des risques, et ceux-ci doivent être justifiés. Chacun d’eux, comme le joueur, doit donc avoir sa propre stratégie. C’est précisément de là que partait J.-F.. Nash, développant une méthode qui fut plus tard appelée « équilibre de Nash ».
L'équilibre de Nash est un ensemble de stratégies ou d'actions selon lesquelles chaque participant met en œuvre la stratégie optimale, en anticipant les actions des adversaires.
La « stratégie » comme concept de base de la théorie des jeux par J.-F. Nash explique sur la base d'un « jeu à somme nulle » (« jeu symétrique »), où chaque participant dispose d'un certain nombre de stratégies. Les gains de chaque joueur dépendent de la stratégie qu'il choisit, ainsi que de la stratégie de ses adversaires. Sur cette base, une matrice est construite pour trouver la stratégie optimale qui, lorsque le jeu est répété plusieurs fois, fournit à un certain joueur le gain moyen maximum possible (ou la perte moyenne maximale possible). Puisque ce joueur ne sait pas quelle stratégie l'ennemi choisira, il est plus judicieux pour lui de choisir une stratégie conçue pour le comportement de l'ennemi qui lui est le plus défavorable (principe du « résultat garanti »). Agissant avec prudence et considérant le concurrent fort, ce joueur choisira le minimum gain possible. Et ainsi, parmi toutes les stratégies minimalement gagnantes, il choisira celle qui lui apportera le maximum de tout. gains minimum(«maximine»)
Son adversaire pense probablement la même chose. Il trouvera pour lui-même les plus grandes pertes dans toutes les stratégies de ce joueur, puis parmi ces pertes maximales, il choisira le minimum (« minimax »). Si le maximin est égal au minimax, les décisions des joueurs seront stables et le jeu sera équilibré. La stabilité (équilibre) des décisions (stratégies) réside dans le fait qu'il ne sera pas rentable pour les deux participants au jeu de s'écarter des stratégies choisies. Lorsque maximin n'est pas égal à minimax, alors les décisions (stratégies) des deux joueurs, s'ils ont au moins dans une certaine mesure deviné le choix de la stratégie de l'ennemi, seront instables et hors d'équilibre.
Cela signifie qu’un équilibre de Nash est un résultat dans lequel la stratégie de chaque joueur est la meilleure parmi les autres stratégies adoptées par les autres participants au jeu. Cette définition repose sur le fait que chaque acteur, en changeant son propre rôle, ne peut obtenir le plus grand bénéfice (maximisation de la fonction d'utilité) si les autres participants adhèrent fermement à leur propre ligne de comportement.
Sa « formule d'équilibre » J.-F. Nash a renforcé l'indicateur de la quantité optimale d'informations. Il l'a dérivé de l'analyse de situations où le joueur était parfaitement informé sur ses adversaires et avec des informations incomplètes sur eux. Après avoir traduit ce postulat du langage mathématique dans le langage de la vie économique, le scientifique a introduit (en tant qu'élément d'information important pour la connaissance des conditions de « l'environnement extérieur ») les variables incontrôlables des relations marchandes.
L'émergence de l'équilibre en science par J.-F. Nash a été découvert par de nombreuses études pour le rapprocher de la réalité économique réelle. Pour améliorer l'équilibre J.-F. Nash a dirigé les recherches de nombreux scientifiques. Parmi eux figurent J.-C. Harsanyi.
Harsanyi John-Charles (1920-2000) - économiste américain, lauréat du prix Nobel (1994). Né à Budapest (Hongrie), diplômé du Gymnase luthérien.
A reçu une formation médicale supérieure. En 1947, après avoir soutenu sa thèse de doctorat, il commence à travailler comme professeur à l'Institut universitaire de sociologie. En raison de ses opinions antimarxistes, il prend sa retraite en 1948 puis part en Australie. Là, il a travaillé dans une usine et a en même temps étudié à l'Université de Sydney, où il a étudié langue anglaise et l'économie. En 1953, il obtient une maîtrise.
Depuis 1954, il est maître de conférences en économie à l'Université de Brisbane. Deux ans plus tard, J.-C. Harsanyi a été honoré par la Fondation Rockefeller, qui l'a autorisé à rédiger sa thèse de doctorat à l'Université de Stanford pour les deux prochaines années.
En 1958 J.-C. Harsanyi retourne en Australie. Cependant, ressentant un certain isolement, la théorie des jeux étant alors pratiquement inconnue dans ce pays, il s'installe aux États-Unis, où il travaille comme professeur d'économie à l'Université de Détroit. En 1964, il était professeur au Walter Haas Economic Center de l'Université de Californie à Berkeley.
D'abord travaux scientifiques J.-C. Harsanyi a publié au début des années 1950 sur l'utilisation de la fonction d'utilité de Neumann-Morgenstern dans l'économie et l'éthique du bien-être. J.-C. Harsanyi est l'auteur de nombreux ouvrages sur l'éthique utilitariste, l'économie du bien-être et dans le domaine frontalier entre l'économie et la philosophie morale. Dans Comportement rationnel et équilibre de négociation dans les jeux et les situations sociales (1977), il plaide en faveur d'une « théorie générale du comportement rationnel » couvrant la « théorie de la décision individuelle », l'éthique des affaires et la théorie des jeux. Ses livres comprennent des Essais sur l'éthique, le comportement social et explication scientifique"(1976), "Travaux sur la théorie des jeux" (1982), " Théorie générale choix d'équilibre dans les jeux » (1988, en collaboration avec R.-J.-R. Selten), publié en russe en 2001, « Rational Interaction », etc.
J.-C. Harsanyi est docteur honoris causa de Northwestern et professeur honoraire de l'Université de Californie (États-Unis).
Le sujet de l'étude est J.-C. Les Harsany étaient situations difficiles, qui se produisent en présence d’informations asymétriques. Dans un jeu avec une information parfaite, tous les joueurs connaissent les avantages des autres, mais dans un jeu avec une information incomplète, ils ont besoin de cette connaissance.
Parce que l'interprétation de l'équilibre de Nash était basée sur la prédiction selon laquelle les joueurs connaissent les avantages des autres, toutes les méthodes n'étaient pas disponibles pour analyser les jeux avec des informations incomplètes, malgré le fait que ces jeux reflètent plus pleinement les relations stratégiques dans le monde réel.
La situation a été radicalement modifiée par les recherches de J.-C. Harsanyi (« Jeux avec des informations incomplètes joués par des joueurs baysiens »). Le scientifique a supposé que chaque joueur est l'un de plusieurs "types", et chaque type correspond à un ensemble d'avantages possibles pour le joueur et classe probablement presque tout le monde en types de joueurs. Cela signifie que chaque joueur d'un jeu avec des informations incomplètes choisit une stratégie de l'un de ces types. Avec une exigence convenue quant à la possibilité de répartir les joueurs, J.-C. Harsanyi a montré que pour chaque jeu avec des informations incomplètes, il existe un jeu équivalent avec des informations complètes. Autrement dit, il a transformé un jeu avec des informations incomplètes en un jeu avec des informations imparfaites. Dans ce cas, le jeu peut être régulé par des modèles standards.
Un exemple de jeu avec des informations incomplètes serait une situation dans laquelle des entreprises privées et Marchés financiers Je ne connais pas exactement les avantages d’une banque centrale par rapport au dilemme entre inflation et chômage. En conséquence, la politique bancaire concernant les taux d’intérêt futurs est également inconnue. L'interaction entre les anticipations futures et la politique des banques centrales peut être analysée à l'aide de la méthodologie proposée par J.-C. Harsanyi. Dans le très sous forme simple La banque peut soit se concentrer sur la lutte contre l’inflation et donc se préparer à mettre en œuvre des politiques restrictives avec des taux d’intérêt élevés, soit lutter contre le chômage avec des taux d’intérêt bas.
L'équilibre de Nash a été affiné et amélioré, notamment concernant les jeux à information incomplète, par R.-J.-R. Selten.
Selten Reinhard-Justus-Reginald (né en 1930) est un économiste allemand, lauréat du prix Nobel (1994). Né à Breslau (aujourd'hui Wroclaw, Pologne). En 1951, il est diplômé du lycée de Melsungen. C’est ici que je me suis intéressé aux mathématiques et que j’ai découvert la théorie des jeux pour la première fois. A étudié à la Faculté de Mathématiques de l'Université de Francfort-sur-le-Main, diplômé en 1957 pendant dix ans
R.-J.-R. Selten y travaillait comme assistant. Cette période de sa vie fut pleine de travail expérimental actif. En 1959, il soutient sa thèse de doctorat en mathématiques. De 1969 à 1972. il est professeur d'économie à l'Université libre de Berlin-Ouest. Il a ensuite travaillé à l'Université de Bielefeld, où il a poursuivi ses recherches expérimentales sur la théorie des jeux.
Depuis 1984 R.-J.-R. Selten est professeur au département d'économie de l'université Friedrich-Wilhelms de Bonn. Après avoir organisé une année de recherche (du 1er octobre 1987 au 30 septembre 1988) sur la théorie des jeux dans les sciences du comportement, il parvient à rassembler un large groupe international d'économistes, biologistes, mathématiciens, politologues, psychologues et philosophes. Leur travail global est décrit
dans 4 livres « Game Equilibrium Models » (1991). R.-J.-R. Selten est le fondateur de la théorie des jeux non coopératifs.
En 1995 R.-J.-R. Selten a été élu vice-président de l'Association économique européenne et, en 1997, son président. Il est membre de l'American Economic Association et de l'Econometric Society, siège à de nombreux comités de rédaction de revues scientifiques, est membre honoraire étranger de l'American Academy of Arts and Sciences, membre de l'US National Academy of Sciences et honoraire. docteur des universités de Bielefeld, Breslau, Graz et de l'université de Francfort-sur-le-Main, etc.
Dans l’article « Modèle d’oligopole avec inertie de la demande » (1965)
R.-J.-R. Selten a développé une « stratégie pure » avec des choix intuitifs. En compliquant et en clarifiant constamment «l'équilibre» noté avec des conditions supplémentaires pour les accords antérieurs sur le jeu, le scientifique l'a développé du point de vue de la dynamique et l'a rapproché des conditions de la vie réelle. Il a prouvé par des contre-exemples que même les points d’équilibre peuvent provoquer un comportement irrationnel. Selon le scientifique, seule une classe spéciale de points d’équilibre (il les appelait « vrais » ou « points d’équilibre parfaits ») garantit réellement un comportement rationnel dans un jeu non coopératif.
Le concept d’« équilibre de Nash » s’étend à la théorie des jeux dynamiques. Dans ce cas, chaque participant choisit une stratégie (c'est-à-dire un plan d'action pour chaque période du jeu) qui maximise son gain compte tenu des stratégies des autres joueurs. Le principal problème de l’équilibre dynamique de Nesch est que, dans la dernière Epoque les joueurs peuvent se comporter de manière irrationnelle. Au moment où il devient clair que cette période du jeu est la dernière, l'action précédemment choisie peut s'avérer irrationnelle (ne maximise pas le bénéfice). Un concept amélioré d'équilibre, proposé en 1975.
R.-J.-R. Selten, vous permet de vous débarrasser des hypothèses imprévues sur les stratégies. Ce concept d'« équilibre de Nash parfait », ou équilibre parfait de sous-jeu, stipule que les stratégies choisies par les joueurs sont l'équilibre de Nash dans chaque sous-jeu (c'est-à-dire dans chaque jeu d'une période du jeu principal), quelles que soient les actions effectuées auparavant. .
L’introduction de l’équilibre de Nash a constitué une étape importante en microéconomie. Son utilisation a contribué à une compréhension approfondie du développement et du fonctionnement des marchés, de la logique décisions stratégiques accepté par les dirigeants de différentes entreprises. Importante est la contribution de R.-J.-R. Selten, qui a affiné le concept d'équilibre de Nash pour analyser les interactions stratégiques au fil du temps et l'a utilisé pour analyser la concurrence dans des conditions impliquant un petit nombre de participants. Et la méthodologie d'analyse d'un jeu à information incomplète J.-C. Harsanyi a fourni base théorique pour la recherche sur l’économie de l’information.
L'équilibre de Nash peut être utilisé pour étudier le processus de négociations politiques et le comportement économique, en particulier sur les marchés oligopolistiques (une forme d'organisation de marché où existent plusieurs producteurs d'un produit homogène ou différencié). Il s'agissait de R.-J.-R. Selten a identifié le potentiel d’utilisation de modèles en politique. Sa collaboration avec le politologue américain A. Pelmuter a permis de développer le scénario dit de la méthode batch - une manière systématique de créer des modèles simples du jeu de conflits internationaux spécifiques, grâce auxquels il est possible de procéder à une vérification experte de faits empiriques.
Ainsi, la théorie des jeux augmentés a donné à l’économie de puissants outils mathématiques qui ont aidé les économistes à se libérer de leur dépendance à l’égard de l’appareil mathématique formel de la physique. L’équilibre de Nash est une méthode flexible pour analyser une variété de problèmes et de situations spécifiques sur les marchés.
La théorie des jeux a ensuite été utilisée dans les recherches de Thomas Schelling et Robert Ohmann. Ils étaient intéressés par la question : « Pourquoi certains groupes de personnes, organisations et pays réussissent-ils à coopérer, tandis que d'autres souffrent de conflits constants ?
Schelling Thomas Crombie (né en 1921) - économiste américain, lauréat du prix Nobel 2005 "Pour avoir fait progresser la compréhension des problèmes de conflit et de coopération grâce à l'analyse dans le cadre de la théorie des jeux." Professeur à l'Université du Maryland. Président de l'American Economic Association en 1991. Lauréat du prix Frank Seidman (1977). Œuvres majeures : « La stratégie du conflit » (1960) ; Micromotifs et macrocomportement, 1978 ; Choix et conséquence (Choix et conséquence, 1985).
Il a utilisé la théorie des jeux pour prendre des décisions rationnelles dans des conditions d'information insuffisante sur les conséquences possibles, comme base de combinaison et de recherche en sciences sociales dans son livre « La stratégie des conflits », publié dans les années 50 du siècle dernier pendant la course aux armements.
Dans son livre, Schelling montre, par exemple, que la capacité de riposter peut parfois être plus utile que la capacité de résister à une attaque, ou qu'une éventuelle rétribution inconnue est souvent plus efficace qu'une rétribution inévitable connue.
Le livre de Schelling examine les possibilités de résoudre les conflits stratégiques et les moyens d'éviter la guerre, mais ses conclusions pourraient également expliquer un large éventail de phénomènes dans le domaine de l'économie et de la compétitivité des entreprises.
R. Aumann, quant à lui, a consacré ses recherches à l'étude de la théorie des jeux répétés à l'infini, ou comment il est possible de maintenir certains résultats dans une relation sur une longue période de temps.
Aumann Israel Robert John (également Oman) (né en 1930) - mathématicien israélien, professeur à l'Université hébraïque de Jérusalem, lauréat du prix Nobel d'économie 2005 « pour avoir élargi la compréhension des problèmes de conflit et de coopération grâce à l'analyse de la théorie des jeux ».
Oman a reçu le prix Harvey en 1983. En 1994, le professeur Oman a reçu le Prix d'État d'économie d'Israël, aux côtés du professeur Michael Bruno.
R. Oman a dirigé la Société pour la théorie des jeux et, au début des années 1990, il a été président de l'Union israélienne des mathématiciens. Il a également été rédacteur en chef du Journal of the European Mathematical Society. Aumann a également conseillé l’Agence américaine de contrôle des armements et de désarmement. Il a étudié la théorie des jeux et ses applications pendant environ 40 ans. Œuvres majeures : « Jeux presque strictement compétitifs » (Jeux presque strictement compétitifs, 1961) ; « Stratégies mixtes et comportementales dans les jeux étendus infinis » (1964).
La théorie des jeux est la science de la stratégie. Elle étudie comment différents groupes concurrents – hommes d’affaires ou autres communautés – peuvent coopérer pour produire un résultat idéal.
Oman s'est spécialisé dans les « jeux répétitifs », analysant l'évolution des conflits au fil du temps. Les recherches d'Aumann reposaient sur l'idée que la coopération dans de nombreuses situations est plus facile à établir dans le cadre de relations stables à long terme.
La théorie d'Aumann explique pourquoi il est plus difficile d'obtenir une coopération entre un grand nombre de participants, étant donné la fréquence, la continuité et la fiabilité des contacts entre eux et la mesure dans laquelle chaque participant peut anticiper les actions des autres.
La recherche vise à expliquer les conflits économiques tels que les guerres des prix et les guerres commerciales, en révélant le mécanisme des négociations dans diverses conditions - depuis les demandes d'augmentation salaires avant la conclusion d’accords commerciaux internationaux.