Научная электронная библиотека. Игры с непротивоположными интересами

  • 08.04.2019

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться отверсии , проверенной 9 мая 2012; проверки требуют2 правки .

Перейти к: навигация ,поиск

Джон Форбс Нэш, ноябрь 2006

Равновесие Нэша (англ. Nash equilibrium ) названо в честьДжона Форбса Нэша - так втеории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша .

Концепция равновесия Нэша (РН) впервые использована не Нэшем; Антуан Огюст Курно показал, как найти то, что мы называем равновесием Нэша, в игре Курно. Соответственно, некоторые авторы называют егоравновесием Нэша-Курно . Однако Нэш первым показал в своей диссертации понекооперативным играм в 1950-м году, что подобные равновесия должны существовать для всех конечных игр с любым числом игроков. До Нэша это было доказано только для игр с 2 участниками снулевой суммой Джоном фон Нейманом иОскаром Моргенштерном (1947).

Формальное определение

Допустим, -игра n лиц в нормальной форме, где- набор чистых стратегий, а- набор выигрышей. Когда каждый игроквыбирает стратегиюв профиле стратегий, игрокполучает выигрыш. Заметьте, что выигрыш зависит от всего профиля стратегий: не только от стратегии, выбранной самим игроком, но и от чужих стратегий. Профиль стратегийявляется равновесием по Нэшу, если изменение своей стратегии снане выгодно ни одному игроку, то есть для любого

Игра может иметь равновесие Нэша в чистых стратегиях или в смешанных (то есть при выборе чистой стратегии стохастически с фиксированной частотой). Нэш доказал, что если разрешитьсмешанные стратегии , тогда в каждой игреn игроков будет хотя бы одно равновесие Нэша.

Литература

    Васин А. А., Морозов В. В. Теория игр и модели математической экономики - М.: МГУ, 2005, 272 с.

    Воробьев Н. Н. Теория игр для экономистов-кибернетиков - М.: Наука, 1985

    Мазалов В. В. Математическая теория игр и приложения - Изд-во Лань, 2010, 446 с.

    Петросян Л. А. , Зенкевич Н. А., Шевкопляс Е. В. Теория игр - СПб: БХВ-Петербург, 2012, 432 с.

Эффективность по Парето

Материал из Википедии - свободной энциклопедии

Перейти к: навигация ,поиск

Оптимальность по Парето - такое состояние системы, при котором значение каждого частного критерия, описывающего состояние системы, не может быть улучшено без ухудшения положения других элементов.

Таким образом, по словам самого Парето : «Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением». Значит, признаётся право на все изменения, которые не приносят никому дополнительного вреда.

Множество состояний системы, оптимальных по Парето, называют «множеством Парето», «множеством альтернатив, оптимальных в смысле Парето», либо «множеством парето-оптимальных альтернатив».

Ситуация, когда достигнута эффективность по Парето - это ситуация, когда все выгоды от обмена исчерпаны.

Эффективность по Парето является одним из центральных понятий для современной экономической науки. На основе этого понятия строятся Первая и Вторая фундаментальные теоремы благосостояния . Одним из приложений Парето-оптимальности является т. н. Парето-распределение ресурсов (трудовых ресурсов и капитала) при международной экономической интеграции, то есть экономическом объединении двух и более государств. Интересно, что Парето-распределение до и после международной экономической интеграции было адекватно математически описано (Далимов Р. Т., 2008). Анализ показал, что добавленная стоимость секторов и доходы трудовых ресурсов движутся противонаправленно в соответствии с хорошо известным уравнением теплопроводности аналогично газу или жидкости в пространстве, что дает возможность применить методику анализа, используемую в физике, в отношении экономических задач по миграции экономических параметров.

Оптимум по Парето гласит, что благосостояниеобщества достигает максимума, а распределение ресурсов становится оптимальным, если любое изменение этого распределения ухудшает благосостояние хотя бы одногосубъекта экономической системы.

Парето-оптимальное состояние рынка - ситуация, когда нельзя улучшить положение любого участника экономического процесса, одновременно не снижая благосостояния как минимум одного из остальных.

Согласно критерию Парето (критерию роста общественного благосостояния), движение в сторону оптимума возможно лишь при таком распределении ресурсов, которое увеличивает благосостояние по крайней мере одного человека, не нанося ущерба никому другому.

Проявляет себя в реальности, дабы показать, что это понятие является не просто абстрактным термином, а обобщением реально существующей закономерности. Однако, несмотря на наглядность примера, на основании только его одного может показаться, что мы наткнулись на какой-то вырожденный случай. Поэтому имеет смысл рассмотреть и более общее описание данного правила.

Многие читатели, возможно, знакомы с равновесием Нэша по одному весьма распространённому его частному случаю - так называемой «дилемме заключённого». Его суть примерно в следующем.

В тюрьме находятся два заключённых, которых взяли с поличным по отдельности, но ещё подозревают в более тяжких преступлениях. Если участие докажут, то срок заключённых возрастёт до десяти лет. Сейчас же они отсиживают по году каждый. Следствие предлагает каждому из них пойти на сделку и дать показания против второго. В этом случае первому срок скостят до полугода, а второй сядет на десять. Однако заключённые понимают, что если они оговорят друг друга, то вряд ли их обоих пощадят - скорее добавят каждому ещё лет по пять.

Расклад можно отобразить при помощи следующей таблицы.

Легко видеть, что «зелёные» варианты (1, 2) и (2, 1) являются симметричными, в двух же других положение заключённых будет идентичным. Поэтому можно рассмотреть логику ситуации с точки зрения только одного из заключённых - для второго она будет такой же.

Заключённый, разумеется, хочет наименьшего срока для себя. Но если он будет хранить молчание, то, возможно, его коллега даст против него показания, чем повысит ему срок до десяти лет. Если бы не обещанное снижение срока, то можно было бы тешить себя мыслью «а зачем мне это?», но соблазн снизить срок слишком вели́к. Кроме того, второй заключённый, как понимает первый, будет подозревать его, первого, в том, что он даст показания против второго и повысит тем самым ему срок.

«Обидно будет оказаться крайним и загреметь на десять лет», - думает первый. Но «и второй наверняка думает так же, и так же подозревает меня, - понимает он, - а потому шансов, что коллега меня не заложит, очень мало. Выходит, надо давать показания: если второй каким-то чудом промолчит, то будет полгода, проговорится - пять. Ну хоть не десять, которые я неизбежно получу из-за разоткровенничавшегося со следствием моего подельника!».

«Оранжевый» вариант (1, 1) является удобоваримым для обоих и в каком-то смысле это оптимум в данной ситуации. Однако у каждого есть ещё лучший вариант - соответствующий «зелёный» (1, 2) или (2, 1). В результате чего на деле будет реализован «красный» вариант (2, 2).

Можно сказать, что для каждого из заключённых он не так плох: всего пять лет против десяти в «зелёном» варианте в пользу подельника. Однако представим, что в «красном» варианте обоим дадут по десять. Логика в данном случае чуть-чуть поменяется: «если я его сдам, то хотя бы есть шанс отвертеться от десяти лет, а если промолчу - шансов нет, он меня наверняка заложит по тем же соображениям». Однако тут система подталкивает заключённых выбрать наихудший вариант из возможных. Действуя, что характерно, строго ради своей выгоды.

Рассмотрим теперь ещё одну ситуацию. Есть две фирмы - А и Б. Каждая из них может воспользоваться стратегией - Икс или Игрек. Однако на результаты оказывает влияние не только стратегия, выбранная самой фирмой, но и стратегия второй фирмы тоже. Выигрыш или проигрыш каждой из фирм мы представим в виде следующей таблицы.

Я специально для повышения накала страстей подобрал числа так, чтобы убыточное для обеих фирм состояние лишь незначительно отличалось бы от «соседних» с ним: тем удивительнее, что будет реализовано именно оно. Фирмы, действуя строго в своих интересах, с большой вероятностью захотят получить тысячу рублей вместо ста и тем самым не получат ничего, а наоборот, даже утратят. Переход же одной из фирм на стратегию Икс ещё сильнее ухудшит её положение - другая фирма будет обогащаться, а вторая терять ещё больше, хотя и незначительно больше.

Запишем вышеприведённые матрицы в более общем виде, абстрагировавшись от «фирм», «заключённых», «сроков» и «рублей». Положим, что у нас просто есть два игрока А и Б, играющие в некоторую игру, где на каждом ходе можно совершить один из двух ходов - Икс или Игрек. Выигрышем являются просто некие «баллы», наибольшее число которых каждый игрок и стремится набрать.

А делает ход Икс А делает ход Игрек
Б делает ход Икс А: a 0
Б: b 0
А: a 1 > a 0
Б: b 1 < b 3
Б делает ход Игрек А: a 2 < a 3
Б: b 2 > b 0
А: b 3
Б: a 3

Правила игры, представленные данной матрицей, будут «подталкивать» игроков к реализации «красного» варианта (2, 2), даже если выигрыши игроков в этом случае существенно меньше, чем во всех остальных вариантах. Правда, в зависимости от соотношения выигрышей (которые могут быть в том числе отрицательными - то есть проигрышами), обозначенных буквами «a» и «b» с индексами, частота реализации каждого из вариантов будет разной.

В частности, на выбор может влиять среднее арифметическое выигрышей при выборе каждой из стратегий, а также предположительная вероятность, с которой игрок сделает тот или иной ход (которая, кстати, может быть аппроксимирована частотой ходов, сделанных в предыдущих раундах). Так, в простейшем случае игрок А для оценки хода Икс складывает a 0 и a 2 и делит результат на два, полагая выбор хода со стороны Б равновероятным. То же самое он проделывает для хода Игрек - складывает a 1 с a 3 , после чего делит результат на два - и сравнивает результаты. В более сложном случае игрок считает сумму a 0 *p x + a 2 *p y , где p x и p y - вероятности ходов Икс и Игрек, сделанных игроком Б. Результат сравнивается с a 1 *p x + a 3 *p y .

Можно было бы, конечно, снова поделить результат на два, но поскольку деление на два имеет место быть для обоих вариантов хода, для сравнения величин эта операция необязательна, как, впрочем, и в случае «равновероятных ходов».

Также игрок может ориентироваться на сами величины. Например, если один из ходов означает вероятный проигрыш - особенно крупный, такой, какой игрок не может себе позволить, - игрок, не исключено, будет выбирать другой ход, даже если предположительный выигрыш при другом ходе в среднем ниже, но зато в обоих случаях положительный.

Наконец, надо помнить, что люди часто, скажем так, «помнят о другом игроке». Если второй игрок - конкурент или даже враг, то, возможно, будет иметь место тенденция выбирать такой ход, который навредит другому игроку, даже если первый игрок из-за этого выиграет мало, и даже, не исключено, проиграет. Если второй игрок - друг, то чаще будет выбираться ход, позволяющий чуть-чуть выиграть и ему тоже - в том случае, если «игра» - это не заранее заявленное соревнование, а какой-то процесс из реальной жизни. Возможности мести и поблажек, разумеется, зависят от соотношений в матрице - при некоторых из них скорее забудут, что соперник - твой друг, чем начнут ему слегка подыгрывать.

Иными словами, рассматриваемый нами принцип отображает именно что тенденцию, а не детерминированность. Чем сильнее соотношения значений выигрышей и проигрышей подобны фигурировавшим в «дилемме заключённого», тем чаще и быстрее система будет подводить игроков к «наихудшему» варианту и тем «более наихудшим» будет этот вариант.

Есть как бы «невидимая рука рынка», которая как бы невидимо подталкивает игроков… ну, вы знаете. Точнее, нет, может быть, и не знаете. В классическом варианте «рука рынка» как бы подталкивает куда всем надо, а тут она толкает совсем не туда. Не во всеобщее благо, а в перманентный кризис, которого при иных раскладах можно было бы избежать, что нам иллюстрирует и «дилемма заключённого», и гипотетический пример с конкуренцией фирм, и реальный пример с неизбежным завышением сроков разработки софта, о котором речь шла в предыдущей статье.

Рынок толкает игроков к равновесию Нэша, которое сколь угодно далеко может отстоять от их общего и личного блага.

В данном случае мы рассматривали только двух игроков и игру с двумя ходами, однако возможно и более широкое обобщение, которое как раз и является формулировкой равновесия Нэша:

Если в некоторой игре с произвольными количеством игроков и матрицей выигрышей существует такое состояние, что при выборе не соответствующего ему хода любым из игроков в отдельности его личный выигрыш уменьшится, то это состояние окажется «равновесным» для данной игры.

Кроме того, в ряде случаев ходы игроков будут иметь тенденцию стремиться к этому состоянию, даже если в этой игре есть другие состояния, в рамках которых выигрыш игроков в целом и/или по отдельности выше.

Приводить примеры такого общего случая способом, подобным ранее использованному, ощутимо тяжелее, поскольку добавление каждого игрока будет добавлять ещё одно измерение к матрице выигрышей. Однако об этом - позже.

Определение 2.10. Пусть задана игра G в нормальной форме (N,Sj , Исход s = (s, s 2 > > %)е5 называется равновесием

Нэша (NE - Nash Equilibrium) игры G, если Vi е 1.....N, Уу, е 5,

Иначе говоря, каждый из игроков максимизирует свою функцию полезности

на множестве своих стратегий.

В точке равновесия Нэша стратегия х,- - одна из лучших для игрока i стратегий в ответ на х_ ; =(х 1 ,х 2 ,--.,^_ 1 ,х 1+1 ,...,х лг) - стратегии остальных игроков. Игрок i рассматривает стратегии из х_ ; как заданную вполне определенную совокупность стратегий «внешнего мира», на которую он не может активно воздействовать. Он может активно выбирать лишь свою стратегию в, которая будет наилучшим выбором, если остальные игроки выберут s_j. При этом игрок i полагает, что аналогично выбирают свои стратегии и все остальные игроки.

В точке равновесия Нэша игроку i невыгодно в одиночку отклоняться от стратегии s it если остальные игроки придерживаются стратегий 5 1 ,s 2 ,...s,-_ 1 ,s i+1 ...s N . Действия «в одиночку» могут только уменьшить выигрыш игрока i. Поиск точки равновесия Нэша, таким образом, сводится к решению системы из N задач максимизации функций полезности по соответствующим переменным

Пусть G - (N, 5,-, Uj , i - 1,..N) - конечная игра в нормальной форме.

Назовем X,- множеством смешанных стратегий игрока i, а множество X = X,-Х 2 -...-X jV - множеством профилей всех смешанных стратегий. Обозначим аеХ - элементы этого множества.

Назовем игру G = (N; X; и) смешанным расширением игры G. Тогда равновесие в смешанных стратегиях в игре G - это равновесие Нэша в ее смешанном расширении.

Пример 2.17. Задана биматричная игра

Какие выигрыши будут у игроков при выборе ими стратегий т = 0 + 0,и п = 0,25с + 0,75d ?

Решение

Запишем рядом с чистыми стратегиями вероятности их выбора:

Поскольку выбор стратегий осуществляется игроками независимо, вероятность профиля (а; с) равна 0,4-0,25 = 0,1. Аналогично рассчитываются вероятности выигрышей игроков при остальных наборах чистых стратегий. Для удобства выигрыши игроков представим в виде вектор-столбца:

Ответ: щ - 2; и 2 = 0,25.

Наряду с равновесием Нэша введем еще одно важное понятие - доминирования по Парето.

Пусть задана игра в нормальной форме G = (N,Si, u it i = l,...,N). Рассмотрим два профиля стратегий x = (x,x 2 ,...,x jY)e5 и i/ = (i/ v i/ 2 ,...,yy)&S.

Определение 2.11. Профиль стратегий х доминирует по Парето профиль стратегий у, если

Последняя система неравенств означает, что для всех игроков профиль х не хуже, чем профиль у, но при этом хотя бы для одного из игроков профиль х лучше, чем у.

Определение 2.12. Профиль стратегий х называется оптимальным по Парето (Парето-оптимальным), если он недоминируем но Парето.

Если исход оптимален но Парето, то он характеризуется следующим свойством: невозможно улучшить положение ни одного из игроков без ухудшения положения хотя бы одного из других игроков.

Пример 2.18. Найти точки равновесия Нэша, точки равновесия в строго доминирующих стратегиях и Парето-оптимальные точки в матричной игре двух игроков с заданными платежными матрицами:

Решение

Очевидно, ни одна из стратегий не является строго доминируемой. Поэтому равновесия в строго доминирующих стратегиях нет.

Для определения равновесий Нэша подчеркнем наибольшие выигрыши каждого из игроков при фиксированных ходах противника:

Исходы с двойными подчеркиваниями будут равновесиями Нэша: (a; d) (b; с); (b;d ).

Для определения Парето-оптимальных исходов удобно изобразить все точки биматричной игры в критериальной плоскости (рис. 2.21 - по осям откладываем выигрыши игроков).


Рис. 2.21

Парето-оптимальными являются точки, в направлении штриховки от которых (к «северо-востоку») нет других точек. Таковыми являются исходы (а ; d) (а; с); (Ь; с). Введем для краткости обозначения для Парето- оптимальных точек - Р и для равновесных по Нэшу - N. Получим

Выясним, существуют ли в этой игре равновесные по Нэшу профили смешанных стратегий.

Пусть стратегии а и b играются с вероятностями р и 1 - р соответственно, а стратегии с и d - с вероятностями q и 1 - q.

Максимизируем функцию щ(р, q) = 3q - 2pq по переменной р е при постоянном значении q

К аналогичному результату приводит рассмотрение рационального поведения второго игрока, оптимизирующего u 2 (p,q ) по переменной q при постоянном значении р

Изобразим полученный результат (рис. 2.22) в координатах (q, р ):

Рис. 2.22

Как видим, оба графика совпали.

Равновесия Нэша:

Пример 2.19. Найти точки равновесия Нэша (в смешанных стратегиях) и Парето-оптимальные точки в матричной игре двух игроков с заданными платежными матрицами:

Решение

Очевидно, доминирующих стратегий в игре нет. Точек равновесия Нэша в чистых стратегиях также нет. Парето-оптимальные профили: (а ; d) и {b d).

Рассмотрим смешанные стратегии игроков.

Пусть стратегии а и b играются с вероятностями р и 1 - р соответственно, а стратегии cud - с вероятностями q и 1 - q. Запишем матрицу ожидаемых выигрышей первого и второго игроков:

Очевидно, первый игрок решает задачу

Решением задачи является

Эти три случая представлены на рис. 2.23.

Рис. 2.23

Аналогично второй игрок решает задачу Решением задачи является

Эти три случая представлены на рис. 2.24.

Рис. 2.24

Совмещая рисунки, получим рис. 2.25.

Рис. 2.25

Точка N (р = 0,75; q = 0,6), очевидно, является точкой равновесия Нэша в смешанных стратегиях, поскольку она получена в результате решения задач максимизации функции u x (p,q ) пори u 2 (p,q) по q.

Ответ: равновесие Нэша:

Как соотносятся между собой решения игр в чистых стратегиях, полученные методом итерационного исключения строго доминируемых стратегий (если они существуют) и равновесий Нэша? Ответ на этот вопрос дают следующие две теоремы.

Теорема 2.3. Если существует процедура итерационного исключения строго доминируемых стратегий в игре G - (S ;, щ;i - 1,...,N), которая приводит к единственному исходу s = (s i ,s 2 ,...,s N), то этот исход является единственным равновесием Нэша.

Доказательство теоремы достаточно очевидно, поскольку процедура итерационного исключения строго доминируемых стратегий в конечной игре не может исключить равновесия Нэша. И в силу единственности получаемого исхода он будет единственным равновесием Нэша.

Замечание. Если в теореме 2.3 исключить слово «строго», то она перестает быть справедливой. Например, в игре

исходы (а; с) и (Ь; с) являются точками равновесия Нэша, хотя стратегия b доминируема.

Теорема 2.4. Если исход явля

ется равновесием Нэша, то он не может быть исключен в процедуре итерационного исключения строго доминируемых стратегий.

Доказательство теоремы следует из определения строгой доминируемости стратегии.

Пример 2.20. Рассмотрим матричную игру:

Точка равновесия Нэша - (а,х). Однако стратегия а первого игрока доминируема (не строго) стратегией с, а стратегия х второго игрока доминируема стратегией у. Тем самым мы показали, что условие строгой доминируемое™ в теореме существенно.

Пример 2.21. Рассмотрим игру двух игроков, называемую «битва полов» (или «семейный спор»). Саша и Маша пытаются решить, как им проводить выходной день, - пойти на футбол или на балет. Конечно, Саше больше хочется пойти на футбол, Маша же получает большее удовольствие от балета. Но совсем никакого удовольствия они не получат, если будут развлекаться порознь (бывает же такое!). Саша и Маша выбирают место развлечения одновременно и независимо друг от друга, не сговариваясь. Матрица выигрышей имеет следующий вид :

В данной игре исход (Футбол; футбол) является точкой равновесия Нэша. Это значит, что если игроки договорились о выборе каждым из них первой стратегии, то ни одному из них невыгодно будет отклоняться от нее, если другой ее придерживается. Аналогично и исход (Балет; балет) будет точкой равновесия Нэша. Рассмотрим теперь возможность выбора игроками смешанных стратегий. Пусть первый игрок (Саша) выбирает первую и вторую чистые стратегии с вероятностями соответственно р и 1 - р. Второй игрок (Маша) выбирает первую и вторую чистые стратегии с вероятностями соответственно q и 1 -q. Получаем матрицу

Выигрыш Саши равен

Стратегия Саши определяется выбором вероятности р. Функция выигрыша Саши и с (р, q) р ,

если , и, следовательно, приСаша выберет максимальное значение вероятности, т.е.р = 1.

Аналогично если, то функция u c (p,q) - убывающая по переменной/;, и, следовательно, при Саша, максимизируя свой выигрыш, выберет минимальное значение вероятности, т.е. р = 0.

При функция и с (р> q) не зависит от р и Сашу удовлетворяет любое значение р е . Таким образом, имеем

Все сказанное наглядно представляется диаграммой (рис. 2.26).

Рис. 2.26

Выигрыш Маши равен

Стратегия Маши определяется выбором вероятности q. Функция выигрыша Маши u M (p,q) является монотонно возрастающей по переменной q,

если , и, следовательно, приМаша выберет максимальное значение вероятности, т.е.q = 1.

Аналогично если , то функция u M (p,q) - убывающая по переменной q, и, следовательно, приМаша выберет минимальное значение

вероятности, т.е.

При функция и и (р, q) не зависит от q и Машу удовлетворяет

любое значение

Все сказанное наглядно представляется диаграммой (рис. 2.27). Совмещение диаграмм на рис. 2.26 и 2.27 дает три точки пересечения наилучших выборов игроков на всевозможные действия другого игрока (рис. 2.28).

Имеем три точки равновесия Нэша. Первые

две из них соответствуют выбору чистых стратегий (Балет; балет) и (Футбол; футбол). Третья точка представляет собой точку равновесия Нэша в смешанных стратегиях.

Заметим, что значения платежных функций обоих игроков в точке В соседней точке, например , значения платежных функций игроков равны Однако

эта точка не будет точкой равновесия, поскольку если Маша будет придерживаться стратегии , то Саше будет более выгодна стратегия р = 1,

поскольку

Рис. 2.27

Пример 2.22. Рассмотрим пример биматричной игры, в которой существует бесконечно много равновесий 11эша:

Выигрыш первого игрока равен

р получим

Графически этот выбор изображается следующим образом (рис. 2.29).

Рис. 2.29

q вторым игроком. Но первый игрок не знает, каков выбор второго игрока. Он лишь знает, что второй игрок будет также максимизировать свою функцию выигрыша по переменной q.

Выигрыш второго игрока равен

Из условия максимизации функции выигрыша по переменной q получим

Графически этот выбор изображается следующим образом (рис. 2.30).

Рис. 230

Совместим графики на рис. 2.29 и 2.30 (рис. 2.31).

Рис. 2.31

Графики совпадают на отрезке АВ и в начале координат. Все эти точки и будут равновесиями Нэша в смешанных стратегиях. Точка p = q = 0 означает выбор профиля чистых стратегий (b;d ). Поэтому получим: NE:{(b;d), (pa + (l-p)b ; с), ре }.

Следующая теорема дает ответ на вопрос о существовании равновесия Нэша в довольно широком классе игр.

Теорема 2.5 (Нэш, 1950). Для любой конечной игры (т.е. множество игроков и множества их чистых стратегий конечны) в нормальной форме G = (N,S jt Uj,i = 1,..., N) всегда существует по крайней мере одна точка равновесия Нэша, возможно, в смешанных стратегиях.

Чистые стратегии могут быть строго доминируемы смешанными стратегиями, даже если в чистых стратегиях не существует доминируемых стратегий. Покажем это на следующем примере.

Пример 2.23. Дана биматричная игра:

Найти все равновесия Нэша в смешанных стратегиях.

Решение

В данной биматричной игре невозможно, рассматривая только чистые стратегии игроков, исключить строго доминируемые стратегии. Попробуем найти смешанную стратегию, которая доминирует чистую стратегию.

Сначала рассмотрим возможность исключения строго доминируемых строк. Выпишем для удобства матрицу выигрышей первого игрока (он выбирает строки):

Очевидно, никакая смешанная стратегия ра + (1- р)Ь не сможет доминировать чистую стратегию с, поскольку неравенство /?-0 + (1-/?)-2>14 невыполнимо ни при каких значениях р е . Значит, стратегия с не может быть строго доминируема даже с применением смешанных стратегий.

Как было доказано выше, величина f(p) = p-A + (l-p) B при /?е, {А и В - действительные числа) может принимать все значения между числами А и В. Действительно, поскольку /(/?) - линейная функция, то множеством ее значений является отрезок E(f) = .

Аналогично стратегия а не может быть доминируема смешанной стратегией pb + (l-р)с, поскольку (при выборе вторым игроком стратегии е) потребуется выполнение неравенства 4/?+ 4(1-/?) >6.

Предполагая, что смешанная стратегия pa + (1 - р)с может строго доминировать чистую стратегию Ь, также получим невыполнимое неравенство 2/?+ 4(1-/?) >8.

Следовательно, в данной игре не существует строго доминируемых стратегий первого игрока.

Рассмотрим стратегии второго игрока. Выпишем матрицу его выигрышей:

Очевидно, стратегии ей/ недоминируемы. Поскольку 2 е , 1 е , то можем предположить, что существует смешанная стратегия qe + (l-q)f, строго доминирующая чистую стратегию d. Проверим наше предположение. Для этого требуется выполнение системы неравенств:

Необязательно было решать систему неравенств. Достаточно догадаться, что эта система имеет какое-нибудь решение. Например, в данной задаче

видно, что смешанная стратегия строго доминирует стратегию d.

Важно понимать, что не только второй игрок исключает стратегию d, но и первый игрок, поставив себя на место второго и выполнив за него все указанные операции, может прийти к вывод}" об исключении стратегии d.

Вычеркнув первый столбец, получим матрицу

Нетрудно увидеть, что в этой матрице смешанная стратегия первого

игрока строго доминирует стратегию с (это стало очевидным только

после исключения стратегии d). Игра сократилась до биматричной игры размерности 2x2:

Теперь е>/. Получим

И наконец, а >- Ь.

Равновесие Нэша: (а; е). Этот исход будет единственным равновесием Нэша в исходной игре, поскольку процедура исключения строго доминируемых стратегий не может исключить равновесный по Нэшу профиль стратегий.

Пример 2.24. Последовательным исключением строго доминируемых чистых стратегий привести биматричную игру к игре размерности 2x2 (смешанная стратегия может доминировать чистую). Найти все равновесия Нэша в смешанных стратегиях.

5) Пусть первый игрок играет смешанную стратегию рА + ( 1 - р)С, а второй - qE + (-q)F.

Выигрыш первого игрока равен

Из условия максимизации функции выигрыша по переменной р получим

Графически этот выбор изображается следующим образом (рис. 2.32).

Рис. 2.32

Это наилучшее для первого игрока действие, зависящее от выбора вероятности q вторым игроком.

Выигрыш второго игрока равен

Из условия максимизации функции выигрыша по переменной q получим Графически этот выбор изображается следующим образом (рис. 2.33).

Рис. 2.33

Совместим графики на рис. 2.32 и 2.33 (рис. 2.34).

Рис. 2.34

Графики совпадают в трех точках. Эти точки и будут определять равновесия Нэша:

Пример 2.25. Найти все равновесия Нэша в смешанных стратегиях в биматричной игре

Решение

Способ 1. Нетрудно видеть, что в данной игре не существует строго доминируемых стратегий. Введем смешанные стратегии игроков:

Выигрыш первого игрока максимизируем по переменной р:

Выигрыш второго игрока максимизируем по переменным q и г.

Рассмотрим различные значения р (рис. 2.35).

Рис. 235

Случай 1. Пусть р 0,5. Тогда из (2) и (3) получим р - 0. Итак, (р = ();q = 0;г = 1) - равновесие Нэша. Это исход (b, d).

Случай 2. Пусть р = 0,5. Тогда из (2) получим q = 0, а из (1) 5г= 3, или г = 0,6. Следовательно, (р = 0,5; q = 0; г = 0,6) - равновесие Нэша. Это исход (0,5а + 0,56, 0,6d + 0,4е).

Случай 3. Пусть р е (0,5; 1). Тогда из (2) и (3) получим q = 0; г= 0. Но тогда из (1) имеем р = 1, что противоречит исходному условию.

Случай 4. Пусть р = 1. Тогда из (3) получим г = 0, а из (1) q 3, что выполняется при всех допустимых q. Итак, (р = 1; е;г = 0) - равновесия Нэша. Это исходы (a, qc + (-q)e), qe[ 0; 1].

Ответ: (6, d) (0,5а + 0,56, 0,6с/ + 0,4с); (a,qc + (-q)e), ^е.

Покажем еще один способ нахождения равновесий Нэша в таких играх.

Способ 2 (решения примера 2.25). Рассмотрим выигрыши второго игрока при условии выбора первым игроком смешанной стратегии ра + (-р)Ь. Выигрыш второго игрока при выборе им чистой стратегии с равен U - 3 р при выборе чистой стратегии d - = р + 3(- р)] при выборе чистой стратегии е - U? 2 =Зр + (-р).

Построим графики функций выигрыша второго игрока (рис. 2.36).


Рис. 2.36

Случай 1. Пусть р d. Но наилучшим ответом первого игрока на стратегию второго d является чистая стратегия b (2 > 0), т.е. р- 0, что удовлетворяет исходному условию р 0,5. Следовательно, (b , d) - равновесие Нэша.

Случай 2. Пусть р е (0,5; 1). Тогда второй игрок выбирает чистую стратегию е. Но наилучшим ответом первого игрока на стратегию второго е является чистая стратегия а (4 > 1), т.е. р = 1, что не удовлетворяет исходному условию. В данном промежутке нет равновесий Нэша.

Случай 3. Пусть р = 0.5. Тогда вторым игроком не будет играться стратегия с, г.е. q - 0. Рассмотрим игру

Математическое ожидание выигрыша первого игрока равно

Значение р = 0,5 может быть наилучшим ответом на смешанную стратегию второго игрока только при г = 0,6. Тогда исход (0,5а + 0,56, 0,6d + + 0,4с) - равновесие Нэша.

К тому же результату мы придем и из других рассуждений. А именно, для первого игрока значение р = 0,5 возможно только в случае его безразличия к выбору стратегии а или Ь. Э го значит:

Случай 4. Пусть р= 1. Тогда вторым игроком не будет играться стратегия d, т.е. г = 0. Матрица принимает вид

Тогда (a, qc + (1 - q)e) - равновесие Нэша при любых

Пример 2.26. Найти все равновесия Нэша в смешанных стратегиях в биматричной игре

Решение

Рассмотрим выигрыши второго игрока при использовании им чистых стратегий в ответ на смешанную стратегию первого игрока:

Построим графики этих функций (рис. 2.37).


Рис. 2.37

В точке А пересекаются прямые d не. Найдем точку пересечения:

В точке В пересекаются прямые сие. Найдем точку пересечения:

Ломаная линия MABN - наилучший ответ второго игрока при различных значениях р. Рассмотрим несколько случаев.

Случай 1:

чистая стратегия d. d й, что соответствует значению b, d).

Случай 2: . Тогда наилучшим ответом второго игрока является

чистая стратегия е. Но наилучшим ответом первого игрока на чистую стратегию е второго игрока является чистая стратегия а , что соответствует значению . В этом промежутке нет равновесий Нэша.

Случай 3: . Тогда наилучшим ответом второго игрока является

чистая стратегия с. Но наилучшим ответом первого игрока на чистую стратегию с второго игрока является чистая стратегия а , что соответствует значению . В этом промежутке получили единственное равновесие Нэша (а } с).

Случай 4: (точка Л). В этой точке заведомо не играется стратегия с. Матрица игры принимает вид

Рассмотрим математическое ожидание выигрыша первого игрока:

При равновесном по Нэшу исходе первый игрок максимизирует по р свою функцию полезности:

Очевидно, если является оптимальным для первого игрока, то

. Это значение можно получить из условия равенства значений функции выигрыша первого игрока при выборе им а и /;. Иными словами, первому игроку безразлично, выберет он а или b :

Следовательно, профиль стратегий является равно

весием Нэша.

Случай 5: (точка В). В этой точке заведомо не играется стратегия d. Матрица игры принимает вид

Поскольку а >- b , то р = 1 , что противоречит исходному условию Следовательно, не существует равновесия Нэша, при котором второй игрок выбирает

Этот метод решения можно применять для нахождения равновесий Нэша в любых биматричных играх размерности 2 хп или п х 2, и, следовательно, он более универсален, чем метод, примененный в способе 1 решения предыдущего примера.

  • Здесь и далее в аналогичных примерах стратегии Саши (Футбол, Балет) обозначенысловом, начинающимся с заглавной буквы, стратегии Маши - со строчной.

В результате освоения данной главы студент должен:

знать

  • определение равновесия по Нэшу (как в чистых, так и в смешанных стратегиях);
  • основные свойства равновесия по Нэшу;
  • теоремы, формулирующие условия существования равновесия по Нэшу в стратегических играх;
  • определение понятия "равновесие дрожащей руки";

уметь

Решать задачу нахождения равновесия по Нэшу в биматричных играх (в том числе графическим методом для игр);

владеть

  • простейшими методами анализа свойств биматричных игр 2 х 2 с использованием результатов их графического решения;
  • системой представлений как о возможностях, так и об объективных проблемах практического применения понятия равновесия по Нэшу;
  • терминологическим аппаратом, позволяющим самостоятельно осваивать научную и профессиональную литературу, использующую понятие равновесия но Нэшу и его свойства.

В данной главе мы рассмотрим основной объект исследования теории бескоалиционных игр, получивший название равновесия по Нэшу. Данное понятие было предложено выдающимся американским математиком Джоном Нэшем (John Forbes Nash) сначала в его диссертации, а затем в серии работ, вышедших в 1950-1953 гг. .

^ Ситуацию s* в игре Г = (I, {} i Î I , {(s)} i Î I) будем называть равновесием но Нэшу (в чистых стратегиях), если для любого игрока i Î I

Другими словами, ситуация равновесия по Нэшу - это такая ситуация в игре, от которой ни одному из игроков невыгодно отклоняться поодиночке (при условии что остальные участники игры придерживаются своих стратегий, образующих равновесие по Нэшу).

Рассмотрим отображения, которые для каждого игрока i Î I для каждой возможной подситуации Î ставят в соответствие некоторую стратегию , являющуюся его наилучшим ответом для данной подситуации:

Отображения возвращающие наилучшие ответы на подситуации, также называют отображениями отклика игрока. Из неравенства (3.1) следует, что ситуация равновесия по Нэшу образуется стратегиями, которые возвращаются отображениями отклика всех игроков, т.е. ситуация равновесия по Нэшу - это ситуация, образуемая наилучшими ответами каждого игрока на наилучшие ответы остальных:

В свою очередь, из условия (3.3) вытекают следующие свойства.

  • 1. Строго доминируемые стратегии и НЛО-стратегии не могут входить в равновесие по Нэшу.
  • 2. Стратегии, образующие равновесие по Нэшу, не могут быть исключены в процессе удаления строго доминируемых стратегий и рационализации игры.

Одновременно следует подчеркнуть, что слабо доминируемые стратегии перечисленными свойствами не обладают. Несложно сконструировать пример равновесия по Нэшу, в котором будут присутствовать одна или несколько слабодоминируемых стратегий.

Для рассмотрения свойств равновесия по Нэшу вернемся к игре "дилемма заключенного" (см. табл. 2.1).

Как нетрудно заметить, данная игра имеет единственное состояние равновесия по Нэшу. Это ситуация (С, С), в которой оба игрока сознаются и получают по пять лет тюремного наказания. Фундаментальным качеством ситуации (С, С) является именно то, что от нее действительно никому невыгодно отклоняться поодиночке. Если один из заключенных попытается сменить стратегию с "сознаться" на "молчать", то

этим он только ухудшит свое положение - вместо пяти лет наказания получит десять - и улучшит положение другого игрока, которого отпустят.

Нельзя не признать, что ситуация равновесия в данном примере является неэффективным исходом для заключенных. Ведь в ситуации (М, М) - оба молчат - их полезности выше (срок наказания составляет один год против пяти). Однако ситуация (М, М) обладает тем недостатком, что она неустойчива. В ней каждому из игроков выгодно сменить стратегию "молчать" на "сознаться", при условии что другой игрок продолжает придерживаться стратегии "молчать". В этом случае наказание для предавшего становится нулевым, правда, резко возрастает для преданного: с года до десяти.

Таким образом, дилемма заключенного достаточно ярко отражает тот факт, что

равновесие по Нэшу - необязательно "самая выгодная" ситуация для игроков, это устойчивая ситуация.

Также на примере дилеммы заключенного достаточно наглядно может быть продемонстрировано соотношение равновесия по Нэшу с таким фундаментальным понятием экономики, как оптимальность по Парето . Напомним, что

распределение называют оптимальным но Парето (Парето-оптимальным), когда полезность (благосостояние) ни одного из участников этого распределения не может быть увеличена без уменьшения полезности какого-либо другого участника.

Нетрудно заметить, что в дилемме заключенного ситуация равновесия но Нэшу является единственной Парето-неоптимальной: полезность участников "безболезненно для каждого из них" можно улучшить, перейдя от ситуации (С, С) к ситуации (М, М), но последняя не является равновесием по Нэшу в силу своей неустойчивости. С этой точки зрения дилемма заключенного является классическим примером, демонстрирующим различия между понятиями "равновесие по Нэшу" и "оптимальность по Парето".

Продемонстрируем возможности практического использования концепции равновесия по Нэшу на примере сюжетов из литературного приложения.

  • За свой вклад в теорию некооперативных игр Дж. Нэш в 1994 г. получил Нобелевскую премию по экономике
  • Введено итальянским экономистом и социологом Вильфредо Парето (1848-1923)

В реальной жизни часто появляются вопросы, почему на одних рынках фирмы сотрудничают, а на других - агрессивно конкурируют; к каким средствам следует прибегать фирме, чтобы не допустить вторжения потенциальных конкурентов; как принимаются решения о цене; когда меняются условия спроса или издержек. Изучая эти проблемы, ученые используют теорию игр.
Первыми исследователями в области теории игр были американский математик Дж.-Ф. Нейман и австро-американский экономист О. Моргенштерн («Теория игр и экономическое поведение», 1944). Они распространили математические категории на экономическую жизнь общества, вводя понятия оптимальных стратегий, максимизации ожидаемой полезности, доминирование в игре (на рынке), коалиционные соглашения. Эти ученые оказали стимулирующее влияние на развитие социальных наук в целом, математической статистики, экономической мысли, в частности в области практического использования теории вероятности и теории игр в экономике.
Ученые стремились сформулировать основополагающие критерии рационального поведения участника рынка. Они различали два вида игр. Первый - «с нулевой суммой» - предусматривает такой выигрыш который формируется из издержек других игроков, то есть общая сумма выгоды и издержек всегда равна нулю. Другой вид - «игра с плюсовой суммой», когда индивидуальные игроки ведут борьбу за выигрыш, складывающийся из их ставок. Иногда этот выигрыш создается за счет наличия «выходного» (термин из карточной игры в бридж; так называют одного из игроков, который, делая ставки, не принимает участия в игре), совсем пассивного и часто такого, который служит объектом эксплуатации. И в том, и в другом случае игра неминуемо соединена с риском, поскольку каждый из ее участников, как считали Дж.-Ф. Нейман и О. Моргенштерн, «стремится максимально повысить функцию, переменные которой не контролируются». Если все игроки одинаково умелые, то решающим фактором становится случайность. Однако так происходит редко. Почти всегда важнейшую роль в игре играет хитрость, с помощью которой делаются попытки раскрыть замысел противника и завуалировать свои намерения, а потом занять выгодные позиции и вынудить противника действовать в убыток себе. Важная роль отводится и «контрхитрости».
Во время игры много зависит и от рационального поведения игрока, то есть продуманного выбора и оптимальной стратегии. Разработке формализованного (в виде моделей) описания конфликтных ситуаций, в частности «формулы равновесия», то есть устойчивости решений противников в игре, занимался Дж.-Ф. Нэш
Нэш (Nash) Джон-Форбс (род в 1928) - американский экономист, лауреат Нобелевской премии (1994). Родился в г. Блуэфилд (штат Западная Вирджиния, США). Учился в Университете Карнеги-Меллона по специальности инженера-химика, но, увлекшись математикой, перевелся на математический факультет. Получил диплом бакалавра математики и одновременно магистра математики.
Поступил в аспирантуру по математической специализации Принстонского университета, где защитил докторскую диссертацию на тему «Некооперативные игры» (1950). В следующем году ее опубликовали отдельной статьей в журнале «Анналы математики». Когда обучался на старших курсах университета, принимал участие в исследовательской работе фирмы «RAND Corp.», которая финансировала ряд его разведывательных проектов в области теории игр, математической экономики и общей теории рационального поведения в игровых ситуациях.
В 1951-1959 гг. Дж.-Ф. Нэш - преподаватель Массачусетского технологического института. Одновременно ведет научно-исследовательскую деятельность. Ему удалось решить классическую проблему, связанную с дифференциальной геометрией.
Из-за тяжелой болезни он в течение 20 лет не мог работать.
В 70-е годы болезнь отступила. Но продуктивные научные результаты высшей пробы ему не удавались.
Дж.-Ф. Нэш продолжает исследования по математике. В целом он опубликовал 21 научную работу, 16 из них увидели свет до 1959 г.
Он член Национальной академии наук США, Эконометрического общества и Американской академии искусств и наук.
В классической теории игр кооперативные и бескоалиционные игры трактуются по-разному. Дж.-Ф. Нэш первым указал на отличие между ними и определил кооперативные игры как игры, допускающие свободный обмен информацией и принудительные условия между игроками, а бескоалиционные - как такие, которые не допускают свободного обмена информацией и принудительных условий. Некооперативной является такая игра, когда кооперирование между игроками не допускается вообще. В статьях «Точки равновесия в играх с N-числом участников» и «Проблема заключения сделок» (1951) он математически точно вывел правила действий участников (игроков), которые выигрывают в соответствии с выбранной стратегией. Каждый из игроков старается снизить степень риска с помощью самой выгодной стратегии, то есть путем постоянного приспособления к поведению тех, кто тоже хочет достичь наиболее лучших результатов.
Досконально изучив разные игры, создав серию новых математических игр и наблюдая за действиями участников в разных игровых ситуациях, Дж.-Ф. Нэш стремился понять, как функционирует рынок, как компании принимают решения, связанные с риском, почему покупатели действуют так, а не иначе. Ведь в экономике, как и в игре, руководители фирм должны учитывать не только последние, но и предыдущие шаги конкурентов, а также ситуацию на всем экономическом (игровом, например, шахматном) поле и другие факторы.
Известно, что субъекты экономической жизни - активные ее участники, которые на рынке в условиях конкуренции идут на риск, и он должен быть оправдан. Поэтому каждый из них, как и игрок, должен иметь свою стратегию. Именно из этого исходил Дж.-Ф. Нэш, разрабатывая метод, который позже назвали «равновесием Неша».
Равновесие Неша - совокупность стратегий или действий, согласно которым каждый участник реализовывает оптимальную стратегию, предвидя действия соперников.
«Стратегию» как основное понятие теории игр Дж.-Ф. Нэш разъясняет на основе «игры с нулевой суммой» («симметричная игра»), когда каждый участник имеет определенное количество стратегий. Выигрыш каждого игрока зависит от выбранной им стратегии, а также от стратегии его соперников. На этой основе строится матрица для нахождения оптимальной стратегии, которая при многократном повторении игры обеспечивает определенному игроку максимально возможный средний выигрыш (или максимально возможный средний проигрыш). Поскольку этому игроку неизвестно, какую стратегию выберет противник, ему самому целесообразнее выбрать стратегию, рассчитанную на самое неблагоприятное для него поведение противника (принцип «Гарантированного результата»). Действуя осторожно и считая конкурента сильным, этот игрок выберет для каждой своей стратегии минимально возможный выигрыш. И таким образом из всех минимально выигрышных стратегий выберет такую, которая обеспечит ему максимальный из всех минимальных выигрышей («максимин»).
Его противник, наверное, рассуждает так же. Он найдет для себя наибольшие проигрыши во всех стратегиях этого игрока, а потом из этих максимальных проигрышей выберет минимальный («минимакс»). При равенстве максимина минимаксу решения игроков будут устойчивыми, а игра будет иметь равновесие. Устойчивость (равновесие) решений (стратегий) заключается в том, что обоим участникам игры будет невыгодно отходить от выбранных стратегий. Когда же максимин не равен минимаксу, то решения (стратегии) обоих игроков, если они хотя бы в какой-то мере угадали выбор стратегии противника, будут неустойчивыми, неравновесными.
Значит, равновесие Нэша - результат, в котором стратегия каждого из игроков является лучшей среди других стратегий, принятых остальными участниками игры. Это определение основывается на том, что каждый из игроков изменением собственной роли не может достичь наибольшей выгоды (максимизации функции полезности), если другие участники твердо придерживаются собственной линии поведения.
Свою «формулу равновесия» Дж.-Ф. Нэш усилил показателем оптимального объема информации. Он вывел его из анализа ситуаций с полным информированием игрока о своих противниках и с неполным информированием о них. Переведя этот постулат с математического языка на язык экономической жизни, ученый ввел (как важный информационный элемент знания условий «внешней среды») неуправляемые переменные рыночных отношений.
Появление в науке равновесия Дж.-Ф. Нэша открыло многочисленные исследования с целью приближения его к реальной экономической действительности. На усовершенствование равновесия Дж.-Ф. Нэша были направлены исследования многих ученых. Среди них Дж.-Ч. Харшани.
Харшани (Harsanyi) Джон-Чарльз (1920-2000) - американский экономист, лауреат Нобелевской премии (1994). Родился в г. Будапеште (Венгрия), закончил Лютеранскую гимназию.
Получил высшее медицинское образование. В 1947 г., защитив докторскую диссертацию, начал работать преподавателем университетского Института социологии. Из-за антимарксистских взглядов в 1948 г. вышел в отставку, а потом выехал в Австралию. Там работал на заводе, одновременно обучался в Сиднейском университете, где изучал английский язык и экономику. В 1953 г. получил степень магистра.
С 1954 г. он лектор экономики Брисбенского университета. Через два года Дж.-Ч. Харшани был отмечен Фондом Рокфеллера, что давало ему право в течение следующих двух лет писать докторскую диссертацию в Стэнфордском университете.
В 1958 г. Дж.-Ч. Харшани возвращается в Австралию. Однако, почувствовав определенную изолированность, поскольку в этой стране в то время теория игр фактически не была известна, переехал в США, где работал профессором экономики Детройтского университета. В 1964 г. он профессор Экономического центра Волтера Хааса при университете Беркли в штате Калифорния.
Первые научные работы Дж.-Ч. Харшани опубликовал в начале 50-х годов, посвятив их вопросам использования функции полезности Неймана-Моргенштерна в экономике благосостояния и в этике. Дж.-Ч. Харшани является автором многих работ по утилитарной этике, экономики благосостояния, а также в сфере, граничащей между экономикой и моральной философией. В работе «Рациональное поведение и переговорное равновесие в играх и социальных ситуациях» (1977) он обосновывает «общую теорию рационального поведения», охватывающую «теорию индивидуального решения», вопросы деловой этики и теорию игр. Среди его книг «Эссе по этике, социальному поведению и научному объяснению» (1976), «Работы по теории игр» (1982), «Общая теория выбора равновесия в играх» (1988, совместно с Р.-Дж.-Р. Селтеном), которая в 2001 г. издана на русском языке, «Рациональное взаимодействие» и др.
Дж.-Ч. Харшани - почетный доктор Северно-Западного и почетный профессор Калифорнийского университетов (США).
Предметом исследования Дж.-Ч. Харшани были сложные ситуации, которые случаются при наличии асимметричной информации. В игре с полной информацией все игроки знают преимущества других, а в игре с неполной информацией они нуждаются в этих знаниях.
Поскольку толкование равновесия Нэша базировалось на прогнозе, что игроки знают преимущества других, все методы были недоступны для анализа игр с неполной информацией, несмотря на то, что такие игры более полно отражают стратегические взаимосвязи в реальном мире.
Ситуацию радикально изменили исследования Дж.-Ч. Харшани («Игры с неполной информацией, сыгранные байсианскими игроками»). Ученый исходил из того, что каждый игрок является одним из нескольких «типов», а каждый тип отвечает набору возможных преимуществ для игрока и вероятно распределяет почти всех на типы игроков. Значит, каждый игрок в игре с неполной информацией выбирает стратегию одного из таких типов. С согласованным требованием в отношении возможности распределения игроков Дж.-Ч. Харшани показал, что для каждой игры с неполной информацией существует эквивалентная игра с полной информацией. То есть он трансформировал игру с неполной информацией в игру с несовершенной информацией. В таком случае игра может регулироваться стандартными моделями.
Примером игры с неполной информацией может быть ситуация, когда частные фирмы и финансовые рынки точно не знают преимуществ центрального банка в отношении дилеммы между инфляцией и безработицей. Соответственно неизвестна и банковская политика в отношении будущих процентных ставок. Взаимодействие между будущими ожиданиями и политикой центрального банка можно проанализировать с помощью методики, предложенной Дж.-Ч. Харшани. В самом простом виде банк может или ориентироваться на борьбу с инфляцией и, значит, готовиться к осуществлению ограничительной политики с высокими процентными показателями, или будет бороться с безработицей с помощью низких процентных показателей.
Равновесие Нэша доработал и усовершенствовал, в частности относительно игр с неполной информацией, Р.-Дж.-Р. Селтен.
Селтен (Selten) Рейнхард-Джустус-Реджинальд (род в 1930) - немецкий экономист, лауреат Нобелевской премии (1994). Родился в г. Бреслау (ныне г. Вроцлав, Польша). В 1951 г. закончил в г. Мелсунген среднюю школу. Уже здесь заинтересовался математикой, впервые узнал о теории игр. Учился на математическом факультете Университета во Франкфурте-на Майне, окончил его в 1957 г. в течение десяти лет
Р.-Дж.-Р. Селтен работал там ассистентом. Этот период его жизни был насыщен активной экспериментаторской работой. В 1959 г. защитил докторскую диссертацию по математике. На протяжении 1969-1972 гг. он профессор экономики Свободного университета в Западном Берлине. Потом работал в Билефельдском университете, в котором продолжил экспериментальные исследования теории игр.
С 1984 г. Р.-Дж.-Р. Селтен - профессор кафедры экономики Боннского университета имени Фридриха-Вильгельма. Выступив организатором научно-исследовательского года (с 1 октября 1987 года по 30 сентября 1988 года) по теории игр в поведенческих науках, он сумел собрать большую международную группу экономистов, биологов, математиков, политологов, психологов и философов. Их общая работа изложена
в 4-х книгах «Модели равновесия игры» (1991). Р.-Дж.-Р. Селтен - основатель теории некооперативных игр.
В 1995 г. Р.-Дж.-Р. Селтен избран вице-президентом Европейской экономической ассоциации, а в 1997 г. - ее президентом. Он член Американских экономической ассоциации и эконометрического общества, входит в состав многих редколлегий научных журналов, является почетным иностранным членом Американской академии искусств и наук, членом Национальной академии наук США, а также почетным доктором Билефельдского, Бреславского, Грацского университетов, Университета Франкфурта-на-Майне и др.
В статье «Модель олигополии с инерцией спроса» (1965)
Р.-Дж.-Р. Селтен разработал «чистую стратегию» с интуитивным выбором. Последовательно усложняя и уточняя отмеченное «равновесие» дополнительными условиями для предыдущих договоренностей об игре, ученый развивал ее с точки зрения динамики и приближал к условиям реальной жизни. Он на противоположных примерах доказал, что даже точки равновесия могут вызвать иррациональное поведение. По мнению ученого, только специальный класс точек равновесия (он их назвал «истинными», или «совершенными точками равновесия») обеспечивает на самом деле рациональное поведение в бескоалиционной игре.
Понятие «равновесие Нэша» распространяется на теорию динамичных игр. В этом случае каждый участник выбирает стратегию (то есть план действий для каждого периода игры), которая максимизирует его выигрыш при заданных стратегиях других игроков. Основная проблема с динамичным равновесием Неша заключается в том, что в последнем периоде игры игроки могут вести себя иррационально. В тот момент, когда становится ясно, что данный период игры последний, ранее выбранное действие может оказаться иррациональным (не максимизирует выгоду). Усовершенствованное понятие равновесия, предложенное в 1975 г.
Р.-Дж.-Р. Селтеном, позволяет избавиться от непредвиденных предпосылок о стратегиях. Это понятие «совершенного равновесия Нэша», или совершенного равновесия субигры, предусматривает, что стратегии, выбранные игроками, являются равновесными, по Нешу, в каждой субигре (то есть в каждой однопериодной игре основной игры) независимо от того, какие действия были выполнены раньше.
Внедрение равновесия Нэша стало важным шагом в микроэкономике. Его использование способствовало углубленному пониманию развития и функционирования рынков, обоснованию стратегических решений, принимающихся менеджерами разных фирм. Важным является вклад Р.-Дж.-Р. Селтена, который усовершенствовал концепцию равновесия Нэша для анализа стратегического взаимодействия в динамике и использовал это для анализа конкуренции при условии небольшого количества участников. А методология анализа игры с неполной информацией Дж.-Ч. Харшани обеспечила теоретическую основу для исследования экономики информации.
Равновесием Нэша можно пользоваться при изучении процесса ведения политических переговоров и экономического поведения, в частности на олигополистических рынках (форма организации рынка, где существует несколько производителей однородного или дифференцированного товара). Именно Р.-Дж.-Р. Селтен выявил возможности использования моделей в политике. Его сотрудничество с американским ученым-политиком А. Пелмутером позволило разработать так называемый сценарий пакетного метода - систематизированный способ создания простых моделей игры конкретных международных конфликтов, благодаря которым можно осуществлять экспертные проверки эмпирических фактов.
Таким образом, дополненная теория игр дала экономике мощный математический инструментарий, который помог экономистам освободиться от зависимости от формального математического аппарата физики. Равновесие Нэша - это гибкий метод анализа разнообразных конкретных проблем и ситуаций на рынках.
Теория игр в дальнейшем была использована в исследованиях Томаса Шеллинга и Роберта Оманна. Их интересовал вопрос: «Почему некоторые группы людей, организаций и стран преуспевают в сотрудничестве, в то время как другие страдают от постоянных конфликтов?»
Шеллинг (Schelling) Томас Кромби (род. в 1921) - американский экономист, лауреат Нобелевской премии 2005 г. «За расширение понимания проблем конфликта и кооперации с помощью анализа в рамках теории игр». Профессор Мэрилендского университета. Президент Американской экономической ассоциации в 1991 г. Лауреат премии Фрэнка Сейдмана (1977). Основные произведения: «Стратегия конфликта» (The Strategy of Conflict, 1960); «Микромотивы и макровыбор» (Micromotives and Macrobehavior, 1978); «Выбор и последствия» (Choice and Consequence, 1985).
Использовал теорию игр для принятия рациональных решений в условиях недостаточной информации о возможных последствиях, как базу для объединения и исследования общественных наук в своей книге «Стратегия конфликта» (The Strategy of Conflict), опубликованной в 50-е годы прошлого века в условиях гонки вооружений.
В своей книге Шеллинг показывает, например, что способность принять ответные меры может быть иногда более полезной, чем способность выдержать атаку, или что возможное неизвестное возмездие часто более эффективно, нежели известное неотвратимое возмездие.
В книге Шеллинга рассматривались возможности решения стратегических конфликтов и способы избежать войны, однако его выводы могли объяснить и широкий диапазон явлений в сфере экономики и конкурентоспособности предприятий.
Р. Ауманн в свою очередь, посвятил свои исследования изучению теории бесконечных повторяющихся игр или того, каким образом можно поддерживать определенные результаты в отношениях в течение долгого периода времени.
Ауманн (Aumann) Исраэль Роберт Джон (также Оман) (род. в 1930) - израильский математик, профессор Еврейского университета в Иерусалиме, лауреат Нобелевской премии по экономике 2005 года «За расширение понимания проблем конфликта и кооперации с помощью анализа в рамках теории игр».
В 1983 году Оман был награждён премией Харви. В 1994 году профессор Оман был награждён Государственной премией Израиля по экономике вместе с профессором Михаэлем Бруно.
Р. Оман возглавлял Общество теории игр, а в начале 1990-х являлся президентом Израильского союза математиков. Кроме того являлся ответственным редактором «Журнала Европейского математического общества». Ауманн также консультировал Агентство США по контролю за вооружениями и разоружению. Он занимался теорией игр и её приложениями около 40 лет. Основные произведения: «Почти строго конкурентные игры» (Almost Strictly Competitive Games, 1961); «Смешанные и поведенческие стратегии в бесконечно расширенных играх» (Mixed and Behavior Strategies in Infinite Extensive Games, 1964).
Теория игр - это наука о стратегии, она изучает, как различные соперничающие группы - бизнесмены или любые другие сообщества - могут сотрудничать с получением идеального результата.
Оман специализировался в «повторяющихся играх», анализируя развитие конфликта во времени. Исследования Ауманна базировались на идее о том, что сотрудничество во многих ситуациях легче установить в ходе долгосрочных стабильных отношений.
Теория Ауманна объясняет, почему более трудно достичь сотрудничества между большим количеством участников, учитывая насколько часты, продолжительны и надежны контакты между ними и насколько каждый участник может предвидеть действия других.
Исследования направлены на объяснение таких экономических конфликтов, как ценовые и торговые войны, раскрытие механизма переговоров в различных условиях - от требований о повышении заработной платы до заключения международных торговых соглашений.