Фон Нейман создал условия для возникновения новой математической теории, известной сегодня как теория игр. С этого момента игры перестали быть развлечением и превратились в сценарий, в котором двое или более человек могли развивать рациональные стратегии, чтобы повлиять на результат партии. Сценарии могли быть абсолютно разными, и для их реализации был необходим такой сложный и фундаментальный аспект, как принятие решений.
Игра — это деятельность, присущая не только человеку, но и большинству высших млекопитающих. Доказано, что игра сама по себе является неотъемлемой частью процессов обучения и развития многих важных качеств. Именно через игру животные учатся координировать свои движения, чтобы охотиться, нападать, защищаться, именно через игру человек развивает многие способности, используя различные элементы для симуляции реальности. Для игры важны три фактора: сценарий, случайность и заклад.
Сценарий игры — первый шаг к пониманию ее структуры, он позволяет создавать математические модели в очень простых ситуациях, таких как партия в шашки, или в очень сложных — например, в настоящем военном сражении.
В любой игре всегда в той или иной степени присутствует случай, который определяет уровень инициативы игроков при выборе стратегии. В играх, где случай почти не играет роли, например в шахматах, инициатива игроков имеет решающее значение. Напротив, в играх, целиком построенных на случае, например при подкидывании монеты, инициатива игроков ограничена закладом.
Заклад — это то, на что идет игра. Он может быть нематериальным — как, например, умения или честь игрока, а вот в игре в рулетку на кону может стоять даже жизнь. В любом случае во всех играх есть тот или иной заклад, даже когда никто ни на что не играет и когда нельзя определить, кто выиграл, а кто проиграл. Самая важная характеристика заклада состоит в том, что ему можно присвоить номер. В самом простом случае, когда речь идет о выигрыше или проигрыше, номера могут быть соответственно 1 и 0. Когда чему-то можно присвоить номер, значит, к нему можно применить математический подход.
Теория вероятностей и статистика появились как следствие систематического изучения игр, но, скорее, их предметом было предугадывание результата, а не сама природа игры. Уже в первых работах фон Неймана содержалась другая точка зрения, очень далекая от статистических подсчетов. В них игра проявила другую свою сущность: она предстала не как событие, зависящее главным образом от воли случая, а как конфликт интересов. В этом смысле исследования фон Неймана необходимо рассматривать как первые в своем роде. Именно из них позже появилась новая ветвь математики — теория игр.
Трудно сказать точно, когда и где фон Нейман впервые заинтересовался математическим аспектом теории игр, поскольку у нас нет об этом ни письменных, ни устных свидетельств. В конце 1926 года, еще будучи стипендиатом Гёттингенского университета, он поразил всех, собрав конференцию по теории игр в помещении Математического общества университета. После нее фон Нейман написал статью, которую направил в журнал Mathematische Annalen. Работа была опубликована год спустя под заголовком Zur Theorie der Gesellschaftsspiele («А* теории стратегических игр»). Потом его будто бы оставил интерес к этой теме, но мы можем и ошибаться в своем предположении, потому что 18 лет спустя вместе с экономистом Оскаром Моргенштерном фон Нейман опубликовал книгу о теории игр, которая сегодня считается одной из самых важных из всего его наследия.
В своей первой работе ученый провел математическую формализацию антагонистических ситуаций, в которых участвуют два игрока. Особенно его интересовали возможные стратегии, которые могут развивать игроки в играх с нулевой суммой, по определению фон Неймана.
Немецкий математик и экономист Оскар Моргенштерн родился 24 января 1902 года в Гёрлице. В некотором смысле можно сказать, что он имел аристократическое происхождение: его мать была незаконной дочерью императора Фридриха III. В 1925 году Моргенштерн получил диплом по политическим и экономическим наукам в Венском университете. Благодаря Рокфеллеровской стипендии он провел четыре года в Принстоне, где получил постдипломное образование.
В 1929 году Моргенштерн вернулся в Австрию и вступил в Mathematische Kolloquium — группу математиков, возглавляемую Карлом Менгером (1902-1985), который очень критически относился к знаменитому Венскому кружку. В 1938 году нацистское правительство отняло у Моргенштерна кафедру в Венском университете, ему пришлось эмигрировать в США, и позже он стал гражданином Америки. В 1970 году Моргенштерн получил кафедру экономики в Принстоне. Он проработал там до самой смерти, 26 июля 1977 года. Как и Менгер, Моргенштерн четко высказывался в пользу аксиоматизации экономической теории, отрицая направления, частично поддерживаемые Венским кружком, в которых предпочтение для теории экономического равновесия отдавалось математическим инструментам, с успехом применяемым в физике (например, исчисление бесконечно малых). Таким образом, еще до того как фон Нейман и Моргенштерн встретились в Принстоне, у них были одинаковые представления о том, какой подход следует применить к экономике, чтобы возвести ее в ранг науки.
Теория игр очень многогранна и может применяться не только в игровых ситуациях. Ее суть состоит в том, чтобы определить стратегию и формализовать принятие решений. Существует пример, который, благодаря своей необыкновенной простоте, часто используется, чтобы объяснить, какие цели преследует теория игр: разрезание торта.
Предположим, два человека должны поделить торт. Обычно в этом примере речь идет о детях: считается, что дети очень любят сладкое и потому хотят получить самый большой кусок, и это позволяет лучше понять ситуацию. Детский индивидуализм — идеальное качество для нужных нам игроков. Дележ торта будет происходить так: ребенок А будет резать торт, а ребенок В — первым выбирать себе кусок. Таким образом, ребенок А должен всегда помнить о ребенке В и о том, что после того, как он разрежет весь торт, В заберет себе самый большой кусок. Это условие является основополагающим для выбора наилучшей стратегии, которая, разумеется, состоит в том, чтобы разрезать торт на две равные части. Любой другой вариант опасен. Если, например, А подумает, что В — очень хороший и воспитанный ребенок и потому возьмет себе кусок поменьше, то он начнет резать торт на неравные куски. Но это решение содержит много рисков и основывается на догадках или дополнительной информации, которая не имеет ничего общего с игрой.
Это объяснение может показаться слишком простым, но в нем содержатся все ключевые элементы, определяющие сценарий, выбранный для теории игр. Ситуация типа «я играю только для того, чтобы приятно провести время, меня не беспокоит проигрыш, и вообще я могу позволить выиграть своему противнику» может быть вполне оправданной во многих сценариях, но не в теории игр. В ней игроки рассматриваются прежде всего как рациональные люди, чья цель — выиграть, а для этого им нужно думать о себе.
Требование к рациональности игроков довольно глубокое. Оно предполагает идеальную ситуацию, так как никто не в состоянии держать в уме все возможные ходы и каждый раз принимать нужное решение, чтобы выиграть любой ценой. Игры с простой структурой, такие как «ним», позволяют дойти до такого уровня без особого труда, поскольку в них деревья принятия решений имеют мало ветвей, и если оба игрока абсолютно рациональны в нужном нам смысле, то либо они придут к ничьей, либо выиграет тот, кто сделал первый ход. Другие игры, например го или шахматы, тоже обладают этими характеристиками, но уровень их сложности гораздо выше, и не допустить погрешностей фактически невозможно.
Обобщая, можно сказать, что игра — это процесс, в котором участвуют два или больше игроков, действующих по строго определенным правилам. Участники могут принимать решения, формирующие особую стратегию, которая может повлиять на ход игры. Цель игры — получить некую выгоду, поэтому одним из ключевых ее понятий является платеж — более общее понятие по сравнению с закладом. Платеж может существовать в виде приза вне самой игры, который делится между несколькими игроками, или же представлять собой штраф. Например, в соревновании двух игроков один выигрывает (получает положительный платеж), а второй проигрывает (получает отрицательный платеж).
Опираясь на понятие платежа, можно провести первую классификацию игр и разделить их на две большие группы: игры с нулевой и ненулевой суммой. В игре первого типа игроки борются за один приз или платеж, а сумма всех выигрышей равна сумме всех проигрышей. Игры, в которых можно одновременно выбирать несколько призов, называются играми с ненулевой суммой.
Спектр игр с нулевой суммой очень широк. Именно к этой категории относятся такие игры, как шашки или шахматы: когда один игрок получает очко, другой его теряет. Можно сказать, что один получает положительное очко, а второй — отрицательное. Такой сценарий фон Нейман назвал игрой с нулевой суммой для двух игроков. Эта схема включает в себя большое количество соревновательных игр. В них игрок получает все или ничего, борьба идет до конца, то есть игра заканчивается, когда один игрок побеждает, а другой проигрывает. Другими словами, игроки не могут сотрудничать друг с другом.
Для анализа игр очень полезным инструментом оказывается так называемая платежная матрица (Pay-off Matrix). Она представляет собой двойную таблицу, где слева записываются возможные стратегии игрока А, а вверху — игрока В. Под стратегиями понимаются возможности, появляющиеся в ходе игры. В каждой ячейке таблицы указаны выигрыши или проигрыши каждого игрока, полученные в результате выбранной стратегии. Два числа, разделенные запятой или косой чертой, обозначают выигрыши и проигрыши первого и второго игрока соответственно.
Игрок В | |||
1 | 2 | ||
Игрок А | 1 | 10/2 | -3/5 |
2 | 1/-6 | 4/8 |
Эта платежная матрица говорит нам, что если игрок А выберет стратегию 2, а игрок В — стратегию 1, то в результате выигрыш первого составит 1, а проигрыш второго — 6. Если же игрок А выберет стратегию 1, а В — 2, то проигрыш первого составит 3, а выигрыш второго — 5. Ниже приведен еще один, более простой способ изображения платежной матрицы с такой же расшифровкой.
В1 | В2 | |
А1 | 10,2 | -3,5 |
А2 | 1-6 | 4,8 |
При игре с нулевой суммой достаточно вставить одно число в каждую ячейку, так как выигрыш одного игрока будет равен потере другого.
Джон фон Нейман за чаепитием с выпускниками в Институте перспективных исследований Принстона (IAS) в ноябре 1947 года.
Бюст фон Неймана в Будапеште.
В 1944 году Оскар Моргенштерн (на фото) и Джон фон Нейман выпустили совместную работу Theory of Games and Economic Behavior («Теория игр и экономическое поведение·).
В1 | В2 | |
А1 | 9 | -3 |
А2 | -2 | 14 |
Эта матрица показывает, что если игрок А выберет первую стратегию, а игрок В — вторую, то первый потеряет 3, а второй выиграет 3, и так далее для остальных ячеек.
Этот способ представления игры для двух человек с нулевой суммой в виде двойной таблицы фон Нейман назвал сведением к нормальной форме игры.
Разумеется, таблицы, приведенные выше, могут относиться только к очень простым играм, но это не означает, что их нельзя применить и к таким сложным, как шахматы, хотя в этом случае таблица была бы огромной. Но важны не размеры таблицы, а то, что игры такого типа можно привести к нормальной форме.
Предшественником фон Неймана в моделировании игр был французский математик Эмиль Борель (1871-1956), опубликовавший с 1921 по 1927 год серию работ по теории игр, целью которых было установить выигрышные стратегии вне зависимости от фактора удачи или психологического состояния игроков в момент принятия решений. Несмотря на то что их работы в чем-то схожи, фон Нейман всегда утверждал, что проводил свои исследования совершенно независимо от Бореля. Можно с точностью сказать, что математические результаты фон Неймана имеют более общий характер и отвечают на такие ключевые вопросы, которые никогда даже не поднимались в работах Бореля. Тем не менее некоторые ученые отстаивают важность его вклада и, говоря об этой схеме, называют ее теорией Бореля — Неймана.
Для того чтобы установить выигрышную стратегию в игре, игроки должны отвечать двум требованиям.
1. Они оба должны быть рациональными.
2. Они оба должны выбирать свои стратегии, ориентируясь исключительно на личную выгоду.
Теперь представим, что игроки А и В участвуют в игре со следующей платежной матрицей.
В1 | В2 | B3 | |
А1 | -5 | 0 | -2 |
А2 | 1 | -3 | -2 |
A3 | 3 | 8 | -1 |
Она содержит три возможных выбора для каждого игрока. Предположим, что числа обозначают выигрыши или проигрыши в евро. Следовательно, речь идет об игре с нулевой суммой в ее нормальной форме. Проанализируем возможные стратегии игроков. Допустим, В выбирает первую стратегию. В таком случае лучшим вариантом для А будет третья стратегия: с ней он заработает 3 евро, тогда как с первой потеряет 5, а со второй выиграет всего 1. Если же В выберет вторую стратегию, то А тоже будет лучше следовать третьему варианту, так как он позволяет заработать больше всего. Наконец, если В выберет третью стратегию, то А проиграет в любом случае, но его проигрыш составит только 1 евро. Следовательно, для А лучшей стратегией, безусловно, будет третья, вне зависимости от выбора В.
У игрока В немного другая ситуация. Если А выберет первую стратегию, наилучшим вариантом будет В1. В случае А2, разумеется, следует выбрать В2, а в случае A3 В должен выбрать третью стратегию, так как с ней он потеряет меньше всего. При этом В не имеет ни малейшего понятия о том, как поступит А, и тем не менее он должен сделать свой выбор. Именно в этот момент строится следующее предположение: «А — рациональный игрок, и лучший вариант для него — A3; в этом случае ВЗ будет для меня выгоднее всего, и значит, я последую этой стратегии». Игрок В знает, что в противном случае он проиграет, и пытается свести этот риск к минимуму.
Исследуя эту схему, фон Нейман сделал следующее замечание: на каждой строке всегда есть число меньше остальных двух. Он назвал его минимальным значением. Например, в предыдущей таблице в первой строке стоят числа -5, 0, -2. Самое маленькое из них -5. Таким же образом, минимальное значение для второй строки -3, для третьей —1. Фон Нейман взял самое большое из этих трех чисел, —1 (из всех трех вариантов оно является минимальным проигрышем), и назвал его максимином.
Затем он проделал то же самое для столбцов, но наоборот. Найдем самое большое, то есть максимальное, число в каждом столбце. В первом это будет 3, во втором 8, в третьем -1. Теперь определим самое маленькое из них, минимакс, которым в этом случае будет -1. Таким образом, в этой игре максимин и минимакс совпали в -1. И не случайно, ведь именно это и утверждается в теореме фон Неймана: «В большинстве игр с двумя участниками и нулевой суммой максимин всех строк всегда совпадает с минимаксом столбцов», и оно будет значением игры при оптимальной стратегии для обоих игроков.
Этот результат, известный как первая теорема о минимаксе, был опубликован в статье 1928 года Ж теории стратегических игр». В ней фон Нейман заложил общие основы будущей теории игр. Важно подчеркнуть еще раз: для того чтобы удовлетворить условиям теоремы фон Неймана, оба игрока должны быть рациональными, заботиться исключительно о собственных интересах и очень тщательно анализировать свои возможные стратегии. Эти критерии выполняются не во всех играх. Например, если один из игроков — природа, то в силу вступают произвольные факторы, и этот противник, разумеется, не осуществляет никакого анализа.
Теория игр имела и продолжает иметь тесную связь с так называемыми военными играми. Одним из первых случаев, когда она была применена на войне, стало сражение в море Бисмарка, состоявшееся 23 декабря 1942 года, в котором столкнулись стратегии американского генерала Джорджа Кенни и контр-адмирала Масатоми Кимуры. В конце боя были потоплены все транспортные суда и половина японских кораблей. Благодаря критерию минимакса командование США выбрало оптимальную стратегию и установило новую доктрину для разведывательных полетов. Японский флот должен был выйти из порта Рабаул на северо-востоке острова Новая Британия и направиться в порт Лае для подкрепления. У контр-адмирала Масатоми Кимуры было два варианта: выбрать северный маршрут, пролегавший по морю Бисмарка, где обычно были очень плохие климатические условия, или южный, с более благоприятными. Генерал Кенни должен был сконцентрировать все самолеты-разведчики на одном из этих двух маршрутов, учитывая при этом количество дней, которое ему потребовалось на бомбардировку, как только были бы замечены японские корабли. Применив к платежной матрице критерий минимакса, авторы стратегии выяснили, что при выборе северного маршрута предполагаемое количество дней для бомбардировки в любом случае равнялось бы 2, поэтому был сделан выбор в пользу следующей стратегии.
Самолеты союзнической армии атакуют японский корабль во время сражения в море Бисмарка.
Кимура | |||
Северный маршрут | Южный маршрут | ||
Кенни | Северный маршрут | 2 | 2 |
Южный маршрут | 1 | 3 |
Любой, кто рассматривает арифметические методы для получения произвольных цифр, разумеется, грешник.
Джон фон Нейман
Логично было бы ожидать от ученого, решившего исследовать теоретические загадки игр, выбора в качестве модели шашек или шахмат. Фон Нейман был очень хорошо знаком с этими играми еще с детства. И тем не менее в статье 1928 года, в которой он доказал теорему о минимаксе, приводится тщательный анализ игры в... покер. Широко известно, что фон Нейман очень любил эту игру, хотя не всегда добивался в ней больших успехов. По его мнению, самым интересным аспектом покера был блеф, который делал выбор стратегии еще более сложным. В покере гораздо труднее математически установить оптимальную стратегию по сравнению с играми с двумя участниками и нулевой суммой. Несмотря на это фон Нейман придумал упрощенный вариант покера, который позволил ему включить эту игру в свои исследования.
СЕДЛОВЫЕ ТОЧКИ
Представим, что игроки А и В участвуют в игре со следующей платежной матрицей.
В1 | В2 | вз | |
А1 | -3 | -1 | 4 |
А2 | 3 | 0 | 1 |
A3 | 3 | -1 | -4 |
Когда игрок А выбирает стратегию 1, максимальный проигрыш имеет место, если стратегию 1 выберет и игрок В. Для А это означает потерю -3, что выделено жирным шрифтом в таблице ниже.
В1 | В2 | В3 | ||
А1 | -3 | -1 | 4 | -3 |
А2 | 3 | 0 | 1 | 0 |
A3 | 3 | -1 | -4 | -4 |
3 | 0 | 4 |
Следуя этой схеме, постепенно записываются максимальные потери при каждой стратегии. Теперь возьмем игрока А. Для него наименьшим из всех значений будет 0, что соответствует стратегии 2. Это значение фон Нейман назвал значением игры. Если оно равно 0, как в этом примере, игру называют справедливой. Для игрока В также минимальное значение в этом случае равно 0, что соответствует стратегии 2.
Заметим, что обе стратегии минимакса совпадают в одной ячейке таблицы (А2-В2). Ее значение является минимальным на строке и максимальным в столбце. Эту точку называют седловой. Ее может и не быть, но если она есть, то влияет на стратегию обоих игроков. В предыдущей таблице мы видим, что никому из игроков невыгодно менять стратегию. Это ситуация равновесия, при которой игра достигает оптимального результата, так как стратегия минимакс одного игрока совпадает с минимаксом другого. Если в игре есть седловая точка, можно утверждать, что в ней есть стабильная стратегия. Это конец игры.
Изобразить седловую точку легко, если мы представим себе седло с двумя перпендикулярными плоскостями. Обозначим плоскость, которая соединяет седло со стременами, через Л, а вторую, идущую от головы до хвоста, — В. Игрок, следующий в направлении Л, должен подняться, чтобы достичь максимума в седловой точке, а игрок В должен спуститься, чтобы достичь в той же точке минимума.
Исходя из этого фон Нейман определил седловую точку как точку матрицы, обладающую следующими характеристиками.
1. Она имеет минимальное значение на своей строке.
2. Она имеет максимальное значение в своем столбце.
Джон Форбс Нэш родился 13 июня 1928 года в Блюфильде, штат Вирджиния, США. Уже в очень раннем возрасте он проявил незаурядные способности к математике и оказался в числе десяти учеников его же возраста, получивших стипендию на учебу в Политехническом институте Карнеги.
Там он сначала изучал инженерное дело и химию, а позже понял, что его настоящее призвание — математика.
После института Нэш поступил в Принстонский университет. Там он заслужил восхищение сокурсников придуманной им настольной игрой, которая позже появилась в продаже под названием гекс. Увлечение играми было частью математических исследований Нэша. В 1950-е годы теория игр стала одной из самых интересных областей математики. Нэш внес ключевой вклад в первое экспериментальное изучение дилеммы заключенного (см. главу 5), а затем занялся играми с нулевой суммой, или некооперативными играми, в которых игроки преследуют прямо противоположные интересы. Одним из самых важных достижений ученого стало понятие так называемого равновесия Нэша. Впоследствии он основал на нем новую экономическую теорию, за которую получил Нобелевскую премию по экономике в 1944 году. Равновесие Нэша проявляется в ситуации, когда две стороны приходят на определенном этапе игры или в сделке к соглашению, нарушение или изменение которого причинит ущерб им обеим. Равновесие характеризует такую фазу игры, в которой ни один из ее участников не может увеличить выигрыш, изменив стратегию в одностороннем порядке.
Если во время игры участник А предположит, что В не поменяет стратегию и, следовательно, сохранит свою, и участник В, в свою очередь, тоже подумает, что Л сохранит стратегию, то говорится, что игра достигла равновесия Нэша, названного так в честь американского математика Джона Форбса Нэша (р. 1928). В конкретной игре равновесия Нэша может не быть, или оно может быть одно либо их окажется несколько.
Не во всех играх с двумя игроками и нулевой суммой есть седловая точка. Рассмотрим очень простой пример с подбрасыванием двух монеток. Каждый игрок ставит 1 евро. Первый одновременно подбрасывает в воздух две монеты. Если на обеих выпадает орел или решка, он оставляет их обе себе. Но если выпал один орел и одна решка, монеты забирает второй игрок. Платежная матрица такой игры будет следующей.
Решка | Орел | |
Решка | 1 | -1 |
Орел | -1 | 1 |
Легко убедиться, что разница между минимальным из максимальных значений и максимальным из минимальных составляет два евро. Изучая ситуации такого типа, фон Нейман еще больше отточил свою теорию игр и ввел различие между чистыми и смешанными стратегиями. К первым относятся игры, в которых игрок выбирает одну и ту же стратегию во всех раундах. Если оба игрока выбирают один и тот же путь, все партии будут одинаковыми. Напротив, в играх со смешанными стратегиями игрок меняет свое поведение от раунда к раунду произвольным образом.
Например, он может определить свою стратегию в зависимости от подброшенной монеты. В статье 1928 года Джон фон Нейман привел математическое доказательство того, что в каждой игре с двумя участниками и нулевой суммой, в которой можно играть с чистыми или смешанными стратегиями, стратегия минимакс каждого из игроков всегда привела бы к стабильной ситуации, седловой точке. На этом результате основана общая теория игр. Наконец, теорема о минимаксе утверждает, что в каждой конечной игре с двумя рациональными игроками, нулевой суммой и с чистой или смешанной стратегией всегда есть решение. Фон Нейман считал эту теорему краеугольным камнем теории игр.
Первая теорема о минимаксе, доказанная фон Нейманом в 1928 году, может применяться к большинству игр с двумя участниками и нулевой суммой, главное условие — чтобы в каждый момент оба игрока точно знали, на какой стадии находится игра. Эти игры фон Нейман назвал играми с полной информацией. Играя в шахматы, шашки или трис, каждый игрок может видеть расположение фигур после хода. Если же один игрок закроет часть доски, это условие перестанет выполняться, и применить теорему будет нельзя.
Фон Нейман доказал вторую теорему о минимаксе, которая могла использоваться для игр с двумя участниками, нулевой суммой, но неполной информацией. Согласно этой теореме, определить выигрышную стратегию невозможно для одной партии, но возможно, если сыграть их несколько.
Очень простая игра, иллюстрирующая эти условия, — классическая «камень, ножницы, бумага». Платежная матрица такой игры, в которой игроки ставят по 1 евро в каждой партии, имела бы такой вид.
В | ||||
Камень | Бумага | Ножницы | ||
А | Камень | 0 | -1 | 1 |
Бумага | 1 | 0 | -1 | |
Ножницы | -1 | 1 | 0 |
Если, например, А выбирает бумагу, а В — камень, то А выигрывает 1 евро, который, соответственно, проигрывает В. Ничья, когда никто не выигрывает и не проигрывает, соответствует значению 0.
Легко убедиться, что для этого примера теорема о минимаксе не работает, так как максимальный минимум для любой строки равен -1, в то время как минимальный максимум любого столбца — 1. Это происходит из-за того, что у игроков нет полной информации об игре. В одной-единственной партии отсутствует критерий, позволяющий выбрать одну из трех стратегий. Но если сыграть несколько раз, то можно обнаружить, что один из игроков следует определенной модели поведения. Согласно фон Нейману, лучшей стратегией будет положиться на волю случая, так как это помешает нашему противнику понять нашу схему игры. А если такой путь выберет и противник, то хотя ему не будет гарантирована победа, он получит разумный шанс сыграть вничью, а это один из способов минимизировать потери.
Таким образом, вторая теорема о минимаксе гласит, что минимальное из максимальных значений среднего результата игрока А совпадает с максимальным из минимальных значений среднего результата для игрока В.
Эта теорема имеет более общий характер по сравнению с предыдущей, так как ее можно применить к играм с двумя участниками и нулевой суммой вне зависимости от того, полная в них информация или нет.
Смысл теоремы о минимаксе элементарен, и его можно изложить обычным языком без специальных терминов, однако доказательство теоремы очень далеко от простоты. Сначала фон Нейман пытался доказать теорему, используя только алгебраические методы, но ему не удалось добиться удовлетворительных результатов. Тогда он обратился к топологии.
Топология — это область математики, изучающая свойства фигур, которые не меняются при трансформации — расширении, сжатии или растягивании (при условии, что при этом не совмещаются их разные точки и не создаются новые). Фигуры называются топологически эквивалентными, когда одну можно получить из другой при помощи трансформаций такого типа. Чтобы лучше понять, что происходит при этих трансформациях, представим себе некую эластичную плоскость (допустим, из резины или пластилина, довольно легко поддающихся деформации), на которую нанесен рисунок, например квадрат.
Растягивая поверхность в соответствующем направлении, мы можем получить из этого квадрата круг, или шестиугольник, или любой другой многоугольник. Главное, чтобы в ходе трансформации поверхность не разорвалась и никакие точки фигуры не наложились на другие. Трансформации, происходящие без разрывов, дыр и склеиваний, то есть посредством растягивания, сжатия или выравнивая, называются непрерывными.
Особым подвидом такого типа трансформаций являются те, при которых остается неподвижная точка. У некоторых пространств это свойство сохраняется при любом виде непрерывной трансформации, и оно позволяет классифицировать различные виды поверхностей. Из всех теорем, затрагивающих это понятие, нужно выделить теорему о неподвижной точке Брауэра, которую сформулировал голландский математик Лёйтзен Эгберт Ян Брауэр (1881-1966). Теорема звучит сложновато, но ее можно легко объяснить. Представим себе, что мы плавно помешиваем ложкой в чашке с кофе. Согласно теореме Брауэра, как только кофе вернется в состояние покоя, в нем будет такая точка, которая окажется в том же самом положении, как когда мы его перемешивали. Из всех способов помешивания кофе есть один, при котором действие теоремы очевидно, — когда ложка движется вдоль стенок чашки. При таком круговом движении центр жидкости останется неподвижным — как глаз бури,— и именно он будет неподвижной точкой Брауэра.
Фон Нейман обнаружил тесную связь между теоремой о минимаксе и теорией неподвижных точек. Это помогло ему не только доказать свою теорему, но и годы спустя сделать важное дополнение теоремы неподвижных точек Брауэра.
Несмотря на свое немного устрашающее название, война полов — классический пример теории игр, примененной к повседневной жизни, который позволяет нам овладеть базовыми понятиями теории и прийти к определенным социологическим выводам. Оригинальная схема была представлена Робертом Данканом Люче и Говардом Рейфой в книге Games and Decisions («Игры и решения»). В игре участвует пара — мужчина и женщина, — они должны решить, как провести вечер воскресенья. Предлагается два варианта: пойти на футбольный матч или в кино. И у него, и у нее классические вкусы, так что с предпочтениями все понятно. Но добавляется еще одно условие, которое важнее личных предпочтений: провести вечер нужно вместе, а не отдельно, поскольку это один из немногих дней, когда можно побыть вдвоем. В таком случае его предпочтения будут стоять в следующем порядке.
1. Они вместе идут на матч.
2. Они вместе идут в кино.
3. Он идет на матч, а она в кино.
4. Он идет в кино, а она на матч.
На основе этого мы можем определить следующую платежную матрицу, где 1 обозначает лучший платеж, а 4 — худший.
Она на футбол | Она в кино | |
Он на футбол | 1, 2 | 3, 3 |
Он в кино | 4, 4 | 2, 1 |
Эта матрица расшифровывается очень просто. Если они оба идут на матч, то он идет куда хочет, и одновременно проводит время с ней (первое условие); при этом она идет не туда, куда хочет, но проводит время с ним, а это второе условие. Если он идет на футбол, а она в кино, то каждый идет куда хочет, но отдельно друг от друга, а это для них обоих третий по предпочтительности вариант (3, 3).
Мы имеем дело с неповторяющейся игрой, то есть с такой, в которую играют только один раз, и в ней нельзя принимать решения исходя из прошлых стратегий. К тому же это игра с нетрансферабельной полезностью и некооперативная, так как предполагается, что в ней нельзя устанавливать предварительные соглашения типа «если ты пойдешь со мной в кино, я заплачу за твой билет».
Стратегия минимакса привела бы нас к следующей ситуации.
Она на футбол | Она в кино | ||
Он на футбол | 1, 2 | 3, 3 | 3 |
Он в кино | 4, 4 | 2, 1 | 4 |
4 | 3 |
Самые большие потери для него составляют 3 и 4, поэтому его минимакс равен 3. Для нее — 4 и 3, и ее минимакс также равен 3. Это ситуация, в которой он идет на матч, а она в кино, где платежи составляют 3 и 3, что является лучшим вариантом для обоих. В данном случае стратегия минимакса не приводит к равновесию Нэша, так как один из игроков может поменять стратегию, чтобы получить больший выигрыш. Пока он в одиночестве идет на стадион, он может передумать и пойти в кино, получив таким образом больший платеж. Правда, при этом есть риск, что они оба передумают и понесут максимальные потери.
Сделав небольшое усилие, мы можем представить себе ситуацию, в которой все женщины любят футбол, а мужчины — кино. Но игра была бы в точности такой, как мы описали. Это значит, что игра симметрична. Внесем небольшое изменение, сделав ее асимметричной. Изменим порядок его предпочтений.
1. Они вместе идут на матч.
2. Он идет на матч, а она в кино.
3. Они вместе идут в кино.
4. Он идет в кино, а она на матч.
То есть он предпочитает пойти один на футбол, чем вместе в кино. В таком случае платежная матрица будет выглядеть следующим образом.
Она на футбол | Она в кино | |
Он на футбол | 1, 2 | 2, 3 |
Он в кино | 4, 4 | 3, 1 |
При такой перспективе понятно, что независимо от ее выбора он всегда выберет футбол, поскольку это будет выигрышным решением в любом случае. А для нее, учитывая, что он всегда выберет футбол, лучшим решением будет пойти вместе с ним. Тогда это и будет седловой точкой, равновесием Нэша, то есть стратегией, которую всегда выберут оба игрока. В таком случае говорится, что есть доминирующий выбор или что у игрока есть доминирующая стратегия, которая для него предпочтительнее всех остальных. Могут быть случаи, когда доминирующей стратегией располагают оба игрока. Парадокс предыдущей ситуации состоит в том, что эта эгоистичная доминирующая позиция «я пойду на матч все равно, с тобой или без тебя» приводит к лучшему результату, чем в предыдущем случае.
В статье «K теории стратегических игр», написанной в 1928 году, фон Нейман представил новый вариант игр с нулевой суммой и с количеством игроков большим 2. В их сценарии появилась новая переменная — возможные коалиции между игроками. Например, если имеется три игрока — А, В и С, — может случиться, что двое из них — А и В — объединятся против третьего, как если бы они были одним игроком, заключая договор о дележе выигрышей. В играх, изучавшихся до сегодняшнего дня, соперники не могли общаться друг с другом, чтобы заключать предварительные договоры. В этом случае говорят об играх с нетрансферабельной полезностью. Напротив, те игры, в которых игроки еще до начала игры могут общаться и заключать договоренности, называются играми с трансферабельной полезностью, или кооперативными.
Например, представим себе группу из трех друзей — А, В и С, — которым надо поделить между собой 100 евро. Решать, как будет происходить дележ, они будут простым голосованием, то есть большинством голосов. Возможными коалициями будут AB, АСУ ВСу а также четвертая — АВС. С такими исходными данными можно установить бесконечное количество платежей:
А = 33; В = 33; С = 34
А = 70; В = 30; С = 0
А = 25; В= 70; С = 5
и так далее.
Таким образом, ни одна коалиция не будет стабильной. Анализ таких игр немного сложнее анализа некооперативных игр. В этом случае надо угадать, каковы шансы на создание стабильных коалиций, в которых распределение платежей будет происходить таким образом, что никто из их членов не будет заинтересован в выходе из коалиции. В обычной жизни такой анализ приводит к появлению некоего судьи, который сделает возможной оптимальную коалицию. Например, реальная ситуация, в которой необходим подобный метод, может возникнуть в Европарламенте, при распределении некоего бюджета между членами союза. Каждая страна имеет определенное количество депутатов с правом голоса.
Возможные коалиции между игроками являются фактором нестабильности, которым очень трудно управлять. В любом случае единственный способ применить здесь результаты для игр с двумя игроками и нулевой суммой — считать коалицию одним игроком. Если в некоем сценарии есть, например, четыре игрока А, В, С и D и создается коалиция между А, В и С, то эта группа игроков рассматривается как один игрок, соперничающий с D то тогда можно применить схему игры с двумя игроками и нулевой суммой.
Теорема о минимаксе и результаты теории игр имеют свои ограничения. Разумеется, они не являются безошибочным способом выиграть в любой игре, даже если речь идет о двух рациональных игроках. Эта теория предлагает прежде всего наилучший способ принятия решения. Рациональный игрок, играющий против нерационального, может создать техники игры, не имеющие ничего общего с теорией игр. Самое главное, что была создана математическая теория, способная моделировать сценарии и абстрагировать конкретные ситуации, чтобы рассмотреть их с точки зрения математической логики. В этом смысле теория игр имеет много общего с аксиоматизацией теории множеств и квантовой механикой — это и вызвало интерес фон Неймана и было основной причиной, по которой он занимался настолько отличными друг от друга областями. Он поднимал до уровня науки дисциплины, которым ранее этот уровень был несвойственен, как это случилось с экономической теорией.
На первом этапе своего становления любая наука развивает методы наблюдения, которые позволяют точно описать предмет исследования. Следующим шагом является формулировка законов, как правило эмпирических, которые описывают поведение этого предмета. С этого момента теория должна быть в состоянии предположить, как будет развиваться система с течением времени. Научное описание такой сложной системы планет, как наша, утратило бы большую часть своего значения, если бы с его помощью нельзя было определить, например, дату, точное время и место солнечного затмения. Однако для того чтобы этот прогноз был научным результатом, а не плодом догадок, необходимо, чтобы теория была математизирована. Это значит, что ее законы должны описываться совокупностью уравнений. И когда говорится, что физика перестала быть натурфилософией и превратилась в науку, подразумевается, что благодаря новым методам исчисления законы ньютоновой механики были записаны в виде формул.
Галилей подробно описал свободное падение тел, но необходимо было дождаться появления исчисления бесконечно малых, что позволило свести законы механики к математическим формулам и узнать с высокой степенью точности, сколько времени требуется камню, чтобы достичь земли, и какова его скорость.
В начале XX века в некоторых естественных науках, таких как химия и биология, были внедрены методы математического исчисления. Но для общественных наук этот процесс оказался (и является таковым до сих пор) гораздо более сложным, так как в них всегда действует человеческий фактор, подразумевающий некоторую непредсказуемость. Тем не менее у экономики изначально было больше шансов, чем у какой-либо другой науки, ведь она, в конце концов, имела дело с числами. С другой стороны, это было одной из причин, по которым многие не соглашались с тем, чтобы такая деликатная материя, как человеческое поведение, рассматривалась отстраненно, с помощью чисел.
Прогнозирование всегда было одним из самых интересных аспектов экономической теории и одновременно самым слабым ее местом. В этом смысле экономика очень похожа на метеорологию, с той только разницей, что инструменты последней гораздо более совершенны. Метеорология может и не предсказать какое-то атмосферное явление, но когда оно произойдет, она будет в состоянии детально описать его причины, что в большинстве случаев неподвластно экономике, для которой многие кризисы являются совершенной неожиданностью.
Такое положение вещей кажется логичным, ведь метеорология ближе к физическим наукам, чем экономика, и, следовательно, ее легче математизировать. Не случайно фон Нейман однажды заявил, что экономика в своем развитии отстала на миллион миль от такой науки, как физика.
Хотя до 1937 года фон Нейман не опубликовал ни одной работы по экономике, его интерес к этой теме зародился довольно давно, еще во время бесед с отцом за семейными завтраками. Почти с самого начала фон Нейман подумал о том, чтобы отставить инструменты и методы математического анализа, несмотря на хорошие результаты, которые они дали в области ньютоновой механики.
Он полагал, что эти методы переоценены и не могут принести существенную пользу экономической теории. Фон Нейман больше полагался на то, что мы сегодня называем дискретной математикой. Используя методы, очень похожие на те, что были применены в теории игр, и обобщив теорему Брауэра о неподвижной точке, в 1937 году фон Нейман опубликовал работу Über ein ökonomisches Gleichungssystem und eine Verallgemeinerung des Brouwer’schen Fixpunktsatzes («Об экономической системе уравнений и обобщении теоремы Брауэра о неподвижной точке»), в которой доказывал существование математического параметра, представляющего равновесие цен.
Возможно, главная ценность этой статьи заключалась в том, что теория Неймана основывалась на системе аксиом, созданных им независимо от их экономического значения. Его методология была очень похожа на его же подход к аксиоматизации теории множеств или квантовой механики. Речь шла о том, чтобы начать с нуля и четко определить элементы, которые участвовали бы в рассмотрении.
Теория игр была создана в чисто математическом ключе, и фон Нейман хотел придать ей новое значение, заставить ее перешагнуть эти ограничения. Его новой целью стала экономика. Прежде эта наука использовала те же методы, что и классическая механика, а также прибегала к инструментам математического анализа, в частности вариационному исчислению. Применение теории игр, комбинаторики и конверсии означало большие изменения. Необходимо также добавить, что работы фон Неймана знаменовали рождение математики, которую мы называем прикладной. На этом пути у ученого был спутник — не математик и не физик, а экономист.
Человеческий фактор всегда имел большое значение для создания какой- либо экономической теории — не только из-за вносимой им непредсказуемости, но и потому, что он учитывает элементы морали. В этом смысле интересно, что на Моргенштерна, а затем и на фон Неймана оказали влияние идеи Карла Менгера (1840-1921), прославившегося своей работой «Основания политической экономии».
Менгер, на чью философию сильно повлиял Витгенштейн, представлял моральный кодекс как правила игры, которые поддерживают, упорядочивают и структурируют человеческие взаимоотношения в определенной группе, составляющей общество. Таким образом, будет столько разных моралей, сколько групп будет взято в расчет. Для анализа этих общественных кодексов Менгер предлагал использовать логику и комбинаторику, отбрасывая математический анализ, модный в то время, но дававший ничтожные результаты применительно к экономической теории. Именно в таком подходе Менгер видел большие возможности для улучшения работы с экономической теорией, что и было частично реализовано с появлением теории игр и, главным образом, теоремы о минимаксе, примененной к анализу рыночного равновесия.
Австрийский экономист Карл Менгер был отцом известного во всем мире математика, также Карла Менгера.
В 1934 году в Принстоне фон Нейман познакомился с Оскаром Моргенштерном (1902-1977), немецким экономистом, чье имя уже имело некоторую известность в Венском кружке. Моргенштерн явно предпочитал общаться с математиками, нежели с экономистами, и сразу же заинтересовался подходом фон Неймана. Они оба критически относились к тому, как до этого рассматривалась экономическая теория, и стали работать над текстом, который должен был быть первым в ряду лекций фон Неймана в Принстоне. Однако для начала Моргенштерну требовалось усовершенствовать свои математические знания до уровня, необходимого для этой работы. Фон Нейман посоветовал ему несколько книг. Надо отдать должное таланту и усердию Моргенштерна, ведь достичь необходимого уровня для того, чтобы на равных работать с фон Нейманом, было нелегкой задачей.
Текст, который должен был стать обычным вступлением к серии лекций, является одной из важнейших работ по экономической теории, написанных по сегодняшний день. Он также послужил основой не только для последующего ее развития, но и для только что появившейся теории игр. Книга, написанная фон Нейманом и Моргенштерном, была опубликована в 1944 году под названием Theory of Games and Economic Behavior («Теория игр и экономическое поведение») и считается одной из главных работ венгерского ученого. В ней теория игр предстала как полная, завершенная теория, которая могла стать основой новой ветви математической науки.
Авторы доказали, что любая игра с количеством игроков n и ненулевой суммой может быть сведена к игре с количеством игроков n + 1 и нулевой суммой. То, что в теории игр главным образом рассматриваются игры с двумя игроками и нулевой суммой, объясняется тем, что, во-первых, их проще анализировать, а во-вторых, они в каком-то смысле являются общим случаем для n + 1 числа игроков в игре с нулевой суммой.
Разумеется, сложность анализа возрастает с увеличением числа игроков. Чтобы решить эту проблему, фон Нейман и Моргенштерн использовали матрицы с n измерениями и функции с n переменными. Применение теории игр к поведению экономических агентов произошло естественным путем — их стали рассматривать как субъекты антагонистической игры, чьей целью было получить выигрыш, снизив риски. В таких играх, разумеется, участники могли создавать коалиции.
Главное свойство математики, по моему мнению, — это ее особенная связь с естественными науками, или, обобщая, со всеми науками, интерпретирующими опыт на более высоком уровне, нежели чисто описательный.
Джон фон Нейман
Может показаться парадоксальным, но часто книги, оказавшие наибольшее влияние на развитие определенной науки, читают меньше всего. В этом можно найти некую логику, если вспомнить, что для их чтения необходимо обладать очень глубокими знаниями, следовательно, они могут быть интересны только узкому кругу специалистов. С другой стороны, эти специалисты обычно обладают признанным авторитетом, который может сделать книгу известной и вне сугубо профессионального круга, причем настолько, что она вызовет интерес средств массовой информации и даже станет модной. Нечто подобное произошло с «Теорией игр и экономическим поведением» — книгой, полной формул и тяжелой для чтения, явно адресованной только специалистам. Газета «Нью-Йорк Таймс» посвятила ей длинную статью, в которой объяснялись революционные последствия нового подхода. Вскоре все специалисты (и, как часто бывает в таких случаях, многие, кто таковыми не являлся) заявили, что появление этой книги ознаменовало новую эпоху в развитии экономической теории. И все же за пять лет было продано всего около 4000 экземпляров. Многие покупатели были не математиками и не экономистами, а профессиональными игроками.
Однажды вечером Оскару Моргенштерну позвонил Курт Гёдель и сказал, что нашел противоречия в Конституции США. При этом на следующий день Гёдель должен был предстать перед судьей Филипом Форманом для заключительной процедуры принятия американского гражданства, которая носила исключительно формальный характер. Разумеется, математик досконально изучил Конституцию и не намерен был молчать об обнаруженных противоречиях. Тогда Моргенштерн решил позвонить Эйнштейну (который тогда был уже очень известен) и попросить его пойти к судье вместе с ними. На следующий день они предстали перед судьей втроем. Как и следовало ожидать, Гёдель завел речь о формулировке пятой статьи, которая ставила под вопрос устойчивость всей системы. К счастью, Моргенштерну и Эйнштейну удалось убедить судью в благих намерениях Гёделя, и тот смог поклясться на Конституции без каких-либо проблем. Ему очень повезло и со спутниками, и с судьей.
Эйнштейн любил проводить время в обществе Гёделя. Вдвоем они совершали долгие прогулки по кампусу Принстонского университета.
Вероятно, они были очень расстроены, открыв книгу и обнаружив 165 страниц, заполненных математическими формулами.
Фон Нейман и Моргенштерн сравнивали уровень, на котором тогда находилась экономическая теория, с уровнем физики до появления теорий Ньютона и Кеплера. Они считали неприемлемым интуитивный подход, лишенный серьезной теоретической базы, при котором объяснение основывалось на туманной терминологии без четких определений. Ученые прекрасно отдавали себе отчет в том, что развитие экономики требует создания новой математики, которой на тот момент не существовало.