Бертран предсказал, что в равновесии фирмы будут продавать товар по более низкой цене, чем соперник, что похоже на исход {признание, признание} в «Дилемме заключенных». Несмотря на это предсказание, на рынках с небольшим количеством компаний часто можно заметить цены, основанные на сговоре. Большинство западных демократий обладают так называемым «антитрестовским» законодательством для предотвращения подобного сговора (кооперации нескольких фирм) и содействия конкуренции.
Чтобы понять, как игроки сговариваются в ситуациях вроде «Дилеммы заключенных», нам необходимо уйти от однократных игр (в которых участники играют один раз и затем игра кончается) и начать размышлять о более реалистичных сценариях повторяющегося взаимодействия, при котором участники играют в одну игру снова и снова.
Заметили бы мы равновесную кооперацию в «Дилемме заключенных», если бы игроки снова и снова взаимодействовали?
Представьте, что оба игрока знают, что они будут играть в «Дилемму заключенных» не один раз, а два. Чтобы найти равновесие в игре с повторяющимся взаимодействием, нам сначала необходимо предсказать равновесие, которое сформируется в последнем туре. А затем мы размышляли бы о том, каким будет равновесие в первом туре. Такая схема размышления называется обратной индукцией.
В конце игры
Во время второго раунда игроки понимают, что это последний раунд, поэтому нет больше необходимости пытаться изменить потенциальный исход. Соответственно, последний тур игры представляет собой однократную «Дилемму заключенных»: все сотрудничество отменяется.
Игроки могут рассудить, что во втором туре никто не будет сотрудничать вне зависимости от событий первого раунда. Таким образом, с точки зрения игрока первый тур игры также ничем не отличается от однократной «Дилеммы заключенных». Так что в равновесной ситуации ни на одной стадии игры никто не будет сотрудничать.
В действительности, даже если «Дилемму заключенных» повторять на протяжении многих раундов, мы никогда бы не увидели кооперации ни на одном из уровней, до тех пор пока у игры есть определенный финальный тур, так как обратная индукция разбирает игру с последнего раунда.
Что, если определенного последнего тура нет?
Роберт Джон Ауманн, израильский математик (род. в 1930 г.), в 2005 году разделивший Нобелевскую премию по экономике с Томасом Шеллингом, занимался изучением кооперации как равновесного исхода в случае, когда у игры бесконечный горизонт, то есть игра может повторяться вечно. При таком горизонте обратная индукция не разбирает кооперацию с последнего тура, ведь определенного последнего тура и не существует.
Первым условием для того, чтобы кооперация стала равновесным исходом, является обязательное наличие в стратегиях игроков элемента наказания за «плохое» поведение в прошлом (то есть за некооперативное поведение). Игроки могут вести себя кооперативно, чтобы избежать наказания в будущем.
В «Дилемме заключенных» с бесконечным горизонтом, то есть когда в игру играют непрерывно, вечно, можно рассмотреть так называемую стратегию вечной кары: сначала игрок действует кооперативно (в зависимости от игры это может оказаться преступник, хранящий молчание, соседка, моющая посуду, или компания, устанавливающая высокую цену по сговору). В последующих турах игрок сотрудничает, только если другой игрок до этого всегда вел себя кооперативно. Однако первый игрок перестает сотрудничать (заключенный признается, соседка перестает мыть посуду, а компания устанавливает более низкую цену), если другой игрок когда-либо в прошлом вел себя некооперативно.
Оба участника, выбирающие стратегию вечной кары, могут формировать равновесие Нэша в повторяющейся игре вроде «Дилеммы заключенных», если они достаточно терпеливы (если они способны не польститься на большой выигрыш сегодня, чтобы получить кооперативный выигрыш в будущем). В этом случае наказание за отступничество может удержать игроков от некооперативного поведения.
Тем не менее, если игроки нетерпеливы, они навряд ли смогут устоять и не предать другого игрока, несмотря на последующее наказание. Понимая это, соперник изначально не станет вступать в кооперацию. Таким образом, сотрудничество с нетерпеливыми игроками не может быть равновесным.
Когда участники терпеливы (из-за угрозы наказания, которое становится сдерживающим средством), угроза должна быть убедительной. Стратегия вечной кары может оказаться не убедительной, если наказывающий участник также не получает большого выигрыша из-за этого наказания. Соответственно, если сговор проваливается, у обоих игроков появляется стимул пересмотреть отношения, не обращать внимания на отклонения и просто начать сговор заново. Однако если игроки ожидают, что им удастся быстро пересмотреть их отношения, то их сговор изначально нельзя назвать устойчивым.
Тем не менее если участники ожидают, что пересмотр займет определенное время, то угроза может возыметь сдерживающее действие, и в конце концов будет сформирован равновесный исход, основанный на сговоре.
Даже если игра не повторяется вечно при условии, что игроки не уверены, когда она кончится, сотрудничество можно поддерживать в равновесии до тех пор, пока они верят, что игра, скорее всего, продолжится в следующем раунде. Тогда появляется вероятность того, что отступление от договоренности будет наказано, а значит, кооперация вне опасности.
Тем не менее, если игра, вероятнее всего, кончится в следующем туре, то игрок будет действовать с выгодой для себя и отступит от договоренности, чтобы в этом туре получить больший выигрыш. Понимая это, и его соперник не будет действовать кооперативно. Сговора в этой ситуации не будет.
Эксперимент с «Дилеммой заключенных»
Одним из отцов-основателей экспериментальной экономики был Рейнхард Зельтен, который в 1994 году разделил Нобелевскую премию по экономике с Джоном Нэшем и Яношем Харсаньи. Зельтен провел эксперимент, в ходе которого участники играли в версию повторяющейся «Дилеммы заключенных» на настоящие деньги. Игроки не знали, сколько раз будет повторяться игра, но знали, что рано или поздно эксперимент подойдет к концу.