Такого рода дилеммы долгое время являются излюбленной темой бихевиористов и теоретиков игр. Самый обсуждаемый пример — дилемма заключенного. Заслуга в открытии этой простой игры приписывается математику А.У. Такеру, взявшему ее название из анекдота, который вначале ее иллюстрировал. Двоих заключенных держат в разных камерах за серьезное преступление, которое они совершили. Однако имеющиеся у обвинения доказательства позволяют вынести им приговор только за небольшое правонарушение, которое карается, скажем, годом тюремного заключения. Каждому из заключенных говорят, что, если он признается, а другой промолчит, признавшийся выйдет на свободу, тогда как его подельник проведет 20 лет в тюрьме. Если признаются оба, они получат промежуточный срок, скажем, пять лет. (Эти выигрыши приводятся в табл. II. 1.) Заключенным не разрешается общаться друг с другом.
Превалирующая в дилемме заключенного стратегия — признаваться. Независимо от того, что делает Y, X получает более мягкий приговор, если заговорит: если Y тоже признается, X получит пять лет вместо 20; если Y так и будет молчать, X выйдет на свободу вместо того, чтобы год сидеть в тюрьме. Выигрыши идеально симметричны, так что Y тоже лучше признаться вне зависимости от того, что делает X. Трудность здесь опять-таки заключается в том, что, если каждый будет вести себя эгоистически, обоим будет хуже, чем если каждый проявит сдержанность. Таким образом, когда оба признаются, они получают пять лет вместо одного года, который могли бы отсидеть, если бы промолчали.
Хотя заключенным не позволяется общаться друг с другом, было бы ошибкой считать, что источник затруднений именно в этом. Скорее, их проблема в нехватке доверия. Простое обещание не признаваться не меняет материальных выигрышей игры. (Если бы каждый мог пообещать, что не признается, все равно каждому было бы лучше, если бы он не сдержал обещание.)
В одном давнем исследовании Анатоль Рапопорт и Альберт Чаммах выясняли, как на самом деле ведут себя люди, перед которыми неоднократно вставала дилемма заключенного
[23]. В их экспериментах, как и в сотнях других, последовавших за ними, парам игроков давалось два варианта выбора: «сотрудничать» или «отказаться от сотрудничества». В качестве выигрыша выступали небольшие суммы денег, а не годы тюремного заключения, но в остальном структура игры была идентична дилемме заключенного. Типичная игра представлена в табл. ІІ.2.
Как и раньше, превалирующая стратегия для идентичной игры — не сотрудничать. Это приносит более высокий выигрыш независимо от того, как поступает второй игрок. Однако, как и в изначальной дилемме заключенного, каждому игроку будет лучше, если оба будут сотрудничать, чем если оба переметнутся.
Главное открытие Рапопорта и Чаммаха было в том, что люди демонстрируют сильную тенденцию к сотрудничеству, когда многократно играют с одним и тем же партнером. Причина проста. Если игра происходит много раз, у сотрудничающего есть возможность расквитаться с партнером, который его предал. Как только становится понятно, что за это придется расплачиваться, обе стороны обычно сходятся на модели сотрудничества. Рапопорт и Чаммах назвали стратегию, вознаграждающую сотрудничество и наказывающую переметнувшегося, «око за око».
В недавней книге Роберт Аксельрод исследует вопрос, как стратегия «око за око» работает на фоне широкого ряда хитроумных контрстратегий
[24]. Стратегия «око за око» формально определяется как «первый ход — сотрудничать, каждый последующий ход — повторять предшествующий ход другого игрока». Это «хорошая» стратегия в том смысле, что она показывает изначальную склонность к сотрудничеству. Но это также и жесткая стратегия: она быстро наказывает другую сторону, как только та предаст. Если каждый из игроков играет «око за око», результат — идеальное сотрудничество в каждом раунде игры. Таким образом, пара игроков, применяющих стратегию «око за око», получает самый большой совокупный выигрыш.
Аксельрод изучал гипотетические популяции игроков. В популяциях были представлены не только стратегия «око за око», но также и многочисленные другие стратегии. Он выполнил компьютерные симуляции, чтобы понять, какие условия способствуют появлению сотрудничества. И открыл, что стратегия «око за око» действовала очень хорошо в сравнении с рядом циничных стратегий, которые были специально разработаны для того, чтобы нанести ей поражение.
В схеме Аксельрода появление сотрудничества требует, чтобы был достаточно стабильный состав игроков, каждый из которых может вспомнить, что делали другие игроки в предшествующих взаимодействиях. Оно также требует, чтобы игроки делали серьезную ставку на то, что произойдет в будущем, ибо только страх расплаты удерживает людей от того, чтобы отказаться от сотрудничества. Когда эти условия выполнены, сотрудничающие могут распознать друг друга и исключить тех, кто склонен к предательству
[25]. Чем выше выигрыши, заложенные в успешном сотрудничестве, тем больше доля популяции, готовая сотрудничать.
Условия, необходимые для модели «око за око», часто выполняются в человеческих популяциях. Многие люди и в самом деле взаимодействуют многократно, и большинство следит за тем, как другие с ними обращаются. Аксельрод собрал убедительные свидетельства, что эти факторы помогают объяснить, как в действительности ведут себя люди. Возможно, самое убедительное подтверждение — рассказы о системе «живи сам и дай жить другим», сложившейся в окопах во время Первой мировой войны. Во многих местах боевых действий одни и те же воинские подразделения вели окопную войну друг против друга на протяжении нескольких лет. Часто они были подобраны в соответствии друг с другом, так, чтобы ни у кого не было надежды на быструю победу. Перед ними стоял выбор: либо интенсивно сражаться с большими потерями с обеих сторон, либо практиковать сдерживание.