«Ну, как вы не понимаете? — восклицал после одного такого матча новоприбывший священник-рефери. — Цель игры — победить соперника. Кто-то обязательно должен выиграть!» «Нет, отец, — терпеливо отвечали капитаны команд. — Все не так. Только не здесь, не в Асмате. Если кто-то выиграет, значит, кто-то проиграет — а это никуда не годится»72.
Такие рассуждения кажутся, мягко говоря, странными. Но лишь потому, что нам инстинктивно трудно их понять — по крайней мере, в контексте игры (лично я сомневаюсь в прелестях новогвинейского футбола). Рассмотрим торговлю. Для экономистов обоюдная прибыль — аксиома. Если две страны расширяют торговлю, обеим лучше. И все же, обыватель — не говоря уж о его представителе-демагоге — видит это несколько иначе. Для него торговля это конкуренция: экспорт — хорошо, импорт — плохо.
Вообразите турнир по футболу, слегка отличающийся от новогвинейского. Пусть в этом соревновании победителем станет не тот, кто выиграл больше всего матчей, а тот, кто забил больше всех мячей. Теперь представьте, что несколько команд решили сыграть в нормальный футбол: то есть их основная задача — пропустить как можно меньше мячей и набрать как можно больше очков. Остальные участники пробуют иную стратегию: сначала позволяют соперникам забить гол, а потом стараются сделать это сами. По возможности оппоненты поступают так же, и так далее. Какие команды наиболее успешны, видно сразу: конечно, те, что используют стратегию «Око за око». Иными словами, из игры с нулевой суммой футбол превратился в игру с ненулевой суммой. Именно этого добился и Аксельрод: он превратил дилемму заключенного из игры с нулевой суммой в игру с ненулевой суммой. В жизни-то первая встречается очень редко.
В одном важном аспекте, однако, Бинмор и другие критики оказались правы. Аксельрод слишком поторопился, заключив, что сама стратегия «Око за око» является эволюционно стабильной — то есть популяция, применяющая ее, защищена от вторжения той, которая использует любую другую стратегию. Этот вывод опровергли дальнейшие компьютерные симуляционные соревнования, похожие на третий турнир Аксельрода. В ходе них Роб Бойд и Джеффри Лорбербаум показали, насколько легко создать условия, в которых «Око за око» не побеждает.
Эти турниры, напомню, подразумевают борьбу случайной комбинации стратегий друг против друга за контроль над ограниченным пространством — путем размножения со скоростью, определяемой количеством заработанных в предыдущей игре очков: 5, з, 1 или о. Наиболее успешными поначалу являются непорядочные («гадкие») — такие, как «Всегда предавай»: эксплуатируя наивные кооперативные стратегии, они постепенно вытесняют их. Но вскоре и они слабеют: встречаясь только друг с другом, они получают всего по одному очку, и на первый план выходит «Око за око». Играя против «Всегда предавай», она скоро тоже начинает предавать (тем самым лишая оппонента искушения ценой в пять очков), а играя против себя самой, сотрудничает и набирает по три балла. Выходит, пока стратегии «Око за око» могут найти себе подобных и сформировать пусть маленький, но кооперативный кластер, они будут процветать и, в конечном счете, доведут до вымирания «Всегда предавай»73.
Если стрелок ирландской республиканской армии, целясь в британского солдата, убивает невинного наблюдателя-протестанта, ошибка может привести к ответному убийству.
Но тут-то и проявляется слабое место «Око за око»: она подвержена ошибкам. Если вы помните, эта стратегия сотрудничает до тех пор, пока не столкнется с предательством, которое затем наказывает. Как правило, два игрока «Око за око» благополучно сотрудничают, но если один вдруг предает (по ошибке, по случайности), второй начинает мстить. В результате получается замкнутый круг чрезвычайно неприбыльного обоюдного предательства. Рассмотрим пример из реальной жизни. Если стрелок ирландской республиканской армии, целясь в британского солдата, убивает невинного наблюдателя-протестанта, ошибка может привести к ответному убийству лоялистом случайно выбранного католика. Тот, разумеется, тоже будет отомщен — и так далее до бесконечности. Подобные серии смертей в Северной Ирландии известны как убийства из мести — «око за око, зуб за зуб».
С учетом всех этих ограничений становится ясно, что успех стратегии «Око за око» в турнирах Аксельрода явно определялся формой их проведения. Она оказалась такова, что просто не выявились слабые места этой стратегии. В мире, где ошибки совершают все без исключения, стратегия «Око за око» — второсортная, уступающая всем остальным типам.
И вот ясные выводы Аксельрода заволокло облаками. И чем более изощренными были новые стратегии, тем сильнее сгущались тучи.
Введите Павлова
Перенесемся в Вену. Конец 1980-х годов. Карл Зигмунд, одаренный математик с весьма игривым складом ума, ведет семинар по теории игр. Один из присутствующих студентов, Мартин Новак, тут же решает бросить химию и полностью отдаться изучению данной темы. Зигмунд, приятно удивленный напором своего ученика, ставит перед ним нелегкую задачу: разобраться в дебрях сложностей, окруживших дилемму заключенного после появления стратегии «Око за око». Найдите мне идеальную стратегию в реалистичном мире, предложил Зигмунд.
Новак разработал собственный турнир: он отличался отсутствием какой бы то ни было определенности и был построен на статистике. Стратегии либо совершали случайные ошибки с определенной вероятностью, либо меняли тактики по тому же вероятностному принципу. Система, однако, могла «учиться» или развиваться, сохраняя улучшения и отказываясь от неудачных тактик. Постепенному эволюционному изменению подвергались даже те вероятности, с которыми совершались те или иные действия. Такой новый реализм оказался чрезвычайно полезен, ибо устранил все излишние усложнения. Вместо нескольких стратегий, в равной степени способных выиграть, четкое лидирующее положение занимала одна. И это была не «Око за око», а ее очень близкая родственница — «Великодушная око за око» (которую я для краткости буду называть просто «Великодушной»).
Эта стратегия иногда прощает единичные ошибки. Иными словами, примерно треть всего времени она прощает разовое предательство. Прощение всех единичных предательств — стратегия, известная как «Око за два ока» — подразумевает явную эксплуатацию. А вот прощение время от времени (примерно с 30-процентной вероятностью) оказалось на удивление эффективным: оно помогало разорвать циклы взаимных упреков, не подвергаясь при этом эксплуатации со стороны предателей. В компьютерной популяции игроков «Око за око», совершающих периодические ошибки, «Великодушная» будет распространяться за счет последних. Как это ни парадоксально, «Око за око» фактически, прокладывает дорогу стратегии, более доброй, чем она сама. Это Иоанн Креститель, а не сам Мессия.
Впрочем, и «Великодушная» — тоже не Мессия. Она настолько великодушна, что позволяет распространяться еще более добрым, более наивным стратегиям. Например простая «Всегда сотрудничай» может преуспевать среди «Великодушных» игроков, хотя на самом деле не побеждает их. Но «Всегда сотрудничай» — стратегия фатально великодушная; ее легко побеждает «Всегда предавай», самая непорядочная из всех. В популяции «Великодушных» игроков «Всегда предавай» ни к чему ни приводит. Но стоит кому-то начать использовать «Всегда сотрудничай», как она наносит удар. Так, вместо счастливого мира взаимности мы получаем вот что. «Око за око» вводит в игру «Великодушную», та может ввести «Всегда сотрудничай», которая может развязать постоянное предательство — и вот мы опять возвращаемся к тому, с чего начали. Один из выводов Аксельрода оказался ошибочен: в этой игре стабильного исхода нет.