Значение этих открытий за пределами лаборатории зависит от цели.
Если цель в том, чтобы повлиять на действие, например, в школьном классе, в казино или на рабочем месте, организатор может (более или менее свободно) установить режим вознаграждений, чтобы сформировать желаемое поведение. Так, режим с вариативным интервалом часто используют для воздействия на поведение, например, когда учитель использует политику произвольных викторин. При режиме с вариативным соотношением, который работает для многих азартных игр, легче повлиять на поведение, если первая награда дается рано
[225]. Поскольку менеджеры казино и ипподромов не располагают технологией, которая позволила бы им втягивать новых игроков, предлагая им более высокий выигрыш, им приходится полагаться на так называемое везение новичков
[226]. Действия мошенников, однако, часто полагаются на выдачу быстрых наград. В школьном классе и в казино режимы вознаграждений работают «за спиной» у учеников или игроков, то есть они воздействуют на поведение не эксплицитными стимулами, но скорее как в случае с плачущим ребенком, то есть посредством бессознательного процесса. Наоборот, когда менеджеры платят работникам, если те достигли установленной цели (режим с постоянным соотношением) или ежемесячно (режим с постоянным интервалом), они просто устанавливают систему стимулов. Поскольку поведение работников может быть адекватно объяснено ожиданием вознаграждения, нет нужды обращаться к собственно вознаграждению.
Если цель в том, чтобы объяснить модели поведения их реальными последствиями, режимы вознаграждения имеют смысл, только если возникают естественным образом и, более того, настолько непрозрачны, что не создают открытых стимулов. С двумя постоянными режимами такое, похоже, случается нечасто. На поведение моих друзей влияет не то, сколько я им улыбаюсь, а то, насколько последовательны и уместны мои улыбки. В естественных условиях редко встречаются награды, выдаваемые на регулярной основе (как зарплата). Важнее два вариативных режима. Человек, играющий в «горячо-холодно» (режим с вариативным соотношением) с представителем противоположного (или того же) пола, может вызвать более сильное влечение, чем тот, кто неизменно демонстрирует дружественное поведение. Режим с вариативным интервалом возникает, когда вы хотите до кого-то дозвониться, а линия занята. Вы знаете, что рано или поздно дозвонитесь, но не знаете, когда. В этой ситуации возникает стабильный паттерн повторяемого набора номера, но теория рационального выбора не может дать точного прогноза. Эта теория могла бы предсказать любое число паттернов в зависимости от представлений звонящего о том, как долго может продлиться разговор. Однако представляется маловероятным, чтобы у людей были стабильные убеждения на сей счет.
Паттерн реакций, порождаемый подкреплением, как правило, отличается от паттерна, порождаемого сознательным, рациональным выбором. Предположим, животное должно нажать рычаг, выдающий награды в режиме либо с вариативным соотношением, либо с вариативным интервалом. Рациональный паттерн, максимально увеличивающий общее вознаграждение, состоит в том, чтобы большую часть времени нажимать рычаг с вариативным соотношением, набирая поощрительные очки, и при этом время от времени нажимать на рычаг с вариативным интервалом, чтобы посмотреть, не вышло ли новое вознаграждение. Подкрепляющее обучение, однако, не производит такой паттерн. Вместо этого животные гораздо чаще, чем надо, нажимают на рычаг с вариативным интервалом. Они уравнивают средние награды при нажатии одного или другого рычага, вместо того чтобы, как диктует рациональность, уравнивать предельные (marginal) вознаграждения. При других комбинациях режимов подкрепляющее обучение иногда подражает рациональному выбору, но делает это непоследовательно. Если и есть какой-то неинтенциональный механизм, способный надежно симулировать рациональность, его нужно искать в другом месте.
Дифференцированное половое соответствие
Чаще всего упоминают механизм естественного, или социального, отбора. В третьей части книги я указываю на то, что объяснять поведение можно, используя предположение о более или менее рациональном приспосабливании агентов к своей среде обитания. В радикально иной перспективе мы можем допустить, что агенты отбираются средой. Хотя отбор может быть плодом деятельности интенционального агента, когда, например, выводится порода послушных домашних собак или когда в лаборатории отбирают более умных крыс, многие механизмы отбора покоятся на каузальных процессах, не предполагающих интенционального агента.
В частности, дифференцированное выживание организмов, основанное на паттернах их поведения, может привести к оптимальному (для репродукции) поведению в популяции даже в отсутствие любого оптимизирующего отбора или намерения. Предположим, что 10 % организмов в популяции из 100 особей так эффективно добывают корм, что оставляют потомство численностью в среднем 10 особей, которое доживает до взрослого состояния, тогда как оставшиеся 90 % оставляют только 5 особей. Если поведение родителей (через какой-то механизм) передается потомству, следующее поколение взрослых организмов будет включать группу 100 / 550 ~ 18 %, которая будет демонстрировать более эффективное поведение. Еще несколько поколений – и практически все организмы будут демонстрировать такое поведение. Если мы спросим, почему оно повсеместно распространено, ответ будет: его последствия лучше
[227]. Этот механизм работает через все поколения. В отличие от подкрепляющего обучения, он модифицирует поведение не отдельной особи, а следующих друг за другом поколений особей.
Естественный отбор
Теория естественного отбора подробно описывает эту историю. Здесь я приведу упрощенную, или классическую, версию теории, которая удовлетворяет нашим целям. Я хочу продемонстрировать, чем естественный отбор отличается от намеренного и тем более от рационального выбора. Естественный отбор является оптимизирующим механизмом, но только в слабом смысле. Также я хочу заложить фундамент для разбора в следующей главе того, что социальный отбор вряд ли способен провести даже столь слабую форму оптимизации.
Приспособляемость организма, измеряемая численностью его (способного к репродукции) потомства
[228], определяется одновременно его окружением и физиологическими и поведенческими особенностями, или фенотипом. Его генотип – это набор инструкций, который, действуя согласно со средой, определяет фенотип. Эти инструкции записаны в длинных молекулах ДНК, которые имеют много общего с письменным языком. Буквы ДНК – это четыре молекулы (нуклеотиды), называемые Т, А, Г и Ц. Слова, или кодоны, ДНК – это триплеты нуклеотидов, каждый из которых содержит инструкции для сборки одной из 20 аминокислот, которые являются кирпичиками протеинов в организме. Поскольку триплетов 64 (61, если мы исключим 3 из них, выполняющих другие функции), одна и та же аминокислота может кодироваться более чем одним триплетом. Ген – это сегмент ДНК, кодирующий один отдельный протеин.