Точки «разжигают ненависть» между нейронами, или Поле битвы – мозг
Лео Сагру с коллегами отталкивались от идеи, что нейрон или нейронная сеть принимает решение, собирая информацию об альтернативах в поведении, и делает выбор в пользу оптимальной стратегии достижения результата.
Экспериментаторы обучали обезьян следить за определенными объектами. Лео Сагру хотел найти нервные клетки, которые принимают решение, куда перевести взгляд (вправо или влево). На экране перед животными появлялось облако из точек, причем исследователи могли задавать разную степень синхронности их перемещения. Скажем, все точки одновременно двигались вправо или, наоборот, влево. В какие-то моменты они двигались хаотично, а иногда большая часть – вправо, а остальные – влево. Оказалось, что обезьяны достаточно быстро выявляли доминирующее направление движения точек и следовали за ним взглядом. Экспериментаторы увеличивали или уменьшали количество точек, двигавшихся в одном направлении, что усложняло или упрощало задачу.
Выяснилось, что за отслеживание перемещения точек – а вернее за принятие решения, куда смотреть, – отвечали нейроны внутритеменной борозды (lateral intraparietal area, LIP). Нейроны этой области собирали информацию до какого-то порогового значения, и как только оно достигалось – запускалось движение глаз в ту или иную сторону.
На основе полученных данных нейробиологи предложили простую модель: информация о направлении движения обрабатывается на уровне специализированных нейронов-детекторов. А сами по себе эти нейроны кодируют информацию о движении независимо друг от друга.
К примеру, чем больше точек в облаке движутся вправо, тем более активными становятся нейроны – детекторы этого направления. Но была отмечена удивительная вещь.
Чтобы отправить команды на моторные структуры и заставить обезьяну смотреть в том или ином направлении, одни нейроны начинали подавлять другие!
Они конкурировали за то, чтобы быть активированными, просто включиться в работу! Мы с вами уже сталкивались с этим принципом, когда говорили о получении фактора роста в развивающемся мозге. Тут аналогичная ситуация, реализуемая по принципу «выбывает тот, кто не успел включиться в работу». Здесь, правда, никого не уничтожают, но неактивные клетки все же получают меньше стимуляции. Задача клетки – проявлять активность, так она упрочняет свои связи. Ее положение в системе становится более устойчивым.
А теперь подумайте: чтобы вы сейчас перевели взгляд, решили отложить какое-то дело или найти себе другое занятие, в вашем мозге развернулась настоящая битва между клетками, каждая из которых хочет включиться в работу. Никакой романтики, никакой слаженной работы по взаимным договоренностям – только жесткая борьба, только победа сильнейшего.
Ваш выбор – победа сильнейших нейронов вашего мозга в конкурентной борьбе.
Отложите книгу на несколько минут и подумайте об этом…
Да, так себе картинка вырисовывается. Не очень приятно осознавать, что есть бездушные клеточные единицы, которые отдают вам команды, выясняя отношения между собой.
Эксперименты с обезьянами производились с применением положительного подкрепления. Животных награждали апельсиновым соком. Оказалось, что активность нейронов области LIP зависела как от величины ожидаемой награды, так и от того, с какой вероятностью эта самая награда могла быть получена. Вдумайтесь, клетки еще и просчитывали, целесообразно ли вообще выполнять нужное действие.
Таким образом, нейроэкономика смогла очень близко подойти к объяснению концепции ожидаемой полезности. Всякий раз, делая выбор, нейроны взвешивают на невидимых весах степень полезности (целесообразности) того или иного действия.
Но все-таки – не одни же нейроны области LIP участвуют в принятии решений! На примере разбора механизмов двигательного акта мы уже убедились, что обычно в работу включается множество систем мозга. Как же мы принимаем решения и какие еще структуры мозга на это влияют?
Большинство из нас считает привычку задумываться над последствиями наших поступков ужасно скучной… порой до смерти.
Бертран Рассел
Принятие решений
Известно, что, помимо области LIP, в процесс оценки ожидаемой полезности вовлечены структуры дофаминовой системы (прилежащее ядро, гипоталамус, стриатум). Особую роль в оценке полезности конкретного выбора играют именно стриатум и орбитофронтальная кора.
Согласно одной из базовых нейробиологических моделей нейросети собирают информацию от органов чувств (и систем внутренней мотивации), а далее производят сравнение альтернатив. Все поступившие сигналы (когнитивный, мотивационный, зрительный, слуховой и так далее) сравниваются в нейросети, а далее на выход подается результат сравнения – оптимальное (по мнению нейросети) решение.
Но обратите внимание: никто не говорит о том, что нейросеть будет сидеть и учитывать досконально каждый параметр предложенных альтернатив. Думаете, ей больше заняться нечем? Более того, она работает в условиях ограниченной информации.
Вообще, орбитофронтальная кора задействована в тех ситуациях, когда мозг когнитивно перегружен. Представьте: вы думаете, думаете, думаете, взвешиваете, анализируете, а потом говорите: «Эх, была не была! Будь что будет». Орбитофронтальная кора как бы разрешила эмоциям взять верх и принять решение. Потому что мозг устал разбираться, в чем там дело.
В реальной жизни на человека действуют самые разнообразные факторы. И далеко не всегда мозгу вообще есть смысл измерять ценность конечного результата. Почему? Потому что многое из того, что мы делаем (как мы уже выяснили ранее), – автоматизмы.
К примеру, супруги договорились, что каждую пятницу ходят в театр. Соответственно, на выходных или за несколько дней до наступающей пятницы они выбирают, на какой спектакль пойти. Это вариант целесообразного осмысленного поведения, потому что оно направлено на достижение конечной цели.
Но! Если супруги будут выбирать спектакль достаточно часто и регулярно, то в какой-то момент подобное поведение превратится в привычку. То есть процедура выбора перестанет быть зависимой от ценности ее результата.
И в итоге получается, что автоматизм – поведение, которое вообще не требует достижения цели. Здесь очень важно понять, что само по себе действие (этот автоматизм) обладает высокой ценностью для нас, но при этом не зависит от реальной цели. И тут кроется главное коварство всего механизма принятия решений.
Под воздействием внезапно возникших внешних условий может происходить сбой в цепочке событий «действие – награда». А это приведет к тому, что мозг ошибется в предсказании ценности решения.
Давайте рассмотрим пример. Вы любите пить кофе, и для вас это уже ритуал. У вас даже есть любимая кофейня. Вы приходите туда каждое утро перед работой. В какой-то момент уровень сервиса сильно падает, да и кофе будто стал чуть хуже, но не критично. Рациональная часть мозга, задействующая структуры префронтальной коры, должна отдать команду искать новое место. Но в силу сложившегося автоматизма сделать это крайне сложно. Вы эмоционально привязаны к месту, к запаху кофе в конкретной атмосфере.