Напомню, что лица – не единственные объекты, распознаваемые в височной коре. Другие участки специализируются на широком разнообразии других типов объектов, связанных визуально или концептуально. Хороший пример – клетки, реагирующие на изображения инструментов, причем не на конкретные инструменты, а на инструменты как категорию (молотки, пилы, плоскогубцы). Мы только начинаем делать первые шаги к расшифровке необычной логической схемы височной доли.
Часть III
До самого горизонта и дальше
Как вы могли заметить, по ходу этой книги мы постепенно перемещались от признанных научных фактов к все менее и менее изученным феноменам. Далее мы собираемся вступить и вовсе на зыбкую почву предположений и догадок. Но зачем нам предаваться этим опасным «спекуляциям», которых серьезные нейробиологи чураются как огня? Если мы этого не сделаем, вся рассказанная выше длинная подробная история останется оборванной на самом интересном месте: что происходит дальше в цепочке зрительного восприятия. К сожалению, никто не знает этого наверняка, но в третьей части книги я постараюсь обрисовать вам в общих чертах то, что нам известно об этой малоизведанной территории, где восприятие сливается с мышлением.
12 | Почему эволюция так любит нейронные сети
Выживают не самые сильные виды и не самые умные, а те, которые лучше других приспосабливаются к изменениям.
ЧАРЛЬЗ ДАРВИН
Разумно предположить, что за несколько миллионов лет эволюции природа могла сотворить все, что хотела. Почему же она выбрала нейронные сети? Если кратко: природа решила, что гораздо проще, экономичнее и эффективнее создать модифицируемый синапс, чем перестраивать геном – генетическую схему зрительной системы – для каждого живого вида. Способная к обучению нейронная система мозга, по сути, представляет собой универсальный механизм, который может гибко адаптироваться к специфике различных визуальных сред (ближнее зрение в лесу, дальнее зрение на равнине) и одновременно распознавать ваше любимое чадо среди других детей на детской площадке.
Первое ключевое преимущество такого устройства касается развития мозга. Представьте себе альтернативу: мозг, состоящий из фиксированных связей, – машина для распознавания лиц, похожая на красивый швейцарский хронометр XVIII в. со множеством мелких латунных деталей, где каждое знакомое лицо кодируется особой комбинацией колесиков и шестеренок. Но тут возникают серьезные загвоздки: во-первых, этих комбинаций вряд ли бы хватило на всех людей, которых человек узнает в течение жизни. Во-вторых, чтобы машина узнала этих людей, они должны быть запрограммированы в ней заранее. В случае с человеческой машиной это означает, что генеральный строительный план – генетический код, превращающий оплодотворенную яйцеклетку в человека, – должен содержать информацию о каждом потенциальном знакомом лице. Но как природа может знать об этом наперед?
Это также нереалистично с точки зрения объема генетического кода. Первичная зрительная кора содержит примерно 14 млн нейронов, которые связаны со вторичной зрительной корой (V2), содержащей около 10 млн нейронов. Если бы система имела фиксированные связи – то есть если бы аксон каждого нейрона V1 имел строго заданную мишень в V2, – процесс наведения аксонов требовал бы огромного количества дифференцированных молекулярных сигналов, каждый из которых пришлось бы кодировать определенной последовательностью ДНК. Предполагать, что такой уровень специфичности действительно может существовать, просто нелепо. Даже несмотря на умные способы архивирования, информационная емкость нашего генома с его жалкими 20 000 генов на порядки меньше тех объемов информации, которые потребовались бы для кодирования одной только системы зрительного восприятия.
Поэтому вместо того, чтобы пытаться изначально специфицировать все возможные связи, природа использует двойную стратегию. Сначала в действие вступают генетически запрограммированные правила для механизма аксонального наведения (молекулярные пути, диффундирующие сигналы), благодаря которым аксоны нейронов-источников соединяются с нейронами-мишенями в заданной области мозга. Именно поэтому участки распознавания лиц в височной доле приматов находятся примерно в одном и том же месте. И именно благодаря этому топография каждой зрительной зоны отражает пространственную карту сетчатки. Но этот механизм работает только на грубом уровне. Поэтому после того, как была сформирована грубая схема связей, в действие вступают правила машинного обучения, которые уточняют эти связи и кодируют восприятие конкретных объектов. Другими словами, молекулярные механизмы, если воспользоваться терминологией Ливингстон, создают «протоучастки» распознавания лиц, расположение которых жестко запрограммировано в генетическом коде, тогда как их окончательная избирательность формируется синаптической пластичностью.
Другое ключевое преимущество состоит в том, что нейронные сети эффективно решают проблему запоминания и распознавания визуальных объектов, с которыми человек сталкивается на протяжении жизни и которые могут представать перед ним в самом разном виде, на разных расстояниях, под разными углами. В нейронной сети каждый нейрон может участвовать в нескольких распознающих схемах в зависимости от того, как его вывод обрабатывается следующим слоем. Если в нейронной сети много слоев и каждый слой содержит, скажем, несколько десятков тысяч элементов, это дает нам поистине астрономическое число возможных комбинаций – достаточное для того, чтобы запомнить лицо любимой бабушки во всех возможных ракурсах и чтобы узнать своего ребенка, будь он прыгающим, бегающим и даже чумазым, в толпе других детей на детской площадке.
В самом фундаментальном смысле главное преимущество нейронных сетей состоит в том, что они позволяют зрительной системе мозга адаптироваться к естественной среде обитания данного живого вида. Нейронная сеть, отвечающая за визуальное распознавание, учится распознавать именно те визуальные объекты, которые присутствуют в конкретном окружающем мире этого вида. Это могут быть очень простые объекты, такие как ориентированные края, которые являются важнейшим признаком практически во всех визуальных сценах в жизни млекопитающего. Или более сложные, например, лица, которые играют важную роль в жизни социальных животных, таких как приматы, включая нас с вами. Как показывают эксперименты, если подопытная обезьяна с детства не видит лиц, ее протоструктуры распознавания лиц учатся распознавать руки. Другими словами, эти нейронные системы развиваются посредством обучения.
* * *
Я не могу удержаться от того, чтобы еще раз не подчеркнуть элегантность, экономичность и простоту естественного дизайна сенсорных систем мозга. Мы вновь и вновь убеждаемся в удивительной продуманности лежащего в их основе организационного принципа: зрительная система настраивается на статистически значимые закономерности естественного мира – на те составляющие визуального ввода, которые наиболее важны для выживания данного живого вида. В случае некоторых ключевых компонентов, которые всегда присутствуют в визуальном мире этого вида, эволюция сочла необходимым потратить драгоценные гены, чтобы запрограммировать сетчатку на восприятие этих аспектов. Хороший пример – «вшитая» функция обнаружения контраста (краев), которая реализуется при помощи молекулярных инструкций, эволюционировавших на протяжении многих миллионов лет, от эпохи, когда обитали мечехвосты, до времени появления людей
[34].