Раньше было распространено мнение о том, что наши зрительные системы работают «снизу вверх», сначала различая самые общие черты, затем объединяя их в области и формы и наконец распознавая предметы. Однако в последние годы стало ясно, что на то, что происходит на «самых ранних» стадиях, влияют наши высокоуровневые ожидания.
[Большинство старых теорий восприятия] основано на модели зрения «пожарная цепочка», которая сейчас уже не пользуется популярностью. Это иерархическая модель последовательных действий, которая приписывает наш эстетический отклик только самой последней стадии – мощному всплеску узнавания. По моему мнению… на каждой стадии визуальной сегментации, еще до финального «Ага!», происходит множество мини-всплесков. В самом деле, сам акт перцептуального захвата объектоподобных единиц может быть таким же приятным, как собирание пазла. Другими словами, искусство – это визуальная прелюдия перед финальной кульминацией распознавания.
В. С. Рамачандран, 2004
На самом деле сейчас мы знаем, что зрительные системы нашего мозга получают гораздо больше сигналов от других областей мозга, чем от глаз.
Такой большой вклад хранящихся в мозге знаний в восприятие соотносится с недавно обнаруженной интенсивностью нисходящих связей в анатомии мозга. Примерно 80 % волокон, поступающих к передаточной станции латерального коленчатого тела, поступает вниз из коры головного мозга, и лишь 20 % – от сетчатки.
Ричард Грегори, 1998
Предположительно, эти сигналы от остальных частей мозга выдвигают предположения для зрительной системы, какие черты распознавать или какого рода объекты могут встретиться в поле зрения. Таким образом, как только вы догадываетесь, что находитесь на кухне, вы с большей вероятностью начнете распознавать предметы как чашки или блюдца.
Все это означает, что более высокие уровни мозга никогда не воспринимают визуальную сцену как собрание пигментных пятен. Вместо этого ваши Описатели пространства представят арку из конструктора в более крупномасштабных терминах – например, так: «горизонтальный брусок лежит сверху на двух поставленных вертикально».
Без использования подобных высокоуровневых описаний правила реакций редко будут иметь практическое применение, и для того чтобы «Строитель» использовал визуальные подсказки, мы должны снабдить его знанием о том, что может означать его сенсорная информация. В данном случае область, которую должен был воспринять «Строитель», состояла в основном из прямоугольных брусков – и это знание привело к удивительным результатам: одна из программ «Строителя» часто могла распознать все бруски, находящиеся в определенной области, лишь по контуру или силуэту! У него получилось это сделать благодаря серии следующих предположений:
Как только программа различила внешние грани, она вообразила остальные части брусков, которые они очерчивали, и использовала эти догадки для поиска новых подсказок, снова и снова перемещаясь вверх-вниз по шести разным уровням визуальной обработки. Программа зачастую даже показывала лучшие результаты, чем исследователи, которые ее создали
[52].
Мы также снабдили «Строителя» дополнительными знаниями о самых распространенных «значениях» углов и граней. Например, предположим, что программа находит грани таким образом:
Тогда «Строитель» предположит, что они все принадлежат одному бруску, и начнет искать другой объект, который, возможно, загораживает оставшуюся часть бруска
[53].
Таким образом, наши системы низшего уровня, возможно, начинают с распознавания отдельных обрывков и фрагментов, но затем мы используем «контекст», чтобы догадаться об их значении, – и после этого пытаемся подтвердить догадки, используя другие виды обработки информации. Другими словами, мы «у-знаем» вещи с помощью «у-поминания» о знакомых предметах, которые могут встать на место отсутствующих фрагментов. Но нам все еще не хватает знаний о том, как наши высокоуровневые ожидания влияют на то, какие черты распознают системы низшего уровня.
5.8. Представление воображаемых сцен
Реальность оставляет большой простор для воображения.
Джон Леннон
Любой может распознать арку, составленную из прямоугольных брусков. Но мы также можем представить себе, как она будет выглядеть, если мы заменим верхнюю фигурку треугольной. Как у машины или у мозга получается «воображать» отсутствующие в поле зрения вещи?
В данном случае может показаться, что воображаемые нами сцены имеют схожую суть со зрительными образами – то есть состоят из большого количества отдельных точек. Однако я подозреваю, что это иллюзия, потому что подобные внутренние образы не ведут себя так же, как картинки. Более вероятно, что мы воображаем подобные сцены, вмешиваясь в более высокие уровни репрезентаций, которые мы описывали в предыдущем разделе:
Изменения на самых низких уровнях. В принципе, мы могли бы создать новый образ, изменив каждую точку в изначальной картинке. Для этого потребуется огромное количество вычислений и, если вы захотите изменить угол зрения, придется заново рассчитывать все изображение. Но чтобы произвести такие изменения, сначала понадобятся высокоуровневые репрезентации того, что эти новые образы должны изображать, – однако если эти описания высокого уровня смогут ответить на ваши вопросы, вам не нужно будет рассчитывать изображения!
Изменения на средних уровнях. Поэтому вместо внесения изменений в саму картинку можно изменить сегменты описаний высокого уровня. Например, на уровне Обнаружителей областей мы можем заменить название передней поверхности верхнего бруска с «прямоугольной» на «треугольную». Однако это вызовет проблемы на других уровнях, ведь грани треугольника не стыкуются нормально с гранями прямоугольных форм.