“Мы еще очень, очень далеко”
Текущая эпоха искусственного интеллекта определяется господством глубокого обучения с триумвиратом глубоких нейронных сетей, больших данных и сверхбыстрых компьютеров. Тем не менее в стремлении к созданию надежного и общего интеллекта глубокое обучение, возможно, натыкается на стену: имеющий первостепенную важность “барьер понимания”. В настоящей главе я кратко описала некоторые разработки, направленные на преодоление этого барьера. Я рассказала, как исследователи (включая и меня) пытаются наделить компьютеры здравым смыслом и человеческими способностями к построению абстракций и аналогий.
Размышляя на эту тему, я особенно оценила любопытный и информативный пост в блоге Андрея Карпатого, специалиста по глубокому обучению и компьютерному зрению, который руководит развитием ИИ в Tesla. В своем посте под заголовком “Состояние компьютерного зрения и ИИ: мы еще очень, очень далеко”
[357] Карпатый с позиции профессионала описывает свою реакцию на фотографию, показанную на рис. 50. Карпатый отмечает, что нам, людям, это изображение кажется довольно забавным, и спрашивает: “Как компьютеру понять это изображение так же, как понимаем мы с вами?”
Карпатый перечисляет множество вещей, которые понимают люди, но которые не под силу понять лучшим современным программам компьютерного зрения. Например, мы понимаем, что на снимке есть люди, а еще есть зеркала, поэтому некоторые человеческие фигуры – это зеркальные отражения. Мы понимаем, что действие происходит в раздевалке, и нас удивляет, что в раздевалке собралась целая группа людей в костюмах.
Кроме того, мы понимаем, что человек стоит на весах, хотя весы составлены из белых пикселей, которые сливаются с фоном. Мы понимаем, как отмечает Карпатый, что “Обама слегка надавливает ногой на весы”, и без труда описываем ситуацию в трехмерном пространстве, которое достраиваем сами, а не в двумерном пространстве фотографии. Интуитивное знание физики позволяет нам сделать вывод, что из-за ноги Обамы весы переоценят вес стоящего на них человека. Интуитивное знание психологии говорит нам, что человек на весах не знает, что Обама также поставил на них ногу: мы делаем такой вывод, замечая направление его взгляда и зная, что у него нет глаз на затылке. Мы также понимаем, что человек, вероятно, не чувствует, как Обама легонько надавил на весы. Наша теория психики позволяет нам предположить, что человек на весах не обрадуется, когда весы покажут ему больший вес, чем он ожидал.
Рис. 50. Фотография, обсуждаемая в блоге Андрея Карпатого
Наконец, мы понимаем, что Обама и другие люди, наблюдающие за происходящим, улыбаются, и делаем вывод, что всем понравилась шутка, которая, возможно, стала еще смешнее из-за статуса президента. Мы также понимаем, что все смеются по-доброму и ожидают, что мужчина на весах тоже рассмеется, когда узнает о шутке. “Вы делаете выводы о настроении людей и их представлении о настроении другого человека, – отмечает Карпатый. – И выходите на пугающий метауровень”.
В общем, “поразительно, что все вышеперечисленные выводы [люди] делают, просто взглянув на двумерную конфигурацию [пиксельных] значений”.
На мой взгляд, пример Карпатого прекрасно показывает сложность человеческого понимания и предельно ясно объясняет серьезность задачи, которая стоит перед ИИ. Карпатый написал свой пост в 2012 году, но и сегодня он остается актуальным – и это, полагаю, не изменится еще долгое время.
Карпатый завершает свой пост размышлением:
Казалось бы, неизбежен вывод, что нам, возможно… понадобится телесная реализация ИИ, и единственный способ создать компьютеры, способные трактовать сцены так же, как мы, – это позволить им получать все те годы (структурированного, упорядоченного во времени) опыта, которым располагаем мы сами, наделить их способностью взаимодействовать с миром и обеспечить волшебной архитектурой активного обучения и построения выводов, которую мне сложно даже вообразить, когда я начинаю думать обо всем, на что она должна быть способна.
В XVII веке философ Рене Декарт предположил, что наши тела и мысли состоят из разных субстанций и подчиняются разным законам физики
[358]. С 1950-х годов основные подходы к ИИ неявным образом принимали тезис Декарта, полагая, что лишенные тел компьютеры можно наделить общим интеллектом. Но небольшая часть сообщества ИИ всегда продвигала так называемую гипотезу о воплощенном познании – утверждение, что машина не может развить интеллект человеческого уровня, не имея физического тела, которое взаимодействует с миром
[359]. С этой точки зрения, стоящий на столе компьютер или растущий в резервуаре мозг не может усвоить концепции, необходимые для общего интеллекта. Лишь машина определенного типа – имеющая тело и активно взаимодействующая с миром – получит возможность развить интеллект человеческого уровня. Как и Карпатый, я не могу представить, какие открытия нам необходимо совершить, чтобы создать такую машину. Но, много лет работая с искусственным интеллектом, я нахожу гипотезу о необходимой телесности все более убедительной.
Глава 16
Вопросы, ответы и гипотезы
В заключительной части книги “Гёдель, Эшер, Бах” Дуглас Хофштадтер взял у самого себя интервью о будущем ИИ. В разделе “Десять вопросов и возможных ответов” он разобрал вопросы не только о возможности машинного мышления, но и об общей природе интеллекта. Читая “ГЭБ” после окончания университета, я проявила огромный интерес к этому разделу. Размышления Хофштадтера убедили меня, что, несмотря на заявления прессы о неизбежности появления искусственного интеллекта человеческого уровня (в 1980-х тоже без них не обходилось), эта сфера на самом деле была открыта и жаждала новых идей. В ней оставалось множество серьезных вызовов, которые ждали молодых людей вроде меня, делавших первые шаги в этой сфере.
Работая над книгой сегодня, более тридцати лет спустя, я подумала, что будет неплохо завершить ее собственными вопросами, ответами и гипотезами, и чтобы отдать дань разделу из “ГЭБ” Хофштадтера, и чтобы связать воедино идеи, изложенные на этих страницах.
Вопрос: как скоро беспилотные автомобили войдут в обиход?
Это зависит от того, что называть “беспилотным автомобилем”. Национальное управление по безопасности дорожного движения США определило шесть уровней автономности транспортных средств
[360]. Я перефразирую их определения.