Выясняется, что одного сенсорного интеллекта для общения на естественном языке вовсе недостаточно. Распознавание речи лишь самый поверхностный слой настоящего разговорного интеллекта, перевод звукового сигнала в текст. Конечно, благодаря глубокому обучению в машинной обработке текстов тоже имеются большие успехи. Это видно хотя бы по довольно высокому качеству современного машинного перевода. Однако оказывается, что излагать одно и то же содержание на другом языке и делать умозаключения на основе этого содержания – задачи разного уровня сложности. Первое требует наличия у машины семантического пространства, в котором отражается содержание предложений, тогда как второе предполагает умение оперировать в этом семантическом пространстве, прокладывать в нем осмысленные траектории – рассуждения.
Разговорный интеллект должен обучаться формировать осмысленное поведение в семантическом пространстве, понимая на каждом шаге цели и позиции всех участников диалога, включая свои собственные. Значит, он и сам должен уметь ставить перед собой какие-то цели и добиваться их достижения. Иными словами, машинный перевод еще можно отнести к задачам распознавания образов – отображению исходного текста в его семантическое представление, а последнего – в текст на другом языке. Разговорный же интеллект относится к гораздо более сложному классу задач – обучению адаптивному целесообразному поведению, включая рациональное мышление как разновидность поведения в семантическом пространстве и умение осознанно манипулировать смыслами. А это – прямой путь к настоящему сильному ИИ.
Современное машинное обучение пытается найти решение этой задачи с помощью все тех же глубоких нейросетей. У всех на слуху недавние победы машин во всевозможных стратегических играх, от культовой древней игры го до новомодных StarCraft 2 и Dota 2, где требуется реагировать на действия соперников в реальном времени и строить гипотезы о том, что происходит в ненаблюдаемых областях игрового поля. Эти достижения демонстрируют способность глубоких нейросетей формировать полезные поведенческие навыки и строить выигрышные стратегии в виртуальных мирах. Но современные алгоритмы пока что не позволяют машинному интеллекту вырваться из этих виртуальных миров в реальный. Обучение нейросетей происходит сегодня слишком медленно, и соответствующий «жизненный опыт» за приемлемое время удается набрать лишь в виртуальном мире за счет существенного ускорения темпа игры. Эти алгоритмы невозможно перенести на обучение роботов в реальном мире, где у них не будет столько времени на обучение и стольких виртуальных жизней, которыми заплачено за неудачные решения.
К тому же, если вернуться к разговорному интеллекту, у нас пока нет виртуальных миров для оттачивания разговорных навыков. Ассистентам надо учиться рассуждать и вести диалоги, а для этого – пробовать самим генерировать варианты ответов в различных сценариях. Привычное обучение на больших корпусах готовых диалогов здесь не подходит. Надо, чтобы кто-то оценивал качество каждой реплики в бесчисленных ветвящихся вариантах развития диалогов, из которых лишь очень немногие могут присутствовать в обучающей выборке. А на это пока что способны только живые люди и лишь в реальном времени.
Резюмируя, можно сказать, что существующий уровень машинного интеллекта явно не устраивает лидеров цифровой революции, которые остро нуждаются в разговорном интеллекте человеческого уровня и будут вкладываться в его создание, чтобы не отстать от конкурентов. Рынок разговорного интеллекта удваивается каждые 2 года и в 2020 году должен был превысить $12 млрд. Так что спрос на сильный ИИ в современной экономике уже сформировался, и мы понимаем, кому и для чего он сегодня нужен. Следовательно, этим уже имеет смысл заниматься, хотя еще совсем недавно после всех пережитых разочарований задача построения сильного ИИ всерьез не воспринималась, а разговоры о нем считались ненаучными.
Цифровые платформы будущего: интеллект роботов
Разговорный интеллект «здесь и сейчас» нужен тем, кто сегодня зарабатывает в основном за счет персонализации рекламы. Что собой представляют те же электронные витрины Amazon, как не набор рекламных баннеров, сделанных с учетом предпочтений каждого покупателя? Между тем весь рекламный рынок, $560 млрд, составляет лишь 0,5 % мирового ВВП. Так что рыночный потенциал для применения ИИ гораздо шире, чем рынок умных программных ассистентов.
Но для радикального расширения области применений ИИ программным агентам предстоит выйти из виртуального мира в реальный, превратиться в роботов. Сенсорный интеллект агентов предстоит дополнить моторным интеллектом роботов – способностью активно взаимодействовать с миром, иметь предиктивную модель внешнего мира и своих действий в нем, чтобы, например, понимать, что стул или чашку можно переставить с места на место, а шкаф или машину лучше и не пытаться, или что, если чашку наклонить, ее содержимое выльется, или что двери иногда открываются легко, а иногда нет и, если они заперты, в них надо не ломиться, а стучаться. Последнее уже относится к области социального интеллекта – понимания того, как принято себя вести в обществе, чего от тебя ждут в тех или иных ситуациях, «что такое хорошо и что такое плохо».
Все эти элементарные знания, известные любому ребенку, невозможно запрограммировать, им надо обучаться. И обучаться активно, методом проб и ошибок, как это делают дети. А для этого у роботов должна быть искусственная психика с врожденным любопытством, настроенная, как и у детей, на постоянное обучение, чтобы как можно скорее набраться опыта и научиться достигать своих целей в этом сложном и непредсказуемом поначалу мире. Искусственная психика роботов должна быть настолько универсальна, чтобы она могла обеспечить эффективное обучение всем видам интеллекта: сенсорному, моторному, социальному и разговорному. Ведь и дети обучаются ходить, говорить и вести себя правильно практически одновременно.
В математике бывает, что иногда легче решить задачу в более общей постановке, которая лучше отражает суть проблемы. Возможно, разработка искусственной психики – тот самый случай: вместо множества специализированных систем, обучающихся разным задачам по разным лекалам (подход, принятый сегодня в глубоком обучении), лучше разработать единый общий интеллект (Artificial General Intelligence, AGI).
Резюме
Итак, цифровая экономика – это экономика платформ, рост влияния которых на экономику мы наблюдаем с начала XXI века. Именно платформы больше всех заинтересованы в использовании и развитии технологий ИИ. Сегодня основным драйвером развития сильного ИИ служит спрос на разговорный интеллект агентов. Через какое-то время появится еще более мощный драйвер – спрос на искусственную психику роботов.
Мы рассмотрим подходы к построению сильного ИИ чуть позже, в главе 5. Пока же следует обсудить силы, которые будут препятствовать его появлению, потому что кроме тех, кто заинтересован в инновациях, всегда есть и те, кто им сопротивляется, причем не без оснований. Потому-то каждая крупная технологическая революция сопровождается революциями социальными. Смена технологического ландшафта закономерно приводит к трансформации социальной надстройки.