Такие задачи, как руководство правительством или преподавание молекулярной биологии, намного сложнее. Они имеют комплексную, по большей части ненаблюдаемую среду (состояние целой страны или состояние ума студента), намного больше объектов и их типов, отсутствие четкого определения того, в чем заключаются действия, практически неизвестные правила, огромную неопределенность и очень длинные временные интервалы. У нас есть идеи и стандартные инструменты, направленные на каждую из этих характеристик в отдельности, но на данный момент нет общих методов, которые охватывали бы все характеристики одновременно. Если мы строим системы ИИ для задач этого типа, они обычно требуют сложной доработки под конкретную задачу и часто очень ненадежны.
Прогресс в движении к общности происходит, когда мы изобретаем методы, эффективные для самой трудной задачи в данном типе, или же методы, требующие меньшего количества допущений, что делает их применимыми к большему числу задач. ИИ общего назначения будет методом, применимым ко всем типам проблем и эффективно работающим в масштабных и трудных случаях, требуя очень мало допущений. Это конечная цель исследования ИИ: система, не требующая доработки под конкретную задачу, которую запросто можно «попросить» вести занятия по молекулярной биологии или руководить правительством. Она будет учиться тому, что ей нужно будет уметь, пользуясь всеми доступными ресурсами, при необходимости задавать вопросы и начнет формулировать и осуществлять работающие планы.
Такого метода общего назначения пока не существует, но мы к нему приближаемся. Возможно, вас удивит, что в значительной мере это приближение к универсальному ИИ обеспечивается исследованиями, не связанными с построением экономных систем ИИ общего назначения. Оно обеспечено изучением инструментов ИИ, или узкого ИИ, под которым подразумеваются точные, надежные, скучные системы ИИ, разработанные для конкретных задач, например игры в го или распознавания рукописных цифр. Многие считают, что исследование этого типа ИИ не несет в себе никакого риска, потому что связано с конкретными задачами и не имеет ничего общего с разработкой универсального ИИ.
Это убеждение вытекает из непонимания того, какого рода работа входит в круг задач этих систем. В действительности исследование инструментов ИИ может обеспечить и часто обеспечивает прогресс в создании универсального ИИ, особенно когда им занимаются талантливые ученые, берущиеся за задачи, которые выходят за рамки существующих общих методов. В данном случае «талантливые» означает, что подход к решению не сводится к простой кодировке действий разумного человека в такой-то ситуации, но представляет собой попытку наделить машину способностью находить решение самостоятельно.
Например, команда AlphaGo из Google DeepMind сумела создать программу игры го, обыгравшую чемпиона мира, не работая в действительности над программой игры в го. Я имею в виду, что они не писали полный код, предназначенный исключительно для го, указывая, что делать в разных ситуациях этой игры. Они не разрабатывали процедуры принятия решений, работающие только для го. Они внесли улучшения в два более-менее общих метода — прогностическое исследование для принятия решений и обучение с подкреплением для обучения оценке позиций, — и этого оказалось достаточно, чтобы играть в го на сверхчеловеческом уровне. Эти улучшения применимы ко многим другим задачам, в том числе до сих пор относимым к области робототехники. Просто для примера: версия AlphaGo под названием AlphaZero недавно научилась побеждать AlphaGo в го, а также сокрушила Stockfish (лучшую в мире шахматную программу, далеко опережающую любого человека) и Elmo (лучшую в мире программу для игры сёги, также играющую гораздо лучше любого человека). AlphaZero сделала все это за один день
[59].
Был также достигнут значительный прогресс в движении к ИИ общего назначения в исследовании распознавания рукописных цифр в 1990-х гг. Команда Яна Лекуна из AT&T Labs не писала специальные алгоритмы для распознавания «8» путем поиска изогнутых линий и петель, а усовершенствовала существующие алгоритмы обучения нейронных сетей, создав сверхточные нейросети. Эти сети, в свою очередь, продемонстрировали эффективное распознавание знаков после соответствующего обучения на категоризованных примерах. Те же алгоритмы могут научиться распознавать буквы, формы, стоп-сигналы, собак, кошек и полицейские автомобили. Под шапкой «глубокого обучения» они совершили переворот в распознавании речи и визуальных объектов. Они являются и одним из ключевых элементов AlphaZero, а также большинства сегодняшних проектов автомобилей с автопилотом.
Если задуматься об этом, не приходится удивляться, что приближение к универсальному ИИ происходит в проектах узкого ИИ, решающих конкретные задачи. Эти задачи дают исследователям какой-то материал для работы. (Поэтому никто не говорит: «Нужно просто смотреть в окно — так совершаются изобретения».) В то же время важно понимать, как далеко мы уже продвинулись и где проходят границы. Когда AlphaGo разбила Ли Седоля, а затем всех остальных лучших игроков в го, многие предположили, что, поскольку машина с нуля научилась побеждать человеческую расу в задаче, известной своей сложностью даже для высокоинтеллектуальных людей, это начало конца — главенствование над нами искусственного интеллекта лишь вопрос времени. Даже некоторые скептики могли сдаться, когда AlphaZero выиграла не только в го, но и в шахматы, и в сёги. Однако у AlphaZero жесткие ограничения: она работает только в классе дискретных, наблюдаемых игр для двух игроков с известными правилами. Этот подход попросту совершенно не сработает для вождения, преподавания, руководства правительством или захвата мира.
Вследствие четких ограничений возможностей машины, когда люди говорят, что «машинный IQ» быстро растет и грозит превзойти человеческий IQ, это нонсенс. Концепция IQ имеет смысл применительно к человеку, потому что способности людей обычно коррелируют в широком спектре умственной деятельности. Пытаться оценить IQ машины — все равно что пытаться заставить животное участвовать в человеческом десятиборье. Действительно, лошади могут быстро бегать и высоко прыгать, но сталкиваются с большими трудностями в прыжках с шестом и метании диска.
Цели и стандартная модель
Если рассматривать интеллектуального агента снаружи, то имеет значение только последовательность действий, которую он создает, исходя из получаемого им потока входных данных. При рассмотрении изнутри действия должны выбираться программой, заложенной в агента. Люди от рождения имеют, скажем так, одну агентскую программу, которая со временем заставляет их действовать с разумной мерой успешности при выполнении громадного круга задач. На сегодняшний день это не относится к ИИ: мы не знаем, как построить одну универсальную программу ИИ, которая делала бы все, и вместо этого создаем разные типы агентских программ для разных типов задач. Мне придется дать хотя бы минимальные объяснения того, как работают разные агентские программы. Более подробные объяснения вы найдете в приложениях в конце книги, адресованных тем, кому это будет интересно. (Ссылки на конкретные приложения даются верхними индексами, например здесьА и здесьГ.) В центре внимания вопрос о том, как стандартная модель реализуется в этих разных типах агентов — иными словами, как ставится задача и как она транслируется агенту.