Изображения, которые производит DeepDream, кажутся мне, может быть, самой важной формой ИИ-искусства из всех, которые я видел, занимаясь этой темой. Здесь речь не идет о попытках создать новую картину Рембрандта или состязаться с современными художниками на выставке Арт-Базель; эти изображения позволяют нам отчасти разобраться, как алгоритмы распознавания визуальных образов видят мир. Они, возможно, не обладают большой эстетической ценностью, но, на мой взгляд, они выражают главную задачу искусства – попытку увидеть мир чужими глазами и понять мировоззрение другого.
Алгоритм DeepDream работает по тому же принципу, что и сознание человека, который, глядя на изображение, внезапно видит на гренке человеческое лицо, а в облаках – формы животных, хотя на самом деле ничего такого там нет. Мозг человека в ходе эволюции стал чрезвычайно восприимчив к образам животных, поскольку это было необходимо для выживания. Но это значит, что иногда мы видим животных там, где их нет. Алгоритмы распознавания визуальных образов работают похоже. Они выискивают в изображении структуры и интерпретируют их. Находить такие структуры они научились в сжатом процессе эволюции, натренировавшись на тысячах изображений; их выживание зависит от правильной интерпретации таких структур. По сути дела, машинное обучение представляет собой форму цифровой эволюции. Что же видят алгоритмы в цифровом кустарнике?
Результаты, полученные в Google, были весьма поразительными. Буквально ниоткуда начали появляться морские звезды и муравьи. По-видимому, алгоритм обладал способностью не только распознавать изображения, но и генерировать их. Но эта работа была не просто забавной игрой. Она дала интереснейшую информацию о том, как обучался алгоритм. Например, на изображениях гантелей всегда присутствовали руки, держащие гантели. Очевидно, алгоритм узнал о гантелях из изображений тренирующихся людей. Поэтому он не понимал, что этот предмет – не часть человеческого тела и может существовать отдельно от рук.
Вместо того чтобы показывать алгоритму случайные наборы пикселей, можно было дать ему настоящие изображения и предложить выделить элементы, которые он в них находит, или сыграть в игру, в которую когда-то играли все мы, глядя на облака: что можно увидеть в их пухлых формах? Алгоритму удавалось выделить черты, которые казались похожими на собаку, на рыбу или, возможно, на каких-то химер. Роман, по которому был снят культовый фильм «Бегущий по лезвию», назывался «Снятся ли андроидам электроовцы?»
[60]. При помощи таких алгоритмов мы наконец можем ответить на этот вопрос! В одном из изображений, созданных алгоритмом, в небе действительно начали появляться овцы.
В будущем принятие все большего и большего числа решений будет переходить из рук человека в руки алгоритмов, которые мы создаем. Беда в том, что появляющиеся алгоритмы машинного обучения вырабатывают деревья решений, которые человеку чрезвычайно трудно анализировать. В этом заключается одно из ограничений программирования нового типа. В конечном счете мы не знаем точно, почему алгоритм принимает именно такое, а не другое решение. Как мы можем быть уверены, что речь идет о чрезвычайно проницательной идее, а не об ошибке? Комментаторы игры в го не были уверены, к какой категории отнести 37-й ход AlphaGo во второй партии, пока, наконец, не увидели, что он обеспечил победу программы. Но все чаще такие алгоритмы не просто играют в игры.
Они принимают решения, касающиеся нашей жизни. Поэтому по мере наступления все более автоматизированного будущего любые средства, помогающие нам понять, как и почему алгоритмы приходят к своим решениям, будут чрезвычайно важны.
Что касается алгоритмов компьютерного зрения (распознавания визуальных образов), те произведения искусства, которые они способны создавать, позволяют нам получить некоторое представление об их работе. Иногда те черты, которые находит и отбирает алгоритм, совпадают со знакомыми нам образами, но в других случаях бывает трудно определить, что именно алгоритм видит в изображении. Произведения искусства дают нам представление о том уровне абстракции, на котором алгоритм работает в том или ином слое дерева решений. Мы заглядываем, так сказать, в глубинное подсознание этого алгоритма. Программисты из Google назвали этот процесс «инцепционизмом»; они считают, что эти изображения подобны снам алгоритма, что и отражено в названии DeepDream. В изображениях, которые генерирует этот алгоритм, и впрямь чувствуется некое психоделическое безумие, как будто бы алгоритм галлюцинировал, наглотавшись ЛСД. Снова и снова применяя алгоритм к его же собственным произведениям и укрупняя изображения после каждой итерации, программисты могут производить бесконечный поток все новых и новых образов.
Я не думаю, что кто-нибудь счел бы произведения Deep-Dream хорошим искусством (что бы это ни обозначало). Журналист Алекс Рейнер, первым написавший об этих изображениях, отмечал: «Они похожи на мандалы из студенческого общежития или на цифровые психоделические узоры, которые обычно встречаются на обложках книг Теренса Маккенны». Такого рода произведений не найдешь на лондонской выставке Фриз или на Арт-Базель. Но они представляют важный новый способ понимания чего-то во внутреннем мире алгоритма, классифицирующего изображения.
Алгоритм как произведение искусства
Ведут ли эти новые средства изобразительное искусство к интересным новым территориям? Я решил, что мне нужно вернуться в галерею «Серпентайн», чтобы поговорить с Хансом Ульрихом Обристом и узнать, что он думает о роли искусственного интеллекта в мире искусства. Но, прежде чем зайти в его кабинет, я решил взглянуть на произведения, выставленные в галерее.
Когда я вошел в галерею, меня встретил BOB, искусственное существо, созданное с использованием программы Иэна Чэна. На самом деле существует шесть BOBов. Вначале у всех них был одинаковый код, но на эволюцию этих существ влияет их общение с посетителями. К тому моменту, когда я добрался до выставки, все шесть BOBов развились в очень разных направлениях. Будучи отцом двух генетически идентичных девочек-близнецов с очень разными характерами, я знаю, что малейшие изменения окружающей среды могут оказывать огромное влияние на развитие изначально одинаковых кодов.
Как и в случае с выставкой 4900 Farben Рихтера, мне очень хотелось разобраться в коде, который лежит в основе BOBа. Но это код другого рода, и его гораздо труднее восстановить. Может быть, именно поэтому ему удается привлекать наше внимание дольше, чем можно было бы ожидать. Он учится и развивается, исходя из взаимодействия с посетителями, приходящими в галерею.
BOB определяет эмоциональное состояние посетителя при помощи взаимодействия со смартфоном. Чэна интересовали вопросы авторства и процесс зарождения произведений. Он хотел узнать: «Как получается, что искусство по замыслу принадлежит автору, но в то же время живет самостоятельной жизнью и изменяется?» Чтобы ответить на этот вопрос, нужно было создать систему и дать ее содержанию возможность развиваться и изменяться под влиянием взаимодействий, которые создатель не сможет контролировать. Взаимодействие BOBа с посетителями приводит к тому, что в какой-то момент Чэн перестает успевать за изменениями кода, на который влияют новые параметры, происходящие из этих встреч.