Фэннинг стал неизвестной неизвестной, машины не смогли бы прогнозировать его появление. Стоит согласиться с мнением Талеба и многих других – людям тоже плохо дается прогноз неизвестных неизвестных. Перед ними пасуют и люди, и машины.
Неизвестные известные
Возможно, самый большой недостаток прогностических машин заключается в неверных прогнозах, причем обоснованных. Как мы уже обсудили, в случае известных неизвестных люди предполагают неточности в прогнозе: он выдается с доверительным интервалом, из чего следует вероятность погрешностей. О неизвестных неизвестных люди ничего не знают. При наличии же неизвестных известных прогностическая машина выдает точный прогноз, но он может быть очень далек от истины.
Почему так получается? Дело в следующем: хотя решения и выносят исходя из данных, но и данные иногда получают посредством решений. Если машина не понимает процесса принятия решений для получения данных, то ее прогноз неточен. К примеру, вы хотите прогнозировать, будете ли использовать прогностическую машину в своей организации. Считайте, что она у вас уже есть. Если вы читаете эту книгу, то почти наверняка обзаведетесь прогностической машиной.
Вы так поступите по меньшей мере по трем причинам. Первая и самая непосредственная – изложенные в книге идеи покажутся многообещающими: читая, вы больше узнаете о прогностических машинах и, следовательно, захотите повысить с их помощью эффективность своего бизнеса.
Вторая причина называется «обратной причинностью». Вы читаете эту книгу потому, что у вас уже есть прогностическая машина или вы собираетесь в скором времени приобрести ее. Не книга привела к применению технологий, а применение технологий (в настоящее время), наоборот, привело к чтению книги.
Третья причина называется «пропущенной переменной». Вы интересуетесь техническими новинками и занимаете руководящую позицию, поэтому решили прочитать книгу. В работе вы применяете новые технологии, в том числе прогностические машины. В этом случае ваша склонность к технологиям и управлению становится причиной и чтения книги, и использования прогностических машин.
Причина не всегда существенна. Если нужно знать, воспользуется ли читатель прогностическими машинами, то неважно, что будет причиной, а что – следствием. Если вы видите человека, читающего эту книгу, можете обоснованно прогнозировать, что он внедрит прогностические машины в свой рабочий процесс.
Но иногда причина все же имеет значение. Вы порекомендуете эту книгу друзьям в случае, если благодаря ей повысите свое мастерство в качестве менеджера в сфере прогностических машин. Что вы хотели бы узнать? Сначала вы прочитаете книгу. Затем попробуете заглянуть в будущее и посмотреть, насколько хорошо пойдет работа с ИИ. Предположим, вы увидели радужные перспективы и замечательно преуспели на поприще прогностических машин: они играют главную роль в вашей организации, и вы добились больших успехов, чем в самых смелых мечтах. Можно ли сказать, что книга привела вас к этому?
Нет.
Если вы хотите убедиться в том, что такое влияние оказала именно книга, необходимо знать, что случилось бы, если бы вы ее не читали. Но таких данных у вас нет. Следует рассмотреть «отсутствие вмешательства», как говорят экономисты и статистики: что произошло бы, если бы вы предприняли иные действия. Для утверждения, что действие служит причиной результата, требуется два прогноза: первый – что будет, если предпринять это действие, и второй – что будет, если предпринять другое действие. Но это невозможно. У вас никогда не появится данных о последствиях того, чего вы не делали
[57].
Это хроническая проблема прогностических машин. В книге Deep Thinking Гарри Каспаров обсуждает похожие проблемы первых алгоритмов машинного обучения в шахматах: «В начале 1980-х Мичи с коллегами написали экспериментальную шахматную программу машинного обучения, основанную на данных. Результат оказался очень забавным. Они загрузили в машину сотни тысяч позиций гроссмейстерских игр в надежде, что она разберется, какие ходы удачные и какие нет. Сначала вроде бы все получалось. Анализ позиций был точнее, чем у других программ. Проблемы начались, когда машина начала сама играть в шахматы. Она сделала несколько ходов, пошла в атаку и сразу же пожертвовала ферзем! Через пару ходов она проиграла, отдав ферзя без всякой причины. Почему? Когда гроссмейстер жертвует ферзем, обычно это ловкое и продуманное решение. Обучаясь на одних только гроссмейстерских играх, машина сделала вывод, что выигрывает тот, кто остается без ферзя!»
[58]
Машина неверно истолковала причинно-следственную связь. Не понимая, что гроссмейстер жертвует ферзем только в случае, если это прямой и верный путь к победе, она сделала вывод, что игрок побеждает вскоре после того, как отдаст ферзя, то есть ошибочно связала потерю шахматной фигуры и победу. Данную проблему прогностические машины решили, но обратная причинность остается слабым местом этих технологий.
В бизнесе такие задачи тоже встречаются. В большинстве сфер низким ценам сопутствует падение продаж. Например, в гостиничном бизнесе в несезонное время цены снижаются, но вырастают, когда спрос большой и отели переполнены. На основании таких данных машина может наивно предположить, что если поднять цены, то повысится спрос. Человек – хотя бы с минимальными познаниями в экономике – понимает, что рост цен служит следствием повышения спроса, а не наоборот. То есть, если поднять цены, продажи не вырастут.
Человек может предоставить машине верные данные (например, предложения индивидуального комфорта гостиничного номера исходя из цены) и соответствующие модели (с учетом сезонного спроса, а также других требований и предложений), чтобы лучше прогнозировать продажи по различным ценам. Для машины это неизвестные известные, но человек, разбирающийся в ценообразовании, воспринимает их как известные неизвестные или даже известные известные, если способен принимать решения по ценам самостоятельно.
Проблема с неизвестными известными и причинно-следственная зависимость становятся еще важнее в присутствии стратегического поведения других людей. Поиск Google работает по секретным алгоритмам. Они создаются с помощью прогностических машин, прогнозирующих, на какую ссылку пользователь нажмет с наибольшей вероятностью. Для администратора веб-сайта высокое ранжирование означает больше посетителей и продаж. Большинство администраторов знают об этом и делают оптимизацию в поисковых системах: стараются повысить рейтинг сайта в результатах поиска Google. Оптимизация, как правило, заключается в построении обходных путей существующих алгоритмов, в результате чего со временем поисковая машина замусоривается спамом и неинтересными пользователю ссылками.