Однако в последние годы эксперты по искусственному интеллекту добились большого прогресса в автоматизации процесса умозаключений, ведущего от улик к гипотезам и подобным же образом — от следствий к причинам. Мне повезло участвовать в этом процессе на самых ранних стадиях: я разработал один из его базовых инструментов под названием «байесовские сети». Эта глава объясняет, что они собой представляют, рассматривает способы их применения сегодня и обсуждает окольные пути, по которым они привели меня к исследованию причинно-следственных связей.
Bonaparte — компьютер-детектив
17 июля 2014 года рейс MH17 авиакомпании «Малайзия эйрлайнс» вылетел из амстердамского аэропорта Схипхол в Куала-Лумпур. Увы, самолет не добрался до пункта назначения. Через три часа, когда самолет пролетал над Восточной Украиной, его сбили ракетой «земля — воздух» российского производства. Все 298 человек на борту, 283 пассажира и 15 членов экипажа, погибли в авиакатастрофе.
23 июля, когда в Нидерланды были доставлены первые погибшие, объявили днем государственного траура. Но для криминалистов из Нидерландского института судебной экспертизы в Гааге 23 июля стало точкой отсчета. В их задачи входило как можно скорее идентифицировать останки и доставить их близким для похорон. Время поджимало, потому что каждый день неизвестности приносил обездоленным семьям новую боль.
Криминалисты столкнулись со множеством препятствий. Тела были сильно обожжены, и многие хранились в формальдегиде, который разрушает ДНК. Кроме того, поскольку Восточная Украина оставалась территорией военных действий, место авиакатастрофы было доступно не всегда. Останки находили в течение десяти месяцев. К тому же криминалисты не располагали информацией о ДНК жертв по той простой причине, что погибшие не были преступниками. Поэтому приходилось полагаться на частичные совпадения с ДНК родственников.
К счастью, у голландских специалистов был мощный инструмент — новейшая программа под названием Bonaparte, предназначенная для идентификации жертв катастроф. Эта программа, которую разработали в середине 2000-х ученые из Университета Неймегена имени святого Радбода Утрехтского, использует байесовские сети, чтобы скомбинировать информацию о ДНК, взятую у нескольких членов семьи.
Отчасти благодаря скорости и точности Bonaparte голландские криминалисты смогли опознать останки 294 из 298 жертв к декабрю 2014 года. К 2016 году только две жертвы катастрофы (оба граждане Нидерландов) оставались пропавшими без вести.
Байесовские сети, инструмент для машинного рассуждения, лежащий в основе программы Bonaparte, влияет на нашу жизнь разными способами, о которых большинство людей не имеет представления. Они используются в программах распознавания речи, фильтрах для спама, прогнозах погоды, при оценке потенциальных нефтяных скважин и одобрении медицинских приборов в Управлении по санитарному надзору за пищевыми продуктами и медикаментами. Если вы играете в видеоигры на приставке XboX компании «Майкрософт», значит, байесовские сети оценивают ваш уровень. Если у вас есть мобильный телефон, то алгоритмы, которые используются, чтобы выбрать ваш исходящий вызов из тысяч других, кодируются с помощью алгоритма распространения доверия, разработанного для байесовских сетей. Винт Серф, главный пророк Интернета из еще одной небезызвестной компании — Google, — говорит об этом так: «Мы потребляем байесовские методы в огромных объемах».
В этой главе я расскажу историю байесовских сетей с их появления в XVIII веке до развития в 1980-х годах, а еще приведу больше примеров того, как они используются сегодня. Они связаны с диаграммами причинности очень простым способом: такая диаграмма — это байесовская сеть, в которой каждая стрелка обозначает прямое причинно-следственное отношение или, по крайней мере, его возможность в направлении этой стрелки. Не все байесовские сети имеют причинно-следственную природу — во многих случаях это не имеет значения. Однако, если вы когда-нибудь захотите задать вопрос второго или третьего уровня на Лестнице Причинности, вам необходимо будет нарисовать диаграмму, обратив самое пристальное внимание на причинно-следственные связи.
Преподобный Байес и проблема обратной вероятности
Томас Байес, в честь которого я назвал сети в 1985 году, даже и не мечтал, что формула, которую он вывел в 1750-х годах, однажды будет использоваться, чтобы идентифицировать жертв катастрофы. Его волновала исключительно вероятность двух событий, одно из которых (гипотеза) происходит после второго (подтвержденного факта). Тем не менее причинность весьма его волновала. Более того, стремление установить причинно-следственные связи было движущей силой для его анализа «обратной вероятности».
Преподобный Томас Байес, пресвитерианский священник, живший с 1702 по 1761 годы, очевидно, был сильно увлечен математикой. Отколовшись от англиканской церкви, он не мог учиться в Оксфорде или Кембридже и вместо этого получил образование в Эдинбургском университете, где, вероятно, немало занимался любимой наукой. После того как Байес вернулся в Англию, он продолжал баловаться математикой и организовывать математические обсуждения.
В статье, опубликованной после его смерти, Байес разобрал задачу, которая была для него идеальной: столкнул математику и теологию. Это произошло в следующих обстоятельствах: в 1748 году шотландский философ Дэвид Юм написал эссе под названием «О чудесах», в котором утверждал, что личное свидетельство никогда не может служить подтверждением для чуда. Чудом, которое Юм имел в виду, было, конечно, воскресение Христа, хотя он был достаточно умен, чтобы этого не сказать (20 годами ранее теолог Томас Вулстон был обвинен в богохульстве и сел в тюрьму за такие утверждения). Главная мысль Юма состояла в том, что наблюдения, которые по природе своей могут быть ошибочными, не способны опровергнуть положение, основанное на законах природы, например: «Мертвые люди остаются мертвыми».
В глазах Байеса это утверждение приводило к естественном вопросу, прямо в духе Холмса: сколько доказательств необходимо, чтобы убедить нас в том, что события, которые мы считаем невероятными, все же произошли? Если исключить невозможное, то, что останется, и будет правдой, сколько бы невероятным это ни казалось. Когда гипотеза переходит границу между невозможным и невероятным или даже между вероятностью и подлинной уверенностью? Хотя этот вопрос был выражен на языке вероятности, за ним стояли намеренно богословские выкладки. Ричард Прайс, коллега-священник, который нашел эссе в вещах Байеса после его смерти и отправил его в печать с хвалебным вступлением, написанным самолично, выразил эту мысль предельно ясно: «Цель, которую я имею в виду, состоит в том, чтобы показать, по какой причине мы верим, что в порядке вещей существуют неизменные законы, в соответствии с которыми все происходит, и что, таким образом, мироустройство должно быть результатом мудрости и мощи разумной причины, а значит, подтвердить аргумент, основанный на конечных причинах, в пользу существования Всевышнего. Будет легко увидеть, что обратную проблему, решенную в этом эссе, легче применить для этой цели; она показывает нам ясно и точно, каковы основания полагать, что в любом случае каждого конкретного порядка и повторяемости событий этот порядок или повторяемость объясняются стабильной причиной и законами природы, а не случайностями, не подчиненными порядку».