Изыскания Глинна и Кашина показывают, почему поправки парадного входа оказываются столь мощным инструментом: он позволяет нам снимать осложнения по таким переменным, по которым мы не можем получить наблюдений (например, в случае мотивации), включая те, которые даже не можем никак назвать. Рандомизированные контролируемые исследования считаются золотым стандартом оценок каузального воздействия ровно по тем же причинам. Поскольку оценки парадного входа равноценны, к тому же обладают дополнительным преимуществом, позволяя наблюдать поведение людей в их привычной обстановке, а не в условиях лаборатории, я не удивлюсь, если когда-нибудь этот метод составит серьезную конкуренцию РКИ.
Математика Do-оператора, или сознание над материей
Главная цель обеих обсужденных выше поправок — вычислить эффект интервенции, P (Y | do (X)), в терминах данных типа Р (Y | X, A, B, Z…), не включающих оператор do. Если нам удастся полностью устранить все do, мы сможем использовать для оценки каузального воздействия наблюдаемые данные, что позволит нам перепрыгнуть со ступени 1 на ступень 2 Лестницы Причинности.
Тот факт, что в приведенных двух случаях мы это сделали (черный ход и парадный вход), немедленно поднимает вопрос, существуют ли другие входы и выходы, через которые устраняются все do. Рассуждая в общем и целом, мы поднимаем вопрос, реально ли решить заранее, допускает данная каузальная модель подобную процедуру устранения или нет. Если да, мы применим эту процедуру и обретем желаемое каузальное воздействие, не пошевелив пальцем для осуществления интервенции. В противном случае мы по крайней мере будем знать, что допущения, встроенные в модель, недостаточны для того, чтобы выявить каузальное воздействие с помощью одних только наблюдений, и, как бы умны мы ни были, нам никуда не деться от постановки интервенционного эксперимента того или иного рода.
Перспектива принятия таких решений на основе чисто математических средств должна показаться заманчивой любому, кто понимает дороговизну и сложность проведения рандомизированных контролируемых исследований даже в тех случаях, когда они возможны с точки зрения физики и законодательства. Я тоже был вдохновлен этой идеей в начале 1990-х, не как экспериментатор, а как ученый в области информатики и заодно философ. Несомненно, одно из самых радостных событий в жизни ученого — обнаружить, что, не выходя из-за своего стола, вы способны определить, что возможно или невозможно в реальном мире — особенно, если решаемая проблема важна для общества, а тех, кто пытался ее решить до вас, она ставила в тупик. Могу себе представить, что нечто подобное испытывал Гиппарх из Никеи, когда обнаружил, что в состоянии вычислить высоту пирамиды по ее тени на земле, не взбираясь на нее. Это была явная победа разума над материей.
В самом деле, используемый мной подход во многом был вдохновлен учеными Древней Греции (включая Гиппарха) и изобретенной ими формальной логикой геометрии. В центре древнегреческой логики — набор аксиом, или самоочевидных истин, допустим: «Между двумя точками можно провести одну и только одну прямую». С помощью этих аксиом древним грекам удалось создать сложные структурированные утверждения — теоремы, истинность которых уже очень далека от очевидной. Возьмем, к примеру, утверждение, что сумма углов треугольника равна 180° (или двум прямым углам) вне зависимости от его размера и формы. Истинность этого утверждения ни в какой мере не очевидна; однако философы-пифагорейцы V века до н. э. сумели доказать его универсальную истинность, используя самоочевидные аксиомы в качестве деталей конструктора.
Если вы постараетесь вспомнить школьные уроки геометрии, хотя бы в первом приближении, вы вспомните, что доказательства теорем всегда состоят из вспомогательных построений: скажем, прямой, параллельной стороне треугольника, отмечающей равенство определенных углов; окружности с радиусом, равным данному сегменту, и т. д. Эти вспомогательные построения рассматриваются как временные математические предложения, которые содержат допущения (или требования), касающиеся свойств изображенных фигур. Каждое новое построение опирается на уже существующие, так же как и на аксиомы и на ранее доказанные теоремы. Например, начертание прямой, параллельной одной из сторон треугольника, определяется пятой аксиомой Евклида, о том, что возможно провести одну и только одну прямую, параллельную данной прямой через точку, не лежащую на этой прямой. Начертание этих вспомогательных конструкций — всего лишь операция механического манипулирования символами: в ходе него предложение, написанное ранее (или ранее начертанное изображение), переписывается в новом формате, если это переписывание допускается аксиомой. Великая заслуга Евклида в том, что он определил минимальный набор из всего пяти аксиом, из которого возможно вывести все остальные истинные утверждения геометрии.
Теперь давайте вернемся к нашему центральному вопросу: в каких случаях модель может заменить эксперимент или когда данные, полученные в результате действия, можно заменить просто наблюдаемыми данными. Вдохновившись геометрами Древней Греции, мы хотели бы свести задачу к манипуляции символами и таким образом свергнуть причинность с Олимпа и сделать ее доступной обычному исследователю.
Для начала перефразируем задачу нахождения воздействия X на Y, используя язык доказательств, аксиом и вспомогательных построений, язык Евклида и Пифагора. Начнем с нашего итогового предложения P (Y | do (X)). Задача будет считаться выполненной, если нам удастся удалить из него do-оператор, оставив только классические выражения для вероятностей, вроде P (Y | X) или P (Y | X, Z, W). Конечно, мы не вправе манипулировать нашим итоговым, целевым выражением так, как нам вздумается; операции должны соответствовать тому, что do (X) означает как физическая интервенция. Таким образом, необходимо провести наше выражение через последовательность законных манипуляций, каждая из которых разрешена аксиомами и допущениями нашей модели. Эти манипуляции будут сохранять значение выражения, которое им подвергается, изменяя только формат, в котором оно записывается.
Пример преобразования, сохраняющего значение, — алгебраическое преобразование, превращающее y = ax+ b в ax = y — b. Отношения между X и Y остаются прежними, меняется только формат.
Мы уже знакомы с некоторыми легитимными преобразованиями do-выражений. Так, правило 1 гласит, что, когда мы наблюдаем переменную W, которая не имеет отношения к Y (возможно, является условной по отношению к другим переменным Z), вероятностное распределение Y не изменится. В главе 3 мы видели, что переменная пожар нерелевантна для состояния переменной тревога, если мы знаем состояние переменной-медиатора (дым). Это утверждение о нерелевантности переводится как символическая манипуляция: P (Y | do (X), Z, W) = P (Y | do (X), Z). Постулированное выше уравнение правомерно, если набор переменных Z блокирует все пути от W к Y после того как мы удалили все стрелки, ведущие к Х. В примере пожар → дым → тревога W = пожар, Z = дым и Y = тревога, а Z блокирует все пути от W к Y (в этом случае у нас нет переменной X).