Этот пример заставил нас углубиться в тонкости причинно-следственных моделей, сильнее, чем где-либо выше в этой книге. Но позвольте мне сделать небольшое отступление и порадоваться чуду, которое стало возможным благодаря случаю с Элис. Используя комбинацию данных и модели, мы смогли предсказать поведение индивида (Элис) в полностью гипотетических условиях. Конечно, бесплатного сыра не бывает: мы получили такие веские результаты, потому что сделали веские допущения. Мы не только утвердили причинно-следственные связи между наблюдаемыми переменными, но и предположили, что функциональные связи были линейными. Но линейность здесь не так важна, как знание этих конкретных функций. Они позволили нам вычислить специфические особенности Элис по ее наблюдаемым характеристикам и обновить модель, как того требует трехэтапная процедура.
Рискуя несколько омрачить нашу радость, я должен сказать, что эта функциональная информация не всегда будет доступна на практике. В целом мы называем модель полностью заданной, если функции, выраженные стрелками, известны, и частично заданной — в иных случаях. Например, как и в байесовских сетях, мы можем знать только вероятностные отношения между родителями и детьми. Если модель задана частично, мы не оценим точно зарплату Элис; вместо этого нам, скорее всего, придется сделать утверждение с вероятностным интервалом, предположим: «Вероятность того, что ее зарплата составит 76 000 долларов, составляет 10–20 %». Но даже таких вероятностных ответов достаточно для многих случаев. Более того, действительно поражает, сколько информации мы в состоянии извлечь из диаграммы причинности, даже если у нас нет сведений о конкретных функциях, скрытых за стрелками, или есть лишь очень общие данные, скажем предположение о монотонности, с которым мы столкнулись в последней главе.
Шаги с 1 по 3, описанные выше, можно суммировать в первом законе причинного вывода, как я его называю: YX (u) = YMX (u). Это то же самое правило, которое мы использовали в примере с расстрельной командой в главе 1, только функции здесь другие. Первый закон гласит, что потенциальный результат YX (u) можно условно исчислить, перейдя к модели MX (с удаленными стрелками к X) и вычислив в ней результат Y (u). Отсюда следуют все оцениваемые величины на второй и третьей ступенях Лестницы Причинности. Короче говоря, сведение контрфактивных суждений к алгоритму позволяет нам завоевать столько территории на третьем уровне, сколько позволит математика, но, конечно, ни на йоту не больше.
О том, как важно видеть собственные допущения
Метод SCM, который я показал для вычисления контрфактивов, — не тот метод, который использовал бы Рубин. Основное различие между нами — применение диаграмм причинности. Они позволяют исследователям представить причинные допущения в терминах, которые они могут понять, а затем рассмотреть все контрфактивные утверждения как производные свойства от их модели мира. Причинная модель Рубина рассматривает контрфактивы как абстрактные математические объекты, которыми управляет алгебраический аппарат, а не производные от модели.
В отсутствие графического представления пользователь причинной модели Рубина обычно должен принять допущения. Первое из них, допущение о стабильном эффекте воздействия на единицу, достаточно прозрачно. В нем говорится, что каждый индивид (или единица — предпочтительный термин среди разработчиков причинных моделей) получит одинаковый эффект от лечения независимо от того, какое лечение получают другие индивиды (или единицы). Во многих случаях, если не считать эпидемии и другие коллективные взаимодействия, это имеет смысл. Например, если предположить, что головная боль не заразна, моя реакция на аспирин не будет зависеть от того, получит ли аспирин Джо.
Второе допущение в модели Рубина, тоже безобидное, называется постоянством. Оно подразумевает, что человек, который принял аспирин и выздоровел, также выздоровеет, если получит аспирин в экспериментальном порядке. Это разумное предположение, которое рассматривается как теорема в рамках SCM, фактически утверждает, что эксперимент лишен эффекта плацебо и других недостатков.
Но главное допущение, которое неизменно должны делать все, кто использует потенциальные результаты, называется игнорируемостью. Это более технический аспект, но он является критически важной частью всей операции, поскольку аналогичен условию обмениваемости у Джейми Робинса и Сандера Гренланда, которое обсуждается в главе 4. «Игнорируемость» выражает то же требование в терминах переменной потенциального результата YX Она требует, чтобы YX не зависел от фактически полученного лечения, т. е. X, с учетом значений определенного набора конфаундеров (или конфаундеров Z. Прежде чем исследовать ее интерпретацию, мы должны признать, что любое допущение, выраженное как условная независимость, наследует широкий набор знакомых математических механизмов, разработанных статистиками для обычных (не контрфактивных) переменных. Например, статистики обычно используют правила для определения, когда одна условная независимость следует из другой. К чести Рубина, он признал, что перевод причинного понятия неосложненности в синтаксис теории вероятностей имеет смысл, пусть и на контрфактивных переменных. Допущение игнорируемости делает причинную модель Рубина действительной моделью. Табл. 12 сама по себе не является моделью, поскольку не содержит допущений о мире.
К сожалению, я еще не нашел ни одного человека, который мог бы объяснить, что такое игнорируемость на языке, на котором говорят те, кому необходимо сделать это допущение или оценить его правдоподобие для конкретной задачи. Вот до чего удалось додуматься мне. Определение пациентов в экспериментальную или контрольную группы игнорируется, если в любой страте осложнителя Z пациенты, у которых может быть один потенциальный результат — YX = y, могут оказаться в экспериментальной или контрольной группе с той же вероятностью, что и пациенты, у которых может быть другой потенциальный результат — YX = Y¢. Это определение вполне оправданно, если у вас есть функция вероятности. Но как биолог или экономист, обладающий только научными знаниями, должен оценить, правда это или нет? И как ученый оценит, сохраняется ли игнорируемость для любого из примеров, обсуждаемых в этой книге?
Чтобы понять, в чем здесь сложность, попробуем применить это объяснение к нашему примеру. Чтобы определить, является ли ED игнорируемым (при условии EX), мы должны оценить, будут ли сотрудники с одной потенциальной зарплатой, скажем S1 = s, иметь одинаковый уровень образования с той же вероятностью, что и сотрудники с другой потенциальной зарплатой, предположим S1 = s¢. Если вы думаете, что это похоже на замкнутый круг, я могу только согласиться! Мы хотим определить потенциальную зарплату Элис, но, еще не начав — еще не получив намека на ответ, — должны размышлять о том, зависит ли результат от ED или нет в каждой страте EX. Это настоящий когнитивный кошмар!