Немало чернил ушло на споры о самом «правильном» способе обобщения прямых и непрямых воздействий при переходе от линейных к нелинейным моделям. К сожалению, большая часть статей подходит к проблеме с конца. Вместо того чтобы заново, с нуля решить, что мы имеем в виду под прямым и непрямым воздействиями, они начинают с предположения, что нам всего-то нужно немного подправить определения для линейных моделей. Например, в Линейной Стране Чудес мы видели, что непрямое воздействие подается как произведение двух путевых коэффициентов. Поэтому некоторые исследователи попытались определить непрямое воздействие как произведение двух численных выражений, из которых одно измеряет воздействие X на M, а второе — воздействие M на Y. Этот подход стал известен как метод произведения коэффициентов. Однако мы также видели, что в Линейной Стране Чудес непрямое воздействие задается разницей между суммарным воздействием и прямым воздействием. Поэтому другая, не менее самоотверженная группа исследователей определяла непрямое воздействие как разницу двух численных показателей, один из которых отражал суммарное воздействие, а другой — прямое воздействие. Этот метод стал называться методом разницы коэффициентов.
Какой же из них верен? Ни тот ни другой! Обе группы исследователей спутали процедуру и смысл. Процедура здесь математическая: смысл каузальный. На самом деле проблема еще глубже: исследователи, занимающиеся регрессионным анализом, никогда не рассматривали смысл непрямого воздействия за рамками пузыря линейных моделей. Единственным значением понятия непрямого воздействия был результат алгебраической процедуры (перемножить путевые коэффициенты). Когда эту процедуру у них отобрали, их стало носить ветром, как лодку без якоря.
Один из читателей моей книги «Причинность» в своем письме ко мне прекрасно описывает это чувство растерянности. Мелани Уолл (Колумбийский университет) в свое время преподавала курс математического моделирования биостатистикам и медикам. Однажды она, как обычно, объясняла студентам, как вычислять непрямое воздействие, перемножая прямые путевые коэффициенты. Некий студент спросил ее, что именно имеется в виду под непрямым воздействием. «Я ответила ему то, что отвечала всегда, что непрямое воздействие — это воздействие, которое изменение в X производит на Y через его взаимоотношения с опосредующей переменной Z», — написала мне Уолл. Однако студент оказался очень настойчивым. Он вспомнил, как преподаватель объяснял прямое воздействие как воздействие, которое остается, если мы будем поддерживать опосредующую переменную на постоянном уровне, и спросил: «Тогда что мы удерживаем на постоянном уровне, когда говорим о непрямом воздействии?»
Уолл не знала, что сказать. «Я не уверена, что у меня сейчас есть хороший ответ на этот вопрос, — ответила она. — Как насчет того, что я выясню, что смогу, и сообщу вам?»
Это было в октябре 2001 года, всего через четыре месяца после того, как я представил статью по каузальному опосредованию на конференции «Неопределенность в искусственном интеллекте» в Сиэтле. Стоит ли говорить, что мне очень хотелось поразить Мелани своим свежим решением ее задачи, и я написал ей то же, что пишу здесь сейчас для вас: «Непрямое воздействие X на Y — это изменение в Y, которое мы наблюдаем, если удерживаем X на постоянном уровне и в то же время изменяем M до такого уровня, который M приняло бы при изменении X на единицу».
Я не уверен, что Мелани впечатлилась моим ответом, но ее любознательный студент заставил меня серьезно задуматься о том, как прогрессирует наука в наши времена. Вот сейчас, думал я, прошло 40 лет с тех пор, как Блалок и Дункан ввели путевой анализ в общественные науки. Десятки учебников и сотни научных публикаций по прямым и непрямым воздействиям выходят из печати каждый год, некоторые из них — с заголовками-оксюморонами вроде «Регрессионный подход к опосредованию». Каждое поколение передает следующему из рук в руки мудрость о том, что непрямое воздействие — это всего лишь произведение двух других воздействий, или же разница между суммарным и прямым воздействиями. Никто не осмеливается задать простой вопрос: но что это самое непрямое воздействие означает? Чтобы задать его, вдребезги разбив нашу веру в пророческую роль научного консенсуса, понадобился невинный студент с беззастенчивым нахальством мальчишки из андерсеновского «Нового платья короля».
Знакомьтесь с «если бы»
Далее я расскажу вам историю своего собственного обращения, потому что достаточно долго мне не давал покоя тот же самый вопрос, который озадачил студента Мелани Уолл.
В главе 4 я писал о Джейми Робинсе, пионере статистики и эпидемиологии в Гарвардском университете, который вместе с Сандером Гренландом из Калифорнийского университета в Лос-Анджелесе ввел широкое употребление графических моделей в современной эпидемиологии. Мы сотрудничали несколько лет, с 1993 по 1995 год, и он навел меня на мысли о проблеме последовательных схем интервенции, что было одним из его главных научных интересов.
За много лет до этого Робинса, как эксперта по производственному здравоохранению и безопасности, попросили выступить в суде с мнением о вероятности того, что воздействие химических веществ на рабочем месте привело к смерти рабочего. Робинс был обескуражен, обнаружив, что в статистике и эпидемиологии совершенно нет инструментов для ответов на подобные вопросы. Это по-прежнему была эра почти полного табу на причинность в статистике. Говорить о ней дозволялось только в случае рандомизированных контролируемых исследований, а по этическим соображениям провести подобный эксперимент на людях, чтобы выяснить последствия воздействия формальдегида, было совершенно невозможно.
Обычно рабочие на фабрике подвергаются воздействию токсичных веществ не однократно, а в течение долгого времени. По этой причине Робинс стал интересоваться всеми случаями, когда уровень воздействия химических веществ менялся с течением времени. Иногда такие воздействия бывают и благотворными, например, при СПИДе препараты применяются в течение многих лет, при этом схемы лечения меняются в зависимости от того, как на них реагирует уровень гликопротеина CD4 у пациента. Как вычленить каузальное воздействие курса лечения, если он состоит из множества стадий и промежуточные переменные (которые используются в качестве контроля) зависят от более ранних стадий лечения? Эти вопросы определили направление карьеры Робинса.
После того как Джейми прилетал ко мне в Калифорнию, услышав о «задаче на салфетке» (см. главу 7), он активно заинтересовался перспективами применения графических методов к последовательным схемам лечения, которые были его коньком. Вместе мы выработали последовательный критерий черного хода для оценки каузального воздействия подобных терапевтических курсов. Это сотрудничество научило меня нескольким важным вещам. В частности, оно показало мне, что анализировать два действия иногда проще, чем одно, потому что каждое действие соответствует стиранию стрелки на графе и таким образом делает его более разреженным.
Наш критерий черного хода работал с длительным курсом лечения, состоящим из произвольно большого числа do-операций. Но даже две операции — это уже интересная математика, в том числе контролируемое прямое воздействие, которое состоит из одного действия, которое «играет» значением экспериментального воздействия, в то время как другое действие удерживает опосредующую переменную на постоянном уровне. Что еще важнее, идея определения прямых воздействий в терминах do-операций освободила их из тюрьмы линейных моделей и укоренила в каузальном исчислении. Но по-настоящему я заинтересовался опосредованием только позднее, когда обнаружил, что люди по-прежнему совершают ошибки в самых элементарных вещах, например как в упомянутом выше Заблуждении Опосредования. Меня также огорчало то, что основанное на действии определение прямого воздействия не расширялось на непрямое воздействие. Как сказал студент Мелани Уолл, у нас нет переменной или набора переменных, интервенция по которым могла бы заблокировать прямой путь и оставить непрямой путь действующим. По этой причине непрямое воздействие казалось мне плодом воображения, лишенным независимого значения и только напоминающим нам, что суммарное воздействие может отличаться от прямого воздействия. Я даже писал об этом в таких выражениях в первом издании (2000) своей книги «Причинность». Это был один из трех крупнейших просчетов в моей карьере.