Рис. 58. Каузальная диаграмма для приучения Дэйзи к порядку
Теперь вы видите, почему статистикам так долго не удавалось дать определение непрямых воздействий. Если даже единственное контрфактивное высказывание было для них чем-то из ряда вон выходящим, то двойные контрфактивы были просто с другой планеты. Однако это определение близко к нашему интуитивному пониманию причинности. Человеческая интуиция работает настолько убедительно, что жена Даны безо всякой специальной подготовки легко поняла логику предполагаемого эксперимента.
Для читателей, не боящихся формул, ниже приводится определение ННВ, которое мы только что дали словами выше:
ННВ = P (YM = M1 = 1 | do (X = 0)) — P (YM = M0 = 1 | do (X = 0)). (9.3)
Первое P — результат эксперимента с Дэйзи: вероятность того, что приучение к порядку окажется успешным (Y = 1), при условии, что мы не заводим других животных в доме (X = 0), но придаем опосредующей переменной такое значение, какое она имела бы, если бы они были (M = M1). Мы противопоставляем это вероятности успешного приучения к порядку в «нормальных» условиях, без других животных в доме. Обратите внимание, что контрфактивная величина M1 должна вычисляться для каждого экспериментального животного отдельно: другим собакам для воспитания могут быть необходимы другие значения переменной запирание/надзор. Это выводит непрямое воздействие из области применимости do-исчисления. Этот момент также делает эксперимент невыполнимым, потому что экспериментатор не знает M1 (u) для конкретной собаки u. Тем не менее, приняв, что между M и Y нет осложнителей, натуральное непрямое воздействие все-таки можно подсчитать. Уберем все контрфактивные переменные из ННВ и получим для него Формулу Опосредования, как мы уже делали для НПВ. Это численное выражение, требующее информации с третьей ступени Лестницы Причинности, сокращается тем не менее до выражения, исчисляемого с использованием данных только первой ступени. Такая редукция возможна только благодаря нашему предположению об отсутствии осложнителей, которое, благодаря определяющему свойству уравнений в структурной каузальной модели, находится на третьей ступени.
Чтобы закончить историю с Дэйзи, сообщу, что результаты эксперимента оказались противоречивы. Неизвестно, следили ли Дана с женой за Дэйзи так же тщательно, как если бы приходилось не пускать ее к котятам (поэтому неясно, было ли переменной M действительно придано значение M1). Потребовалось терпение и время — несколько месяцев, — и Дэйзи все-таки научилась делать все свои дела на улице.
Но даже и в этом случае в истории с Дэйзи есть несколько важных уроков. Будучи готовым к возможности столкнуться с опосредующей переменной, Дана смог предположить другой каузальный механизм. Из него было выведено важное практическое следствие: ему и жене не пришлось держать в доме дополнительных животных, составляющих стаю, в течение всей жизни Дэйзи.
Опосредование в линейной стране чудес
Когда вы впервые сталкиваетесь с контрфактивными величинами, вам может показаться странным, что для выражения непрямого воздействия требуется такой громоздкий математический аппарат. В самом деле, скажете вы, непрямое воздействие — это всего-навсего то, что остается, если вычесть прямое воздействие. Иначе мы могли бы написать:
Суммарное воздействие = Прямое воздействие + Непрямое воздействие. (9.4)
Если отвечать на это коротко, то схема не работает в моделях, включающих взаимодействия переменных (иногда говорят «модерацию»). Представим, что некое лекарственное средство стимулирует организм выдел ять фермент, который действует как катализатор: он соединяется с этим лекарственным средством и лечит болезнь. Суммарный эффект этого препарата будет, конечно же, положительным. Однако прямой его эффект равен нулю, потому что, если мы заблокируем медиатор (например, не давая организму выделять фермент), препарат не подействует. Непрямой эффект также равен нулю, потому что, если пациент не будет получать препарат, а начнет принимать искусственно синтезированный фермент, болезнь тоже не пройдет. Сам по себе фермент не излечивает болезнь. Таким образом, уравнение (9.4) не выполняется: суммарное воздействие положительное, но и прямое, и непрямое воздействия равны нулю.
Тем не менее уравнение (9.4) выполняется автоматически в одной ситуации без необходимости ввода контрафактивных переменных. Это случай линейной каузальной модели, вроде той, которую мы рассматривали в главе 8. Как обсуждалось там, линейные модели не допускают взаимонаправленных взаимодействий между переменными, и это может быть как преимуществом, так и недостатком. Преимуществом в том смысле, что анализ опосредования становится намного проще, а недостатком — если мы захотим описать некий каузальный процесс в реальном мире, в котором такие взаимодействия все-таки присутствуют.
Поскольку анализ опосредования намного проще для линейных моделей, посмотрим, как он осуществляется, и с чем вероятны проблемы. Допустим, у нас есть каузальная диаграмма, выглядящая как рис. 59. Поскольку мы работаем с линейной моделью, мы можем представить силу каждого воздействия одним числом. Метки (путевые коэффициенты) показывают, что увеличение переменной экспериментальное воздействие на 1 единицу увеличит переменную медиатор на 2 единицы. Аналогично увеличение переменной медиатор на 1 единицу увеличит переменную итог на 3 единицы, а увеличение экспериментального воздействия на 1 единицу увеличит итог на 7 единиц. Все это прямые воздействия. Здесь мы подходим к первой причине того, почему линейные модели так просты: прямые воздействия не зависят от уровня опосредующей переменной, т. е. КПВ (m) одно и то же для всех значений m и мы можем говорить о единственном прямом воздействии.
Каково же будет суммарное воздействие интервенции, благодаря которой экспериментальное воздействие увеличится на 1 единицу? Во-первых, эта интервенция напрямую вынуждает итог увеличиться на 7 единиц (если мы удерживаем медиатор на постоянном уровне). Она также увеличивает медиатор на 2 единицы. Наконец, поскольку каждое увеличение медиатора на 1 единицу напрямую вызывает увеличение итога на 3 единицы, увеличение медиатора на 2 единицы приведет к дополнительному увеличению итога на 6 единиц. Поэтому суммарное увеличение итога по обоим каузальным путям будет составлять 13 единиц. Первые 7 единиц соответствуют прямому воздействию, а оставшиеся 6 — непрямому воздействию. Проще пареной репы!
Рис. 59. Пример линейной модели (путевая диаграмма) с опосредующей переменной