При прочих равных рандомизированные контролируемые испытания по-прежнему предпочтительнее для научных работ, предполагающих наблюдение, точно так же, как сети безопасности рекомендуются для канатоходцев. Однако не все аналогии идеальны. В некоторых случаях интервенция неосуществима физически (например, в исследованиях о влиянии тучности на сердечные заболевания не получится рандомно назначить, кому из испытуемых быть тучным, а кому нет). В других интервенция неэтична (изучая влияние курения, мы не имеем права случайным образом назначить испытуемых, которые будут курить 10 лет). Кроме того, у нас могут возникнуть сложности с набором испытуемых для тестирования заведомо неприятных процедур, и добровольцы, которые в результате рискнут участвовать в эксперименте, не будут представлять собой репрезентативную выборку всей популяции в целом. К счастью, оператор do позволяет нам адекватным с точки зрения науки образом выявлять каузальные воздействия в неэкспериментальных научных работах, что бросает вызов традиционному главенству РКИ. Как обсуждалось выше в примере с ходьбой, подобные каузальные оценки, полученные из обзорных работ, целесообразно назвать условной причинностью, т. е. причинностью, условно возможной при наборе предположений, отраженных в нашей каузальной диаграмме. Важно, что мы не относимся к таким исследованиям как к гражданам второго сорта; у них есть то преимущество, что они проводятся в естественных условиях, на целевой аудитории, а не в искусственной среде лаборатории и они по-своему «чисты» — у них нет никаких проблем ни с этикой, ни с осуществимостью.
Теперь, когда мы понимаем, что принципиальный смысл РКИ в том, чтобы избавиться от осложнителей, давайте посмотрим и на другие методы, данные нам Революцией Причинности. История начинается со статьи 1984 года, написанной двумя моими давними коллегами, в которой было положено начало переоценке представлений о том, что такое конфаундеры.
Новая парадигма конфаундеров
«Хотя проблема конфаундеров, или вмешивающихся переменных, общепризнанно считается одной из центральных в эпидемиологических исследованиях, обзор литературы обнаруживает заметную непоследовательность в определении этих терминов», — этой фразой Сандер Гренланд из Калифорнийского университета в Лос-Анджелесе и Джейми Робинс из Гарвардского университета выразили самую суть причины, по которой в борьбе с конфаундерами ученые их времени не продвинулись ни на шаг со времен Фишера. Без сущностного понимания проблемы авторы обзорных работ, в которых контроль над условиями наблюдаемого невозможен, не могли сказать ничего осмысленного.
Каково было определение конфаундеров тогда и каким оно должно быть теперь? Благодаря современным знаниям о логике причинности, на второй вопрос ответить проще. То, что мы наблюдаем и способны измерить, — это вероятность данного исхода при данном воздействии, P (Y | X). Вопрос, который мы задаем природе, имеет отношение к причинно-следственной связи между X и Y, которая выражается в интервенционной вероятности P (Y | do (X)). Конфаундеры, таким образом, должны быть определены просто как все, что приводит к несовпадению этих вероятностей: P (Y | X) ≠ P (Y | do (X)). Что тут сложного?
К сожалению, до 90-х годов XX века все было непросто, потому что оператор do еще не был формализован. Даже сегодня, если вы поймаете на улице статистика и спросите, что такое конфаундеры, вы, скорее всего, услышите самое запутанное и переусложненное объяснение, какое вам только доводилось слышать от ученого. Одна недавно вышедшая книга, написанная сразу двумя светилами статистики, объясняет, что это такое, на протяжении целых двух страниц, и мне еще, надеюсь, предстоит встретить ее читателя, который понял это объяснение.
Причина этих трудностей в том, что конфаундеры — понятие за рамками статистики. Это несоответствие того, что мы хотели бы получить (причинно-следственная связь), и того, что мы реально получаем статистическими методами. Если мы не в состоянии математически выразить то, что собираемся найти, то как мы определим несоответствие ему? Исторически концепция конфаундеров возникла вокруг двух связанных между собой концепций: несопоставимости и скрытой (вмешивающейся) третьей переменной. Обе эти концепции упорно не поддавались формализации. Когда мы говорили о сопоставимости в контексте эксперимента Даниила, мы утверждали, что подопытная и контрольная группы должны быть идентичны по всем важным параметрам. Но из этого неизбежно следует, что нам придется отличать важное от неважного. Откуда мы знаем, что в исследовании про ходьбу пожилых мужчин в Гонолулу возраст — это важный параметр? Почему мы знаем, что расположение фамилий участников этого исследования по алфавиту — параметр неважный? Можно сказать, что это очевидно или что это следует из здравого смысла, однако бесчисленные поколения ученых бьются над тем, чтобы как-то формализовать этот здравый смысл, поскольку робота поступать согласно человеческому здравому смыслу научить нельзя.
От такой же двусмысленности страдает и определение третьей переменной. Считать ли таковой только общую причину X и Y, или достаточно, чтобы эта переменная была скоррелирована с ними обеими? Сегодня мы отвечаем на такие вопросы, обращаясь к каузальной диаграмме и выясняя, какие переменные отвечают за несоответствие между P (X | Y) и P (X | do (Y)). Без диаграмм и оператора do пять поколений статистиков и медиков мучились с их суррогатами, ни один из которых не был полностью удовлетворяющим. То, что лекарства в вашей аптечке разработаны и испытаны на основе сомнительного определения конфаундеров, должно вызывать беспокойство.
Давайте взглянем на некоторые суррогатные дефиниции конфаундеров. Большинство их подпадает под одну из двух категорий — декларативную или процедурную. Типичное (и неверное) декларативное определение звучит так: «Конфаундер — это любая переменная, коррелирующая сразу и с X, и с Y». Процедурное определение, в свою очередь, будет пытаться определить конфаундер в терминах статистического анализа. Это нравится статистикам, которые обожают методы, применимые на имеющихся данных напрямую, без обращения к модели.
Вот процедурное определение, известное под пугающим названием «несхлопываемость». Оно появилось в статье 1996 года норвежского эпидемиолога Свена Хернберга: «Формально можно сравнить грубый относительный риск и относительный риск после поправок на потенциальные конфаундеры. Наличие разницы означает, что конфаундеры реально присутствуют, и в этом случае следует использовать скорректированную оценку риска. Если разницы нет или она пренебрежимо мала, конфаундеров нет и предпочтительнее использовать грубую оценку». Другими словами, чтобы узнать, есть ли влияние конфаундеров, попробуйте вводить по ним поправки или не вводить; если есть разница, есть и конфаундер. Конечно, Хернберг был далеко не первым, кто предложил такой подход; почти столетие он путал эпидемиологов, экономистов, социологов и до сих царит в некоторых областях практической статистики. Я выбрал определение Хернберга только потому, что он написал об этом неожиданно подробно и в 1996 году, когда Революция Причинности уже шла полным ходом.