В обеих статьях Вайнберг медицинское применение приведенных схем было в выяснении влияния курения (X) на выкидыши, или «спонтанное прерывание беременности» (Y). В игре 1 фактор A — это нарушения, вызываемые курением; это ненаблюдаемая переменная, потому что мы не знаем, в чем эти нарушения состоят. Фактор B представляет собой историю предыдущих выкидышей. Для эпидемиолога будет большим искушением обратить внимание на число предшествовавших выкидышей и ввести поправку по этой переменной, оценивая вероятность будущих выкидышей. Но в данном случае это как раз неправильно! Поступив так, мы частично деактивируем механизм, по которому действует курение, и, таким образом, истинное влияние курения окажется недооцененным.
Игра 2 — более сложная версия, в которой курение разделено между двумя разными переменными: X показывает, курит ли беременная сейчас (в начале второй беременности), а A — курила ли она во время первой беременности. B и E — скрытые (ненаблюдаемые) нарушения развития, вызываемые курением, D — физиологические причины этих нарушений. Обратите внимание, что эта диаграмма допускает вариант, при котором женщина изменила свое поведение между беременностями, начав или бросив курить, но другие физиологические причины нарушений остаются прежними. Многие эпидемиологи захотят ввести поправки по предшествовавшим случаям выкидышей, но это плохая идея, если одновременно не ввести поправки по курению в предыдущей беременности (A).
Игры 4 и 5 взяты из статьи, опубликованной в 2014 году Эндрю Форбсом, биостатистиком из Университета Монаша в Австралии, вместе с несколькими соавторами. Он интересовался влиянием курения на развитие астмы у взрослых. В игре 4 переменная X — это отношение индивида к курению, Y — болел ли он астмой во взрослом возрасте. Фактор B обозначает заболевание астмой в детском возрасте, и это фактор-коллайдер, потому что на него влияют одновременно A, курение родителей и C — скрытая (и ненаблюдаемая) предрасположенность к астме. В игре 5 у переменных те же значения, но Форбс добавил две стрелки для пущего реализма (смысл игры 4 был только в том, чтобы представить читателям М-образный граф).
На самом деле в полной модели Форбса было еще несколько переменных и она выглядела так, как на рис. 27. Обратите внимание, что игра 5 «погружена» в эту модель, в том смысле, что у переменных A, B, C, X и Y ровно те же взаимоотношения. Следовательно, наши рассуждения остаются верными и в этом случае, и нам следует ввести поправки по A и B или по C, но C — ненаблюдаемая и, следовательно, невыравниваемая переменная. Вдобавок к этому у нас появляются еще четыре вмешивающиеся переменные: D — астма у родителей, E — хронический бронхит, F — пол и G — социально-экономический статус. Читатель для своего удовольствия может самостоятельно вывести, что нам нужно вводить поправки по E, F и G, но не нужно по D. Таким образом, достаточный набор переменных для устранения смещения оценки — это A, B, E, F и G.
Рис. 27. Модель связи курения (X) и астмы (Y), созданная Эндрю Форбсом
В конце концов Форбс обнаружил, что в необработанных данных у курения есть небольшая и статистически незначимая ассоциация с астмой среди взрослых, а после введения поправок по конфаундерам этот эффект становился еще незаметнее и менее достоверным. Нулевой результат не должен, однако, уводить внимание от того факта, что его статья — модельная работа по «искусному допросу Природы».
И последний комментарий по поводу этих игр: когда переменными становятся такие явления, как курение, выкидыши и т. д., это уже совершенно определенно не игры, а серьезное дело. Я назвал их играми, потому что радость от возможности получить их решение быстро и осмысленно очень похожа на удовольствие, которое ребенок получает, обнаружив, что щелкает как орехи те задачи, что раньше вводили его в ступор.
Мало какие моменты в научной карьере приносят столько удовлетворения, как удачное сведение проблемы, озадачивавшей и путавшей целые поколения предшественников, к прямолинейной игре или алгоритму. Я полагаю окончательное решение вопроса конфаундеров одним из важнейших событий Революции Причинности, потому что оно положило конец эпохе заблуждений, приводивших, вероятно, к множеству неверных решений в прошлом. Это была тихая революция, баррикады которой располагались в основном в исследовательских лабораториях и конференц-залах. Однако, вооружившись новыми инструментами и идеями, научное сообщество сегодня берется за более сложные задачи, как теоретические, так и практические, о чем расскажут последующие главы.
Глава 5. Дымные дебаты: на свежий воздух
И сказали друг другу: «пойдем бросим жребии, чтобы узнать, за кого постигает нас эта беда».
Книга пророка Ионы. 1:7
В конце 50-х — начале 60-х годов ХХ века статистика и медицина бились над одним из самых важных вопросов столетия в области здравоохранения: вызывает ли курение рак легких? Спустя полстолетия мы воспринимаем ответ на этот вопрос как само собой разумеющееся, но в те времена он был совершенно неочевиден. Ученые и даже члены одной семьи часто имели по этому вопросу противоположные мнения.
Семья Якоба Ерушалми (1904–1973) была одной из таких. Биостатистик Калифорнийского университета в Беркли Ерушалми был одной из последних цитаделей одобрения курения в академическом мире. «Ерушалми возражал против мнения, что сигареты вызывают рак, вплоть до своего последнего дня», — писал его племянник Дэвид Лилиенфельд спустя много лет. Отец Дэвида Эйб Лилиенфельд был эпидемиологом в Университете Джонса Хопкинса и одним из самых ярых сторонников теории, что курение рак все-таки вызывает. Лилиенфельд вспоминает, как дядя Як (сокращенно от Якоб) с его отцом сидели и спорили о последствиях курения, окутанные «облаками дыма от сигарет Яка и трубки Эйба» (см. иллюстрацию в начале главы). Ах, если бы Революция Причинности могла привнести в их спор глоток свежего воздуха! Как будет видно из этой главы, одним из самых серьезных аргументов против гипотезы, что курение вызывает рак, было вероятное наличие неизвестных факторов, которые обусловливают одновременно тягу к никотину и рак легких. Мы только что обсудили подобные осложняющие схемы и отметили, что современные каузальные диаграммы извели проклятье конфаундеров под корень. Но сейчас мы с вами в 1950-х и 1960-х, за два десятилетия до Сандера Гренланда и Джейми Робинса и за 30 лет до того, как хоть что-нибудь будет известно об операторе do. Поэтому интересно посмотреть, как ученые той эпохи справились с этой проблемой и доказали, что аргумент осложнения непрочен как дым.
Нет сомнений, что темой многих споров Эйба и Яка в курилке был не табак и не рак, а это несносное слово «причина». Не в первый раз в истории врачи сталкивались со сложными каузальными вопросами: многие великие вехи в истории медицины — это обнаружение истинных каузативных агентов. В середине XVIII века Джеймс Линд открыл, что плоды цитрусовых способны предотвращать цингу, а в середине XIX-го Джон Сноу выяснил, что вода, загрязненная испражнениями, вызывает холеру (позже исследования более точно идентифицировали в каждом случае каузативные агенты: дефицит витамина С для цинги, холерный вибрион для холеры). Эти два примера блестящего расследования объединяет то, что соотношение между причиной и следствием в обоих случаях однозначно. Холерный вибрион — единственная причина холеры или, как мы сказали бы сегодня, ее необходимое и достаточное условие. Если вы не подверглись его воздействию, вы не заболеете холерой. Точно так же недостаток витамина С — необходимое условие для развития цинги, а по прошествии некоторого времени — и достаточное.